TWI376681B - Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon - Google Patents
Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon Download PDFInfo
- Publication number
- TWI376681B TWI376681B TW093114299A TW93114299A TWI376681B TW I376681 B TWI376681 B TW I376681B TW 093114299 A TW093114299 A TW 093114299A TW 93114299 A TW93114299 A TW 93114299A TW I376681 B TWI376681 B TW I376681B
- Authority
- TW
- Taiwan
- Prior art keywords
- input
- language model
- semantic
- quot
- user
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
- Telephone Function (AREA)
Description
Γ376681 九、發明說明: 【發明所屬之技術領域】 本發明與在一個電腦系統中資訊的存取及截取相關。 本發明尤指使用識別和理解的資訊存取有關。 【先前技術】 最近,進步的技術已經允許使用者藉由提供語音命令 在一電腦系統存取資訊。當接收使用者命令時,電腦系統 執行對使用者輸入的語音識別,並進一步處理該輸入以確 定使用者的意圖,以使電腦系統執行一所欲行動。 在一些情況下,由使用者提供的輸入是不完全的或不 確定的,其將需要電腦系統自使用者請求進一步的資訊, 不論是以視覺的或聽覺的提示形式。因此能夠在使用者和 電腦系統之間建立對話,其中每一回合提供問題、答案和/ 或確認,直到使用者的意圖確定並且能夠執行一行動為 止。在其他情況下,產生此類對話是用於與電腦系統相互 作用的較佳模式。 語音應用語言標記(SALT)已經被導入以對現代使用 者介面設計,以協助作為一可實行的輸入/輸出形態的語 音。SALT的設計目標係為了使一般語音任務易於程式化, 亦允許可直接理解的進一步能力。SALT係為許多應用設 計。例如,其一為電話基礎的,僅藉由語音對話與使用者 互動的純語音應用。 SALT包括語音輸入和輸出的物件(”聽"和”提示"),其 5 1376681 具有一模式設計為整合技術以偵測使用者回合的開始和結 束。同樣地,許多語音應用程式所使用的使用者介面要求 使用者發出信號以表示使用者回合的開始。一些電腦系統 包括可穿戴電腦(wearable computers)、語音可用形態或多 形態的(語音輸入,被提供以用於由一例如滑鼠的輸入裝置 所選擇的攔位)裝置和其他無需眼睛的應用程式。然而,在 每一種此類環境中,仍呈現使用者與電腦系統回合的簡潔 定義。 然而在參與者之間的人類談話通常不是簡潔的、回合 制的對話。而是談話能夠包括一參與者的確認、證明、提 問,等等,而其他人所提供的資訊可能大大地影響、輕微 地影響或甚至於影響講話者提供資訊的模式。人類講話者 使用談話的自然形式。同樣地,電話系統使用全雙工技術 允許這樣的談話發生。 相對地,對話基礎的介面在一使用者和一電腦系統之 間使用一種嚴格回合制的模式操作,其使電腦系統在處理 和採取後續行動之前,等待使用者對話的結束。雖然簡單 回饋(例如,像是在一個電腦螢幕前進的一連串小點之視覺 指示)可能提供這個使用者電腦系統至少在處理某事的某 種保證,但是直到該使用者完成他/她的回合及電腦系統回 應時,才知道電腦系統所理解的程度。 因此,需要改進基於識別及理解的一電腦系統。此類 改進提供一種易於由使用者利用更自然方式存取資訊的系 統或方法" 6 Γ376681 【發明内容】 一種提供一語音輸入模式之方法和系統,其當音訊標 題仍在處理時,能動態報告部分語意分析。能以立即回報 使用者的一種結果評價語意分析。所得之效果是傳統上由 系統回合執行之任務,現在由使用者回合執行,因而出現 一種與語音對話之回合制屬性相差極大的差異。 通常,本發明的一種態樣包括一電腦實作方法,用以 與一電腦系統互動。該方法包括從使用者處接收輸入,以 及截取用於處理的輪入。而後在其後或同時在輸入上執行 識別,以確定語意資訊屬於輸入和輸出這個語意物件的一 第一部分。語意物件包括欲由電腦應用處理的格式之資 料,該電腦應用係依據所識別的輸入(例如,文字、加密文 字、壓縮文字、等等),以及第一部分的語意資訊。如上所 述,當繼續載取該輸入之後的部分時,執行識別並輸出語 意物件。能夠用例如語音的聽覺輸入以及非聽覺的輸入執 行這個方法,例如,視覺輸入或手寫識別。 上述方法能夠以含有可由電腦裝置讀取指令之一電腦 可讀媒體實作,當實作時,使該電腦裝置控制資訊和執行 該方法。在一進一步的實施例中,該電腦可讀媒體能夠包 括指令,其用以建立一語言模型以執行識別和理解。該語 言模型係依據識別的輸入以一種格式提供資料,以及提供 接收的輸入之語意資訊。 7 1376681 【實施方式】 第1圖是一個資料表示系統1 0的方塊圖,用以依 音輸入呈現資料。系統10包括一個語音介面模組12 語音識別和理解模組1 4和一資料呈現模組1 6。一使 以聲音查詢形式對語音介面模組1 2提供輸入。語音介 組12從一使用者搜集語音資訊和提供指示它的信號。 由語音介面模組1 2收集到輸入語音以後,語音識別和 的模組1 4使用一語音識別器識別該語音,以及亦執行 理解,其中,當仍在截取音訊語音輸入時,在本發明 態樣中,提供目前為止接收的輸入的部分語意分析。 部分語意分析典型上包括所接收的輸入文字(或 指示輸入文宇的資料),也確定了語意資訊,該部分語 析被提供至能夠採取許多不同形式之一應用模組16 如,在一個實施例中,應用模組 16可以是個人資訊 器,用以寄送、接收和回覆電子郵件、安排會議等等 照該方法,該使用者能夠提供聽覺命令以執行這些任 更重要的是,雖然應用模組1 6能夠提供互動式回饋3 在接收到部分語意分析資訊時,對其採取行動,從而 該使用者應用模組1 6的一高度互動式介面。例如,在 聲音操作模式中,輸出2 0能夠包含回到使用者的聽 述,然而,當然有可能執行其他與該應用有關的任務 使用該部分語.意分析或語意物件,以執行應用中的對 輯。例如,對話邏輯可以依據一或更多語意物件,顯 選擇(或多數的或一個清單的選擇)給使用者。 據聲 、 —^ 用者 面模 在已 理解 語音 之一 其他 意分 。例 管理 。依 務。 W或 提供 一純 覺陳 o "vj* 話邏 示一 8 Γ376681 如此允許系統1 〇基於部分表達,亦即在使用者回 束以前,立即表示報告結果。換句話說,藉由使用用 告和執行通常與系統回合相關之任務的回送通道之溝 一使用者和一系統回合的定義是模糊的。最傳統的對 究,尤其基於人類對人類的對話,經常視回送通道溝 非侵入式的回饋,其僅傳送例如確定、否定、或中立 的簡單信號。然而,由輸出20提供的回饋有可能可以 更多的資訊,以致於對正在進行的使用者談話造成一 入,其可能或可能不造成該使用者清楚表達該使用者 圖或方向。然而,該方法在使用者和系統1 0之間提供 實的人類對話,在許多種情況下並不會讓人覺得厭煩 讓使用者更舒適,並逐漸確定將能達成使用者的願望 關於這點,應該注意的是本發明並不侷限於一個 音操作環境,而能夠基於部分語意分析或物件的處理 含回饋至使用者的其他形式。例如,在上述應用中, 1 6執行電子郵件任務,輸出2 0能夠包含視覺回饋,例 在來自使用者包含"send e-mail to Bob”的一連續指令 啟動僅基於如"send e-mail"的接收片語之一電子郵 組,其中,處理"to Bob”的片語可能使該應用模組在 貯存18中存取更進一步的資訊,並取得名字為”Bob" 名清單。據以檢查該清單,使用者只要確認所欲接 "Bob Green"就可以將其選取,因為系統為部分表示 Green"提供了另一個語意物件,其當由應用接收和 時,將導致"Bob Green"被選取。 合結 以報 通, 話研 通為 確認 搭載 點侵 的意 更真 ,且 〇 純聲 ,包 模組 如, 中, 件模 資料 的人 收者 "Bob 處理 9 1376681 如上所述,應用模組16可以採用本發明下述 有利之許多種形式,而不受到侷限,應用模組1 6 提供使用者的語音輸入的原文輸出的一個口述: 而,藉由處理部分輸入或輸入的片語之語意輸入 得更精確的轉譯。 雖然上文中就含有聲音命令之來自使用者 論,也能夠把本發明的許多態樣應用於例如手寫 手勢或視覺指示之其他輸入形式。 因為賦予了處理部分語意分析或物件的廣泛 通常描述能夠在上述系統1 0中作用的計算裝置 用的。那些熟知該項技藝者應了解,系統1 0的元 在一單一電腦之内,或分佈在使用網路連結和通 一個分散式計算環境。 現下參考第2圖,在元件3 0說明例如一個資 置之一行動裝置的一例示性形式(PIM、PDA或类 然而,本發明亦思及能夠使用下文中討論的其他 實施。例如,電話和/或資料管理裝置也可受益於 相較於習知之可攜式個人資訊管理裝置及其他可 裝置,此類裝置具有較佳的功能。 第2圖說明了 一資料管理行動裝置30的例开 該行動裝置30包括一外罩32並具有包括一顯示I 使用者介面,其與一個尖筆33共同作用,使用一 示幕。該尖筆33係用於以指定的方向按壓或接 3 4以選擇欄位、以選擇性地使移動一游標的一 態樣可能 也可能是 模組。然 ,能夠獲 的輸入而 、ETMF、 適用性, 也許是有 件可能位 訊協定的 料管理裝 頁似者)。 計算裝置 本發明。 攜式電子 :性形式, i 34 的一 觸控式顯 觸顯示器 個開始位 10 ^/0081 np 2相反地藉由例如手勢或手寫提供命令資訊。選 地裝置30上包括一或更多按鈕35,用以瀏覽。此 也能夠提供例如旋輪、捲軸或類似者之的其他輸入機 應該/主忍的疋本發明並不揭限於輸入機制的這 式。例如,輸入的另一個形式能夠包括藉由例如電腦 的視覺輸入》 現下參考第3圖,一方塊圖說明包括行動裝置3〇 能性元件。一中央處理單元(cpu)5〇實作軟體控制功 CPU 50與顯示器34連接,以使依據控制軟體產生的 與圖像出現在顯示器34。一擴音器43能夠以數位至 轉換器59連接至CPU 5〇,以提供一聽覺輸出。由使 下載或輸入到行動裝置3〇裡的資料係儲存在一非揮 讀取/寫入隨機存取記憶體貯存54,其雙向連接至 5〇。隨機存取記憶體(RAM) 54為由CPU 50執行的 供揮發性貯存,及為暫時性資料(例如,登錄值)提供 設定選擇的預設值及其他參數係儲存在一個唯讀 (r〇m)58中。也能夠用R〇M 58來儲存用於控制行 3 〇的基本功能和其他的作業系統核心功能(例如, 體元件至RAM 54)之裝置作業系統軟體。 R A Μ 5 4也以翻々,μ丄 ^
乂於在用來儲存應用程式的PC 碟機的功能的模式,作為程式碼之儲存器。應該注意 儘管使用非揮發性記憶儲存程式碼,其亦可選擇性 在不用以執行該程式k揮發性記憶中。 藉由與CPU 50連接之無線收發器52能夠由行 擇性 外, 制。 些形 視訊 的功 能。 文字 類比 用者 發性 CPU 令提 !存。 憶體 裝置 載軟 之硬 丨是, 健存 裝置 11 1376681 發送/接收無線信號。如果需要的話,亦可以提供一選擇性 的溝通介面60,用以自一電腦(例如,桌上型電腦)或從連 線的網路直接下載資料。因此,介面60能夠包括各種形式 的溝通裝置,例如,紅外線連結、數據機、網路卡、或其 他類似者。 行動裝置30包括一話筒29、和類比至數位轉換器37, 及儲存在貯存54之一選擇性的識別程式(語音、DTMF、手 寫、手勢或電腦視訊)。舉一示例,為回應來自裝置30之 一使用者的聽覺資訊、指令或命令,話筒29提供語音信 號,其係由A/D轉換器3 7數位化。語音識別程式能夠在 數位化語音信號上執行正規化和/或特徵抽取功能,以獲得 中間語音識別結果。使用無線收發器5 2或溝通介面6 0, 語音資料能夠被傳遞至將在下文中討論並以第6圖的結構 說明的一遠端識別伺服器204。而後回傳識別結果至行動 裝置3 0,以在其上呈現(例如,視覺者和/或聽覺者),和最 終傳輸至一網頁伺服器202(第6圖),其中以客戶端/伺服 器關係操作該網頁伺服器202和行動的裝置3 0。 能夠把類似處理用於其他形式的輸入。例如,手寫入 輸入可以在裝置 30上以預先處理或不預先處理而數位 化。如同語音資料,此類形式之輸入可以被傳輸至識別伺 服器2 0 4,以用於識別,其中識別結果被回傳到裝置3 0和 /或網頁伺服器202之至少一者。同樣地,DTMF資料、手 勢資料和視覺性資料能夠同樣地被處理。依據輸入的形 式,裝置30(和將在下文中討論的其他客戶端形式)將包括 12 Γ376681 例如照相機的必要硬體作視覺輸入。 第4圖是一個可攜式電話8 0之例示性實施例的平面視 圖。該電話80包括一顯示器82和袖珍鍵盤84。通常,第 3圖的方塊圖適用於第4圖的電話,雖然可能需要執行其 他功能所必需的附加電路系統。例如,第3圖的實施例需 要一個作為電話所必需的收發器;然而,此類電路系統並 不適用於本發明。 除在上述的可攜式或行動計算裝置以外,亦應理解本 發明能夠用於許多其他計算裝置,例如,一般桌上型電腦。 例如,當其他傳統輸入裝置(例如,一個完全阿爾法數字的 鍵盤)太難於操作時,本發明允許使用者以有限的實體能力 輸入或鍵入文字到電腦裡。 本發明亦可操作於各種其他一般目的或特別目的的計 算系統、環境或設定。可能適於使用本發之習知的計算系 統、環境、和/或設定之示例包含但不侷限於常規電話(沒 有螢幕)、個人電腦、伺服器電腦、手持式或膝上式裝置、 平板式電腦、多處理器系統、微處理器基礎的系統、機上 盒、可程式消費性電子產品、包含任何上述系統或裝置之 分散式計算環境,及其他類似者。 下文中,在第5圖概述一般目的電腦120。然而,電 腦1 20亦是一合適計算環境的示例並非就發明功能或使用 範圍設下任何限制。該電腦120不該視為有任何相依或需 要關聯於其中所述之元件的結合或任一者。 可以使用由一電腦執行之電腦可執行指令(例如,程式 13 1376681 模組)的一般文字描述本發明》通常,程式模組包括常式、 程式、物件、元件、資料結構、等等’其執行特定任務或 實作特定抽象資料類型。本發明亦可實施於分散式計鼻環 境,其中由遠端處理裝置執行任務,該遠端處理裝置係藉 由溝通網路連接。在一分散式計算環境中’程式模組可能 位於本地端和遠端的電腦儲存媒體中,其包括記憶儲存裝 置。由程式執行的任務和模組係以圖示之輔助描述於下文 中。那些熟知該項技藝者能夠實作該敘述及圖示為處理器 可執行指令,其無夠以任何形式寫入一電腦可讀媒體。 參考第5圖,電腦120的元件可能包括,但不偈限於 一處理單元1 4 0、〆系統記憶體1 5 0及一系統匯流排1 4 1, 其耦接各種系統元件包括系統記憶體至處理單元1 40 °系 統匯流排1 4 1可以是任何若干種類的匯流排結構’包括一 記憶體匯流排或記憶體管理器、一週邊匯流排、和使用許 多匯流排結構的任一者之一本地匯流排。舉一示例而非限 制,此類結構包括工業標準結構(IS A)匯流排、通用序列匯 流排(USB)、微通道結構(MCA)匯流排、加強ISA(EISA)匯 流排、視訊電子標準協會(VESA)本地端匯流排、及也稱作 多層構架(Mezzanine)匯流排之週邊元件連接(PCI)匯流 排。電腦1 20通常包括許多電腦可讀媒體。電腦可讀媒體 可能是任何可用的媒體,其可由電腦丨2〇存取並且包括揮 發性和非揮發性媒體’和可移除式和不可移除式媒體。舉 一示例而非限制,電腦可讀媒體可能包括電腦儲存媒體和 溝通媒體。電腦儲存媒體包括揮發性和非揮發性可移除 14 υ-/0()81 式和不可移除式媒體,其以任彳 任竹方法或技術實作,用於資 訊之貯存,例如電腦可讀指合 M7 、身料結構、程式模組或其 他的資料。電腦儲存媒體包括作 υ促1-不侷限於RAM、ROM、 EEPROM、快閃記憶體或其他印格 ^ 把·疋憶體技術、CD-ROM、數位 影音光碟(DVD)或其他的光磾儲 70 ’保存器、磁卡式盒、磁帶、 磁碟儲存或其他的磁性儲存步番 I®•’或能夠用來儲存所欲資 訊以及能夠被電腦120存取之杯和1_甘l 疋任何其他媒體。 溝通媒體通常使用電腦可讀# „ %卿J项才曰令、資料結構、程式模 組或在一調制資料信號中的立 J '、他的資料,例如,一載波或 其他的傳輸機制,以及包括任佃咨 仕何資訊傳遞媒體。術語「調 制資料信號」意指具有一戎P^ ,次更多它的特徵,其以設定或改 變之方式將訊息編譯於信號中。叛 _ r 舉一不例而非限制,溝通 媒體包括有線媒體(例如’有蝮姻致十古k 另深洞路或直接連線連結)以及 無線媒體(例如,聲音、FR、紅外線及其他無線媒體)。上 述任何者之結合亦應包含在電腦可讀媒體的範圍之内。 系統記憶體150包括揮發性和/或非揮發性的記憶體 形式之電腦健存媒冑’例如’唯讀記憶(R0M)151和隨機 存取記憶(RAM)152。一個基本輸入/輸出系統 153(BI〇S)(含有幫助在電腦元件之間傳送資訊的基本常 式,例如在起動階段)通常係儲存在r〇m 151。ram ι52 通常含有可立即存取和/或可由處理單元14〇立即操作的 資料和/或私式模組。舉一示例而非限制,第5圖說明作業 系統154、應用程式155、其他程式模組156、和程式資料 157 〇 15 1376681 電腦120也可能包括其他可移除/不可移除的揮發性/ 非揮發性電腦儲存媒體。僅為示例,第5圖說明一硬碟機 161,其讀取自或寫入不可移除的、非揮發性磁性媒體中; 一磁碟機 171,其讀取自或寫入一可移除、非揮發性磁碟 172;和一光碟機175,其讀取自或寫入一可移除的、非揮 發性光碟176,例如,一 CD ROM或其他的光學媒體。其 他的可移除/不可移除、揮發性/非揮發性電腦儲存媒體(其 可用於示例性的操作環境,但無限制)包含卡帶卡式盒、快 閃記憶卡、數位影音光碟、數位視訊帶、固態RAM、固態 ROM等等。硬碟機161通常藉由不可移除的記憶體介面(例 如,介面1 60)連接到系統匯流排1 4 1,而磁碟機1 7 1和光 碟機1 75通常藉由可移除記憶體介面(例如介面1 70)連接 到系統匯流排1 4 1上。 上文所討論的並以第5圖說明的相關的電腦儲存媒體 為電腦1 2 0提供電腦可讀指令、資料結構、程式模組的其 他的資料的儲存。在第5圖,例如,圖示硬碟機161儲存 作業系統1 64、應用程式1 65、其他程式模組1 66、和程式 資料 1 6 7。特別說明的是,這些元件可能相同或不同於作 業系統154、應用程式155、其他程式模組156、和程式資 料1 5 7。作業系統1 6 4、應用程式1 6 5、其他程式模組1 6 6、 和程式資料1 6 7在這裡被給定不同的號碼,以至少說明它 們是不同的。 一使用者可能藉由例如鍵盤1 8 2、話筒1 8 3及指向裝 置181(如滑鼠,軌跡球或觸控盤)的輸入裝置輸入命令和 16 Γ376681 資訊到電腦120裡。其他輸入裝置(未見於圖示)可能包括 操縱桿、遊戲墊、衛星碟、掃描器、或其他類似者。這些 和其他的輸入裝置經常藉由使用者輸入介面180連接至處 理單元1 4 0,又使用者輸入介面1 8 0係連接至系統匯流排 但是可能由其他介面和匯流排結構連接,例如,平行埠、 遊戲埠或一通用序列匯流排(USB )。一監視器1 84或其他 類型的顯示裝置亦藉由一介面(例如,一視訊介面 185)連 接至系統匯流排 1 41。除監視器以外,電腦也可能包括例 如擴音器187和印表機186的其他週邊輸出裝置,其可能 藉由一輸出週邊介面188連接。 電腦120可能在使用邏輯連結連接至一或更多遠端電 腦之網路環境中操作,例如遠端電腦 1 94。遠端電腦1 94 可以是個人電腦、手持裝置、伺服器、路由器、網路電腦、 一點裝置或其他普通的網路節點,和通常包括上述與個人 電腦120相關之許多或所有元件。第5圖圖示的邏輯連接 包括區域網路(LAN) 191 和廣域網路(WAN) 193,但是也可 能包括其他網路。此類網路環境常見於辦公室、企業級電 腦網路、内部網路及網際網路。 當用於一 LAN網路裱境時,電腦1 20係藉由一個網路 介面或接合器190連接至LAN191 。當用於一個WAN網 路環境時,電腦 120通常包括數據機 192或其他用以在 WAN193上建立溝通的工具,如網際網路。數據機192(可 以是内部或外部的)可能藉由使用者輸入介面180或其他 適當機制連接至系統匯流排 1 4 1。在一網路環境中,所述 17 =电腦⑶或其部分相關之程式模 傑存裝置中1 -示例而非限制,第 194上的遠端應用程式195。人們將 " 連接是例示性的,亦可使用在:::*,“ 他工具。 使用在電腦之間建立淳 200,盆為土政 啊只丞规的識別及資 202 明之一示例。一般而言,儲存 中的資訊可以藉由例如行動裝 代表其他形式的計算裝…旦有依給或電 替 罝,、’、虿依輸入形 愛綦、麥克風、照相機、觸控盤等等)之客戶 或藉由其中資訊是以聽覺要求之電話80’ , 產生之音調以回應音調之降低及其中來自網 之資訊只以語音傳回給使用者。 你战π他例干,結構200是統—的,不論 戶端1 〇〇或使用語音識別由電話8〇獲得資訊, 伺服器204能夠支援操作的任一模 呀式。此外, 操作係使用公知的標記語言之撼 、彍充(例如 XHTML、cHTML、XML、WML、楚 &、 I # )。因此 服器202上储存的資訊也能夠藉由以μ、+.诚μ 11:1从上述標記 之公知圖形使用者介面(GUI)方法存取。藉由使 記語言的擴充,在網頁伺服器202上編輯更加 存在的其他應用也易於修改以包括聲音識別。 一般而言,客戶端100執行HTML網頁 者,通常如206所指示者,其係由網頁伺服器 在遠端記憶 在遠端電腦 所示的網路 通連結的其 截取之結構 網頁伺服器 12〇(本文中 所需之顯示 100存取, I由電話 80 伺服器202 是否藉由客 一單一識別 結構200之 1 HTML ' ,在網頁伺 語言為基礎 用公知的標 容易,目前 腳本或類似 2 02以瀏覽 18 Γ376681 器提 能是 戶端 之指 由客 語言 其中 希望 如果 1 00 者介 至網 網頁 伺服 指的 實體 服器 中於 複雜 網路 服器 能夠 中, 供°當需要例如語音資料之聲音識別時語音資料(可 數位化的音訊信號或語音特徵,其中音訊信號係由客 1 00預先處理’如上文所述)被以文法或語言模型220 不提供至識別伺服器204以用於語音識別期間(可能 戶端100提供)。選擇性地,語音伺服器204可能包括 模型220。識別伺服器2〇4的執行能夠有許多形式, 之一已陳述如上,但是’通常包括識別器211。如果 或適當的話’提供識別的結果並傳回至客戶端1〇〇。 需要的話’可以使用文字至語音模組222以對客戶端 提供口述的文字。在編輯經過識別和任何圖形化使用 面(如果有使用的話)的資訊時,客戶端1〇〇傳送訊息 頁伺服器202供進一步的處理,並接收進一步的HTML /腳本,如果必要的話。 如第6圖所示,客戶端1 〇 〇、網頁伺服器2 〇 2和識別 器204 —般藉由網路205相連及分別尋址,本發明中 是廣域網路如網際網路。因此,任何上述裝置不需要 上相鄰接。尤其是網頁伺服器202不需要包括識別伺 204»依照該方法,在網頁伺服器202的編輯能夠集 應用,而希望它不需要編輯者知道識別伺服器204的 事物。最好是,識別伺服器204可獨立設計和連接至 205,從而不需要進一步變化就能更新和改進網頁伺 202。網頁伺服器202也能夠包括一個編輯機制,其 動態地產生客戶端標記和腳本。在一進一步的實施例 網頁伺服器202、識別伺服器204和客戶端1〇〇可能 19 1376681 依據實作機器的能力而結合β例如,如果該客戶端1〇〇包 括—般目的電腦,例如一個人電腦,客戶端可能包括該識 别伺服器204。同樣地,如果需要的話,網頁伺服器2〇2 和識別伺服器204能夠被整合到一單一機器裡。 藉由電話80對網頁词服器202之存取包括電話到 有線或無線電話網路208的連接,依序是,連接電話8〇 到第三者閘道器210。閘道器210連接電話8〇到電話聲音 割覽器212。電話聲音瀏覽器212包括一媒體伺服器214, 其提供一電話介面和聲音瀏覽器216。例如客戶端1〇〇,電 話聲音劉覽器212自網頁伺服器202接收HTml網頁/腳本 或其他類似者。在一個實施例中,HTML·網頁/腳本之形式 與提供給客戶端100之HTML網頁/腳本類似。依照該方 法’網頁祠服器202不必分別支援客戶端ι〇〇和電話8〇, 或甚至於分別支援標準的GUI客戶端,尚能夠使用普通的 標記語言。此外,例如客戶端1〇〇 ’由電話8〇發送之聽覺 信號的聲音識別係由聲音瀏覽器2丨6經由網路2〇5或經由 專線207(例如’使用TCP/IP)提供給識別伺服器2〇4。網 頁伺服器202識別伺服器204和電話聲音劉覽器212能夠 實施於任何合適的計算環境(例如,—般目的桌上型電 腦),如第5圖所示。 在系統1 0中具有上述各種環境及結構功能,本文提供 系統10各種元件之更詳盡叙述及功能。第7圖說明語音識 別和理解模組1 4的方塊圖。從語音介面模組1 2得到的輸 入語音被送到語音識別和理解模組1 4。語音識別和理解模 20 1376681 組1 4包括一個識別引擎3 Ο 6,其具有一個相關的語言模型 310。當接收到輸入時,識別引擎306使用語言模型310 以識別可能的表面語意結構,以表示來自輸入之每一片 語,提供部分語意分析或物件。與系統不同的是,等待使 用者完成表示從而處理接收到的完成輸入,模組14只依據 目前所接收到的持續提供語意物件。 識別引擎306提供至少一個基於部分表示之表面語意 輸出物件。在一些實施例中,識別引擎3 0 6能夠為每一個 選擇結構提供多於一個選擇表面語意物件。 儘管已第7圖中說明其提供語音輸入,本發明亦能夠 用於手寫識別、手勢識別或圖形使用者介面(其使用者使用 鍵盤或其他輸入裝置與其互動)。在這些其他實施例中,一 如在該項技藝中眾所周知的,用一個合適的識別引擎代替 語音識別器306。對於圖形使用者介面,一個文法器(其具 有語言模型),例如,藉由一輸入盒而與使用者輸入相關。 據此,一使用者輸入之處理係藉由一個一致的方法,而不 需因為輸入模式而大幅修正。 如上所述之互動式對話也包括使用SALT(語音應用語 言標記)或其他語音、手寫及型態識別APIs(應用程式介面) 實作,基於部分語意分析或物件,由系統1 0回饋的其他型 式之資訊,該些識別APIs支援一個語言模型架構,其能夠 基於一選定企劃提供語意資訊以用於一給定的應用和語意 物件同步解譯。SALT是一個建構標準,用於,例如,從 個人電腦、電話、平板電腦和無線行動裝置存取資訊、應 21 1376681 用和網頁服務。但是,也能夠用於應用介面而不需與一網 路互相連接。SALT擴充,例如,HTML、XHTML和XML 的既有標記語5 » SALT1.0的規格可以在http://www.SALTfomm.org 找到。應該法意的是SALT能夠依據使用者輸入提供語意 資訊,例如從語音伺服器204 ,其中在表示完成以後,此 類Μ訊形成提供給資料呈現模組16的物件;然而如下所 述此夠以不預先考慮的模式使用SALT ,以提供部分語 意刀析或物件。使用SALT擴充、或在其他的類似擴 充,以支援高度互動式事件驅動的使用者互動。 在此舉出使用SALT之一示例,salt 物件能用 以執行語音識別和理解任務。這是因為檢視點及公式之設 計將語音理解視為型態識別問題,如同語音識別一般。兩 者皆致力於自可能結果之集合找出一型態。對於語音識 別’部尋找的模式是一串文字,然而對於理解而言,卻是 一 意物件樹。_值姑·立. S識別任務以一個語言模型在編 寫可能的文字字串時,指導尋找程序。在一個類似樣式中, 一語音理解任務能夠導引相同的搜尋弓!擎,以用—個語意 模型:寫合適的語意物件樹。例如-個語言模型,其經常 意味者-專門詞索和從該專門詞棄項目編寫片語片斷的規 則’一個語意模型意味著土 耆斤有》口思物件的一辭典和編寫它 們的規則。識別結果是一 語意物件樹。 _個文子子串時’理解結果則是, 雖然有可能延伸N'gram以回傳-個結構化的尋找結 果,大多數典划的注立 !的。。曰理解應用係基於機率上下文無關文 22 1376681 而 則 部 語 的
法(PCFG),其中設計者能夠規定編寫語意物件的規則, 無需大量的樹庫(tree-bank)註解訓練資料。指定此類規 的一種方法使每一 P CFG規則與指引搜尋引擎如何轉換 分P C F G分析樹為語意物件樹的產生指示有關。在微軟 音應用介面(SAPI)(其亦是能夠用於本發明的語音 API 一示例)所載的一示例,其格式顯示如下: <rule name="nyc"> <list> <phrase>new york ?city</phrase> <phrase>?the big apple</phrase> <output> 〈city location〉 <city>New York</city> <state>New York</state> <country>USA</country> </city_location> 〈/output〉 </rule> <rule name=’’NewMeeting’’> <ruleref min="0" name=,,CarrierPhrase"/> <ruleref max=,,inf" name="ApptProperty"/> 23 1376681 <output> <NewMeeting> <DateTime> <xsl:apply-templates select=,7/Date”/> <xsl:apply-templates select=”//Timen/> <xsl:apply-templates select=’’//Duration”/> </DateTime> <Invitees> <xsl:apply-templates select=5V/Person"/> </Invitees> </NewMeeting> </output> </rule> <rule name=nApptProperty"/> <list> 〈ruleref name=’’Date’’/> <ruleref name=”Duration’7> <ruleref Tiame=’’Time 丨’/> <ruleref name=55Person" max==5,inf7/> <ruleref name=MApptSubjectn/> 24 Γ376681 </rule> 這文法部分包含三種規則。第一個 勺市的名稱。該例中的<01^卩1^>標 ’前端名字"nyc"列出 籤包圍用於建構語意 件的規則。當 則呼叫它們。 時’則產生一 搜尋路徑存在著由標 記所標示之文法節點
在這種情況下,當搜尋路徑存在著"nyc"規 适意物件(用<city_l〇cati〇n>元件以xML 不)。該語意物件依序由三個語意物件:城市名、州和國 縮寫所組成。 "α意物件的組成也可能是一個動態程序,例如,安 新會議。例如’當使用者完成指定例如日期(date)、時 (time)、持續時間(durati〇n)及參加者(attendees)的會議 質時’將產生一個NewMeeting語意物件。能夠用樣板 其他語意物件作為元件貼入NewMeeting語意物件裡。 能夠把相同的原理應用於本文中未記述的其他規則。舉 示例’ 一表示「安排與Li Deng和Alex Acero為時一 時的會議於1月1曰"將產生下文中的語意物件: 紐 物 j 則 表 名 排 間 性 將 也 小 <NewMeeting> <DateTime> <Date>01/01/2003</Date> <Duration>3600</Duration> 25 Γ376681 </DateTime> <Invitees> <Person>Li Deng</Person> <Person>Alex Acero</Person> 〈/Invitees〉 </NewMeeting> 在實際的應用中,改進 PCFG範 務。因此,除此之外,想要能夠使用Τ' 能性片語,其未載有重要的語意資訊但 具有可調整大小的變化(例如,「我可以 我…」、「請告訴我」)。在一個實施例 包括一個語意語言模型,其結合PCFG 略異於一統一語言模型,其亦可使用。 傳統類別N-gram的自然延伸,除了它j 模型化為一個別標記之 CFG部分(而 單)。識別器3 0 6使用該模型仍然產生必 的文字字串。統一的語言模型被設計為 學結構以幫助文字轉譯。 另一方面,語意語言模型意之目的 識別器來找尋語意結構(其通常較易由 此,相反於在N-gram裡嵌入CFG部分 應於一 N-gram關係之特別PCFG前端 N-gram。在微軟SAPI文法格式中,可以ΐ 圍是令人氣餒的任 丨-gram去模型化功 通常在語法結構上 ...」、「你可以告訴 中,語言模型 3 1 0 與N-gram。該技術 該統一語言模型係 L許欲在N-gram中 非只是一個文字清 須在之後文法分析 整合包含某種語言 在於使用解碼器或 PCFG所截取)。因 ,藉由產生一個對 ,用 PCFG來包含 3 — XML<citation> 26 Γ376681 標籤來標示,如同
LCFG〈dictation max=" inf"/> RCFG 其中,LCFG和RCFG分別標示嵌入N-gram的内容的左邊 和右邊。如果進入一正常非終端的話,搜尋程序視 〈dictation〉標籤為一標記並擴展為 N-gram。標籤上 的’’max”屬性指定可被N-gram消耗的文字最大數量。在 N-gram之内,藉由以PCFG修改後退(backoff)N-gram計算 文字字串機率,尤其是, P(w„ | w„.i, w /ί-2 5 * · * )=XP(w „.i\Ngram, wn.\, w„.2,...) + {\-X)P{wn I RCFG)P{RCFG \ wn.x, wn.2,...) (1) 其中 λ是 N-gram修改權重,而 P(PCFG I Wn-丨,...)使用 N-gram的後退機率,即,wn被視為如同它是詞彙文字的 結果。在一實施例中,依據是否已經達到最大N-gram文 字字串大小,及該文字是否在CFG的範圍内,設定術語 P(wn | RCFG)為二元值。因為來自PCFG的文字通常具有 一較高的機率,實際上屬於被CFG涵蓋的範圍之路徑傾向 於獲得它們的N-gram配對,即便當最大N-gram文字計數 被設定為無限。除了程式化片語,嵌入的N-gram亦可用 於具有一口述類屬性之模型化語意物件。例如,會議物件 是我們任務的模型 <rule name = " ApptSubj ect"> <p> 〈dictation max = ’’inf"/> </p> 27 1376681 在"Semantic modeling for dialog systems in a pattern recognition frame work" (Proc. ASRU-2001, Trento Italy, 2 001)中,K. Wang詳述了語意語言模型,其中將該文獻與 本文併呈於上。 本發明的進一步態樣包含SALT list物件的新用法。 SALT提供一套XML元件,其具有相關的屬性和d〇M物 件性質、事件和方法,可與來源標記文件一起應用一語音 介面於一來源網頁。一般而言,該主要元件包含: <prompt...>用於語音合成結構和提示播放 〈listen .··>用於語音識別器設定’識別執行和後處理 及記錄 <dtmf .··>用於DTMF的設定和控制 <smex ...>用於與平台元件之一般目的溝通 該listen和dtmf物件亦包含gramniar及bind控制: 〈grammar ···>用於指定輸入文法資源。 <bind ·.·>用於處理識別結果。 1 i s t e η元件能夠包括一 "m 〇 d e"屬性以識別三種模式之 識別’其指導識別伺服器(例如,204)如何並且何時回傳結 果。結果的回傳意味著提供,,onReco”事件或,,凝固"適當地 啟動"bind"元件。 在一第一模式t ,"automatic”(語音平台,而非應用) 控制何時停止識別程序。該模式已提供給電話或免手持領 域。一旦獲得識別結果,和/或在一個時期的靜默過後,語 28 音平台自勒I H - 助地停止識別器並回傳它的結果,其能夠藉由 bind元件與摘a '週§欄位關聯。 在操作的第二模式中,"single" ’ 一識別結果的回傳係 由明確的”,, Ρ呼叫所控制。該stop呼叫對應於例如使用 者的"p e n - Ή η丨丨*·,. ρ寧件’並且該模式被用於多模式環境,其中 的裝置允哞往_ Α Α ° m η輪入。但是,使用者通常藉由例如尖筆3.3 的使用(第]阁、 、斤1圖),控制何者及何時選擇欄位。 "Β識別益操作的一第三模式是"multiple mode"。該 操作模式传© # 、你用於—"open-microphone"或在口述方面。一般 而。’在該操作模式中’每隔—段間隔回傳識別結果直到 接到明綠的St〇p呼叫,或與未確認輸入或超過聽(listen) 的一個最大時間相關的其他時間超過時。一般而言,在該 操作模式’對確認的每一片語而言,發出一"onReco"事件 並且回傳結果直到接收到stop()呼叫為止。 然而本發明其他態樣的操作模式能夠藉由允許它們只 要超過語言界標立即回報的方式,提供搜尋引擎向使用者 揭示更為互動的能力之方法。基於時間同步解譯的搜尋運 算係為眾人公知並能夠以直接的模式用於該模式。在H.
Ney, S. Ortmanns 的"Dynamic programming search for continuous speech recognition, "(IEEE Signal Processing Magazine, pp. 64-83 , 1 999)描述了 一種此類運算。對於語 音識別而言,通常語言界標與一文字或片語邊界一致。因 此只要它們是可獲得的,就能夠用一 SALT multiple模式 識別來動態地顯示文字字串假設。一個UI效果在許多商 29 Γ376681 業 式 已 對 解 模 把 位 介 入 序 饋 子 圍 結 性 替 對 之 意 元 口述軟體中是常見的,然而,在本發明中, 能夠將語意物件的例子當作語言界標並回報 理解函數的回應,亦以動態模式回到它們上 應用設計者而言,有如SALT正在執行語意 〇 將該操作模式與多模式方面比較更易於理 式方面中,一使用者指示一欄位,例如,藉 該尖筆指向並放置於輸入欄位裡。當該使用 般欄位中並表達一精確的語句以一單一句 ,然而使用者的眼睛和手需要專注於該「鍵 面,這種設計在許多情況下並不適當。此外 並講話」待徵係一豐富回送通道溝通,其在 下顯示處理條及體積,但是就速度和品質而 只對講話語言處理提供非常簡略的線索。對 就更有可能產生問題,其中錯誤可以傳播 ,最終需要花費更多的心力去驗證及校正識 果。因為從可用性研究看來,似乎較長的句 差異因素,其顯示語音的用途並非僅是鍵盤 ,滿足UI體驗對於把語音用作可實行形態 必要的。 為了增進人類-電腦間的感覺,使其成為達 緊密合作仗伴,藉由儘快報告部分語意分析 物件同步理解是有效的。在一實施例中,藉由 件的multiple模式用於SALT可達成。尤其 multiple 模 ,即,提供 的應用。它 物件同步理 解它。在多 由在講話時 者能夠鍵入 填入許多欄 入並講話」 ,雖然「鍵 講話語言程 論,那些回 於較長的句 至較廣的範 別及理解的 子是一關鍵 的加強或代 的成功是絕 成共同目標 或物件,語 把 listen(聽) 是對於已指 30 Γ376681 定一個multiple模式之listen元件並且之後為欲識別之輸 入語音指定的所有識別文法。結果的指派亦是在listen物 件中指定。例如,用以截取必要資訊之HTML輸入程式碼, 例如,日期、時間、位置、標題及會議人員、等等。用以 產生一新的會議可能採取下列型式: 〈listen mode= “multiple"…〉 〈grammar src=”subject.grm"/> 〈grammar src=ndate.grmn/> 〈grammar src=”time—duration·grmn/> 〈grammar src=n’attendees. grmn/> <bind targetElement=f!subject" value=7/ApptSubject’7> <bind targetElement=!tdate" value=n//DateTime"/> <bind targetElement="start time" value=!l//start_time// targetElement=nend time" value=,V/end_time" targetElement==f, duration1' value="//DateTime/duration,V> </listen> 31 1376681 多個文法器以一回到進入點的空值轉變迴圈為識別編 寫一平行搜尋空間。在該模式中,一旦一文法器退出,SALT 允許listen物件產生一事件。當下面的音訊集合和識別正 在進行時,事件分叉出一平行處理,以呼叫序列中的bind 指示,從而當一語音指令仍在對具有欄位的視覺呈現之一 應用敘說時,產生效果給使用者,其填滿表格中相關欄位。 對於免用視覺的應用程式之使用者介面,可能需要伴 隨的語音輸出。在這種情況下,SALT prompt物件可用於 給定立即的回饋。例如,下列的SALT prompt物件可用於 基於資料欄位之動態内容同步回應,而該語音同步化可用 於觸發額外的bind指令如下: <prompt id="say_date"> on〈value targetElement="date”/> </prompt> <listen ...> <bind targetElement"date" value="//date" targetElement="say_date" targetMethod="Start7> </listen> 32 Γ376681 純粹效果是使用者覺得他/她正在與另一人講話,不只 是草草記下,而是重複所聽到的,如同「在下週二(1〇/29 2 0 0 2)兩點(下午兩點開始)持續二小時(期間:二小時)安排 會議(新會議)」’其中在括號内所提供的該句子表示回到使 用者的聽覺和/或視覺提示(其亦被同步化)。 應該注意的是SALT允許設計者連接訂製的識別事件 管理器,其執行精密的計算,超越SALT bind指令的簡單 指派。在上例中,可以在語意文法器完成日期正規化,然 而該語意文法器不能有助於進一步的參考解析(例如,”安 排L i D e n g和他的經理的會議")。在此類例子中,可以實 作計算為可甴適當管理器存取的腳本(script)物件,以存取 用以確認不明確參考的儲存資料。此類計算係敘述於κ· Wang,"A plan based dialog system with probabilistic inferences" Proc. ICSLP-2000, Beijing China, 2000 及歐洲 專利EP 1199630A2,2002年4月24曰公告",在此參照其 全文併呈。 應該注意的是’儘管多模式操作對於listen物件存 在’在現有實作中,該模式只提供接收輸入的文字,例如 在口述方面。然而’在本發明的該態樣中,當接收輸入時 部分結果不僅是文字,而且尚包括屬於文字的對應語意資 訊’並因此該輸出包括部分語意分析或物件,其能夠如上 所述般提供使用者更佳品質回饋,其為電腦能夠適當理解 所接收者。依據接收部分語意分析或物件之應用的精密 33 1376681 度,依據所接收的部分語意分析系統提供確認、選擇、修 正及澄清回給使用者。 雖然已知多模型應用包括多個文法器以允許使用者講 話,及據此有能力提供被指示的資訊,在多種模式操作中 使用listen元件會更好,因為它提供給使用者較高的理解 的指示。在一純語音的應用中,產生一自然形式的對話, 然而如果使用視覺呈現的話,依據使用者目前所提供者之 部分語意分析及當使用者繼續講話時,一應用可以開始處 理(講話動作、顯示過渡結果結果或選擇,例如,經由跳出 式視窗)。 儘管係參照特定實施例描述本發明,習知該項技藝者 將了解任何未背離本發明範圍及精神之形式上及細節上之 改變皆屬本發明之範疇。 【圖式簡單說明】 第1圖是一種資料表示系統的方塊圖。 第2圖是操作環境的一計算裝置的一平面視圖。 第3圖是第2圖計算裝置的一方塊圖。 第4圖是一電話的一平面視圖。 第5圖是一般目的電腦的一方塊圖。 第 6圖是用於一客戶端/服務器系統之一結構的方塊 圖。 第7圖是語音識別和理解的模組的方塊圖。 34 Γ376681 【主要元件符號說明】 10系統 1 2語音介面模組 1 4語音識別及理解模組 1 6應用模組 18資料 20輸出 29麥克風 30元件 32外罩 33尖筆 34顯示器 35按鈕 3 6袖珍鍵盤 37 A/D轉換器 43擴音器
50 CPU 5 2無線收發器 54 RAM記憶體 58 ROM 5 9 D/A轉換器 60溝通介面 80電話 82顯示器 35 Γ376681 84袖珍鍵盤 100客戶端 120電腦 140處理單元 1 4 1系統匯流排 1 5 0系統記憶體
151 ROM
152 RAM 153 BIOS 154作業系统 1 5 5應用程式 1 5 6其他程式模組 1 5 7程式資料 1 6 0不可移除非揮發性記憶體介面 161硬碟機 164作業系統 1 6 5應用程式 166其他程式模組 1 6 7程式資料 1 70可移除非揮發性記憶體介面 171磁碟機 1 7 2可移除非揮發性磁碟 175光碟機 176可移除非揮發性光碟 36 1376681 180使用者輸入介面 181指向裝置 1 82鍵盤 1 83話筒 1 8 4監視器 1 8 5視訊介面 1 8 6印表機 187擴音器 1 88輸出週邊介面 1 9 0網路介面 1 9 1 區域網路 192數據機 1 9 3廣域網路 1 94遠端電腦 195遠端應用程式 200用於網頁基礎的識別及資料截取之結構 202網頁伺服器 204識別伺服器 2 0 5網路 206網頁語音可用控制/樣版 2 0 7專線 208公用電話網路 2 1 0第三者閘道器 2 11識別器 37 Γ376681 212電話聲音瀏覽器 2 1 4媒體伺服器 2 1 6聲音瀏覽器 220語言模型 222語音模組 3 0 6語音識別器 3 1 0語言模型
Claims (1)
- Γ376681 十、申請專利範圍: 1. 一種語音理解系統,包含: 一語言模型,其包含一 N-gram語言模型及一上下 文無關之文法語言模型之組合,該語言模型儲存與欲識 別的文字及語意資訊相關之資訊; 一模組,其適用於自一使用者接收輸入,及截取該 輸入以用於處理,該模組更適用於接收與該輸入的識別 相關的 SALT應用程式介面,該模組可設定以處理該 SALT應用程式介面及該輸入,以確定與一第一部分的 該輸入相關的語意資訊,及藉由存取該語言模型以輸出 一語意物件,其包含該第一部分的文字及語意資訊,其 中該語意物件的識別及輸出之執行係在持續截取該輸 入後續部分時執行。 2. 如申請專利範圍第1項所述之系統,其中該語言模型包 括一統一語言模型。 3. 如申請專利範圍第1項所述之系統,其中該語言模型包 括一語意語言模型。 4. 如申請專利範圍第1、2或3項所述之系統,其中該模 組適用於在一多數模式識別 SALT的一聽(listen)物 件,以在持續截取該輸入的爾後部分時,執行識別和輸 出該語意物件。 5. 如申請專利範圍第4項所述之系統,其中該模組適用於 識別文法物件,以定義該語言模型的一搜尋空間。 39 1376681 6. 如申請專利範圍第1、2或3項所述之系統,其中 組適用於識別文法物件,以定義該語言模型的一搜 間。 7. 一種包含電腦裝置可讀指令之電腦可讀取媒體,當 時使該電腦裝置藉由執行下列步驟控制資訊,包招 接收來自一使用者的輸入,及截取該輸入用 理; 接收S ALT應用程式介面,以識別一語言模型 行識別及理解,該語言模型適用於提供所識別的輸 字,及該接收的輸入之語意資訊; 藉由存取該語言模型處理該輸入,以對該輸入 識別,以確定與該輸入的一第一部分相關之語意賀 以及輸出一語意物件,其包含該識別的輸入的文字 該第一部分的語意資訊,其中該語意物件的識別及 之執行係在持續截取該輸入爾後部分時執行。 8. 如申請專利範圍第7項所述之電腦可讀取媒體,其 理包括在一多數模式中識別SALT的一聽物件,以 續截取該輸入爾後部分時,執行識別和輸出該語 件。 9. 如申請專利範圍第8項所述之電腦可讀取媒體,其 收SALT應用程式界面包括識別文法物件,以定義 言模型的一搜尋空間。 10. 如申請專利範圍第7項所述之電腦可讀取媒體,其 該模 尋空 實作 於處 以執 入文 執行 訊, ,及 輸出 中處 在持 意物 中接 該語 中接 40 1376681 收S A LT應用程式界面包括識別文法物件,以定義該語 言模型的搜尋空間。 41
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/448,018 US7200559B2 (en) | 2003-05-29 | 2003-05-29 | Semantic object synchronous understanding implemented with speech application language tags |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200515369A TW200515369A (en) | 2005-05-01 |
TWI376681B true TWI376681B (en) | 2012-11-11 |
Family
ID=33131605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW093114299A TWI376681B (en) | 2003-05-29 | 2004-05-20 | Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon |
Country Status (16)
Country | Link |
---|---|
US (1) | US7200559B2 (zh) |
EP (2) | EP1482481B1 (zh) |
JP (1) | JP4768970B2 (zh) |
KR (1) | KR101042119B1 (zh) |
CN (1) | CN100578614C (zh) |
AT (1) | ATE398325T1 (zh) |
AU (1) | AU2004201992B2 (zh) |
BR (1) | BRPI0401850B1 (zh) |
CA (1) | CA2467220C (zh) |
DE (1) | DE602004014316D1 (zh) |
HK (1) | HK1071466A1 (zh) |
MX (1) | MXPA04005122A (zh) |
MY (1) | MY142974A (zh) |
RU (1) | RU2349969C2 (zh) |
TW (1) | TWI376681B (zh) |
ZA (1) | ZA200403492B (zh) |
Families Citing this family (250)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6630800A (en) * | 1999-08-13 | 2001-03-13 | Pixo, Inc. | Methods and apparatuses for display and traversing of links in page character array |
US8645137B2 (en) * | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US20110267263A1 (en) | 2000-07-17 | 2011-11-03 | Microsoft Corporation | Changing input tolerances based on device movement |
US7249018B2 (en) * | 2001-01-12 | 2007-07-24 | International Business Machines Corporation | System and method for relating syntax and semantics for a conversational speech application |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US20080313282A1 (en) | 2002-09-10 | 2008-12-18 | Warila Bruce W | User interface, operating system and architecture |
US7386449B2 (en) * | 2002-12-11 | 2008-06-10 | Voice Enabling Systems Technology Inc. | Knowledge-based flexible natural speech dialogue system |
US7426329B2 (en) | 2003-03-06 | 2008-09-16 | Microsoft Corporation | Systems and methods for receiving, storing, and rendering digital video, music, and pictures on a personal media player |
US7669134B1 (en) * | 2003-05-02 | 2010-02-23 | Apple Inc. | Method and apparatus for displaying information during an instant messaging session |
US7966188B2 (en) * | 2003-05-20 | 2011-06-21 | Nuance Communications, Inc. | Method of enhancing voice interactions using visual messages |
US8301436B2 (en) * | 2003-05-29 | 2012-10-30 | Microsoft Corporation | Semantic object synchronous understanding for highly interactive interface |
US7532196B2 (en) * | 2003-10-30 | 2009-05-12 | Microsoft Corporation | Distributed sensing techniques for mobile devices |
US7739117B2 (en) * | 2004-09-20 | 2010-06-15 | International Business Machines Corporation | Method and system for voice-enabled autofill |
US20060155530A1 (en) * | 2004-12-14 | 2006-07-13 | International Business Machines Corporation | Method and apparatus for generation of text documents |
TWI276046B (en) * | 2005-02-18 | 2007-03-11 | Delta Electronics Inc | Distributed language processing system and method of transmitting medium information therefore |
US20060247925A1 (en) * | 2005-04-27 | 2006-11-02 | International Business Machines Corporation | Virtual push-to-talk |
US20060277525A1 (en) * | 2005-06-06 | 2006-12-07 | Microsoft Corporation | Lexical, grammatical, and semantic inference mechanisms |
JP4733436B2 (ja) * | 2005-06-07 | 2011-07-27 | 日本電信電話株式会社 | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US7636794B2 (en) | 2005-10-31 | 2009-12-22 | Microsoft Corporation | Distributed sensing techniques for mobile devices |
US7817991B2 (en) * | 2006-02-14 | 2010-10-19 | Microsoft Corporation | Dynamic interconnection of mobile devices |
US7865357B2 (en) * | 2006-03-14 | 2011-01-04 | Microsoft Corporation | Shareable filler model for grammar authoring |
US7752152B2 (en) * | 2006-03-17 | 2010-07-06 | Microsoft Corporation | Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling |
US8032375B2 (en) * | 2006-03-17 | 2011-10-04 | Microsoft Corporation | Using generic predictive models for slot values in language modeling |
US20070239453A1 (en) * | 2006-04-06 | 2007-10-11 | Microsoft Corporation | Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances |
US7689420B2 (en) * | 2006-04-06 | 2010-03-30 | Microsoft Corporation | Personalizing a context-free grammar using a dictation language model |
US7797672B2 (en) * | 2006-05-30 | 2010-09-14 | Motorola, Inc. | Statechart generation using frames |
US7505951B2 (en) * | 2006-05-30 | 2009-03-17 | Motorola, Inc. | Hierarchical state machine generation for interaction management using goal specifications |
US7493293B2 (en) * | 2006-05-31 | 2009-02-17 | International Business Machines Corporation | System and method for extracting entities of interest from text using n-gram models |
US8140267B2 (en) * | 2006-06-30 | 2012-03-20 | International Business Machines Corporation | System and method for identifying similar molecules |
US8346555B2 (en) * | 2006-08-22 | 2013-01-01 | Nuance Communications, Inc. | Automatic grammar tuning using statistical language model generation |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8019590B1 (en) | 2006-09-11 | 2011-09-13 | WordRake Holdings, LLC | Computer processes for analyzing and improving document readability |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US8515733B2 (en) * | 2006-10-18 | 2013-08-20 | Calculemus B.V. | Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language |
ES2302640B1 (es) * | 2006-12-21 | 2009-05-21 | Juan Jose Bermudez Perez | Sistema para la interaccion mediante voz en paginas web. |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US7912828B2 (en) * | 2007-02-23 | 2011-03-22 | Apple Inc. | Pattern searching methods and apparatuses |
US8977255B2 (en) * | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
ITFI20070177A1 (it) | 2007-07-26 | 2009-01-27 | Riccardo Vieri | Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento. |
US8074199B2 (en) * | 2007-09-24 | 2011-12-06 | Microsoft Corporation | Unified messaging state machine |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8595642B1 (en) | 2007-10-04 | 2013-11-26 | Great Northern Research, LLC | Multiple shell multi faceted graphical user interface |
US8364694B2 (en) | 2007-10-26 | 2013-01-29 | Apple Inc. | Search assistant for digital media assets |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US8370160B2 (en) * | 2007-12-31 | 2013-02-05 | Motorola Mobility Llc | Methods and apparatus for implementing distributed multi-modal applications |
US8386260B2 (en) * | 2007-12-31 | 2013-02-26 | Motorola Mobility Llc | Methods and apparatus for implementing distributed multi-modal applications |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8327272B2 (en) | 2008-01-06 | 2012-12-04 | Apple Inc. | Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8289283B2 (en) | 2008-03-04 | 2012-10-16 | Apple Inc. | Language input interface on a device |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US20100082328A1 (en) * | 2008-09-29 | 2010-04-01 | Apple Inc. | Systems and methods for speech preprocessing in text to speech synthesis |
US8396714B2 (en) * | 2008-09-29 | 2013-03-12 | Apple Inc. | Systems and methods for concatenation of words in text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8352268B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8352272B2 (en) * | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US8355919B2 (en) * | 2008-09-29 | 2013-01-15 | Apple Inc. | Systems and methods for text normalization for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8380507B2 (en) * | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
GB0905457D0 (en) | 2009-03-30 | 2009-05-13 | Touchtype Ltd | System and method for inputting text into electronic devices |
US9424246B2 (en) | 2009-03-30 | 2016-08-23 | Touchtype Ltd. | System and method for inputting text into electronic devices |
US10191654B2 (en) | 2009-03-30 | 2019-01-29 | Touchtype Limited | System and method for inputting text into electronic devices |
US9189472B2 (en) | 2009-03-30 | 2015-11-17 | Touchtype Limited | System and method for inputting text into small screen devices |
GB0917753D0 (en) | 2009-10-09 | 2009-11-25 | Touchtype Ltd | System and method for inputting text into electronic devices |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US8412531B2 (en) * | 2009-06-10 | 2013-04-02 | Microsoft Corporation | Touch anywhere to speak |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20110010179A1 (en) * | 2009-07-13 | 2011-01-13 | Naik Devang K | Voice synthesis and processing |
KR20110036385A (ko) * | 2009-10-01 | 2011-04-07 | 삼성전자주식회사 | 사용자 의도 분석 장치 및 방법 |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8311838B2 (en) * | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8977584B2 (en) | 2010-01-25 | 2015-03-10 | Newvaluexchange Global Ai Llp | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US9104670B2 (en) | 2010-07-21 | 2015-08-11 | Apple Inc. | Customized search or acquisition of digital media assets |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
TWI423044B (zh) * | 2010-10-25 | 2014-01-11 | Univ Nat Taiwan Science Tech | 基於普及運算的意見交流方法與系統 |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US20120265784A1 (en) * | 2011-04-15 | 2012-10-18 | Microsoft Corporation | Ordering semantic query formulation suggestions |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
WO2013116461A1 (en) * | 2012-02-03 | 2013-08-08 | Kextil, Llc | Systems and methods for voice-guided operations |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US9294539B2 (en) | 2013-03-14 | 2016-03-22 | Microsoft Technology Licensing, Llc | Cooperative federation of digital devices via proxemics and device micro-mobility |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US11151899B2 (en) | 2013-03-15 | 2021-10-19 | Apple Inc. | User training by intelligent digital assistant |
US10078487B2 (en) | 2013-03-15 | 2018-09-18 | Apple Inc. | Context-sensitive handling of interruptions |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101959188B1 (ko) | 2013-06-09 | 2019-07-02 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
US9437186B1 (en) * | 2013-06-19 | 2016-09-06 | Amazon Technologies, Inc. | Enhanced endpoint detection for speech recognition |
US9123336B1 (en) * | 2013-06-25 | 2015-09-01 | Google Inc. | Learning parsing rules and argument identification from crowdsourcing of proposed command inputs |
US9026431B1 (en) * | 2013-07-30 | 2015-05-05 | Google Inc. | Semantic parsing with multiple parsers |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US9495359B1 (en) | 2013-08-21 | 2016-11-15 | Athena Ann Smyros | Textual geographical location processing |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US8868409B1 (en) | 2014-01-16 | 2014-10-21 | Google Inc. | Evaluating transcriptions with a semantic parser |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9747896B2 (en) | 2014-10-15 | 2017-08-29 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9836527B2 (en) * | 2016-02-24 | 2017-12-05 | Google Llc | Customized query-action mappings for an offline grammar model |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
GB201610984D0 (en) | 2016-06-23 | 2016-08-10 | Microsoft Technology Licensing Llc | Suppression of input images |
US10140260B2 (en) * | 2016-07-15 | 2018-11-27 | Sap Se | Intelligent text reduction for graphical interface elements |
US10503808B2 (en) | 2016-07-15 | 2019-12-10 | Sap Se | Time user interface with intelligent text reduction |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
CN107665706B (zh) * | 2016-07-29 | 2021-05-04 | 科大讯飞股份有限公司 | 快速语音交互方法及系统 |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
RU2648572C1 (ru) * | 2017-01-12 | 2018-03-26 | Общество с ограниченной ответственностью "Инвестиционная группа "Коперник" | Алгоритм поиска в компьютерных системах и базах данных |
US10311860B2 (en) * | 2017-02-14 | 2019-06-04 | Google Llc | Language model biasing system |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
TWI640877B (zh) * | 2017-06-14 | 2018-11-11 | 財團法人資訊工業策進會 | 語意分析裝置、方法及其電腦程式產品 |
US11037554B1 (en) * | 2017-09-12 | 2021-06-15 | Wells Fargo Bank, N.A. | Network of domain knowledge based conversational agents |
CN108010525A (zh) * | 2017-12-07 | 2018-05-08 | 横琴七弦琴知识产权服务有限公司 | 一种语音控制智能抽屉系统 |
CN108133701B (zh) * | 2017-12-25 | 2021-11-12 | 江苏木盟智能科技有限公司 | 一种机器人语音交互的系统与方法 |
CN109994105A (zh) * | 2017-12-29 | 2019-07-09 | 宝马股份公司 | 信息输入方法、装置、系统、车辆以及可读存储介质 |
CN108831482A (zh) * | 2018-08-24 | 2018-11-16 | 深圳市云采网络科技有限公司 | 一种基于语音识别搜索电子元器件的方法 |
US11430433B2 (en) | 2019-05-05 | 2022-08-30 | Microsoft Technology Licensing, Llc | Meeting-adapted language model for speech recognition |
CN110379428A (zh) * | 2019-07-16 | 2019-10-25 | 维沃移动通信有限公司 | 一种信息处理方法及终端设备 |
CN110619873A (zh) * | 2019-08-16 | 2019-12-27 | 北京小米移动软件有限公司 | 音频处理方法、装置及存储介质 |
CN113223510B (zh) * | 2020-01-21 | 2022-09-20 | 青岛海尔电冰箱有限公司 | 冰箱及其设备语音交互方法、计算机可读存储介质 |
US12211517B1 (en) | 2021-09-15 | 2025-01-28 | Amazon Technologies, Inc. | Endpointing in speech processing |
Family Cites Families (119)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2981254A (en) * | 1957-11-12 | 1961-04-25 | Edwin G Vanderbilt | Apparatus for the gas deflation of an animal's stomach |
US3657744A (en) * | 1970-05-08 | 1972-04-25 | Univ Minnesota | Method for fixing prosthetic implants in a living body |
US3788327A (en) * | 1971-03-30 | 1974-01-29 | H Donowitz | Surgical implant device |
US3874388A (en) * | 1973-02-12 | 1975-04-01 | Ochsner Med Found Alton | Shunt defect closure system |
US4014318A (en) * | 1973-08-20 | 1977-03-29 | Dockum James M | Circulatory assist device and system |
US4086665A (en) * | 1976-12-16 | 1978-05-02 | Thermo Electron Corporation | Artificial blood conduit |
US4212463A (en) * | 1978-02-17 | 1980-07-15 | Pratt Enoch B | Humane bleeder arrow |
DE3019996A1 (de) * | 1980-05-24 | 1981-12-03 | Institute für Textil- und Faserforschung Stuttgart, 7410 Reutlingen | Hohlorgan |
US4808183A (en) * | 1980-06-03 | 1989-02-28 | University Of Iowa Research Foundation | Voice button prosthesis and method for installing same |
EP0203124B1 (en) * | 1984-11-15 | 1991-06-05 | NAZARI, Stefano | Device for selective bronchial intubation and separate lung ventilation |
ES8705239A1 (es) * | 1984-12-05 | 1987-05-01 | Medinvent Sa | Un dispositivo para implantar,mediante insercion en un lugarde dificil acceso, una protesis sustancialmente tubular y radialmente expandible |
US4759758A (en) * | 1984-12-07 | 1988-07-26 | Shlomo Gabbay | Prosthetic heart valve |
US4831550A (en) | 1986-03-27 | 1989-05-16 | International Business Machines Corporation | Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events |
US4832680A (en) * | 1986-07-03 | 1989-05-23 | C.R. Bard, Inc. | Apparatus for hypodermically implanting a genitourinary prosthesis |
US4795449A (en) * | 1986-08-04 | 1989-01-03 | Hollister Incorporated | Female urinary incontinence device |
US4852568A (en) * | 1987-02-17 | 1989-08-01 | Kensey Nash Corporation | Method and apparatus for sealing an opening in tissue of a living being |
DE3723078A1 (de) | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
DE3821631A1 (de) * | 1987-07-28 | 1989-02-09 | Bader Paul | Verschluss fuer eine maennliche harnroehre |
DE3739681A1 (de) | 1987-11-24 | 1989-06-08 | Philips Patentverwaltung | Verfahren zum bestimmen von anfangs- und endpunkt isoliert gesprochener woerter in einem sprachsignal und anordnung zur durchfuehrung des verfahrens |
US4830003A (en) * | 1988-06-17 | 1989-05-16 | Wolff Rodney G | Compressive stent and delivery system |
JP2710355B2 (ja) * | 1988-09-20 | 1998-02-10 | 日本ゼオン株式会社 | 医用弁装置 |
US4846836A (en) * | 1988-10-03 | 1989-07-11 | Reich Jonathan D | Artificial lower gastrointestinal valve |
DE3834545A1 (de) * | 1988-10-11 | 1990-04-12 | Rau Guenter | Flexibles schliessorgan, insbesondere herzklappe, und verfahren zur herstellung desselben |
EP0474748B1 (en) * | 1989-05-31 | 1995-01-25 | Baxter International Inc. | Biological valvular prosthesis |
US5263117A (en) | 1989-10-26 | 1993-11-16 | International Business Machines Corporation | Method and apparatus for finding the best splits in a decision tree for a language model for a speech recognizer |
DK124690D0 (da) * | 1990-05-18 | 1990-05-18 | Henning Rud Andersen | Klapprotes til implantering i kroppen for erstatning af naturlig klap samt kateter til brug ved implantering af en saadan klapprotese |
US5411552A (en) * | 1990-05-18 | 1995-05-02 | Andersen; Henning R. | Valve prothesis for implantation in the body and a catheter for implanting such valve prothesis |
US5193525A (en) * | 1990-11-30 | 1993-03-16 | Vision Sciences | Antiglare tip in a sheath for an endoscope |
US5116360A (en) * | 1990-12-27 | 1992-05-26 | Corvita Corporation | Mesh composite graft |
US5477451A (en) | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US5123919A (en) * | 1991-11-21 | 1992-06-23 | Carbomedics, Inc. | Combined prosthetic aortic heart valve and vascular graft |
DE69324239T2 (de) * | 1992-01-21 | 1999-11-04 | The Regents Of The University Of Minnesota, Minneapolis | Verschlusseinrichtung eines septumschadens |
US5329887A (en) * | 1992-04-03 | 1994-07-19 | Vision Sciences, Incorporated | Endoscope control assembly with removable control knob/brake assembly |
US5502774A (en) | 1992-06-09 | 1996-03-26 | International Business Machines Corporation | Automatic recognition of a consistent message using multiple complimentary sources of information |
US5382261A (en) * | 1992-09-01 | 1995-01-17 | Expandable Grafts Partnership | Method and apparatus for occluding vessels |
JP3378595B2 (ja) * | 1992-09-30 | 2003-02-17 | 株式会社日立製作所 | 音声対話システムおよびその対話進行制御方法 |
US5409019A (en) * | 1992-10-30 | 1995-04-25 | Wilk; Peter J. | Coronary artery by-pass method |
US5419310A (en) * | 1992-11-03 | 1995-05-30 | Vision Sciences, Inc. | Partially inflated protective endoscope sheath |
US5384892A (en) | 1992-12-31 | 1995-01-24 | Apple Computer, Inc. | Dynamic language model for speech recognition |
US5306234A (en) * | 1993-03-23 | 1994-04-26 | Johnson W Dudley | Method for closing an atrial appendage |
US5447148A (en) * | 1993-07-08 | 1995-09-05 | Vision Sciences, Inc. | Endoscopic contamination protection system to facilitate cleaning of endoscopes |
DE69423838T2 (de) | 1993-09-23 | 2000-08-03 | Xerox Corp., Rochester | Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen |
US5615296A (en) | 1993-11-12 | 1997-03-25 | International Business Machines Corporation | Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors |
US5483951A (en) * | 1994-02-25 | 1996-01-16 | Vision-Sciences, Inc. | Working channels for a disposable sheath for an endoscope |
US5520607A (en) * | 1994-03-04 | 1996-05-28 | Vision Sciences, Inc. | Holding tray and clamp assembly for an endoscopic sheath |
US5499995C1 (en) * | 1994-05-25 | 2002-03-12 | Paul S Teirstein | Body passageway closure apparatus and method of use |
US5417226A (en) * | 1994-06-09 | 1995-05-23 | Juma; Saad | Female anti-incontinence device |
US5675819A (en) | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5752052A (en) | 1994-06-24 | 1998-05-12 | Microsoft Corporation | Method and system for bootstrapping statistical processing into a rule-based natural language parser |
US5755770A (en) * | 1995-01-31 | 1998-05-26 | Boston Scientific Corporatiion | Endovascular aortic graft |
US5689617A (en) | 1995-03-14 | 1997-11-18 | Apple Computer, Inc. | Speech recognition system which returns recognition results as a reconstructed language model with attached data values |
IT1279171B1 (it) | 1995-03-17 | 1997-12-04 | Ist Trentino Di Cultura | Sistema di riconoscimento di parlato continuo |
DE29507519U1 (de) * | 1995-05-05 | 1995-08-10 | Angiomed Ag, 76227 Karlsruhe | Endosphinkter und Set zum freigebbaren Verschließen der Urethra |
US5710866A (en) | 1995-05-26 | 1998-01-20 | Microsoft Corporation | System and method for speech recognition using dynamically adjusted confidence measure |
US5667476A (en) * | 1995-06-05 | 1997-09-16 | Vision-Sciences, Inc. | Endoscope articulation system to reduce effort during articulation of an endoscope |
US5680511A (en) | 1995-06-07 | 1997-10-21 | Dragon Systems, Inc. | Systems and methods for word recognition |
US5645565A (en) * | 1995-06-13 | 1997-07-08 | Ethicon Endo-Surgery, Inc. | Surgical plug |
CA2234389A1 (en) * | 1995-10-13 | 1997-04-17 | Transvascular, Inc. | A device, system and method for interstitial transvascular intervention |
JPH09114488A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
DE69517705T2 (de) | 1995-11-04 | 2000-11-23 | International Business Machines Corp., Armonk | Verfahren und vorrichtung zur anpassung der grösse eines sprachmodells in einem spracherkennungssystem |
US6567778B1 (en) | 1995-12-21 | 2003-05-20 | Nuance Communications | Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores |
US5913193A (en) | 1996-04-30 | 1999-06-15 | Microsoft Corporation | Method and system of runtime acoustic unit selection for speech synthesis |
US5937384A (en) | 1996-05-01 | 1999-08-10 | Microsoft Corporation | Method and system for speech recognition using continuous density hidden Markov models |
EP0906135B1 (en) * | 1996-05-20 | 2004-12-29 | Medtronic Percusurge, Inc. | Low profile catheter valve |
DE69719237T2 (de) * | 1996-05-23 | 2003-11-27 | Samsung Electronics Co., Ltd. | Flexibler, selbstexpandierbarer Stent und Verfahren zu dessen Herstellung |
US5835888A (en) | 1996-06-10 | 1998-11-10 | International Business Machines Corporation | Statistical language model for inflected languages |
KR980000327U (ko) * | 1996-06-13 | 1998-03-30 | 이정행 | 귀걸이 설치용 귀걸이홀 성형구 |
US5855601A (en) * | 1996-06-21 | 1999-01-05 | The Trustees Of Columbia University In The City Of New York | Artificial heart valve and method and device for implanting the same |
US5963903A (en) | 1996-06-28 | 1999-10-05 | Microsoft Corporation | Method and system for dynamically adjusted training for speech recognition |
US5685822A (en) * | 1996-08-08 | 1997-11-11 | Vision-Sciences, Inc. | Endoscope with sheath retaining device |
US5782916A (en) * | 1996-08-13 | 1998-07-21 | Galt Laboratories, Inc. | Device for maintaining urinary continence |
JPH1097280A (ja) * | 1996-09-19 | 1998-04-14 | Hitachi Ltd | 音声画像認識翻訳装置 |
US5905972A (en) | 1996-09-30 | 1999-05-18 | Microsoft Corporation | Prosodic databases holding fundamental frequency templates for use in speech synthesis |
US5819220A (en) | 1996-09-30 | 1998-10-06 | Hewlett-Packard Company | Web triggered word set boosting for speech interfaces to the world wide web |
US5829000A (en) | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
GB9701866D0 (en) | 1997-01-30 | 1997-03-19 | British Telecomm | Information retrieval |
DE19708183A1 (de) | 1997-02-28 | 1998-09-03 | Philips Patentverwaltung | Verfahren zur Spracherkennung mit Sprachmodellanpassung |
US6083255A (en) * | 1997-04-07 | 2000-07-04 | Broncus Technologies, Inc. | Bronchial stenter |
US6200333B1 (en) * | 1997-04-07 | 2001-03-13 | Broncus Technologies, Inc. | Bronchial stenter |
US6245102B1 (en) * | 1997-05-07 | 2001-06-12 | Iowa-India Investments Company Ltd. | Stent, stent graft and stent valve |
US5855597A (en) * | 1997-05-07 | 1999-01-05 | Iowa-India Investments Co. Limited | Stent valve and stent graft for percutaneous surgery |
US6073091A (en) | 1997-08-06 | 2000-06-06 | International Business Machines Corporation | Apparatus and method for forming a filtered inflected language model for automatic speech recognition |
US5954766A (en) * | 1997-09-16 | 1999-09-21 | Zadno-Azizi; Gholam-Reza | Body fluid flow control device |
US6154722A (en) | 1997-12-18 | 2000-11-28 | Apple Computer, Inc. | Method and apparatus for a speech recognition system language model that integrates a finite state grammar probability and an N-gram probability |
DE59812219D1 (de) * | 1998-03-04 | 2004-12-09 | Schneider Europ Gmbh Buelach | Vorrichtung zum Einführen einer Endoprothese in einen Katheterschaft |
US6182039B1 (en) | 1998-03-24 | 2001-01-30 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus using probabilistic language model based on confusable sets for speech recognition |
US6141641A (en) | 1998-04-15 | 2000-10-31 | Microsoft Corporation | Dynamically configurable acoustic model for speech recognition system |
US6009614A (en) * | 1998-04-21 | 2000-01-04 | Advanced Cardiovascular Systems, Inc. | Stent crimping tool and method of use |
US5974652A (en) * | 1998-05-05 | 1999-11-02 | Advanced Cardiovascular Systems, Inc. | Method and apparatus for uniformly crimping a stent onto a catheter |
US6174323B1 (en) * | 1998-06-05 | 2001-01-16 | Broncus Technologies, Inc. | Method and assembly for lung volume reduction |
US6188976B1 (en) | 1998-10-23 | 2001-02-13 | International Business Machines Corporation | Apparatus and method for building domain-specific language models |
US6174280B1 (en) * | 1998-11-19 | 2001-01-16 | Vision Sciences, Inc. | Sheath for protecting and altering the bending characteristics of a flexible endoscope |
US6020380A (en) * | 1998-11-25 | 2000-02-01 | Tap Holdings Inc. | Method of treating chronic obstructive pulmonary disease |
US6051022A (en) * | 1998-12-30 | 2000-04-18 | St. Jude Medical, Inc. | Bileaflet valve having non-parallel pivot axes |
US6350231B1 (en) * | 1999-01-21 | 2002-02-26 | Vision Sciences, Inc. | Apparatus and method for forming thin-walled elastic components from an elastomeric material |
US6530881B1 (en) * | 1999-01-21 | 2003-03-11 | Vision Sciences, Inc. | Sheath apparatus for endoscopes and methods for forming same |
US6081799A (en) | 1999-05-05 | 2000-06-27 | International Business Machines Corporation | Executing complex SQL queries using index screening for conjunct or disjunct index operations |
US6206918B1 (en) * | 1999-05-12 | 2001-03-27 | Sulzer Carbomedics Inc. | Heart valve prosthesis having a pivot design for improving flow characteristics |
US6234996B1 (en) * | 1999-06-23 | 2001-05-22 | Percusurge, Inc. | Integrated inflation/deflation device and method |
US6287290B1 (en) * | 1999-07-02 | 2001-09-11 | Pulmonx | Methods, systems, and kits for lung volume reduction |
US6712812B2 (en) * | 1999-08-05 | 2004-03-30 | Broncus Technologies, Inc. | Devices for creating collateral channels |
US6190330B1 (en) * | 1999-08-09 | 2001-02-20 | Vision-Sciences, Inc. | Endoscopic location and vacuum assembly and method |
US6293951B1 (en) * | 1999-08-24 | 2001-09-25 | Spiration, Inc. | Lung reduction device, system, and method |
US6416554B1 (en) * | 1999-08-24 | 2002-07-09 | Spiration, Inc. | Lung reduction apparatus and method |
US6402754B1 (en) * | 1999-10-20 | 2002-06-11 | Spiration, Inc. | Apparatus for expanding the thorax |
US6398775B1 (en) * | 1999-10-21 | 2002-06-04 | Pulmonx | Apparatus and method for isolated lung access |
US6510846B1 (en) * | 1999-12-23 | 2003-01-28 | O'rourke Sam | Sealed back pressure breathing device |
US6865528B1 (en) | 2000-06-01 | 2005-03-08 | Microsoft Corporation | Use of a unified language model |
US6568387B2 (en) * | 2000-07-19 | 2003-05-27 | University Of Florida | Method for treating chronic obstructive pulmonary disorder |
TW472232B (en) * | 2000-08-11 | 2002-01-11 | Ind Tech Res Inst | Probability-base fault-tolerance natural language understanding method |
US6785651B1 (en) * | 2000-09-14 | 2004-08-31 | Microsoft Corporation | Method and apparatus for performing plan-based dialog |
US6527761B1 (en) * | 2000-10-27 | 2003-03-04 | Pulmonx, Inc. | Methods and devices for obstructing and aspirating lung tissue segments |
JP2004530982A (ja) * | 2001-05-04 | 2004-10-07 | ユニシス コーポレーション | Webサーバからの音声アプリケーション情報の動的な生成 |
JP4602602B2 (ja) * | 2001-07-19 | 2010-12-22 | オリンパス株式会社 | 医療器具 |
US20030018327A1 (en) * | 2001-07-20 | 2003-01-23 | Csaba Truckai | Systems and techniques for lung volume reduction |
JP4094255B2 (ja) * | 2001-07-27 | 2008-06-04 | 日本電気株式会社 | コマンド入力機能つきディクテーション装置 |
US20030050648A1 (en) * | 2001-09-11 | 2003-03-13 | Spiration, Inc. | Removable lung reduction devices, systems, and methods |
US6592594B2 (en) * | 2001-10-25 | 2003-07-15 | Spiration, Inc. | Bronchial obstruction device deployment system and method |
JP4000828B2 (ja) * | 2001-11-06 | 2007-10-31 | 株式会社デンソー | 情報システム、電子機器、プログラム |
-
2003
- 2003-05-29 US US10/448,018 patent/US7200559B2/en active Active
-
2004
- 2004-05-07 ZA ZA200403492A patent/ZA200403492B/en unknown
- 2004-05-11 AU AU2004201992A patent/AU2004201992B2/en not_active Ceased
- 2004-05-12 EP EP04011317A patent/EP1482481B1/en not_active Expired - Lifetime
- 2004-05-12 EP EP08010531A patent/EP1970897A1/en not_active Ceased
- 2004-05-12 AT AT04011317T patent/ATE398325T1/de not_active IP Right Cessation
- 2004-05-12 MY MYPI20041762A patent/MY142974A/en unknown
- 2004-05-12 DE DE602004014316T patent/DE602004014316D1/de not_active Expired - Lifetime
- 2004-05-13 CA CA2467220A patent/CA2467220C/en not_active Expired - Fee Related
- 2004-05-20 TW TW093114299A patent/TWI376681B/zh not_active IP Right Cessation
- 2004-05-27 BR BRPI0401850A patent/BRPI0401850B1/pt not_active IP Right Cessation
- 2004-05-27 JP JP2004158360A patent/JP4768970B2/ja not_active Expired - Fee Related
- 2004-05-28 RU RU2004116304/09A patent/RU2349969C2/ru not_active IP Right Cessation
- 2004-05-28 CN CN200410059568A patent/CN100578614C/zh not_active Expired - Fee Related
- 2004-05-28 MX MXPA04005122A patent/MXPA04005122A/es active IP Right Grant
- 2004-05-28 KR KR1020040038497A patent/KR101042119B1/ko active IP Right Grant
-
2005
- 2005-05-13 HK HK05104043A patent/HK1071466A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US20040243393A1 (en) | 2004-12-02 |
JP2004355630A (ja) | 2004-12-16 |
CN100578614C (zh) | 2010-01-06 |
CA2467220C (en) | 2014-07-08 |
RU2349969C2 (ru) | 2009-03-20 |
MY142974A (en) | 2011-01-31 |
KR20040103445A (ko) | 2004-12-08 |
ZA200403492B (en) | 2006-04-26 |
EP1482481A1 (en) | 2004-12-01 |
BRPI0401850A (pt) | 2005-03-08 |
HK1071466A1 (en) | 2005-07-15 |
BRPI0401850B1 (pt) | 2018-09-11 |
JP4768970B2 (ja) | 2011-09-07 |
ATE398325T1 (de) | 2008-07-15 |
EP1482481B1 (en) | 2008-06-11 |
US7200559B2 (en) | 2007-04-03 |
EP1970897A1 (en) | 2008-09-17 |
TW200515369A (en) | 2005-05-01 |
KR101042119B1 (ko) | 2011-06-17 |
RU2004116304A (ru) | 2005-11-10 |
MXPA04005122A (es) | 2005-02-17 |
CN1573928A (zh) | 2005-02-02 |
DE602004014316D1 (de) | 2008-07-24 |
AU2004201992B2 (en) | 2009-10-22 |
AU2004201992A1 (en) | 2004-12-16 |
CA2467220A1 (en) | 2004-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI376681B (en) | Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon | |
KR101066741B1 (ko) | 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체 | |
EP0607615B1 (en) | Speech recognition interface system suitable for window systems and speech mail systems | |
CN102339129B (zh) | 一种基于语音和手势的多通道人机交互方法 | |
US10860289B2 (en) | Flexible voice-based information retrieval system for virtual assistant | |
CN118865965A (zh) | 用户、自动化助理和其它计算服务之间的多模态交互 | |
JP2009059378A (ja) | ダイアログを目的とするアプリケーション抽象化のための記録媒体及び方法 | |
KR101213835B1 (ko) | 음성 인식에 있어서 동사 에러 복원 | |
CN109144458A (zh) | 用于执行与语音输入相对应的操作的电子设备 | |
JP2007328283A (ja) | 対話装置、プログラム、及び対話方法 | |
Wang | Semantic object synchronous understanding in SALT for highly interactive user interface. | |
Miyazaki | Discussion board system with modality variation: From multi-modality to user freedom | |
CN117099077A (zh) | 具有用户视图上下文和多模态输入支持的支持语音助手的客户端应用 | |
Van Kleek et al. | Designing speech interfaces for kiosks | |
Deng et al. | A speech-centric perspective for human-computer interface |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |