[go: up one dir, main page]

TWI376681B - Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon - Google Patents

Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon Download PDF

Info

Publication number
TWI376681B
TWI376681B TW093114299A TW93114299A TWI376681B TW I376681 B TWI376681 B TW I376681B TW 093114299 A TW093114299 A TW 093114299A TW 93114299 A TW93114299 A TW 93114299A TW I376681 B TWI376681 B TW I376681B
Authority
TW
Taiwan
Prior art keywords
input
language model
semantic
quot
user
Prior art date
Application number
TW093114299A
Other languages
English (en)
Other versions
TW200515369A (en
Inventor
Kuansan Wang
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of TW200515369A publication Critical patent/TW200515369A/zh
Application granted granted Critical
Publication of TWI376681B publication Critical patent/TWI376681B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Telephone Function (AREA)

Description

Γ376681 九、發明說明: 【發明所屬之技術領域】 本發明與在一個電腦系統中資訊的存取及截取相關。 本發明尤指使用識別和理解的資訊存取有關。 【先前技術】 最近,進步的技術已經允許使用者藉由提供語音命令 在一電腦系統存取資訊。當接收使用者命令時,電腦系統 執行對使用者輸入的語音識別,並進一步處理該輸入以確 定使用者的意圖,以使電腦系統執行一所欲行動。 在一些情況下,由使用者提供的輸入是不完全的或不 確定的,其將需要電腦系統自使用者請求進一步的資訊, 不論是以視覺的或聽覺的提示形式。因此能夠在使用者和 電腦系統之間建立對話,其中每一回合提供問題、答案和/ 或確認,直到使用者的意圖確定並且能夠執行一行動為 止。在其他情況下,產生此類對話是用於與電腦系統相互 作用的較佳模式。 語音應用語言標記(SALT)已經被導入以對現代使用 者介面設計,以協助作為一可實行的輸入/輸出形態的語 音。SALT的設計目標係為了使一般語音任務易於程式化, 亦允許可直接理解的進一步能力。SALT係為許多應用設 計。例如,其一為電話基礎的,僅藉由語音對話與使用者 互動的純語音應用。 SALT包括語音輸入和輸出的物件(”聽"和”提示"),其 5 1376681 具有一模式設計為整合技術以偵測使用者回合的開始和結 束。同樣地,許多語音應用程式所使用的使用者介面要求 使用者發出信號以表示使用者回合的開始。一些電腦系統 包括可穿戴電腦(wearable computers)、語音可用形態或多 形態的(語音輸入,被提供以用於由一例如滑鼠的輸入裝置 所選擇的攔位)裝置和其他無需眼睛的應用程式。然而,在 每一種此類環境中,仍呈現使用者與電腦系統回合的簡潔 定義。 然而在參與者之間的人類談話通常不是簡潔的、回合 制的對話。而是談話能夠包括一參與者的確認、證明、提 問,等等,而其他人所提供的資訊可能大大地影響、輕微 地影響或甚至於影響講話者提供資訊的模式。人類講話者 使用談話的自然形式。同樣地,電話系統使用全雙工技術 允許這樣的談話發生。 相對地,對話基礎的介面在一使用者和一電腦系統之 間使用一種嚴格回合制的模式操作,其使電腦系統在處理 和採取後續行動之前,等待使用者對話的結束。雖然簡單 回饋(例如,像是在一個電腦螢幕前進的一連串小點之視覺 指示)可能提供這個使用者電腦系統至少在處理某事的某 種保證,但是直到該使用者完成他/她的回合及電腦系統回 應時,才知道電腦系統所理解的程度。 因此,需要改進基於識別及理解的一電腦系統。此類 改進提供一種易於由使用者利用更自然方式存取資訊的系 統或方法" 6 Γ376681 【發明内容】 一種提供一語音輸入模式之方法和系統,其當音訊標 題仍在處理時,能動態報告部分語意分析。能以立即回報 使用者的一種結果評價語意分析。所得之效果是傳統上由 系統回合執行之任務,現在由使用者回合執行,因而出現 一種與語音對話之回合制屬性相差極大的差異。 通常,本發明的一種態樣包括一電腦實作方法,用以 與一電腦系統互動。該方法包括從使用者處接收輸入,以 及截取用於處理的輪入。而後在其後或同時在輸入上執行 識別,以確定語意資訊屬於輸入和輸出這個語意物件的一 第一部分。語意物件包括欲由電腦應用處理的格式之資 料,該電腦應用係依據所識別的輸入(例如,文字、加密文 字、壓縮文字、等等),以及第一部分的語意資訊。如上所 述,當繼續載取該輸入之後的部分時,執行識別並輸出語 意物件。能夠用例如語音的聽覺輸入以及非聽覺的輸入執 行這個方法,例如,視覺輸入或手寫識別。 上述方法能夠以含有可由電腦裝置讀取指令之一電腦 可讀媒體實作,當實作時,使該電腦裝置控制資訊和執行 該方法。在一進一步的實施例中,該電腦可讀媒體能夠包 括指令,其用以建立一語言模型以執行識別和理解。該語 言模型係依據識別的輸入以一種格式提供資料,以及提供 接收的輸入之語意資訊。 7 1376681 【實施方式】 第1圖是一個資料表示系統1 0的方塊圖,用以依 音輸入呈現資料。系統10包括一個語音介面模組12 語音識別和理解模組1 4和一資料呈現模組1 6。一使 以聲音查詢形式對語音介面模組1 2提供輸入。語音介 組12從一使用者搜集語音資訊和提供指示它的信號。 由語音介面模組1 2收集到輸入語音以後,語音識別和 的模組1 4使用一語音識別器識別該語音,以及亦執行 理解,其中,當仍在截取音訊語音輸入時,在本發明 態樣中,提供目前為止接收的輸入的部分語意分析。 部分語意分析典型上包括所接收的輸入文字(或 指示輸入文宇的資料),也確定了語意資訊,該部分語 析被提供至能夠採取許多不同形式之一應用模組16 如,在一個實施例中,應用模組 16可以是個人資訊 器,用以寄送、接收和回覆電子郵件、安排會議等等 照該方法,該使用者能夠提供聽覺命令以執行這些任 更重要的是,雖然應用模組1 6能夠提供互動式回饋3 在接收到部分語意分析資訊時,對其採取行動,從而 該使用者應用模組1 6的一高度互動式介面。例如,在 聲音操作模式中,輸出2 0能夠包含回到使用者的聽 述,然而,當然有可能執行其他與該應用有關的任務 使用該部分語.意分析或語意物件,以執行應用中的對 輯。例如,對話邏輯可以依據一或更多語意物件,顯 選擇(或多數的或一個清單的選擇)給使用者。 據聲 、 —^ 用者 面模 在已 理解 語音 之一 其他 意分 。例 管理 。依 務。 W或 提供 一純 覺陳 o "vj* 話邏 示一 8 Γ376681 如此允許系統1 〇基於部分表達,亦即在使用者回 束以前,立即表示報告結果。換句話說,藉由使用用 告和執行通常與系統回合相關之任務的回送通道之溝 一使用者和一系統回合的定義是模糊的。最傳統的對 究,尤其基於人類對人類的對話,經常視回送通道溝 非侵入式的回饋,其僅傳送例如確定、否定、或中立 的簡單信號。然而,由輸出20提供的回饋有可能可以 更多的資訊,以致於對正在進行的使用者談話造成一 入,其可能或可能不造成該使用者清楚表達該使用者 圖或方向。然而,該方法在使用者和系統1 0之間提供 實的人類對話,在許多種情況下並不會讓人覺得厭煩 讓使用者更舒適,並逐漸確定將能達成使用者的願望 關於這點,應該注意的是本發明並不侷限於一個 音操作環境,而能夠基於部分語意分析或物件的處理 含回饋至使用者的其他形式。例如,在上述應用中, 1 6執行電子郵件任務,輸出2 0能夠包含視覺回饋,例 在來自使用者包含"send e-mail to Bob”的一連續指令 啟動僅基於如"send e-mail"的接收片語之一電子郵 組,其中,處理"to Bob”的片語可能使該應用模組在 貯存18中存取更進一步的資訊,並取得名字為”Bob" 名清單。據以檢查該清單,使用者只要確認所欲接 "Bob Green"就可以將其選取,因為系統為部分表示 Green"提供了另一個語意物件,其當由應用接收和 時,將導致"Bob Green"被選取。 合結 以報 通, 話研 通為 確認 搭載 點侵 的意 更真 ,且 〇 純聲 ,包 模組 如, 中, 件模 資料 的人 收者 "Bob 處理 9 1376681 如上所述,應用模組16可以採用本發明下述 有利之許多種形式,而不受到侷限,應用模組1 6 提供使用者的語音輸入的原文輸出的一個口述: 而,藉由處理部分輸入或輸入的片語之語意輸入 得更精確的轉譯。 雖然上文中就含有聲音命令之來自使用者 論,也能夠把本發明的許多態樣應用於例如手寫 手勢或視覺指示之其他輸入形式。 因為賦予了處理部分語意分析或物件的廣泛 通常描述能夠在上述系統1 0中作用的計算裝置 用的。那些熟知該項技藝者應了解,系統1 0的元 在一單一電腦之内,或分佈在使用網路連結和通 一個分散式計算環境。 現下參考第2圖,在元件3 0說明例如一個資 置之一行動裝置的一例示性形式(PIM、PDA或类 然而,本發明亦思及能夠使用下文中討論的其他 實施。例如,電話和/或資料管理裝置也可受益於 相較於習知之可攜式個人資訊管理裝置及其他可 裝置,此類裝置具有較佳的功能。 第2圖說明了 一資料管理行動裝置30的例开 該行動裝置30包括一外罩32並具有包括一顯示I 使用者介面,其與一個尖筆33共同作用,使用一 示幕。該尖筆33係用於以指定的方向按壓或接 3 4以選擇欄位、以選擇性地使移動一游標的一 態樣可能 也可能是 模組。然 ,能夠獲 的輸入而 、ETMF、 適用性, 也許是有 件可能位 訊協定的 料管理裝 頁似者)。 計算裝置 本發明。 攜式電子 :性形式, i 34 的一 觸控式顯 觸顯示器 個開始位 10 ^/0081 np 2相反地藉由例如手勢或手寫提供命令資訊。選 地裝置30上包括一或更多按鈕35,用以瀏覽。此 也能夠提供例如旋輪、捲軸或類似者之的其他輸入機 應該/主忍的疋本發明並不揭限於輸入機制的這 式。例如,輸入的另一個形式能夠包括藉由例如電腦 的視覺輸入》 現下參考第3圖,一方塊圖說明包括行動裝置3〇 能性元件。一中央處理單元(cpu)5〇實作軟體控制功 CPU 50與顯示器34連接,以使依據控制軟體產生的 與圖像出現在顯示器34。一擴音器43能夠以數位至 轉換器59連接至CPU 5〇,以提供一聽覺輸出。由使 下載或輸入到行動裝置3〇裡的資料係儲存在一非揮 讀取/寫入隨機存取記憶體貯存54,其雙向連接至 5〇。隨機存取記憶體(RAM) 54為由CPU 50執行的 供揮發性貯存,及為暫時性資料(例如,登錄值)提供 設定選擇的預設值及其他參數係儲存在一個唯讀 (r〇m)58中。也能夠用R〇M 58來儲存用於控制行 3 〇的基本功能和其他的作業系統核心功能(例如, 體元件至RAM 54)之裝置作業系統軟體。 R A Μ 5 4也以翻々,μ丄 ^
乂於在用來儲存應用程式的PC 碟機的功能的模式,作為程式碼之儲存器。應該注意 儘管使用非揮發性記憶儲存程式碼,其亦可選擇性 在不用以執行該程式k揮發性記憶中。 藉由與CPU 50連接之無線收發器52能夠由行 擇性 外, 制。 些形 視訊 的功 能。 文字 類比 用者 發性 CPU 令提 !存。 憶體 裝置 載軟 之硬 丨是, 健存 裝置 11 1376681 發送/接收無線信號。如果需要的話,亦可以提供一選擇性 的溝通介面60,用以自一電腦(例如,桌上型電腦)或從連 線的網路直接下載資料。因此,介面60能夠包括各種形式 的溝通裝置,例如,紅外線連結、數據機、網路卡、或其 他類似者。 行動裝置30包括一話筒29、和類比至數位轉換器37, 及儲存在貯存54之一選擇性的識別程式(語音、DTMF、手 寫、手勢或電腦視訊)。舉一示例,為回應來自裝置30之 一使用者的聽覺資訊、指令或命令,話筒29提供語音信 號,其係由A/D轉換器3 7數位化。語音識別程式能夠在 數位化語音信號上執行正規化和/或特徵抽取功能,以獲得 中間語音識別結果。使用無線收發器5 2或溝通介面6 0, 語音資料能夠被傳遞至將在下文中討論並以第6圖的結構 說明的一遠端識別伺服器204。而後回傳識別結果至行動 裝置3 0,以在其上呈現(例如,視覺者和/或聽覺者),和最 終傳輸至一網頁伺服器202(第6圖),其中以客戶端/伺服 器關係操作該網頁伺服器202和行動的裝置3 0。 能夠把類似處理用於其他形式的輸入。例如,手寫入 輸入可以在裝置 30上以預先處理或不預先處理而數位 化。如同語音資料,此類形式之輸入可以被傳輸至識別伺 服器2 0 4,以用於識別,其中識別結果被回傳到裝置3 0和 /或網頁伺服器202之至少一者。同樣地,DTMF資料、手 勢資料和視覺性資料能夠同樣地被處理。依據輸入的形 式,裝置30(和將在下文中討論的其他客戶端形式)將包括 12 Γ376681 例如照相機的必要硬體作視覺輸入。 第4圖是一個可攜式電話8 0之例示性實施例的平面視 圖。該電話80包括一顯示器82和袖珍鍵盤84。通常,第 3圖的方塊圖適用於第4圖的電話,雖然可能需要執行其 他功能所必需的附加電路系統。例如,第3圖的實施例需 要一個作為電話所必需的收發器;然而,此類電路系統並 不適用於本發明。 除在上述的可攜式或行動計算裝置以外,亦應理解本 發明能夠用於許多其他計算裝置,例如,一般桌上型電腦。 例如,當其他傳統輸入裝置(例如,一個完全阿爾法數字的 鍵盤)太難於操作時,本發明允許使用者以有限的實體能力 輸入或鍵入文字到電腦裡。 本發明亦可操作於各種其他一般目的或特別目的的計 算系統、環境或設定。可能適於使用本發之習知的計算系 統、環境、和/或設定之示例包含但不侷限於常規電話(沒 有螢幕)、個人電腦、伺服器電腦、手持式或膝上式裝置、 平板式電腦、多處理器系統、微處理器基礎的系統、機上 盒、可程式消費性電子產品、包含任何上述系統或裝置之 分散式計算環境,及其他類似者。 下文中,在第5圖概述一般目的電腦120。然而,電 腦1 20亦是一合適計算環境的示例並非就發明功能或使用 範圍設下任何限制。該電腦120不該視為有任何相依或需 要關聯於其中所述之元件的結合或任一者。 可以使用由一電腦執行之電腦可執行指令(例如,程式 13 1376681 模組)的一般文字描述本發明》通常,程式模組包括常式、 程式、物件、元件、資料結構、等等’其執行特定任務或 實作特定抽象資料類型。本發明亦可實施於分散式計鼻環 境,其中由遠端處理裝置執行任務,該遠端處理裝置係藉 由溝通網路連接。在一分散式計算環境中’程式模組可能 位於本地端和遠端的電腦儲存媒體中,其包括記憶儲存裝 置。由程式執行的任務和模組係以圖示之輔助描述於下文 中。那些熟知該項技藝者能夠實作該敘述及圖示為處理器 可執行指令,其無夠以任何形式寫入一電腦可讀媒體。 參考第5圖,電腦120的元件可能包括,但不偈限於 一處理單元1 4 0、〆系統記憶體1 5 0及一系統匯流排1 4 1, 其耦接各種系統元件包括系統記憶體至處理單元1 40 °系 統匯流排1 4 1可以是任何若干種類的匯流排結構’包括一 記憶體匯流排或記憶體管理器、一週邊匯流排、和使用許 多匯流排結構的任一者之一本地匯流排。舉一示例而非限 制,此類結構包括工業標準結構(IS A)匯流排、通用序列匯 流排(USB)、微通道結構(MCA)匯流排、加強ISA(EISA)匯 流排、視訊電子標準協會(VESA)本地端匯流排、及也稱作 多層構架(Mezzanine)匯流排之週邊元件連接(PCI)匯流 排。電腦1 20通常包括許多電腦可讀媒體。電腦可讀媒體 可能是任何可用的媒體,其可由電腦丨2〇存取並且包括揮 發性和非揮發性媒體’和可移除式和不可移除式媒體。舉 一示例而非限制,電腦可讀媒體可能包括電腦儲存媒體和 溝通媒體。電腦儲存媒體包括揮發性和非揮發性可移除 14 υ-/0()81 式和不可移除式媒體,其以任彳 任竹方法或技術實作,用於資 訊之貯存,例如電腦可讀指合 M7 、身料結構、程式模組或其 他的資料。電腦儲存媒體包括作 υ促1-不侷限於RAM、ROM、 EEPROM、快閃記憶體或其他印格 ^ 把·疋憶體技術、CD-ROM、數位 影音光碟(DVD)或其他的光磾儲 70 ’保存器、磁卡式盒、磁帶、 磁碟儲存或其他的磁性儲存步番 I®•’或能夠用來儲存所欲資 訊以及能夠被電腦120存取之杯和1_甘l 疋任何其他媒體。 溝通媒體通常使用電腦可讀# „ %卿J项才曰令、資料結構、程式模 組或在一調制資料信號中的立 J '、他的資料,例如,一載波或 其他的傳輸機制,以及包括任佃咨 仕何資訊傳遞媒體。術語「調 制資料信號」意指具有一戎P^ ,次更多它的特徵,其以設定或改 變之方式將訊息編譯於信號中。叛 _ r 舉一不例而非限制,溝通 媒體包括有線媒體(例如’有蝮姻致十古k 另深洞路或直接連線連結)以及 無線媒體(例如,聲音、FR、紅外線及其他無線媒體)。上 述任何者之結合亦應包含在電腦可讀媒體的範圍之内。 系統記憶體150包括揮發性和/或非揮發性的記憶體 形式之電腦健存媒冑’例如’唯讀記憶(R0M)151和隨機 存取記憶(RAM)152。一個基本輸入/輸出系統 153(BI〇S)(含有幫助在電腦元件之間傳送資訊的基本常 式,例如在起動階段)通常係儲存在r〇m 151。ram ι52 通常含有可立即存取和/或可由處理單元14〇立即操作的 資料和/或私式模組。舉一示例而非限制,第5圖說明作業 系統154、應用程式155、其他程式模組156、和程式資料 157 〇 15 1376681 電腦120也可能包括其他可移除/不可移除的揮發性/ 非揮發性電腦儲存媒體。僅為示例,第5圖說明一硬碟機 161,其讀取自或寫入不可移除的、非揮發性磁性媒體中; 一磁碟機 171,其讀取自或寫入一可移除、非揮發性磁碟 172;和一光碟機175,其讀取自或寫入一可移除的、非揮 發性光碟176,例如,一 CD ROM或其他的光學媒體。其 他的可移除/不可移除、揮發性/非揮發性電腦儲存媒體(其 可用於示例性的操作環境,但無限制)包含卡帶卡式盒、快 閃記憶卡、數位影音光碟、數位視訊帶、固態RAM、固態 ROM等等。硬碟機161通常藉由不可移除的記憶體介面(例 如,介面1 60)連接到系統匯流排1 4 1,而磁碟機1 7 1和光 碟機1 75通常藉由可移除記憶體介面(例如介面1 70)連接 到系統匯流排1 4 1上。 上文所討論的並以第5圖說明的相關的電腦儲存媒體 為電腦1 2 0提供電腦可讀指令、資料結構、程式模組的其 他的資料的儲存。在第5圖,例如,圖示硬碟機161儲存 作業系統1 64、應用程式1 65、其他程式模組1 66、和程式 資料 1 6 7。特別說明的是,這些元件可能相同或不同於作 業系統154、應用程式155、其他程式模組156、和程式資 料1 5 7。作業系統1 6 4、應用程式1 6 5、其他程式模組1 6 6、 和程式資料1 6 7在這裡被給定不同的號碼,以至少說明它 們是不同的。 一使用者可能藉由例如鍵盤1 8 2、話筒1 8 3及指向裝 置181(如滑鼠,軌跡球或觸控盤)的輸入裝置輸入命令和 16 Γ376681 資訊到電腦120裡。其他輸入裝置(未見於圖示)可能包括 操縱桿、遊戲墊、衛星碟、掃描器、或其他類似者。這些 和其他的輸入裝置經常藉由使用者輸入介面180連接至處 理單元1 4 0,又使用者輸入介面1 8 0係連接至系統匯流排 但是可能由其他介面和匯流排結構連接,例如,平行埠、 遊戲埠或一通用序列匯流排(USB )。一監視器1 84或其他 類型的顯示裝置亦藉由一介面(例如,一視訊介面 185)連 接至系統匯流排 1 41。除監視器以外,電腦也可能包括例 如擴音器187和印表機186的其他週邊輸出裝置,其可能 藉由一輸出週邊介面188連接。 電腦120可能在使用邏輯連結連接至一或更多遠端電 腦之網路環境中操作,例如遠端電腦 1 94。遠端電腦1 94 可以是個人電腦、手持裝置、伺服器、路由器、網路電腦、 一點裝置或其他普通的網路節點,和通常包括上述與個人 電腦120相關之許多或所有元件。第5圖圖示的邏輯連接 包括區域網路(LAN) 191 和廣域網路(WAN) 193,但是也可 能包括其他網路。此類網路環境常見於辦公室、企業級電 腦網路、内部網路及網際網路。 當用於一 LAN網路裱境時,電腦1 20係藉由一個網路 介面或接合器190連接至LAN191 。當用於一個WAN網 路環境時,電腦 120通常包括數據機 192或其他用以在 WAN193上建立溝通的工具,如網際網路。數據機192(可 以是内部或外部的)可能藉由使用者輸入介面180或其他 適當機制連接至系統匯流排 1 4 1。在一網路環境中,所述 17 =电腦⑶或其部分相關之程式模 傑存裝置中1 -示例而非限制,第 194上的遠端應用程式195。人們將 " 連接是例示性的,亦可使用在:::*,“ 他工具。 使用在電腦之間建立淳 200,盆為土政 啊只丞规的識別及資 202 明之一示例。一般而言,儲存 中的資訊可以藉由例如行動裝 代表其他形式的計算裝…旦有依給或電 替 罝,、’、虿依輸入形 愛綦、麥克風、照相機、觸控盤等等)之客戶 或藉由其中資訊是以聽覺要求之電話80’ , 產生之音調以回應音調之降低及其中來自網 之資訊只以語音傳回給使用者。 你战π他例干,結構200是統—的,不論 戶端1 〇〇或使用語音識別由電話8〇獲得資訊, 伺服器204能夠支援操作的任一模 呀式。此外, 操作係使用公知的標記語言之撼 、彍充(例如 XHTML、cHTML、XML、WML、楚 &、 I # )。因此 服器202上储存的資訊也能夠藉由以μ、+.诚μ 11:1从上述標記 之公知圖形使用者介面(GUI)方法存取。藉由使 記語言的擴充,在網頁伺服器202上編輯更加 存在的其他應用也易於修改以包括聲音識別。 一般而言,客戶端100執行HTML網頁 者,通常如206所指示者,其係由網頁伺服器 在遠端記憶 在遠端電腦 所示的網路 通連結的其 截取之結構 網頁伺服器 12〇(本文中 所需之顯示 100存取, I由電話 80 伺服器202 是否藉由客 一單一識別 結構200之 1 HTML ' ,在網頁伺 語言為基礎 用公知的標 容易,目前 腳本或類似 2 02以瀏覽 18 Γ376681 器提 能是 戶端 之指 由客 語言 其中 希望 如果 1 00 者介 至網 網頁 伺服 指的 實體 服器 中於 複雜 網路 服器 能夠 中, 供°當需要例如語音資料之聲音識別時語音資料(可 數位化的音訊信號或語音特徵,其中音訊信號係由客 1 00預先處理’如上文所述)被以文法或語言模型220 不提供至識別伺服器204以用於語音識別期間(可能 戶端100提供)。選擇性地,語音伺服器204可能包括 模型220。識別伺服器2〇4的執行能夠有許多形式, 之一已陳述如上,但是’通常包括識別器211。如果 或適當的話’提供識別的結果並傳回至客戶端1〇〇。 需要的話’可以使用文字至語音模組222以對客戶端 提供口述的文字。在編輯經過識別和任何圖形化使用 面(如果有使用的話)的資訊時,客戶端1〇〇傳送訊息 頁伺服器202供進一步的處理,並接收進一步的HTML /腳本,如果必要的話。 如第6圖所示,客戶端1 〇 〇、網頁伺服器2 〇 2和識別 器204 —般藉由網路205相連及分別尋址,本發明中 是廣域網路如網際網路。因此,任何上述裝置不需要 上相鄰接。尤其是網頁伺服器202不需要包括識別伺 204»依照該方法,在網頁伺服器202的編輯能夠集 應用,而希望它不需要編輯者知道識別伺服器204的 事物。最好是,識別伺服器204可獨立設計和連接至 205,從而不需要進一步變化就能更新和改進網頁伺 202。網頁伺服器202也能夠包括一個編輯機制,其 動態地產生客戶端標記和腳本。在一進一步的實施例 網頁伺服器202、識別伺服器204和客戶端1〇〇可能 19 1376681 依據實作機器的能力而結合β例如,如果該客戶端1〇〇包 括—般目的電腦,例如一個人電腦,客戶端可能包括該識 别伺服器204。同樣地,如果需要的話,網頁伺服器2〇2 和識別伺服器204能夠被整合到一單一機器裡。 藉由電話80對網頁词服器202之存取包括電話到 有線或無線電話網路208的連接,依序是,連接電話8〇 到第三者閘道器210。閘道器210連接電話8〇到電話聲音 割覽器212。電話聲音瀏覽器212包括一媒體伺服器214, 其提供一電話介面和聲音瀏覽器216。例如客戶端1〇〇,電 話聲音劉覽器212自網頁伺服器202接收HTml網頁/腳本 或其他類似者。在一個實施例中,HTML·網頁/腳本之形式 與提供給客戶端100之HTML網頁/腳本類似。依照該方 法’網頁祠服器202不必分別支援客戶端ι〇〇和電話8〇, 或甚至於分別支援標準的GUI客戶端,尚能夠使用普通的 標記語言。此外,例如客戶端1〇〇 ’由電話8〇發送之聽覺 信號的聲音識別係由聲音瀏覽器2丨6經由網路2〇5或經由 專線207(例如’使用TCP/IP)提供給識別伺服器2〇4。網 頁伺服器202識別伺服器204和電話聲音劉覽器212能夠 實施於任何合適的計算環境(例如,—般目的桌上型電 腦),如第5圖所示。 在系統1 0中具有上述各種環境及結構功能,本文提供 系統10各種元件之更詳盡叙述及功能。第7圖說明語音識 別和理解模組1 4的方塊圖。從語音介面模組1 2得到的輸 入語音被送到語音識別和理解模組1 4。語音識別和理解模 20 1376681 組1 4包括一個識別引擎3 Ο 6,其具有一個相關的語言模型 310。當接收到輸入時,識別引擎306使用語言模型310 以識別可能的表面語意結構,以表示來自輸入之每一片 語,提供部分語意分析或物件。與系統不同的是,等待使 用者完成表示從而處理接收到的完成輸入,模組14只依據 目前所接收到的持續提供語意物件。 識別引擎306提供至少一個基於部分表示之表面語意 輸出物件。在一些實施例中,識別引擎3 0 6能夠為每一個 選擇結構提供多於一個選擇表面語意物件。 儘管已第7圖中說明其提供語音輸入,本發明亦能夠 用於手寫識別、手勢識別或圖形使用者介面(其使用者使用 鍵盤或其他輸入裝置與其互動)。在這些其他實施例中,一 如在該項技藝中眾所周知的,用一個合適的識別引擎代替 語音識別器306。對於圖形使用者介面,一個文法器(其具 有語言模型),例如,藉由一輸入盒而與使用者輸入相關。 據此,一使用者輸入之處理係藉由一個一致的方法,而不 需因為輸入模式而大幅修正。 如上所述之互動式對話也包括使用SALT(語音應用語 言標記)或其他語音、手寫及型態識別APIs(應用程式介面) 實作,基於部分語意分析或物件,由系統1 0回饋的其他型 式之資訊,該些識別APIs支援一個語言模型架構,其能夠 基於一選定企劃提供語意資訊以用於一給定的應用和語意 物件同步解譯。SALT是一個建構標準,用於,例如,從 個人電腦、電話、平板電腦和無線行動裝置存取資訊、應 21 1376681 用和網頁服務。但是,也能夠用於應用介面而不需與一網 路互相連接。SALT擴充,例如,HTML、XHTML和XML 的既有標記語5 » SALT1.0的規格可以在http://www.SALTfomm.org 找到。應該法意的是SALT能夠依據使用者輸入提供語意 資訊,例如從語音伺服器204 ,其中在表示完成以後,此 類Μ訊形成提供給資料呈現模組16的物件;然而如下所 述此夠以不預先考慮的模式使用SALT ,以提供部分語 意刀析或物件。使用SALT擴充、或在其他的類似擴 充,以支援高度互動式事件驅動的使用者互動。 在此舉出使用SALT之一示例,salt 物件能用 以執行語音識別和理解任務。這是因為檢視點及公式之設 計將語音理解視為型態識別問題,如同語音識別一般。兩 者皆致力於自可能結果之集合找出一型態。對於語音識 別’部尋找的模式是一串文字,然而對於理解而言,卻是 一 意物件樹。_值姑·立. S識別任務以一個語言模型在編 寫可能的文字字串時,指導尋找程序。在一個類似樣式中, 一語音理解任務能夠導引相同的搜尋弓!擎,以用—個語意 模型:寫合適的語意物件樹。例如-個語言模型,其經常 意味者-專門詞索和從該專門詞棄項目編寫片語片斷的規 則’一個語意模型意味著土 耆斤有》口思物件的一辭典和編寫它 們的規則。識別結果是一 語意物件樹。 _個文子子串時’理解結果則是, 雖然有可能延伸N'gram以回傳-個結構化的尋找結 果,大多數典划的注立 !的。。曰理解應用係基於機率上下文無關文 22 1376681 而 則 部 語 的
法(PCFG),其中設計者能夠規定編寫語意物件的規則, 無需大量的樹庫(tree-bank)註解訓練資料。指定此類規 的一種方法使每一 P CFG規則與指引搜尋引擎如何轉換 分P C F G分析樹為語意物件樹的產生指示有關。在微軟 音應用介面(SAPI)(其亦是能夠用於本發明的語音 API 一示例)所載的一示例,其格式顯示如下: <rule name="nyc"> <list> <phrase>new york ?city</phrase> <phrase>?the big apple</phrase> <output> 〈city location〉 <city>New York</city> <state>New York</state> <country>USA</country> </city_location> 〈/output〉 </rule> <rule name=’’NewMeeting’’> <ruleref min="0" name=,,CarrierPhrase"/> <ruleref max=,,inf" name="ApptProperty"/> 23 1376681 <output> <NewMeeting> <DateTime> <xsl:apply-templates select=,7/Date”/> <xsl:apply-templates select=”//Timen/> <xsl:apply-templates select=’’//Duration”/> </DateTime> <Invitees> <xsl:apply-templates select=5V/Person"/> </Invitees> </NewMeeting> </output> </rule> <rule name=nApptProperty"/> <list> 〈ruleref name=’’Date’’/> <ruleref name=”Duration’7> <ruleref Tiame=’’Time 丨’/> <ruleref name=55Person" max==5,inf7/> <ruleref name=MApptSubjectn/> 24 Γ376681 </rule> 這文法部分包含三種規則。第一個 勺市的名稱。該例中的<01^卩1^>標 ’前端名字"nyc"列出 籤包圍用於建構語意 件的規則。當 則呼叫它們。 時’則產生一 搜尋路徑存在著由標 記所標示之文法節點
在這種情況下,當搜尋路徑存在著"nyc"規 适意物件(用<city_l〇cati〇n>元件以xML 不)。該語意物件依序由三個語意物件:城市名、州和國 縮寫所組成。 "α意物件的組成也可能是一個動態程序,例如,安 新會議。例如’當使用者完成指定例如日期(date)、時 (time)、持續時間(durati〇n)及參加者(attendees)的會議 質時’將產生一個NewMeeting語意物件。能夠用樣板 其他語意物件作為元件貼入NewMeeting語意物件裡。 能夠把相同的原理應用於本文中未記述的其他規則。舉 示例’ 一表示「安排與Li Deng和Alex Acero為時一 時的會議於1月1曰"將產生下文中的語意物件: 紐 物 j 則 表 名 排 間 性 將 也 小 <NewMeeting> <DateTime> <Date>01/01/2003</Date> <Duration>3600</Duration> 25 Γ376681 </DateTime> <Invitees> <Person>Li Deng</Person> <Person>Alex Acero</Person> 〈/Invitees〉 </NewMeeting> 在實際的應用中,改進 PCFG範 務。因此,除此之外,想要能夠使用Τ' 能性片語,其未載有重要的語意資訊但 具有可調整大小的變化(例如,「我可以 我…」、「請告訴我」)。在一個實施例 包括一個語意語言模型,其結合PCFG 略異於一統一語言模型,其亦可使用。 傳統類別N-gram的自然延伸,除了它j 模型化為一個別標記之 CFG部分(而 單)。識別器3 0 6使用該模型仍然產生必 的文字字串。統一的語言模型被設計為 學結構以幫助文字轉譯。 另一方面,語意語言模型意之目的 識別器來找尋語意結構(其通常較易由 此,相反於在N-gram裡嵌入CFG部分 應於一 N-gram關係之特別PCFG前端 N-gram。在微軟SAPI文法格式中,可以ΐ 圍是令人氣餒的任 丨-gram去模型化功 通常在語法結構上 ...」、「你可以告訴 中,語言模型 3 1 0 與N-gram。該技術 該統一語言模型係 L許欲在N-gram中 非只是一個文字清 須在之後文法分析 整合包含某種語言 在於使用解碼器或 PCFG所截取)。因 ,藉由產生一個對 ,用 PCFG來包含 3 — XML<citation> 26 Γ376681 標籤來標示,如同
LCFG〈dictation max=" inf"/> RCFG 其中,LCFG和RCFG分別標示嵌入N-gram的内容的左邊 和右邊。如果進入一正常非終端的話,搜尋程序視 〈dictation〉標籤為一標記並擴展為 N-gram。標籤上 的’’max”屬性指定可被N-gram消耗的文字最大數量。在 N-gram之内,藉由以PCFG修改後退(backoff)N-gram計算 文字字串機率,尤其是, P(w„ | w„.i, w /ί-2 5 * · * )=XP(w „.i\Ngram, wn.\, w„.2,...) + {\-X)P{wn I RCFG)P{RCFG \ wn.x, wn.2,...) (1) 其中 λ是 N-gram修改權重,而 P(PCFG I Wn-丨,...)使用 N-gram的後退機率,即,wn被視為如同它是詞彙文字的 結果。在一實施例中,依據是否已經達到最大N-gram文 字字串大小,及該文字是否在CFG的範圍内,設定術語 P(wn | RCFG)為二元值。因為來自PCFG的文字通常具有 一較高的機率,實際上屬於被CFG涵蓋的範圍之路徑傾向 於獲得它們的N-gram配對,即便當最大N-gram文字計數 被設定為無限。除了程式化片語,嵌入的N-gram亦可用 於具有一口述類屬性之模型化語意物件。例如,會議物件 是我們任務的模型 <rule name = " ApptSubj ect"> <p> 〈dictation max = ’’inf"/> </p> 27 1376681 在"Semantic modeling for dialog systems in a pattern recognition frame work" (Proc. ASRU-2001, Trento Italy, 2 001)中,K. Wang詳述了語意語言模型,其中將該文獻與 本文併呈於上。 本發明的進一步態樣包含SALT list物件的新用法。 SALT提供一套XML元件,其具有相關的屬性和d〇M物 件性質、事件和方法,可與來源標記文件一起應用一語音 介面於一來源網頁。一般而言,該主要元件包含: <prompt...>用於語音合成結構和提示播放 〈listen .··>用於語音識別器設定’識別執行和後處理 及記錄 <dtmf .··>用於DTMF的設定和控制 <smex ...>用於與平台元件之一般目的溝通 該listen和dtmf物件亦包含gramniar及bind控制: 〈grammar ···>用於指定輸入文法資源。 <bind ·.·>用於處理識別結果。 1 i s t e η元件能夠包括一 "m 〇 d e"屬性以識別三種模式之 識別’其指導識別伺服器(例如,204)如何並且何時回傳結 果。結果的回傳意味著提供,,onReco”事件或,,凝固"適當地 啟動"bind"元件。 在一第一模式t ,"automatic”(語音平台,而非應用) 控制何時停止識別程序。該模式已提供給電話或免手持領 域。一旦獲得識別結果,和/或在一個時期的靜默過後,語 28 音平台自勒I H - 助地停止識別器並回傳它的結果,其能夠藉由 bind元件與摘a '週§欄位關聯。 在操作的第二模式中,"single" ’ 一識別結果的回傳係 由明確的”,, Ρ呼叫所控制。該stop呼叫對應於例如使用 者的"p e n - Ή η丨丨*·,. ρ寧件’並且該模式被用於多模式環境,其中 的裝置允哞往_ Α Α ° m η輪入。但是,使用者通常藉由例如尖筆3.3 的使用(第]阁、 、斤1圖),控制何者及何時選擇欄位。 "Β識別益操作的一第三模式是"multiple mode"。該 操作模式传© # 、你用於—"open-microphone"或在口述方面。一般 而。’在該操作模式中’每隔—段間隔回傳識別結果直到 接到明綠的St〇p呼叫,或與未確認輸入或超過聽(listen) 的一個最大時間相關的其他時間超過時。一般而言,在該 操作模式’對確認的每一片語而言,發出一"onReco"事件 並且回傳結果直到接收到stop()呼叫為止。 然而本發明其他態樣的操作模式能夠藉由允許它們只 要超過語言界標立即回報的方式,提供搜尋引擎向使用者 揭示更為互動的能力之方法。基於時間同步解譯的搜尋運 算係為眾人公知並能夠以直接的模式用於該模式。在H.
Ney, S. Ortmanns 的"Dynamic programming search for continuous speech recognition, "(IEEE Signal Processing Magazine, pp. 64-83 , 1 999)描述了 一種此類運算。對於語 音識別而言,通常語言界標與一文字或片語邊界一致。因 此只要它們是可獲得的,就能夠用一 SALT multiple模式 識別來動態地顯示文字字串假設。一個UI效果在許多商 29 Γ376681 業 式 已 對 解 模 把 位 介 入 序 饋 子 圍 結 性 替 對 之 意 元 口述軟體中是常見的,然而,在本發明中, 能夠將語意物件的例子當作語言界標並回報 理解函數的回應,亦以動態模式回到它們上 應用設計者而言,有如SALT正在執行語意 〇 將該操作模式與多模式方面比較更易於理 式方面中,一使用者指示一欄位,例如,藉 該尖筆指向並放置於輸入欄位裡。當該使用 般欄位中並表達一精確的語句以一單一句 ,然而使用者的眼睛和手需要專注於該「鍵 面,這種設計在許多情況下並不適當。此外 並講話」待徵係一豐富回送通道溝通,其在 下顯示處理條及體積,但是就速度和品質而 只對講話語言處理提供非常簡略的線索。對 就更有可能產生問題,其中錯誤可以傳播 ,最終需要花費更多的心力去驗證及校正識 果。因為從可用性研究看來,似乎較長的句 差異因素,其顯示語音的用途並非僅是鍵盤 ,滿足UI體驗對於把語音用作可實行形態 必要的。 為了增進人類-電腦間的感覺,使其成為達 緊密合作仗伴,藉由儘快報告部分語意分析 物件同步理解是有效的。在一實施例中,藉由 件的multiple模式用於SALT可達成。尤其 multiple 模 ,即,提供 的應用。它 物件同步理 解它。在多 由在講話時 者能夠鍵入 填入許多欄 入並講話」 ,雖然「鍵 講話語言程 論,那些回 於較長的句 至較廣的範 別及理解的 子是一關鍵 的加強或代 的成功是絕 成共同目標 或物件,語 把 listen(聽) 是對於已指 30 Γ376681 定一個multiple模式之listen元件並且之後為欲識別之輸 入語音指定的所有識別文法。結果的指派亦是在listen物 件中指定。例如,用以截取必要資訊之HTML輸入程式碼, 例如,日期、時間、位置、標題及會議人員、等等。用以 產生一新的會議可能採取下列型式: 〈listen mode= “multiple"…〉 〈grammar src=”subject.grm"/> 〈grammar src=ndate.grmn/> 〈grammar src=”time—duration·grmn/> 〈grammar src=n’attendees. grmn/> <bind targetElement=f!subject" value=7/ApptSubject’7> <bind targetElement=!tdate" value=n//DateTime"/> <bind targetElement="start time" value=!l//start_time// targetElement=nend time" value=,V/end_time" targetElement==f, duration1' value="//DateTime/duration,V> </listen> 31 1376681 多個文法器以一回到進入點的空值轉變迴圈為識別編 寫一平行搜尋空間。在該模式中,一旦一文法器退出,SALT 允許listen物件產生一事件。當下面的音訊集合和識別正 在進行時,事件分叉出一平行處理,以呼叫序列中的bind 指示,從而當一語音指令仍在對具有欄位的視覺呈現之一 應用敘說時,產生效果給使用者,其填滿表格中相關欄位。 對於免用視覺的應用程式之使用者介面,可能需要伴 隨的語音輸出。在這種情況下,SALT prompt物件可用於 給定立即的回饋。例如,下列的SALT prompt物件可用於 基於資料欄位之動態内容同步回應,而該語音同步化可用 於觸發額外的bind指令如下: <prompt id="say_date"> on〈value targetElement="date”/> </prompt> <listen ...> <bind targetElement"date" value="//date" targetElement="say_date" targetMethod="Start7> </listen> 32 Γ376681 純粹效果是使用者覺得他/她正在與另一人講話,不只 是草草記下,而是重複所聽到的,如同「在下週二(1〇/29 2 0 0 2)兩點(下午兩點開始)持續二小時(期間:二小時)安排 會議(新會議)」’其中在括號内所提供的該句子表示回到使 用者的聽覺和/或視覺提示(其亦被同步化)。 應該注意的是SALT允許設計者連接訂製的識別事件 管理器,其執行精密的計算,超越SALT bind指令的簡單 指派。在上例中,可以在語意文法器完成日期正規化,然 而該語意文法器不能有助於進一步的參考解析(例如,”安 排L i D e n g和他的經理的會議")。在此類例子中,可以實 作計算為可甴適當管理器存取的腳本(script)物件,以存取 用以確認不明確參考的儲存資料。此類計算係敘述於κ· Wang,"A plan based dialog system with probabilistic inferences" Proc. ICSLP-2000, Beijing China, 2000 及歐洲 專利EP 1199630A2,2002年4月24曰公告",在此參照其 全文併呈。 應該注意的是’儘管多模式操作對於listen物件存 在’在現有實作中,該模式只提供接收輸入的文字,例如 在口述方面。然而’在本發明的該態樣中,當接收輸入時 部分結果不僅是文字,而且尚包括屬於文字的對應語意資 訊’並因此該輸出包括部分語意分析或物件,其能夠如上 所述般提供使用者更佳品質回饋,其為電腦能夠適當理解 所接收者。依據接收部分語意分析或物件之應用的精密 33 1376681 度,依據所接收的部分語意分析系統提供確認、選擇、修 正及澄清回給使用者。 雖然已知多模型應用包括多個文法器以允許使用者講 話,及據此有能力提供被指示的資訊,在多種模式操作中 使用listen元件會更好,因為它提供給使用者較高的理解 的指示。在一純語音的應用中,產生一自然形式的對話, 然而如果使用視覺呈現的話,依據使用者目前所提供者之 部分語意分析及當使用者繼續講話時,一應用可以開始處 理(講話動作、顯示過渡結果結果或選擇,例如,經由跳出 式視窗)。 儘管係參照特定實施例描述本發明,習知該項技藝者 將了解任何未背離本發明範圍及精神之形式上及細節上之 改變皆屬本發明之範疇。 【圖式簡單說明】 第1圖是一種資料表示系統的方塊圖。 第2圖是操作環境的一計算裝置的一平面視圖。 第3圖是第2圖計算裝置的一方塊圖。 第4圖是一電話的一平面視圖。 第5圖是一般目的電腦的一方塊圖。 第 6圖是用於一客戶端/服務器系統之一結構的方塊 圖。 第7圖是語音識別和理解的模組的方塊圖。 34 Γ376681 【主要元件符號說明】 10系統 1 2語音介面模組 1 4語音識別及理解模組 1 6應用模組 18資料 20輸出 29麥克風 30元件 32外罩 33尖筆 34顯示器 35按鈕 3 6袖珍鍵盤 37 A/D轉換器 43擴音器
50 CPU 5 2無線收發器 54 RAM記憶體 58 ROM 5 9 D/A轉換器 60溝通介面 80電話 82顯示器 35 Γ376681 84袖珍鍵盤 100客戶端 120電腦 140處理單元 1 4 1系統匯流排 1 5 0系統記憶體
151 ROM
152 RAM 153 BIOS 154作業系统 1 5 5應用程式 1 5 6其他程式模組 1 5 7程式資料 1 6 0不可移除非揮發性記憶體介面 161硬碟機 164作業系統 1 6 5應用程式 166其他程式模組 1 6 7程式資料 1 70可移除非揮發性記憶體介面 171磁碟機 1 7 2可移除非揮發性磁碟 175光碟機 176可移除非揮發性光碟 36 1376681 180使用者輸入介面 181指向裝置 1 82鍵盤 1 83話筒 1 8 4監視器 1 8 5視訊介面 1 8 6印表機 187擴音器 1 88輸出週邊介面 1 9 0網路介面 1 9 1 區域網路 192數據機 1 9 3廣域網路 1 94遠端電腦 195遠端應用程式 200用於網頁基礎的識別及資料截取之結構 202網頁伺服器 204識別伺服器 2 0 5網路 206網頁語音可用控制/樣版 2 0 7專線 208公用電話網路 2 1 0第三者閘道器 2 11識別器 37 Γ376681 212電話聲音瀏覽器 2 1 4媒體伺服器 2 1 6聲音瀏覽器 220語言模型 222語音模組 3 0 6語音識別器 3 1 0語言模型

Claims (1)

  1. Γ376681 十、申請專利範圍: 1. 一種語音理解系統,包含: 一語言模型,其包含一 N-gram語言模型及一上下 文無關之文法語言模型之組合,該語言模型儲存與欲識 別的文字及語意資訊相關之資訊; 一模組,其適用於自一使用者接收輸入,及截取該 輸入以用於處理,該模組更適用於接收與該輸入的識別 相關的 SALT應用程式介面,該模組可設定以處理該 SALT應用程式介面及該輸入,以確定與一第一部分的 該輸入相關的語意資訊,及藉由存取該語言模型以輸出 一語意物件,其包含該第一部分的文字及語意資訊,其 中該語意物件的識別及輸出之執行係在持續截取該輸 入後續部分時執行。 2. 如申請專利範圍第1項所述之系統,其中該語言模型包 括一統一語言模型。 3. 如申請專利範圍第1項所述之系統,其中該語言模型包 括一語意語言模型。 4. 如申請專利範圍第1、2或3項所述之系統,其中該模 組適用於在一多數模式識別 SALT的一聽(listen)物 件,以在持續截取該輸入的爾後部分時,執行識別和輸 出該語意物件。 5. 如申請專利範圍第4項所述之系統,其中該模組適用於 識別文法物件,以定義該語言模型的一搜尋空間。 39 1376681 6. 如申請專利範圍第1、2或3項所述之系統,其中 組適用於識別文法物件,以定義該語言模型的一搜 間。 7. 一種包含電腦裝置可讀指令之電腦可讀取媒體,當 時使該電腦裝置藉由執行下列步驟控制資訊,包招 接收來自一使用者的輸入,及截取該輸入用 理; 接收S ALT應用程式介面,以識別一語言模型 行識別及理解,該語言模型適用於提供所識別的輸 字,及該接收的輸入之語意資訊; 藉由存取該語言模型處理該輸入,以對該輸入 識別,以確定與該輸入的一第一部分相關之語意賀 以及輸出一語意物件,其包含該識別的輸入的文字 該第一部分的語意資訊,其中該語意物件的識別及 之執行係在持續截取該輸入爾後部分時執行。 8. 如申請專利範圍第7項所述之電腦可讀取媒體,其 理包括在一多數模式中識別SALT的一聽物件,以 續截取該輸入爾後部分時,執行識別和輸出該語 件。 9. 如申請專利範圍第8項所述之電腦可讀取媒體,其 收SALT應用程式界面包括識別文法物件,以定義 言模型的一搜尋空間。 10. 如申請專利範圍第7項所述之電腦可讀取媒體,其 該模 尋空 實作 於處 以執 入文 執行 訊, ,及 輸出 中處 在持 意物 中接 該語 中接 40 1376681 收S A LT應用程式界面包括識別文法物件,以定義該語 言模型的搜尋空間。 41
TW093114299A 2003-05-29 2004-05-20 Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon TWI376681B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/448,018 US7200559B2 (en) 2003-05-29 2003-05-29 Semantic object synchronous understanding implemented with speech application language tags

Publications (2)

Publication Number Publication Date
TW200515369A TW200515369A (en) 2005-05-01
TWI376681B true TWI376681B (en) 2012-11-11

Family

ID=33131605

Family Applications (1)

Application Number Title Priority Date Filing Date
TW093114299A TWI376681B (en) 2003-05-29 2004-05-20 Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon

Country Status (16)

Country Link
US (1) US7200559B2 (zh)
EP (2) EP1482481B1 (zh)
JP (1) JP4768970B2 (zh)
KR (1) KR101042119B1 (zh)
CN (1) CN100578614C (zh)
AT (1) ATE398325T1 (zh)
AU (1) AU2004201992B2 (zh)
BR (1) BRPI0401850B1 (zh)
CA (1) CA2467220C (zh)
DE (1) DE602004014316D1 (zh)
HK (1) HK1071466A1 (zh)
MX (1) MXPA04005122A (zh)
MY (1) MY142974A (zh)
RU (1) RU2349969C2 (zh)
TW (1) TWI376681B (zh)
ZA (1) ZA200403492B (zh)

Families Citing this family (250)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6630800A (en) * 1999-08-13 2001-03-13 Pixo, Inc. Methods and apparatuses for display and traversing of links in page character array
US8645137B2 (en) * 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20110267263A1 (en) 2000-07-17 2011-11-03 Microsoft Corporation Changing input tolerances based on device movement
US7249018B2 (en) * 2001-01-12 2007-07-24 International Business Machines Corporation System and method for relating syntax and semantics for a conversational speech application
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US20080313282A1 (en) 2002-09-10 2008-12-18 Warila Bruce W User interface, operating system and architecture
US7386449B2 (en) * 2002-12-11 2008-06-10 Voice Enabling Systems Technology Inc. Knowledge-based flexible natural speech dialogue system
US7426329B2 (en) 2003-03-06 2008-09-16 Microsoft Corporation Systems and methods for receiving, storing, and rendering digital video, music, and pictures on a personal media player
US7669134B1 (en) * 2003-05-02 2010-02-23 Apple Inc. Method and apparatus for displaying information during an instant messaging session
US7966188B2 (en) * 2003-05-20 2011-06-21 Nuance Communications, Inc. Method of enhancing voice interactions using visual messages
US8301436B2 (en) * 2003-05-29 2012-10-30 Microsoft Corporation Semantic object synchronous understanding for highly interactive interface
US7532196B2 (en) * 2003-10-30 2009-05-12 Microsoft Corporation Distributed sensing techniques for mobile devices
US7739117B2 (en) * 2004-09-20 2010-06-15 International Business Machines Corporation Method and system for voice-enabled autofill
US20060155530A1 (en) * 2004-12-14 2006-07-13 International Business Machines Corporation Method and apparatus for generation of text documents
TWI276046B (en) * 2005-02-18 2007-03-11 Delta Electronics Inc Distributed language processing system and method of transmitting medium information therefore
US20060247925A1 (en) * 2005-04-27 2006-11-02 International Business Machines Corporation Virtual push-to-talk
US20060277525A1 (en) * 2005-06-06 2006-12-07 Microsoft Corporation Lexical, grammatical, and semantic inference mechanisms
JP4733436B2 (ja) * 2005-06-07 2011-07-27 日本電信電話株式会社 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US7636794B2 (en) 2005-10-31 2009-12-22 Microsoft Corporation Distributed sensing techniques for mobile devices
US7817991B2 (en) * 2006-02-14 2010-10-19 Microsoft Corporation Dynamic interconnection of mobile devices
US7865357B2 (en) * 2006-03-14 2011-01-04 Microsoft Corporation Shareable filler model for grammar authoring
US7752152B2 (en) * 2006-03-17 2010-07-06 Microsoft Corporation Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling
US8032375B2 (en) * 2006-03-17 2011-10-04 Microsoft Corporation Using generic predictive models for slot values in language modeling
US20070239453A1 (en) * 2006-04-06 2007-10-11 Microsoft Corporation Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances
US7689420B2 (en) * 2006-04-06 2010-03-30 Microsoft Corporation Personalizing a context-free grammar using a dictation language model
US7797672B2 (en) * 2006-05-30 2010-09-14 Motorola, Inc. Statechart generation using frames
US7505951B2 (en) * 2006-05-30 2009-03-17 Motorola, Inc. Hierarchical state machine generation for interaction management using goal specifications
US7493293B2 (en) * 2006-05-31 2009-02-17 International Business Machines Corporation System and method for extracting entities of interest from text using n-gram models
US8140267B2 (en) * 2006-06-30 2012-03-20 International Business Machines Corporation System and method for identifying similar molecules
US8346555B2 (en) * 2006-08-22 2013-01-01 Nuance Communications, Inc. Automatic grammar tuning using statistical language model generation
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8019590B1 (en) 2006-09-11 2011-09-13 WordRake Holdings, LLC Computer processes for analyzing and improving document readability
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US8515733B2 (en) * 2006-10-18 2013-08-20 Calculemus B.V. Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language
ES2302640B1 (es) * 2006-12-21 2009-05-21 Juan Jose Bermudez Perez Sistema para la interaccion mediante voz en paginas web.
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US7912828B2 (en) * 2007-02-23 2011-03-22 Apple Inc. Pattern searching methods and apparatuses
US8977255B2 (en) * 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
ITFI20070177A1 (it) 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
US8074199B2 (en) * 2007-09-24 2011-12-06 Microsoft Corporation Unified messaging state machine
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8364694B2 (en) 2007-10-26 2013-01-29 Apple Inc. Search assistant for digital media assets
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US8370160B2 (en) * 2007-12-31 2013-02-05 Motorola Mobility Llc Methods and apparatus for implementing distributed multi-modal applications
US8386260B2 (en) * 2007-12-31 2013-02-26 Motorola Mobility Llc Methods and apparatus for implementing distributed multi-modal applications
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8327272B2 (en) 2008-01-06 2012-12-04 Apple Inc. Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8289283B2 (en) 2008-03-04 2012-10-16 Apple Inc. Language input interface on a device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US20100082328A1 (en) * 2008-09-29 2010-04-01 Apple Inc. Systems and methods for speech preprocessing in text to speech synthesis
US8396714B2 (en) * 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8352272B2 (en) * 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8355919B2 (en) * 2008-09-29 2013-01-15 Apple Inc. Systems and methods for text normalization for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8380507B2 (en) * 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
GB0905457D0 (en) 2009-03-30 2009-05-13 Touchtype Ltd System and method for inputting text into electronic devices
US9424246B2 (en) 2009-03-30 2016-08-23 Touchtype Ltd. System and method for inputting text into electronic devices
US10191654B2 (en) 2009-03-30 2019-01-29 Touchtype Limited System and method for inputting text into electronic devices
US9189472B2 (en) 2009-03-30 2015-11-17 Touchtype Limited System and method for inputting text into small screen devices
GB0917753D0 (en) 2009-10-09 2009-11-25 Touchtype Ltd System and method for inputting text into electronic devices
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US8412531B2 (en) * 2009-06-10 2013-04-02 Microsoft Corporation Touch anywhere to speak
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110010179A1 (en) * 2009-07-13 2011-01-13 Naik Devang K Voice synthesis and processing
KR20110036385A (ko) * 2009-10-01 2011-04-07 삼성전자주식회사 사용자 의도 분석 장치 및 방법
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8311838B2 (en) * 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9104670B2 (en) 2010-07-21 2015-08-11 Apple Inc. Customized search or acquisition of digital media assets
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
TWI423044B (zh) * 2010-10-25 2014-01-11 Univ Nat Taiwan Science Tech 基於普及運算的意見交流方法與系統
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120265784A1 (en) * 2011-04-15 2012-10-18 Microsoft Corporation Ordering semantic query formulation suggestions
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US20120310642A1 (en) 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
WO2013116461A1 (en) * 2012-02-03 2013-08-08 Kextil, Llc Systems and methods for voice-guided operations
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US9294539B2 (en) 2013-03-14 2016-03-22 Microsoft Technology Licensing, Llc Cooperative federation of digital devices via proxemics and device micro-mobility
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US11151899B2 (en) 2013-03-15 2021-10-19 Apple Inc. User training by intelligent digital assistant
US10078487B2 (en) 2013-03-15 2018-09-18 Apple Inc. Context-sensitive handling of interruptions
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
US9437186B1 (en) * 2013-06-19 2016-09-06 Amazon Technologies, Inc. Enhanced endpoint detection for speech recognition
US9123336B1 (en) * 2013-06-25 2015-09-01 Google Inc. Learning parsing rules and argument identification from crowdsourcing of proposed command inputs
US9026431B1 (en) * 2013-07-30 2015-05-05 Google Inc. Semantic parsing with multiple parsers
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US9495359B1 (en) 2013-08-21 2016-11-15 Athena Ann Smyros Textual geographical location processing
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US8868409B1 (en) 2014-01-16 2014-10-21 Google Inc. Evaluating transcriptions with a semantic parser
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
EP3195145A4 (en) 2014-09-16 2018-01-24 VoiceBox Technologies Corporation Voice commerce
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9747896B2 (en) 2014-10-15 2017-08-29 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9836527B2 (en) * 2016-02-24 2017-12-05 Google Llc Customized query-action mappings for an offline grammar model
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
GB201610984D0 (en) 2016-06-23 2016-08-10 Microsoft Technology Licensing Llc Suppression of input images
US10140260B2 (en) * 2016-07-15 2018-11-27 Sap Se Intelligent text reduction for graphical interface elements
US10503808B2 (en) 2016-07-15 2019-12-10 Sap Se Time user interface with intelligent text reduction
US10331784B2 (en) 2016-07-29 2019-06-25 Voicebox Technologies Corporation System and method of disambiguating natural language processing requests
CN107665706B (zh) * 2016-07-29 2021-05-04 科大讯飞股份有限公司 快速语音交互方法及系统
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
RU2648572C1 (ru) * 2017-01-12 2018-03-26 Общество с ограниченной ответственностью "Инвестиционная группа "Коперник" Алгоритм поиска в компьютерных системах и базах данных
US10311860B2 (en) * 2017-02-14 2019-06-04 Google Llc Language model biasing system
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
TWI640877B (zh) * 2017-06-14 2018-11-11 財團法人資訊工業策進會 語意分析裝置、方法及其電腦程式產品
US11037554B1 (en) * 2017-09-12 2021-06-15 Wells Fargo Bank, N.A. Network of domain knowledge based conversational agents
CN108010525A (zh) * 2017-12-07 2018-05-08 横琴七弦琴知识产权服务有限公司 一种语音控制智能抽屉系统
CN108133701B (zh) * 2017-12-25 2021-11-12 江苏木盟智能科技有限公司 一种机器人语音交互的系统与方法
CN109994105A (zh) * 2017-12-29 2019-07-09 宝马股份公司 信息输入方法、装置、系统、车辆以及可读存储介质
CN108831482A (zh) * 2018-08-24 2018-11-16 深圳市云采网络科技有限公司 一种基于语音识别搜索电子元器件的方法
US11430433B2 (en) 2019-05-05 2022-08-30 Microsoft Technology Licensing, Llc Meeting-adapted language model for speech recognition
CN110379428A (zh) * 2019-07-16 2019-10-25 维沃移动通信有限公司 一种信息处理方法及终端设备
CN110619873A (zh) * 2019-08-16 2019-12-27 北京小米移动软件有限公司 音频处理方法、装置及存储介质
CN113223510B (zh) * 2020-01-21 2022-09-20 青岛海尔电冰箱有限公司 冰箱及其设备语音交互方法、计算机可读存储介质
US12211517B1 (en) 2021-09-15 2025-01-28 Amazon Technologies, Inc. Endpointing in speech processing

Family Cites Families (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2981254A (en) * 1957-11-12 1961-04-25 Edwin G Vanderbilt Apparatus for the gas deflation of an animal's stomach
US3657744A (en) * 1970-05-08 1972-04-25 Univ Minnesota Method for fixing prosthetic implants in a living body
US3788327A (en) * 1971-03-30 1974-01-29 H Donowitz Surgical implant device
US3874388A (en) * 1973-02-12 1975-04-01 Ochsner Med Found Alton Shunt defect closure system
US4014318A (en) * 1973-08-20 1977-03-29 Dockum James M Circulatory assist device and system
US4086665A (en) * 1976-12-16 1978-05-02 Thermo Electron Corporation Artificial blood conduit
US4212463A (en) * 1978-02-17 1980-07-15 Pratt Enoch B Humane bleeder arrow
DE3019996A1 (de) * 1980-05-24 1981-12-03 Institute für Textil- und Faserforschung Stuttgart, 7410 Reutlingen Hohlorgan
US4808183A (en) * 1980-06-03 1989-02-28 University Of Iowa Research Foundation Voice button prosthesis and method for installing same
EP0203124B1 (en) * 1984-11-15 1991-06-05 NAZARI, Stefano Device for selective bronchial intubation and separate lung ventilation
ES8705239A1 (es) * 1984-12-05 1987-05-01 Medinvent Sa Un dispositivo para implantar,mediante insercion en un lugarde dificil acceso, una protesis sustancialmente tubular y radialmente expandible
US4759758A (en) * 1984-12-07 1988-07-26 Shlomo Gabbay Prosthetic heart valve
US4831550A (en) 1986-03-27 1989-05-16 International Business Machines Corporation Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events
US4832680A (en) * 1986-07-03 1989-05-23 C.R. Bard, Inc. Apparatus for hypodermically implanting a genitourinary prosthesis
US4795449A (en) * 1986-08-04 1989-01-03 Hollister Incorporated Female urinary incontinence device
US4852568A (en) * 1987-02-17 1989-08-01 Kensey Nash Corporation Method and apparatus for sealing an opening in tissue of a living being
DE3723078A1 (de) 1987-07-11 1989-01-19 Philips Patentverwaltung Verfahren zur erkennung von zusammenhaengend gesprochenen woertern
DE3821631A1 (de) * 1987-07-28 1989-02-09 Bader Paul Verschluss fuer eine maennliche harnroehre
DE3739681A1 (de) 1987-11-24 1989-06-08 Philips Patentverwaltung Verfahren zum bestimmen von anfangs- und endpunkt isoliert gesprochener woerter in einem sprachsignal und anordnung zur durchfuehrung des verfahrens
US4830003A (en) * 1988-06-17 1989-05-16 Wolff Rodney G Compressive stent and delivery system
JP2710355B2 (ja) * 1988-09-20 1998-02-10 日本ゼオン株式会社 医用弁装置
US4846836A (en) * 1988-10-03 1989-07-11 Reich Jonathan D Artificial lower gastrointestinal valve
DE3834545A1 (de) * 1988-10-11 1990-04-12 Rau Guenter Flexibles schliessorgan, insbesondere herzklappe, und verfahren zur herstellung desselben
EP0474748B1 (en) * 1989-05-31 1995-01-25 Baxter International Inc. Biological valvular prosthesis
US5263117A (en) 1989-10-26 1993-11-16 International Business Machines Corporation Method and apparatus for finding the best splits in a decision tree for a language model for a speech recognizer
DK124690D0 (da) * 1990-05-18 1990-05-18 Henning Rud Andersen Klapprotes til implantering i kroppen for erstatning af naturlig klap samt kateter til brug ved implantering af en saadan klapprotese
US5411552A (en) * 1990-05-18 1995-05-02 Andersen; Henning R. Valve prothesis for implantation in the body and a catheter for implanting such valve prothesis
US5193525A (en) * 1990-11-30 1993-03-16 Vision Sciences Antiglare tip in a sheath for an endoscope
US5116360A (en) * 1990-12-27 1992-05-26 Corvita Corporation Mesh composite graft
US5477451A (en) 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US5123919A (en) * 1991-11-21 1992-06-23 Carbomedics, Inc. Combined prosthetic aortic heart valve and vascular graft
DE69324239T2 (de) * 1992-01-21 1999-11-04 The Regents Of The University Of Minnesota, Minneapolis Verschlusseinrichtung eines septumschadens
US5329887A (en) * 1992-04-03 1994-07-19 Vision Sciences, Incorporated Endoscope control assembly with removable control knob/brake assembly
US5502774A (en) 1992-06-09 1996-03-26 International Business Machines Corporation Automatic recognition of a consistent message using multiple complimentary sources of information
US5382261A (en) * 1992-09-01 1995-01-17 Expandable Grafts Partnership Method and apparatus for occluding vessels
JP3378595B2 (ja) * 1992-09-30 2003-02-17 株式会社日立製作所 音声対話システムおよびその対話進行制御方法
US5409019A (en) * 1992-10-30 1995-04-25 Wilk; Peter J. Coronary artery by-pass method
US5419310A (en) * 1992-11-03 1995-05-30 Vision Sciences, Inc. Partially inflated protective endoscope sheath
US5384892A (en) 1992-12-31 1995-01-24 Apple Computer, Inc. Dynamic language model for speech recognition
US5306234A (en) * 1993-03-23 1994-04-26 Johnson W Dudley Method for closing an atrial appendage
US5447148A (en) * 1993-07-08 1995-09-05 Vision Sciences, Inc. Endoscopic contamination protection system to facilitate cleaning of endoscopes
DE69423838T2 (de) 1993-09-23 2000-08-03 Xerox Corp., Rochester Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen
US5615296A (en) 1993-11-12 1997-03-25 International Business Machines Corporation Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors
US5483951A (en) * 1994-02-25 1996-01-16 Vision-Sciences, Inc. Working channels for a disposable sheath for an endoscope
US5520607A (en) * 1994-03-04 1996-05-28 Vision Sciences, Inc. Holding tray and clamp assembly for an endoscopic sheath
US5499995C1 (en) * 1994-05-25 2002-03-12 Paul S Teirstein Body passageway closure apparatus and method of use
US5417226A (en) * 1994-06-09 1995-05-23 Juma; Saad Female anti-incontinence device
US5675819A (en) 1994-06-16 1997-10-07 Xerox Corporation Document information retrieval using global word co-occurrence patterns
US5752052A (en) 1994-06-24 1998-05-12 Microsoft Corporation Method and system for bootstrapping statistical processing into a rule-based natural language parser
US5755770A (en) * 1995-01-31 1998-05-26 Boston Scientific Corporatiion Endovascular aortic graft
US5689617A (en) 1995-03-14 1997-11-18 Apple Computer, Inc. Speech recognition system which returns recognition results as a reconstructed language model with attached data values
IT1279171B1 (it) 1995-03-17 1997-12-04 Ist Trentino Di Cultura Sistema di riconoscimento di parlato continuo
DE29507519U1 (de) * 1995-05-05 1995-08-10 Angiomed Ag, 76227 Karlsruhe Endosphinkter und Set zum freigebbaren Verschließen der Urethra
US5710866A (en) 1995-05-26 1998-01-20 Microsoft Corporation System and method for speech recognition using dynamically adjusted confidence measure
US5667476A (en) * 1995-06-05 1997-09-16 Vision-Sciences, Inc. Endoscope articulation system to reduce effort during articulation of an endoscope
US5680511A (en) 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
US5645565A (en) * 1995-06-13 1997-07-08 Ethicon Endo-Surgery, Inc. Surgical plug
CA2234389A1 (en) * 1995-10-13 1997-04-17 Transvascular, Inc. A device, system and method for interstitial transvascular intervention
JPH09114488A (ja) * 1995-10-16 1997-05-02 Sony Corp 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
DE69517705T2 (de) 1995-11-04 2000-11-23 International Business Machines Corp., Armonk Verfahren und vorrichtung zur anpassung der grösse eines sprachmodells in einem spracherkennungssystem
US6567778B1 (en) 1995-12-21 2003-05-20 Nuance Communications Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores
US5913193A (en) 1996-04-30 1999-06-15 Microsoft Corporation Method and system of runtime acoustic unit selection for speech synthesis
US5937384A (en) 1996-05-01 1999-08-10 Microsoft Corporation Method and system for speech recognition using continuous density hidden Markov models
EP0906135B1 (en) * 1996-05-20 2004-12-29 Medtronic Percusurge, Inc. Low profile catheter valve
DE69719237T2 (de) * 1996-05-23 2003-11-27 Samsung Electronics Co., Ltd. Flexibler, selbstexpandierbarer Stent und Verfahren zu dessen Herstellung
US5835888A (en) 1996-06-10 1998-11-10 International Business Machines Corporation Statistical language model for inflected languages
KR980000327U (ko) * 1996-06-13 1998-03-30 이정행 귀걸이 설치용 귀걸이홀 성형구
US5855601A (en) * 1996-06-21 1999-01-05 The Trustees Of Columbia University In The City Of New York Artificial heart valve and method and device for implanting the same
US5963903A (en) 1996-06-28 1999-10-05 Microsoft Corporation Method and system for dynamically adjusted training for speech recognition
US5685822A (en) * 1996-08-08 1997-11-11 Vision-Sciences, Inc. Endoscope with sheath retaining device
US5782916A (en) * 1996-08-13 1998-07-21 Galt Laboratories, Inc. Device for maintaining urinary continence
JPH1097280A (ja) * 1996-09-19 1998-04-14 Hitachi Ltd 音声画像認識翻訳装置
US5905972A (en) 1996-09-30 1999-05-18 Microsoft Corporation Prosodic databases holding fundamental frequency templates for use in speech synthesis
US5819220A (en) 1996-09-30 1998-10-06 Hewlett-Packard Company Web triggered word set boosting for speech interfaces to the world wide web
US5829000A (en) 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
GB9701866D0 (en) 1997-01-30 1997-03-19 British Telecomm Information retrieval
DE19708183A1 (de) 1997-02-28 1998-09-03 Philips Patentverwaltung Verfahren zur Spracherkennung mit Sprachmodellanpassung
US6083255A (en) * 1997-04-07 2000-07-04 Broncus Technologies, Inc. Bronchial stenter
US6200333B1 (en) * 1997-04-07 2001-03-13 Broncus Technologies, Inc. Bronchial stenter
US6245102B1 (en) * 1997-05-07 2001-06-12 Iowa-India Investments Company Ltd. Stent, stent graft and stent valve
US5855597A (en) * 1997-05-07 1999-01-05 Iowa-India Investments Co. Limited Stent valve and stent graft for percutaneous surgery
US6073091A (en) 1997-08-06 2000-06-06 International Business Machines Corporation Apparatus and method for forming a filtered inflected language model for automatic speech recognition
US5954766A (en) * 1997-09-16 1999-09-21 Zadno-Azizi; Gholam-Reza Body fluid flow control device
US6154722A (en) 1997-12-18 2000-11-28 Apple Computer, Inc. Method and apparatus for a speech recognition system language model that integrates a finite state grammar probability and an N-gram probability
DE59812219D1 (de) * 1998-03-04 2004-12-09 Schneider Europ Gmbh Buelach Vorrichtung zum Einführen einer Endoprothese in einen Katheterschaft
US6182039B1 (en) 1998-03-24 2001-01-30 Matsushita Electric Industrial Co., Ltd. Method and apparatus using probabilistic language model based on confusable sets for speech recognition
US6141641A (en) 1998-04-15 2000-10-31 Microsoft Corporation Dynamically configurable acoustic model for speech recognition system
US6009614A (en) * 1998-04-21 2000-01-04 Advanced Cardiovascular Systems, Inc. Stent crimping tool and method of use
US5974652A (en) * 1998-05-05 1999-11-02 Advanced Cardiovascular Systems, Inc. Method and apparatus for uniformly crimping a stent onto a catheter
US6174323B1 (en) * 1998-06-05 2001-01-16 Broncus Technologies, Inc. Method and assembly for lung volume reduction
US6188976B1 (en) 1998-10-23 2001-02-13 International Business Machines Corporation Apparatus and method for building domain-specific language models
US6174280B1 (en) * 1998-11-19 2001-01-16 Vision Sciences, Inc. Sheath for protecting and altering the bending characteristics of a flexible endoscope
US6020380A (en) * 1998-11-25 2000-02-01 Tap Holdings Inc. Method of treating chronic obstructive pulmonary disease
US6051022A (en) * 1998-12-30 2000-04-18 St. Jude Medical, Inc. Bileaflet valve having non-parallel pivot axes
US6350231B1 (en) * 1999-01-21 2002-02-26 Vision Sciences, Inc. Apparatus and method for forming thin-walled elastic components from an elastomeric material
US6530881B1 (en) * 1999-01-21 2003-03-11 Vision Sciences, Inc. Sheath apparatus for endoscopes and methods for forming same
US6081799A (en) 1999-05-05 2000-06-27 International Business Machines Corporation Executing complex SQL queries using index screening for conjunct or disjunct index operations
US6206918B1 (en) * 1999-05-12 2001-03-27 Sulzer Carbomedics Inc. Heart valve prosthesis having a pivot design for improving flow characteristics
US6234996B1 (en) * 1999-06-23 2001-05-22 Percusurge, Inc. Integrated inflation/deflation device and method
US6287290B1 (en) * 1999-07-02 2001-09-11 Pulmonx Methods, systems, and kits for lung volume reduction
US6712812B2 (en) * 1999-08-05 2004-03-30 Broncus Technologies, Inc. Devices for creating collateral channels
US6190330B1 (en) * 1999-08-09 2001-02-20 Vision-Sciences, Inc. Endoscopic location and vacuum assembly and method
US6293951B1 (en) * 1999-08-24 2001-09-25 Spiration, Inc. Lung reduction device, system, and method
US6416554B1 (en) * 1999-08-24 2002-07-09 Spiration, Inc. Lung reduction apparatus and method
US6402754B1 (en) * 1999-10-20 2002-06-11 Spiration, Inc. Apparatus for expanding the thorax
US6398775B1 (en) * 1999-10-21 2002-06-04 Pulmonx Apparatus and method for isolated lung access
US6510846B1 (en) * 1999-12-23 2003-01-28 O'rourke Sam Sealed back pressure breathing device
US6865528B1 (en) 2000-06-01 2005-03-08 Microsoft Corporation Use of a unified language model
US6568387B2 (en) * 2000-07-19 2003-05-27 University Of Florida Method for treating chronic obstructive pulmonary disorder
TW472232B (en) * 2000-08-11 2002-01-11 Ind Tech Res Inst Probability-base fault-tolerance natural language understanding method
US6785651B1 (en) * 2000-09-14 2004-08-31 Microsoft Corporation Method and apparatus for performing plan-based dialog
US6527761B1 (en) * 2000-10-27 2003-03-04 Pulmonx, Inc. Methods and devices for obstructing and aspirating lung tissue segments
JP2004530982A (ja) * 2001-05-04 2004-10-07 ユニシス コーポレーション Webサーバからの音声アプリケーション情報の動的な生成
JP4602602B2 (ja) * 2001-07-19 2010-12-22 オリンパス株式会社 医療器具
US20030018327A1 (en) * 2001-07-20 2003-01-23 Csaba Truckai Systems and techniques for lung volume reduction
JP4094255B2 (ja) * 2001-07-27 2008-06-04 日本電気株式会社 コマンド入力機能つきディクテーション装置
US20030050648A1 (en) * 2001-09-11 2003-03-13 Spiration, Inc. Removable lung reduction devices, systems, and methods
US6592594B2 (en) * 2001-10-25 2003-07-15 Spiration, Inc. Bronchial obstruction device deployment system and method
JP4000828B2 (ja) * 2001-11-06 2007-10-31 株式会社デンソー 情報システム、電子機器、プログラム

Also Published As

Publication number Publication date
US20040243393A1 (en) 2004-12-02
JP2004355630A (ja) 2004-12-16
CN100578614C (zh) 2010-01-06
CA2467220C (en) 2014-07-08
RU2349969C2 (ru) 2009-03-20
MY142974A (en) 2011-01-31
KR20040103445A (ko) 2004-12-08
ZA200403492B (en) 2006-04-26
EP1482481A1 (en) 2004-12-01
BRPI0401850A (pt) 2005-03-08
HK1071466A1 (en) 2005-07-15
BRPI0401850B1 (pt) 2018-09-11
JP4768970B2 (ja) 2011-09-07
ATE398325T1 (de) 2008-07-15
EP1482481B1 (en) 2008-06-11
US7200559B2 (en) 2007-04-03
EP1970897A1 (en) 2008-09-17
TW200515369A (en) 2005-05-01
KR101042119B1 (ko) 2011-06-17
RU2004116304A (ru) 2005-11-10
MXPA04005122A (es) 2005-02-17
CN1573928A (zh) 2005-02-02
DE602004014316D1 (de) 2008-07-24
AU2004201992B2 (en) 2009-10-22
AU2004201992A1 (en) 2004-12-16
CA2467220A1 (en) 2004-11-29

Similar Documents

Publication Publication Date Title
TWI376681B (en) Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon
KR101066741B1 (ko) 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체
EP0607615B1 (en) Speech recognition interface system suitable for window systems and speech mail systems
CN102339129B (zh) 一种基于语音和手势的多通道人机交互方法
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
CN118865965A (zh) 用户、自动化助理和其它计算服务之间的多模态交互
JP2009059378A (ja) ダイアログを目的とするアプリケーション抽象化のための記録媒体及び方法
KR101213835B1 (ko) 음성 인식에 있어서 동사 에러 복원
CN109144458A (zh) 用于执行与语音输入相对应的操作的电子设备
JP2007328283A (ja) 対話装置、プログラム、及び対話方法
Wang Semantic object synchronous understanding in SALT for highly interactive user interface.
Miyazaki Discussion board system with modality variation: From multi-modality to user freedom
CN117099077A (zh) 具有用户视图上下文和多模态输入支持的支持语音助手的客户端应用
Van Kleek et al. Designing speech interfaces for kiosks
Deng et al. A speech-centric perspective for human-computer interface

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees