[go: up one dir, main page]

JP2000032140A - 音声認識を用いたロボットホテル従業員 - Google Patents

音声認識を用いたロボットホテル従業員

Info

Publication number
JP2000032140A
JP2000032140A JP11119834A JP11983499A JP2000032140A JP 2000032140 A JP2000032140 A JP 2000032140A JP 11119834 A JP11119834 A JP 11119834A JP 11983499 A JP11983499 A JP 11983499A JP 2000032140 A JP2000032140 A JP 2000032140A
Authority
JP
Japan
Prior art keywords
name
hotel
customer
robot
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11119834A
Other languages
English (en)
Other versions
JP3135233B2 (ja
Inventor
Jean-Claude Junqua
ジャン−クロード・ジュンカ
Matteo Contolini
マッテオ・コントリーニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JP2000032140A publication Critical patent/JP2000032140A/ja
Application granted granted Critical
Publication of JP3135233B2 publication Critical patent/JP3135233B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 既存の辞書には見あたらない氏名や地名の如
くの単語を認識できるように認識システムを拡張して、
電話交換システムを中心とする業務の省力化、低コスト
化を計る。 【解決手段】 ホテルでの予約登録及び電話システムに
組み込むのに理想的なロボット業務システムで、ロボッ
トホテル従業員は、ホテルの交換手に接続しなくとも、ホ
テルの顧客に対して業務サービスを提供し、かつ、発呼経
路選択機能も行う。ホテル予約登録システムは、ホテル
顧客の記述氏名を受け付けて保存すると共に、各顧客に
対して対応する内線電話番号を割り当てる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ロボットホテル業
務システム(automated hotel attendant system)に関
し、詳述すれば、音声認識装置を自動学習させると共に、
ホテル顧客データベースを維持管理する辞書学習システ
ムを利用したロボットホテル業務システムに関する。
【0002】
【従来の技術】ロボット従業員(automated attendant)
はオフィス環境で使われている。一般に、これらのロボ
ット従業員は、構内交換機(PBX)での発呼経路選択機
能(callrouting function)と行うのに音声認識装置を利
用している。
【0003】音声認識の分野では、音声認識装置が利用
するモデルを構築するためには、当該音声認識装置を利
用するに先立って辞書にある各単語を音声に変換する必
要がある。従来、この音声への変換は、特定の言語の発音
のニュアンスを知り尽くした熟練辞書編纂者が手動で行
っている。しかしながら、辞書における各単語を誤解さ
れないほどほぼ正確に音声へと変換することは、相当な
時間がかかるばかりではなくて、高度の熟練が必要であ
る。
【0004】また、ロボット従業員において利用する辞
書は、姓名に関しては完全にはほど遠いのが通常であ
る。即ち、比較的変化のないオフィス環境では各人の氏
名、特に姓名をほぼ正確に音声に変換することはできる
ようであるが、このような方法は、ホテル顧客データベー
スにおける氏名の如く常時変化しているようなところで
のロボット従業員に適用できるとは思えない。
【0005】ロボット従業員の音声認識装置用のモデル
を自動的に構築する辞書学習システムを利用すれば、音
声変換に伴う前述のような労力や高度な熟練度の大部分
を減らすことができるようである。
【0006】
【発明の要旨】本発明による辞書学習システムは、既存
の認識システムを拡張して、既存の辞書には見あたらな
い氏名や地名の如くの単語を認識できるようにしたもの
である。書かれた氏名(以後、「記述氏名」と称する)か
ら複数の発音を生成する頑丈で信頼性のある表音化装置
こそ、この辞書学習システムの重要なものである。姓名
の発音が一旦判れば、ロボット従業員で使用する音声認
識装置を自動的に学習させるか、それとも更新させるか
の何れか一方、又は、両方を行うのに利用できる、話し手
とは独立した音声認識用モデルを構築できることにな
る。
【0007】従って、本発明のロボットホテル従業員は
前述した原理を利用したものであって、ホテルでの予約
登録及び電話システムに組み込むのに理想的なものであ
る。ロボットホテル従業員は、ホテルの交換手に接続し
なくとも、ホテルの顧客に対して業務サービスを提供で
きるばかりではなくて、発呼経路選択機能も行うもので
ある。ホテル予約登録システムは、ホテル顧客の記述氏
名を受け付けて保存すると共に、各顧客に対して対応す
る内線電話番号を割り当てる。
【0008】辞書学習システムはこのホテル予約登録シ
ステムと接続されていて、記述氏名の書体を単語音素デ
ータに変換することで記述氏名の発音を生成する。この
単語音素データは、音声認識システムが利用する辞書に
保存される。そこで、内線電話から入力した顧客の音声
による氏名(以後、「発声氏名」と略称)が、ホテル予約登
録システムで割り当てた内線電話番号を検索するのに利
用できる所定のホテル顧客氏名に変換されるようにロボ
ット従業員をこの音声認識システムと連携させている。
その後、ロボット従業員は電話交換システムをして、或る
一つの内線電話から発声氏名が入力されると、それに応
答して要請のあった内線電話番号を発呼させるようにし
ている。
【0009】
【好ましい実施の形態】以後、添付図面を参照しながら、
本発明の好ましい実施の形態を詳述する。但し、下記の
説明は好ましい実施の形態の一例であって、本発明とそ
の用途とを限定するものではない。また、音声認識装置
を自動学習させるために辞書学習システムを備えたロボ
ットホテル従業員について説明するが、当業者には、ホテ
ルに限らず、種々の音声処理の分野でも利用できるのは
明らかであろう。
【0010】図1においてロボットホテル業務システム
を10で示す。図示のロボットホテル業務システム10
は、電話交換手に接続しなくても音声認識によりホテル
顧客に対して業務サービスを提供できるようにしてい
る。ホテル顧客がまずチェックインすると、その顧客は
ホテル従業員に対して、住所氏名やチェックアウト時刻、
それにその他の登録情報を提示するのが通常である。そ
こで、ホテル業務システム10を補助する上で、顧客の国
籍などのその他の情報も顧客から集められるようにして
もよい。これらの情報のみならず、割り当てた客室番号
も、コンピュータ12を介して従来公知のホテル予約登
録システム14や、その他のインターフェース装置に入
力されてホテル顧客データベース20に保存される。
【0011】前述のように顧客情報が入力されると、辞
書学習システム30が、顧客の記述氏名を当該氏名に対
応する一つかそれ以上の発音に自動的に変換する。顧客
の氏名の知られた発音を利用すれば、辞書学習システム
30が音声認識装置22の利用する話し手とは独立した
音声認識モデルを構築するのは可能である。この音声認
識モデルは辞書32に保存され、音声認識装置がその辞
書32にアクセスするようになっている。この辞書32
における各ホテル顧客の氏名の特定の発音は、その顧客
がホテルに対してチェックインしたり、チェックアウト
する都度、自動的に更新されるようにしてもよい。
【0012】ロボット従業員50は音声認識を利用し
て、客室番号を知らなくても他のホテル客室に氏名によ
る音声ダイヤル呼出しを行う。即ち、ホテルの電話交換
システム(例えば、PBX)18を介して入ってきたホテ
ル電話16からの発呼は先ずロボット従業員50が受け
付けるが、その後ロボット従業員50は発呼経路選択機
能を実行する。ホテル顧客の発声氏名は、更新されてい
る辞書32を利用して音声認識装置22により認識され
る。すると、ロボット従業員50は、ホテル顧客データベ
ース20から内線電話番号を検索するためにホテル顧客
氏名を利用して発声氏名を割り当てられている内線電話
番号から照合(map)する。最後に、ロボット従業員50
は、電話交換システム18をして、検索した内線電話番号
に対して発呼を行わせることで、要請のあった発呼を適
切に転送するのである。
【0013】当業者にはよく知られているように、本発
明のロボット従業員は、音声による認識作用ができなく
なった場合でも記述氏名認識装置ないし従来公知の番号
案内サービスモジュールと併用できるものである。そし
て、最後の拠り所としては、本発明のロボット従業員はホ
テル交換手に顧客からの発呼を転送する。また、ロボッ
ト従業員50は、他のホテル業務案内や内線番号(例え
ば、フロントルームサービスやホテル内レストラン)にも
音声によるダイヤル発呼を行うこともできる。
【0014】顧客がホテルに宿泊している残余期間中で
は、本発明のロボット業務システム10は他のホテル業
務サービスに対してアクセスできるようになっている。
例えば、ホテル顧客の発音を利用して、音声合成装置24
を介して音声メールシステム26でメッセージをカスタ
マイズすることができる。また、顧客の国籍を利用して、
その国籍に合わせた言語で起床呼出しを行うようにする
こともできる。更にまた、本発明のロボット従業員を介
して他のホテルシステム28と交渉させることも考えら
れる。
【0015】図2に辞書学習システム30を詳細に示
す。一般に辞書学習システムは、記述氏名を構成する文
字を単語音素データに変換することにより当該記述氏名
の発音を生成する一方、このようにして生成した発音を
利用して音声認識装置22を学習させるののである。こ
の辞書学習システム30を実現するには、頑丈で信頼性
のある表音化装置がどうしても必要となる。ホテル予約
登録システム14に入力された顧客の記述氏名は表音化
装置34への入力として使われている。
【0016】ホテル顧客の記述氏名に基づいて複数の発
音を生成する原理を示すものとしての表音化装置34の
一例を図3に示す。これまでは、記述文字からその発音
への変換は、専ら文字そのものに依存するものであっ
た。この方法では、成されなければならないことが沢山
残されている。例えば、文字だけによる発音の生成装置
では、「Bib-l」の如くの単語を適切に発音するのは非常
に困難である。文字の並びに基づいてはじめて、文字だ
けによる発音システムは読み方を習い始めた小学生が発
音できる程度、その単語「Bib-l」を発音できるものと思
われる。従来のシステムにおけるこのような問題点は、
多くの言語の発音規則がもたらす固有の曖昧さや矛盾に
起因している。英語を取り上げただけでも、異なった発
音規則が沢山あって、単語ごとその問題に取り組むのを
困難にしているばかりではなくて、それに取り組むだけ
でも天文学的に莫大な費用を要している。
【0017】しかし、本発明で用いる表音化装置34は、
一組の文字だけの判定ツリー(letter-only decision tr
ees)72を利用する第1段階と、一組の混合判定ツリー
(mixed-decision trees)74を用いる第2段階の二段を
利用している。つまり、「B-I-B-L-E」なる文字の配列の
如くの入力列(input sequence)76を動的プログラム化
音素列生成装置78(dynamic programming phoneme seq
uence generator)78へ入力させる。音素列生成装置7
8は文字だけのツリー72を利用して、記述単語の入力
列について考えられる幾つかの候補発音のリスト80を
生成する。
【0018】音素列生成装置78は入力列にある各文字
を順に検討して、その文字に対応する判定ツリーを適用
して、文字だけのツリーに含まれている確率データに基
づいてその文字に対する音素発音を選択する。好ましく
は、文字だけの判定ツリー72には、アルファベットでの
各文字ごとの判定ツリーが含まれているのが望ましい。
図4は、文字「E」についての文字だけの判定ツリーの
一例を示している。
【0019】図4において、文字「E」についての文字
だけの判定ツリーは、複数の内部ノード(楕円形で示す)
と複数の群葉ノード(矩形で示す)(leaf nodes)とからな
る。各内部ノードはYes-No質疑が占めている。これらの
Yes-No質疑は、イエスとノーの何れかで答えることので
きる質疑である。この文字だけの判定ツリーでは、これ
らの質疑が特定の文字(即ち、文字「E」)と入力列にお
けるその文字に隣接する文字に対してなされている。
尚、図4においては、それぞれの質疑に対する答えがイエ
スか、ノーかに応じて各内部ノードが左側、又は、右側に
枝分かれしている。
【0020】図4において用いた略語の意味を説明す
る。 「+1」、「-1」: その時の文字に対する綴りの位置を表
す。例えば、「+1L=='R'?」とは、「その時の文字(図示の
場合ではE)の後に続く文字はRか」を意味する。 CONSとVOW: 文字のそれぞれの種類、即ち、それぞれ子音
と母音を表す。 「-」: 続く文字がない場合、即ち、ヌル文字の場合を表
す。このシンボルは、或る文字を対応する音素発音と合
わせるときに埋め合わせ記号ないしプレースホールダー
として利用される。 「#」: 単語の境界を示す。
【0021】群葉ノードは考えられる音素発音を、特定
の音素が与えられた文字の正しい発音であるとの確率を
表す数値と対応付ける確率データが占めている。例え
ば、「iy=>0.51」なる表記は、「この群葉における音素
「iy」の確率は0.51である」ことを意味している。
ヌル音素、即ち、無声音については「-」なる記号で示し
てある。
【0022】このように音素列生成装置78(図3)は文
字だけの判定ツリー72を利用して、リスト80に入れ
る一つかそれ以上の推測発音を生成する。好ましくは、
各発音には、判定ツリー72を利用して選ばれた個々の
音素の確率スコアを組み合わせて得られる数値スコアが
それに関連付けられてついているのが望ましい。単語発
音は、考えられる組合せの行列を構築し、動的プログラミ
ングを用いてn番目最良の候補を選択することでスコア
付けされていてもよい。別の方法としては、n番目最良
の候補を、後述のように最もありそうな単語候補を識別
して繰返し換字法により付加的候補を生成する換字法を
利用して選択するようにしてもよい。
【0023】最高確率スコアの発音が、先ず最高スコア
の音素(群葉ノードを検討することで識別される)のそれ
ぞれのスコアを掛け合わせて選択し、この選択を利用し
て確率の最も大きい候補ないし1番目最良の単語候補と
して選択する。そして、別の候補(n番目最良の候補)
を、群葉ノードにおける音素データを再び検討して、最初
に選択した音素との違いが最も小さい音素を識別するこ
とにより選択する。その後、違いが最小の音素を最初に
選択した音素と置換して、二番目最良の単語候補を生成
する。このようなプロセスは、所望数のn番目最良の候
補が選択されるまで繰り返すのである。リスト80はス
コアの降順にソートして、文字だけによる分析で最良で
あると判断された発音がリストの最初に現れるようにし
てもよい。
【0024】前述したように、文字だけによる分析では
芳しくない結果がよくでてくる。これは、文字だけによ
る分析では各文字において次の文字でどんな音素が生成
されるかを判断すべくもないからである。従って、文字
だけによる分析では、自然の音声では実際にあり得ない
高スコア付け発音(high scoring pronunciation)を生成
することができるのである。例えば、固有名「Achille
s」の発音は、両方の「ll」が表音化された発音、即ち、
「ah-k-ih-l-liy-z」となってしまう可能性が大きい。
それに対して、自然の音声では二番目の「l」は無声音
で、「ah-k-ih-l-iy-z」と発音するのがごく普通であ
る。このように、文字だけのツリーを利用する音素列生
成装置には、自然の音声では実際にあり得ない単語の発
音を取捨する機構が備わっていない。
【0025】表音化装置34の第二段階は前述の問題に
対してなされたものである。即ち、混合ツリースコア推
定器82が一組の混合判断ツリー74を利用して、リス
ト80に挙げられている各発音の利用可能(viability)
を評価する。このスコア推定器82は、入力列にある各
文字を、当該文字に音素列生成装置78が割り当てた音
素と共に順に検討すべく作用する。一組の文字だけのツ
リーと同様に、一組の混合ツリーには、アルファベットの
各文字ごとの混合ツリーが備わっている。この混合ツリ
ーの一例を図5に示す。
【0026】図5において、文字だけのツリーと同様に、
混合ツリーには内部ノードと群葉ノードと上がる。図5
では、内部ノードを楕円形で、また、群葉ノートは矩形で
示している。閣内部ノードはYes-No質疑で、また、各群葉
ノードは確率データで占められている。混合ツリーのツ
リー構造は文字だけのツリーのそれと似ているが、一つ
だけ重要な相異点がある。即ち、混合ツリーの内部ノー
ドの質疑には、互いに異なった二種の質疑、即ち、与えら
れた文字と文字列におけるそれと隣接した文字について
の質疑と、その与えられた文字に対応する音素と文字列
に対応する隣接する音素についての質疑とが含まれるこ
とがある。従って、判定ツリーは、質疑がこのように混合
していることから、混合していることになる。
【0027】図5にて示した略語の意味については、図
4に示したのと同一ではあるが、図4に示していない略
語も含まれているので、それについて説明する。図5に
おける略語「L」は、文字とそれに隣接する文字につい
ての質疑を表し、略語「P」は音素とそれに隣接する音
素についての質疑を表す。例えば「+1L=='D'?」なる質
疑は、「+1位置における文字は'D'か」の質問を意味して
いる。略語「CONS」と「SYL」とは、それぞれ子音と音節
との音素の種類を表している。例えば「+1P==CONS?」な
る質疑は、「+1位置における音素は子音か」の質問を意
味しており、群葉ノードにおける数値で、文字だけのツリ
ーの場合と同様に音素確率を表している。
【0028】混合ツリースコア推定器74は、混合ツリ
ー質疑に基づき、混合ツリーの群葉ノードにおける確率
データを利用してリスト80に挙げられている各発音に
ついて改めてスコア付けする。所望によっては、発音リ
ストはリスト84におけるのと同様にそれぞれのスコア
と関連づけして保存してもよい。また、所望によっては、
知ると84は、最初に挙げられた発音がスコアの最も高
いものとなるように、リスト84を降順に保存してもよ
い。
【0029】大抵の場合では、リスト84において最高
スコア位置にある発音は、リスト80において最高スコ
ア位置にある発音とは異なることがある。これは、混合
ツリーを利用する混合ツリースコア推定器74が、自ず
から一致していない音素列(self-consistent phoneme s
equences)を含んでいない発音、又は、自然音声ではあり
得ない発音を取捨しているからである。前述したよう
に、図3に示した表音化装置34は、単に考えられる実施
の形態のほんの一つに過ぎない。
【0030】リスト84からの発音は、音声認識と音声
合成の用途での発音辞書を構築するのに利用できる。所
望によっては、リストにおける一つか、又は、それ以上に
発音を検索するのに、選択モジュール86を利用してリ
スト84にアクセスするようにしてもよい。一般に、選
択モジュール86は最高スコアの発音を検索して、それ
を出力発音88とするようになっている。音声認識にあ
っては、この発音辞書は音声認識装置の学習段階で利用
して、認識装置の内蔵辞書には見あたらないホテル顧客
氏名の如くの単語の発音を出せるようにしている。
【0031】辞書学習システム30に適用していること
から、それぞれの顧客の記述氏名に対するn番目最良の
発音38が図2に示したモデル学習装置46への入力と
なる。本発明の好ましい実施の形態では、モデル学習装
置46の基本としてHMM(隠れMarkovモデル)を利用し
ている。それぞれの顧客の氏名に対応するHMMが音声
認識装置22が利用できるように辞書32に保存されて
いる。モデル学習装置46は、一つかそれ以上の生成し
た発音に対応するコンテクストに依存する音素モデルを
連鎖状につなぐことによりHMMモデルを構築するモジ
ュールである。この実施の形態でのロボット従業員では
音素レベルで音声認識を行っているが、当業者には、この
音声認識装置22は他の認識レベル(即ち、単語レベル)
で行えるようにすることができるのは容易に理解される
であろう。
【0032】辞書学習システム30としては、所望によ
っては、モデル学習装置46への入力となる一つか幾つ
かの整合した発音(aligned pronunciations)を出力44
として生成する発音抽出器40を利用してもよい。予約
時か、顧客のホテル宿泊期間中でのある時にホテル顧客
の発声氏名が電話16か、その他の聴取装置により捕捉
されることがある。発声氏名はその顧客の氏名として好
ましいものであるから、モデル学習器46で利用される
べきである。例えば、発声氏名はデジタル形式に変換し
た後に、当該顧客の氏名に対応するn番目最良の発音か
らの発音を一つか、それ以上選択するのに利用される。
これを行うためには、モデル学習装置46は、n番目最良
の発音38を用いてダイナミック文法を構築して、この
ダイナミック文法を利用する発声言語について認識作用
を行うことで整合された発音44を一つかそれ以上選択
する。
【0033】言語合成に用いる場合では、それぞれの顧
客氏名のn番目最良の発音38は、連鎖状再現(concaten
ated playback)に備えて音素音を生成するのに利用して
もよい。ロボット業務システム10の場合では、言語合
成装置24で、顧客と話し合っているホテル従業員(例え
ばフロント受付係)に対してその顧客の氏名を適切に発
音させることができる。また、Eメール受信者ないしテ
キスト読取りなどの特徴を付加価値として利用するのに
この言語合成装置24を利用することも考えられる。
【0034】ロボット従業員モジュールと辞書学習シス
テム30と言語認識装置22と言語合成装置24とを含
むロボット業務システム10は、他のホテルシステムと
利用できるように、当該他のホテルシステムとは別々に
パッケージ化するか、又は、まとめてパッケージ化しても
よい。そのようにすると共に、コストを最小限にするた
めには、他の既存のホテルシステム、例えばホテル予約登
録システムや、ホテル会計システム、ホテル電話交換シス
テムなどとやりとりできるように構築すべきである。例
えば、発音、国籍などを既存のデータ構造に組み込むのに
既存のホテル顧客データベースを変更するよりは、むし
ろロボットホテル業務システム10が、予約時にスクリ
ーンで捕捉することによりオペレーティングシステムの
レベルでのインターフェースか、又は、ホテル予約登録シ
ステム14に対して定めたAPIの何れか一方からホテ
ル顧客情報を獲得できるようにするのが望ましい。
【図面の簡単な説明】
【図1】 本発明によるロボットホテル業務システムの
好ましい実施の形態を示すブロック図。
【図2】 本発明によるロボットホテル業務システムに
利用する辞書学習システムの構成部品を示す図。
【図3】 本発明によるロボットホテル業務システムに
利用する表音化装置の構成部品を示す図。
【図4】 図3の表音化装置が利用する文字だけのツリ
ーを示す判定ツリー図。
【図5】 図3の表音化装置が利用する混合ツリーを示
す判定ツリー図。
【符号の説明】
10・・・・ロボットホテル業務システム 12・・・・コン
ピュータ 14・・・・ホテル予約登録システム 16・・・・電話 18・・・・電話交換機 20・・・・ホテ
ル顧客データベース 22・・・・言語認識装置 24・・・・言語
合成装置 30・・・・辞書学習システム 32・・・・辞書 34・・・・表音化装置 40・・・・発音
抽出器 46・・・・モデル学習装置 50・・・・ロボ
ット従業員

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 複数の内線電話に対応する電話交換シス
    テムを介して客室間の電話発呼を仲介するロボットホテ
    ル業務システムであって、ホテルの顧客の氏名を表す文
    字を保存すると共に、各顧客に対して対応する内線電話
    番号を割り当てるホテル顧客データベースシステムと、
    一組の単語を当該単語を構成する音素と関連づけする単
    語音素データを保存した辞書を有する言語認識システム
    と、前記データベースシステムと連結されていて、ホテル
    の顧客氏名を単語として前記辞書に追加するものにし
    て、前記氏名を表す文字を単語音素データに変換するこ
    とにより記述氏名の発音を生成する辞書学習システム
    と、前記認識システムと連結されていて、前記内線電話の
    何れから入力されたホテル顧客の発声氏名を所定のホテ
    ル顧客氏名に変換し、前記ホテル顧客氏名を利用して前
    記データベースシステムから割り当てられた内線電話番
    号を検索する発呼経路選択システムとからなり、 前記発呼経路選択システムが前記電話交換システムと交
    信して、前記電話交換システムをして、前記内線電話の何
    れからかの前記発声氏名の入力に応答して前記内線電話
    を呼ばせるように構成してなるロボットホテル業務シス
    テム。
  2. 【請求項2】 請求項1に記載のものであって、前記辞
    書学習システムが、 前記データベースシステムと連結されていて、ホテル顧
    客の氏名を表す文字を、ホテルの各顧客氏名ごとに複数
    の発音に変換する表音化装置と、前記複数の発音から、そ
    れぞれの前記ホテルの顧客氏名に対するHMMモデルを
    構築すると共に、前記言語認識システムでの利用に備え
    て前記辞書に前記HMMを保存するモデル学習装置とで
    構成してなるロボットホテル業務システム。
  3. 【請求項3】 請求項2に記載のものであって、前記表
    音化装置と前記モデル学習装置との間に介在されて、前
    記モデル学習装置への入力となる少なくとも一つの整合
    された発音を生成するものにして、ホテル顧客の発声氏
    名を受けて、当該発声氏名に基づいて前記表音化装置か
    らの複数の発音の中から少なくとも一つを選択する発音
    抽出器を設けてなるロボットホテル業務システム。
  4. 【請求項4】 請求項1に記載のものであって、前記デ
    ータベースシステムには、最初に内線電話を割り当てた
    最初の受付時の顧客の氏名を表す文字が保存さており、
    これによりロボットホテル業務システムが、前記内線電
    話の何れか一つから前記最初の受付時の顧客の発声氏名
    が入力されると前記最初に割り当てた内線電話へと発呼
    経路選択するようになっているロボットホテル業務シス
    テム。
  5. 【請求項5】 請求項1に記載のものであって、前記発
    呼経路選択システムと前記電話交換システムとに連結さ
    れていて、前記言語認識装置がホテル顧客の発声氏名を
    認識できなくなったときに客室間発呼を仲介する記述氏
    名認識装置を設けてなるロボットホテル業務システム。
  6. 【請求項6】 複数の内線電話に対応する電話交換シス
    テムを介して内線電話間の発呼を仲介するロボット業務
    システムであって、電話利用者の氏名を表す文字を保存
    すると共に、各利用者に対して対応する内線電話番号を
    割り当てる電話データベースシステムと、一組の単語を
    当該単語を構成する音素と関連づけする単語音素データ
    を保存した辞書を有する言語認識システムと、前記デー
    タベースシステムと連結されていて、単語としての識別
    子を前記辞書に追加するものにして、前記識別子を表す
    文字を単語音素データに変換することにより記述単語の
    発音を生成する辞書学習システムと、前記認識システム
    と連結されていて、前記内線電話の何れから入力された
    発声識別子を所定のシステム利用者識別子に変換し、前
    記システム利用者識別子を利用して前記データベースシ
    ステムから割り当てられた内線電話番号を検索する発呼
    経路選択システムとからなり、 前記発呼経路選択システムが前記電話交換システムと交
    信して、前記電話交換システムをして、前記内線電話の何
    れからかの前記発声識別子の入力に応答して前記内線電
    話を呼ばせるように構成してなるロボット業務システ
    ム。
  7. 【請求項7】 請求項6に記載のものであって、前記辞
    書学習システムが、 前記データベースシステムと連結されていて、前記識別
    子を表す文字を、前記識別子ごとに複数の発音に変換す
    る表音化装置と、前記複数の発音から、それぞれの前記識
    別子に対するHMMモデルを構築すると共に、前記言語
    認識システムでの利用に備えて前記辞書に前記HMMを
    保存するモデル学習装置とで構成してなるロボット業務
    システム。
  8. 【請求項8】 請求項7に記載のものであって、前記表
    音化装置と前記モデル学習装置との間に介在されて、前
    記モデル学習装置への入力となる少なくとも一つの整合
    された発音を生成するものにして、発声識別子を受けて、
    当該発声識別子に基づいて前記表音化装置からの複数の
    発音の中から少なくとも一つを選択する発音抽出器を設
    けてなるロボット業務システム。
  9. 【請求項9】 請求項6に記載のものであって、前記識
    別子が、割り当てた内線電話に対応する氏名と地名のう
    ちの少なくとも一つを表してなるロボット業務システ
    ム。
  10. 【請求項10】 請求項6に記載のものであって、前記
    発呼経路選択システムと前記電話交換システムとに接続
    されていて、前記言語認識装置がシステム利用者の前記
    発声識別子を認識できなくなったときに客室間発呼を仲
    介する記述氏名認識装置を設けてなるロボット業務シス
    テム。
  11. 【請求項11】 複数の内線電話に対応する電話交換シ
    ステムを介してホテル顧客の氏名の合成発音を生成する
    ロボット業務システムであって、ホテル顧客の氏名を表
    す文字を保存すると共に、各顧客に対応する情報を保存
    するホテル顧客データベースシステムと、一組の単語を
    当該単語を構成する音素と関連づけする単語音素データ
    を保存した辞書を有する言語認識システムと、前記デー
    タベースシステムと連結されていて、単語としてのホテ
    ル顧客の氏名を前記辞書に追加するものにして、前記氏
    名を表す文字を単語音素データに変換することにより記
    述氏名の発音を生成する辞書学習システムと、前記デー
    タベースシステムと前記言語合成システムとに連結され
    ていて、前記データベースシステムのシステム利用者が
    入力したホテル顧客の記述氏名を、単語音素データを利
    用して前記記述氏名の合成発音に変換する仮想従業員と
    からなり、前記か送従業員が前記電話交換システムと交
    信して、前記内線電話を介して前記システム利用者の前
    記合成発音を出すように構成してなるロボット業務シス
    テム。
JP11119834A 1998-04-30 1999-04-27 音声認識を用いたロボットホテル従業員 Expired - Fee Related JP3135233B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/070,399 US6314165B1 (en) 1998-04-30 1998-04-30 Automated hotel attendant using speech recognition
US09/070399 1998-04-30

Publications (2)

Publication Number Publication Date
JP2000032140A true JP2000032140A (ja) 2000-01-28
JP3135233B2 JP3135233B2 (ja) 2001-02-13

Family

ID=22095067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11119834A Expired - Fee Related JP3135233B2 (ja) 1998-04-30 1999-04-27 音声認識を用いたロボットホテル従業員

Country Status (7)

Country Link
US (1) US6314165B1 (ja)
EP (1) EP0953967B1 (ja)
JP (1) JP3135233B2 (ja)
KR (1) KR100574768B1 (ja)
CN (1) CN1116770C (ja)
DE (1) DE69922872T2 (ja)
TW (1) TW424221B (ja)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024412A (ja) * 2000-07-03 2002-01-25 Toshimitsu Kagawa 宿泊室の設備操作システム
JP2002032491A (ja) * 2000-07-19 2002-01-31 Toshimitsu Kagawa 宿泊客に対する情報提供システム
JP2006048058A (ja) * 2004-08-06 2006-02-16 Motorola Inc 多言語による名称の音声認識のための方法とシステム
JP2015512062A (ja) * 2012-03-02 2015-04-23 アップル インコーポレイテッド 名前発音システム及び方法
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
CN110491374A (zh) * 2019-08-27 2019-11-22 北京明日汇科技管理有限公司 基于神经网络的酒店服务语音交互识别方法及装置
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
JP2020003772A (ja) * 2018-06-29 2020-01-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 顧客要求サービスのための音声対話方法及び装置
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411932B1 (en) * 1998-06-12 2002-06-25 Texas Instruments Incorporated Rule-based learning of word pronunciations from training corpora
US8250620B1 (en) * 1998-12-30 2012-08-21 At&T Intellectual Property Ii, L.P. System and method for sharing information between a concierge and guest
US6425131B2 (en) * 1998-12-30 2002-07-23 At&T Corp. Method and apparatus for internet co-browsing over cable television and controlled through computer telephony
WO2002011121A1 (en) * 2000-07-31 2002-02-07 Eliza Corporation Method of and system for improving accuracy in a speech recognition system
TW472232B (en) * 2000-08-11 2002-01-11 Ind Tech Res Inst Probability-base fault-tolerance natural language understanding method
EP1215661A1 (en) * 2000-12-14 2002-06-19 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Mobile terminal controllable by spoken utterances
EP1220200B1 (de) * 2000-12-18 2003-09-24 Siemens Aktiengesellschaft Verfahren und Anordnung zur sprecherunabhängigen Spracherkennung für ein Telekommunikations- bzw. Datenendgerät
US20020087317A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented dynamic pronunciation method and system
US6967947B1 (en) * 2001-03-29 2005-11-22 At&T Corp. Method and system for providing controllable enhanced call service features at mobile locations
US6763102B1 (en) 2001-04-05 2004-07-13 At&T Corp. Method for handling incoming calls directed to a virtual communication service subscriber via a guest PBX
US6925154B2 (en) * 2001-05-04 2005-08-02 International Business Machines Corproation Methods and apparatus for conversational name dialing systems
US7308404B2 (en) * 2001-09-28 2007-12-11 Sri International Method and apparatus for speech recognition using a dynamic vocabulary
US7533020B2 (en) * 2001-09-28 2009-05-12 Nuance Communications, Inc. Method and apparatus for performing relational speech recognition
US6996519B2 (en) * 2001-09-28 2006-02-07 Sri International Method and apparatus for performing relational speech recognition
EP1302928A1 (de) * 2001-10-16 2003-04-16 Siemens Aktiengesellschaft Verfahren zur Spracherkennung, insbesondere von Namen, und Spracherkenner
MY141150A (en) * 2001-11-02 2010-03-15 Panasonic Corp Channel selecting apparatus utilizing speech recognition, and controling method thereof
US8285537B2 (en) * 2003-01-31 2012-10-09 Comverse, Inc. Recognition of proper nouns using native-language pronunciation
US20040156493A1 (en) * 2003-02-06 2004-08-12 Comverse, Ltd. Method and apparatus for providing a central telephony service for a calling party at the called party telephone
AU2004200809B2 (en) * 2003-03-07 2006-05-11 Samsung Electronics Co., Ltd. Method and system for providing data services to mobile communication terminals and mobile communication terminal therefor
US7756726B2 (en) * 2003-09-25 2010-07-13 International Business Machines Corporation Secured medical sign-in
US7660715B1 (en) * 2004-01-12 2010-02-09 Avaya Inc. Transparent monitoring and intervention to improve automatic adaptation of speech models
US8923838B1 (en) 2004-08-19 2014-12-30 Nuance Communications, Inc. System, method and computer program product for activating a cellular phone account
US7653543B1 (en) 2006-03-24 2010-01-26 Avaya Inc. Automatic signal adjustment based on intelligibility
US7983401B1 (en) 2006-08-15 2011-07-19 At&T Mobility Ii Llc Customized provision of automated menu options
US7962342B1 (en) 2006-08-22 2011-06-14 Avaya Inc. Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns
US7925508B1 (en) 2006-08-22 2011-04-12 Avaya Inc. Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns
US8041344B1 (en) 2007-06-26 2011-10-18 Avaya Inc. Cooling off period prior to sending dependent on user's state
US9386154B2 (en) * 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8391464B1 (en) 2010-06-24 2013-03-05 Nuance Communications, Inc. Customer service system, method, and software program product for responding to queries using natural language understanding
CN103474063B (zh) * 2013-08-06 2015-12-23 福建华映显示科技有限公司 语音辨识系统以及方法
DE102013216427B4 (de) * 2013-08-20 2023-02-02 Bayerische Motoren Werke Aktiengesellschaft Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung
WO2015073766A1 (en) * 2013-11-18 2015-05-21 Microsoft Technology Licensing, Llc Identifying a contact
GB201320334D0 (en) * 2013-11-18 2014-01-01 Microsoft Corp Identifying a contact
US9519827B2 (en) * 2014-12-24 2016-12-13 International Business Machines Corporation Personalized, automated receptionist
US20210327304A1 (en) * 2017-01-24 2021-10-21 Tienovix, Llc System and method for augmented reality guidance for use of equpment systems
US20210327303A1 (en) * 2017-01-24 2021-10-21 Tienovix, Llc System and method for augmented reality guidance for use of equipment systems
EP3574504A1 (en) * 2017-01-24 2019-12-04 Tietronix Software, Inc. System and method for three-dimensional augmented reality guidance for use of medical equipment
US20210295048A1 (en) * 2017-01-24 2021-09-23 Tienovix, Llc System and method for augmented reality guidance for use of equipment systems
US10580098B2 (en) * 2017-05-29 2020-03-03 Virtual OnQ Systems, LLC Voice activated hotel room monitor
FR3066848B1 (fr) * 2017-05-29 2021-07-02 Virtual Onq Systems Llc Supervision de chambre d'hotel activee par la voix
US11844654B2 (en) 2019-08-19 2023-12-19 Caption Health, Inc. Mid-procedure view change for ultrasound diagnostics
KR102222597B1 (ko) * 2020-02-03 2021-03-05 (주)라이언로켓 콜미 서비스를 위한 음성 합성 장치 및 방법
CN113936654B (zh) * 2021-09-17 2024-11-19 上海擎朗智能科技有限公司 一种控制方法、送餐机器人及计算机可读存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62140593A (ja) * 1985-12-13 1987-06-24 Nec Corp 外線呼自動内線転送装置
JPS62166642A (ja) * 1986-01-20 1987-07-23 Fujitsu Ltd 電話転送方式
JPH0353649A (ja) * 1989-07-21 1991-03-07 Toshiba Corp 電話交換装置
JPH0420158A (ja) * 1990-05-15 1992-01-23 Mitsubishi Electric Corp 構内交換装置
US5212730A (en) 1991-07-01 1993-05-18 Texas Instruments Incorporated Voice recognition of proper names using text-derived recognition models
EP0562138A1 (en) 1992-03-25 1993-09-29 International Business Machines Corporation Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
JP3144595B2 (ja) 1992-05-08 2001-03-12 ソニー株式会社 音声アダプタ
JPH0818670A (ja) * 1994-07-04 1996-01-19 Mitsubishi Denki Bill Techno Service Kk 構内交換機
WO1997019545A1 (en) * 1995-11-17 1997-05-29 At & T Corp. Automatic vocabulary generation for telecommunications network-based voice-dialing
US5799065A (en) * 1996-05-06 1998-08-25 Matsushita Electric Industrial Co., Ltd. Call routing device employing continuous speech
US5752230A (en) 1996-08-20 1998-05-12 Ncr Corporation Method and apparatus for identifying names with a speech recognition program
US5930336A (en) * 1996-09-30 1999-07-27 Matsushita Electric Industrial Co., Ltd. Voice dialing server for branch exchange telephone systems
US6092044A (en) * 1997-03-28 2000-07-18 Dragon Systems, Inc. Pronunciation generation in speech recognition
DE19751123C1 (de) * 1997-11-19 1999-06-17 Deutsche Telekom Ag Vorrichtung und Verfahren zur sprecherunabhängigen Sprachnamenwahl für Telekommunikations-Endeinrichtungen
US6016471A (en) * 1998-04-29 2000-01-18 Matsushita Electric Industrial Co., Ltd. Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
US6230131B1 (en) * 1998-04-29 2001-05-08 Matsushita Electric Industrial Co., Ltd. Method for generating spelling-to-pronunciation decision tree
US6029132A (en) * 1998-04-30 2000-02-22 Matsushita Electric Industrial Co. Method for letter-to-sound in text-to-speech synthesis
US6233553B1 (en) * 1998-09-04 2001-05-15 Matsushita Electric Industrial Co., Ltd. Method and system for automatically determining phonetic transcriptions associated with spelled words

Cited By (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024412A (ja) * 2000-07-03 2002-01-25 Toshimitsu Kagawa 宿泊室の設備操作システム
JP2002032491A (ja) * 2000-07-19 2002-01-31 Toshimitsu Kagawa 宿泊客に対する情報提供システム
JP2006048058A (ja) * 2004-08-06 2006-02-16 Motorola Inc 多言語による名称の音声認識のための方法とシステム
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
JP2015512062A (ja) * 2012-03-02 2015-04-23 アップル インコーポレイテッド 名前発音システム及び方法
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
JP2020003772A (ja) * 2018-06-29 2020-01-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 顧客要求サービスのための音声対話方法及び装置
US11257492B2 (en) 2018-06-29 2022-02-22 Baidu Online Network Technology (Beijing) Co., Ltd. Voice interaction method and apparatus for customer service
JP7037517B2 (ja) 2018-06-29 2022-03-16 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 顧客要求サービスのための音声対話方法及び装置
CN110491374A (zh) * 2019-08-27 2019-11-22 北京明日汇科技管理有限公司 基于神经网络的酒店服务语音交互识别方法及装置

Also Published As

Publication number Publication date
US6314165B1 (en) 2001-11-06
EP0953967B1 (en) 2004-12-29
KR19990083596A (ko) 1999-11-25
EP0953967A2 (en) 1999-11-03
CN1116770C (zh) 2003-07-30
DE69922872T2 (de) 2005-12-29
EP0953967A3 (en) 2000-06-28
KR100574768B1 (ko) 2006-04-28
DE69922872D1 (de) 2005-02-03
CN1246023A (zh) 2000-03-01
TW424221B (en) 2001-03-01
JP3135233B2 (ja) 2001-02-13

Similar Documents

Publication Publication Date Title
JP3135233B2 (ja) 音声認識を用いたロボットホテル従業員
US6016471A (en) Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
US5940793A (en) Voice-operated services
US8285537B2 (en) Recognition of proper nouns using native-language pronunciation
US7286989B1 (en) Speech-processing system and method
US6684185B1 (en) Small footprint language and vocabulary independent word recognizer using registration by word spelling
US6208964B1 (en) Method and apparatus for providing unsupervised adaptation of transcriptions
US6363342B2 (en) System for developing word-pronunciation pairs
US7716050B2 (en) Multilingual speech recognition
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
CA2613154A1 (en) Dictionary lookup for mobile devices using spelling recognition
KR20040001594A (ko) 발음 사전 갱신 장치 및 방법
Seide et al. Towards an automated directory information system.
KR101250897B1 (ko) 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법
US7970610B2 (en) Speech recognition
JP2002532763A (ja) 音声によって動作される自動問合せシステム
Nahid et al. Comprehending real numbers: Development of bengali real number speech corpus
JP3663012B2 (ja) 音声による入力装置
Georgila et al. A speech-based human-computer interaction system for automating directory assistance services
Carlson Recent developments in the experimental “Waxholm” dialog system
EP0844574A2 (en) A method of data search by vocal recognition of alphabetic type requests
KR20030010979A (ko) 의미어단위 모델을 이용한 연속음성인식방법 및 장치
Georgila et al. Large Vocabulary Search Space Reduction Employing Directed Acyclic Word Graphs and Phonological Rules
KR930000809B1 (ko) 언어번역 시스템
JP2000347685A (ja) 音声認識装置及び音声認識方法、並びに音声モデル作成装置及び音声モデル作成方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees