JP2005249829A - 音声認識を行うコンピュータネットワークシステム - Google Patents
音声認識を行うコンピュータネットワークシステム Download PDFInfo
- Publication number
- JP2005249829A JP2005249829A JP2004055973A JP2004055973A JP2005249829A JP 2005249829 A JP2005249829 A JP 2005249829A JP 2004055973 A JP2004055973 A JP 2004055973A JP 2004055973 A JP2004055973 A JP 2004055973A JP 2005249829 A JP2005249829 A JP 2005249829A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- server
- speech recognition
- client
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 ネットワークで接続されたサーバーコンピュータ装置とクライアントコンピュータ装置から構成されたコンピュータネットワークシステムにおいて、(1)前記サーバーコンピュータ装置に第1の音声認識エンジンを備え、(2)前記クライアントコンピュータ装置に第2の音声認識エンジンを備え、(3)前記クライアントコンピュータ装置に、音声入力データに対して前記第1の音声認識エンジンと前記第2の音声認識エンジンのどちらで処理するか選択判定する音声認識エンジン選択処理手段を備えたことを特徴とする音声認識を行うコンピュータネットワークシステムである。
【選択図】 図1
Description
P(w)=ПP(wi|wi-n+1…wi-1)
と計算される。ここでwは単語列w1〜wnであり、Пは添字iの階乗を表す。音響モデルによって推測される単語列wの組み合わせは、生成確率Pの計算によって最も高い値の単語列が音声認識の結果となる(最尤推定法)。
(1)前記サーバーコンピュータ装置に第1の音声認識エンジンを備え、
(2)前記クライアントコンピュータ装置に第2の音声認識エンジンを備え、
(3)前記クライアントコンピュータ装置に、音声入力データに対して前記第1の音声認識エンジンと前記第2の音声認識エンジンのどちらで処理するか選択判定する音声認識エンジン選択処理手段
を備えたことを特徴とする音声認識を行うコンピュータネットワークシステムである。
(1)前記音声入力が音響モデル辞書、言語モデル辞書、単語辞書のうちいずれか1以上を含む辞書群で記述可能で、かつ前記辞書群が前記クライアントコンピュータ装置に存在する場合は、前記第2の音声認識エンジンを、
(2)その他の場合には前記第1の音声認識エンジンを、
選択する手段を備えたことを特徴とする請求項1記載の音声認識を行うコンピュータネットワークシステムである。
前記クライアントコンピュータ装置に音声入力データから該音声入力データの特徴量を抽出して前記サーバーコンピュータ装置に送信する手段
を備えたことを特徴とする請求項1または請求項2記載の音声認識を行うコンピュータネットワークシステム、
及び、該特徴量を受信した前記サーバーコンピュータ装置は前記サーバーコンピュータ装置上の音声認識エンジンにより前記特徴量を解析する音声認識手段、およびその音声認識結果を前記クライアントコンピュータ装置に送信する手段、
を備えたことを特徴とする請求項1及び請求項2に記載の音声認識を行うコンピュータネットワークシステムである。
・解読不可能なときには選択処理プログラムを介して特徴量のサーバーへ
の自動送信。
・手操作(または音声指示)によるサーバーの選択で特徴量の送信
を行えるようにしておく。
110 ADC(アナログ/デジタル変換コントローラー)、フロントエンド
120 音声認識プログラム
121 クライアント/サーバー音声認識選択処理プログラム(選択処理プログラム)
122 音声認識エンジン(小語彙音声認識エンジン)
123 音響モデル辞書・言語モデル辞書・単語辞書のうちいずれか1以上を含む小語彙辞書群(小語彙辞書群)
130 コンテンツデータベース
140 ユーザーインターフェース(ユーザーI/F)
2 サーバー
210 メインサーバー(音声認識エンジンを含む)
211 音響モデル辞書・言語モデル辞書・単語辞書のうちいずれか1以上を含む大語彙辞書群(大語彙辞書群)
220 サブサーバー
221 サービスコンテンツデータベース
(音声認識結果の一時保管用かつユーザーサービス用音響モデル辞書・言語モデル辞書・単語辞書のうちいずれか1以上を含む小語彙辞書群を含むDB)
9 ネットワーク(おもにインターネット)
DB データベース
Claims (3)
- ネットワークで接続されたサーバーコンピュータ装置とクライアントコンピュータ装置から構成されたコンピュータネットワークシステムにおいて、
(1)前記サーバーコンピュータ装置に第1の音声認識エンジンを備え、
(2)前記クライアントコンピュータ装置に第2の音声認識エンジンを備え、
(3)前記クライアントコンピュータ装置に、音声入力データに対して前記第1の音声認識エンジンと前記第2の音声認識エンジンのどちらで処理するか選択判定する音声認識エンジン選択処理手段
を備えたことを特徴とする音声認識を行うコンピュータネットワークシステム。 - 前記音声認識エンジン選択処理手段が
(1)前記音声入力が音響モデル辞書、言語モデル辞書、単語辞書のうちいずれか1以上を含む辞書群で記述可能で、かつ前記辞書群が前記クライアントコンピュータ装置に存在する場合は、前記第2の音声認識エンジンを、
(2)その他の場合には前記第1の音声認識エンジンを、
選択する手段を備えたことを特徴とする請求項1記載の音声認識を行うコンピュータネットワークシステム。 - 前記音声入力データが前記第1の音声認識エンジンにおいて処理される場合、
前記クライアントコンピュータ装置に音声入力データから該音声入力データの特徴量を抽出して前記サーバーコンピュータ装置に送信する手段
を備えたことを特徴とする請求項1または請求項2記載の音声認識を行うコンピュータネットワークシステム、
及び、該特徴量を受信した前記サーバーコンピュータ装置は前記サーバーコンピュータ装置上の音声認識エンジンにより前記特徴量を解析する音声認識手段、およびその音声認識結果を前記クライアントコンピュータ装置に送信する手段、
を備えたことを特徴とする請求項1及び請求項2に記載の音声認識を行うコンピュータネットワークシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004055973A JP2005249829A (ja) | 2004-03-01 | 2004-03-01 | 音声認識を行うコンピュータネットワークシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004055973A JP2005249829A (ja) | 2004-03-01 | 2004-03-01 | 音声認識を行うコンピュータネットワークシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005249829A true JP2005249829A (ja) | 2005-09-15 |
Family
ID=35030393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004055973A Pending JP2005249829A (ja) | 2004-03-01 | 2004-03-01 | 音声認識を行うコンピュータネットワークシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005249829A (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010025440A3 (en) * | 2008-08-29 | 2010-06-03 | Multimodal Technologies, Inc. | Hybrid speech recognition |
JP2010224301A (ja) * | 2009-03-24 | 2010-10-07 | Denso Corp | 音声認識システム |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
JP2012133243A (ja) * | 2010-12-22 | 2012-07-12 | Toshiba Corp | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
WO2014051219A1 (en) * | 2012-09-28 | 2014-04-03 | Samsung Electronics Co., Ltd. | Image processing apparatus and control method thereof and image processing system |
WO2014051207A1 (en) * | 2012-09-28 | 2014-04-03 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
JP2014089437A (ja) * | 2012-10-29 | 2014-05-15 | Samsung Electronics Co Ltd | 音声認識装置及び音声認識方法 |
JP2015102795A (ja) * | 2013-11-27 | 2015-06-04 | シャープ株式会社 | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラムおよびサーバの制御プログラム |
RU2571520C2 (ru) * | 2012-09-28 | 2015-12-20 | Самсунг Электроникс Ко., Лтд. | Устройство обработки изображений и соответствующий способ управления и система обработки изображений |
JP2015537258A (ja) * | 2012-12-12 | 2015-12-24 | アマゾン テクノロジーズ インコーポレーテッド | 分散音声認識システムにおける音声モデル検索 |
JP2019115047A (ja) * | 2013-04-19 | 2019-07-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | システムの制御方法、システム、及びプログラム |
JP2020086571A (ja) * | 2018-11-16 | 2020-06-04 | アルパイン株式会社 | 車載装置及び音声認識方法 |
-
2004
- 2004-03-01 JP JP2004055973A patent/JP2005249829A/ja active Pending
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010025440A3 (en) * | 2008-08-29 | 2010-06-03 | Multimodal Technologies, Inc. | Hybrid speech recognition |
US7933777B2 (en) | 2008-08-29 | 2011-04-26 | Multimodal Technologies, Inc. | Hybrid speech recognition |
JP2012501480A (ja) * | 2008-08-29 | 2012-01-19 | マルチモーダル・テクノロジーズ・インク | ハイブリッド型音声認識 |
JP2010224301A (ja) * | 2009-03-24 | 2010-10-07 | Denso Corp | 音声認識システム |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
JP2012133243A (ja) * | 2010-12-22 | 2012-07-12 | Toshiba Corp | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
US9037471B2 (en) | 2012-09-28 | 2015-05-19 | Samsung Electronics Co., Ltd. | Image processing apparatus and control method thereof and image processing system |
US9582245B2 (en) | 2012-09-28 | 2017-02-28 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
CN103716704A (zh) * | 2012-09-28 | 2014-04-09 | 三星电子株式会社 | 图像处理设备及其控制方法和图像处理系统 |
US11086596B2 (en) | 2012-09-28 | 2021-08-10 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
US8838456B2 (en) | 2012-09-28 | 2014-09-16 | Samsung Electronics Co., Ltd. | Image processing apparatus and control method thereof and image processing system |
WO2014051219A1 (en) * | 2012-09-28 | 2014-04-03 | Samsung Electronics Co., Ltd. | Image processing apparatus and control method thereof and image processing system |
US10120645B2 (en) | 2012-09-28 | 2018-11-06 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
RU2571520C2 (ru) * | 2012-09-28 | 2015-12-20 | Самсунг Электроникс Ко., Лтд. | Устройство обработки изображений и соответствующий способ управления и система обработки изображений |
CN103716704B (zh) * | 2012-09-28 | 2018-03-23 | 三星电子株式会社 | 图像处理设备及其控制方法和图像处理系统 |
WO2014051207A1 (en) * | 2012-09-28 | 2014-04-03 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
JP2014089437A (ja) * | 2012-10-29 | 2014-05-15 | Samsung Electronics Co Ltd | 音声認識装置及び音声認識方法 |
JP2015537258A (ja) * | 2012-12-12 | 2015-12-24 | アマゾン テクノロジーズ インコーポレーテッド | 分散音声認識システムにおける音声モデル検索 |
US10152973B2 (en) | 2012-12-12 | 2018-12-11 | Amazon Technologies, Inc. | Speech model retrieval in distributed speech recognition systems |
JP2019115047A (ja) * | 2013-04-19 | 2019-07-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | システムの制御方法、システム、及びプログラム |
USRE48569E1 (en) | 2013-04-19 | 2021-05-25 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
JP2015102795A (ja) * | 2013-11-27 | 2015-06-04 | シャープ株式会社 | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラムおよびサーバの制御プログラム |
JP2020086571A (ja) * | 2018-11-16 | 2020-06-04 | アルパイン株式会社 | 車載装置及び音声認識方法 |
JP7023823B2 (ja) | 2018-11-16 | 2022-02-22 | アルパイン株式会社 | 車載装置及び音声認識方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4267081B2 (ja) | 分散システムにおけるパターン認識登録 | |
US9495956B2 (en) | Dealing with switch latency in speech recognition | |
CA2280331C (en) | Web-based platform for interactive voice response (ivr) | |
US10672391B2 (en) | Improving automatic speech recognition of multilingual named entities | |
US8364487B2 (en) | Speech recognition system with display information | |
JP3920812B2 (ja) | コミュニケーション支援装置、支援方法、及び支援プログラム | |
KR101042119B1 (ko) | 음성 이해 시스템, 및 컴퓨터 판독가능 기록 매체 | |
EP1089193A2 (en) | Translating apparatus and method, and recording medium used therewith | |
US20110054899A1 (en) | Command and control utilizing content information in a mobile voice-to-speech application | |
WO2008084476A2 (en) | Vowel recognition system and method in speech to text applications | |
JP2002524806A (ja) | 音声認識および自然言語処理を使用したネットワーク用対話型ユーザ・インタフェース | |
JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
CN101115245A (zh) | 具有语音识别及翻译功能的移动终端 | |
JP2005249829A (ja) | 音声認識を行うコンピュータネットワークシステム | |
JP2010048953A (ja) | 対話文生成装置 | |
US8706489B2 (en) | System and method for selecting audio contents by using speech recognition | |
CA2613154A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
JPH07222248A (ja) | 携帯型情報端末における音声情報の利用方式 | |
EP1617409B1 (en) | Multimodal method to provide input to a computing device | |
US20080270128A1 (en) | Text Input System and Method Based on Voice Recognition | |
JP3088364B2 (ja) | 音声言語理解装置及び音声言語理解システム | |
JP5300576B2 (ja) | 検索装置、検索方法、および検索プログラム | |
JP2003162524A (ja) | 言語処理装置 | |
WO2019142447A1 (ja) | 情報処理装置および情報処理方法 | |
WO2002099786A1 (en) | Method and device for multimodal interactive browsing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070110 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100119 |