JP6538399B2 - 音声処理装置、音声処理方法およびプログラム - Google Patents
音声処理装置、音声処理方法およびプログラム Download PDFInfo
- Publication number
- JP6538399B2 JP6538399B2 JP2015070338A JP2015070338A JP6538399B2 JP 6538399 B2 JP6538399 B2 JP 6538399B2 JP 2015070338 A JP2015070338 A JP 2015070338A JP 2015070338 A JP2015070338 A JP 2015070338A JP 6538399 B2 JP6538399 B2 JP 6538399B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- paraphrase
- speaker
- speech
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 35
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000010365 information processing Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 35
- 238000000034 method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
次に、図1に示した通信端末10の構成例について、図2を参照して説明する。図2は、通信端末10の構成例を示す図である。
次に、図1に示したサーバ20のハードウエア構成例について、図3を参照して説明する。図3は、サーバ20の構成例を示す図である。
次に、サーバ20の機能構成について図3〜図5を参照して説明する。図4は、図3に示したハードウエア構成上で実現されるサーバ20の機能構成の一例を示す図である。図5は、(a)後述する言い換え辞書201のデータ構造と、(b)後述する習熟度記憶部205のデータ構造とを示す図である。
以下、この音声処理を実現するためのサーバ20の動作について、図1〜図6を参照して説明する。図6は、サーバ20の音声処理例を示すフローチャートである。
以上では、ユーザの発音の明瞭度を評価する態様について言及しなかったが、言い換え先の見出し語d30の通知頻度からそれを評価するようにしてもよい。
上述した話者の発音の明瞭度を評価するサーバ20では、この明瞭度に応じて、言い換え先の見出し語d30の検索の可否を決定するようにしてもよい。例えば、図6に示した検索処理(ステップS103)において、CPU21は、話者の明瞭度が高評価になるにつれ、上記音声認識の信頼度のしきい値が小さくなるように変更し、音声認識部22は、そのしきい値に基づいて、音声認識の信頼度が高いか低いかを判定するようにする。これにより、例えば、話者の発音の明瞭度が高評価の場合には、上記音声認識の信頼度のしきい値は小さくなるので、音声認識の信頼度の低い語(言い換え元の見出し語d10)が少なくなる。すなわち、言い換え先の見出し語d30の検索は、話者の発音の明瞭度に応じて行なわれる。
以上では、ユーザ(聞き手)の言語(例えば、英語等)の習熟度に応じて言い換え先の見出し語d30を検索する態様について言及しなかったが、ある習熟度と他の習熟度とを区別して検索を行うようにしてもよい。
20 サーバ
201 言い換え辞書
202 検索部
203 通知部
204 作成部
205 習熟度記憶部
206 評価部
Claims (6)
- 話者の音声を認識する音声処理装置であって、
言い換えの対象としての言い換え元の語と、当該言い換え元の語とは異なる意味を持つ言い換え先の語とを対応付けて格納する言い換え辞書と、
前記話者の音声に、音声認識の信頼度の低い語が含まれる場合は、当該信頼度の低い語と一致する前記言い換え元の語に対応付けられる前記言い換え先の語を前記言い換え辞書から検索する検索部と、
前記話者に対して前記信頼度の低い語の適切な発音を促すために、前記検索された言い換え先の語を前記話者側に対して通知する通知部と、
前記話者に対する前記言い換え語の通知頻度に基づいて、当該話者の音声に対する発音の明瞭度を評価する評価部と
を含むことを特徴とする音声処理装置。 - 前記音声に基づいて、前記言い換え先の語を含む要約文を作成する作成部をさらに含み、
前記通知部は、前記言い換え先の語を含む要約文を前記話者側の端末に出力して表示させることを特徴とする請求項1に記載の音声処理装置。 - 前記音声と同一言語についての前記話者に対する聞き手の習熟度を記憶する習熟度記憶部をさらに含み、
前記検索部は、前記習熟度記憶部の前記聞き手の習熟度に応じて、前記聞き手ごとに、前記言い換え語の検索の可否を決定することを特徴とする請求項1または2に記載の音声処理装置。 - 話者の音声を認識するコンピュータにおける音声処理方法であって、
前記コンピュータは、言い換えの対象としての言い換え元の語と、当該言い換え元の語とは異なる意味を持つ言い換え先の語とを対応付けて格納する言い換え辞書を備えており、前記コンピュータによって、
前記話者の音声に、音声認識の信頼度の低い語が含まれる場合は、当該信頼度の低い語と一致する前記言い換え元の語に対応付けられる前記言い換え先の語を前記言い換え辞書から検索するステップと、
前記話者に対して前記信頼度の低い語の適切な発音を促すために、前記検索された言い換え先の語を前記話者側に対して通知するステップと、
前記話者に対する前記言い換え語の通知頻度に基づいて、当該話者の音声に対する発音の明瞭度を評価するステップと
を含むことを特徴とする音声処理方法。 - 請求項4に記載の音声処理方法をコンピュータに実行させるためのプログラム。
- 請求項4に記載の音声処理方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070338A JP6538399B2 (ja) | 2015-03-30 | 2015-03-30 | 音声処理装置、音声処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070338A JP6538399B2 (ja) | 2015-03-30 | 2015-03-30 | 音声処理装置、音声処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016191740A JP2016191740A (ja) | 2016-11-10 |
JP6538399B2 true JP6538399B2 (ja) | 2019-07-03 |
Family
ID=57245514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015070338A Active JP6538399B2 (ja) | 2015-03-30 | 2015-03-30 | 音声処理装置、音声処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6538399B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874185A (zh) * | 2016-12-27 | 2017-06-20 | 中车株洲电力机车研究所有限公司 | 一种基于语音关键字驱动的自动化测试方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005234236A (ja) * | 2004-02-19 | 2005-09-02 | Canon Inc | 音声認識装置、音声認識方法、記憶媒体およびプログラム |
JP2005309185A (ja) * | 2004-04-23 | 2005-11-04 | Nissan Motor Co Ltd | 音声入力装置、および音声入力方法 |
JP5396530B2 (ja) * | 2012-12-11 | 2014-01-22 | 株式会社Nttドコモ | 音声認識装置および音声認識方法 |
-
2015
- 2015-03-30 JP JP2015070338A patent/JP6538399B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016191740A (ja) | 2016-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3469592B1 (en) | Emotional text-to-speech learning system | |
CN107016994B (zh) | 语音识别的方法及装置 | |
US9947317B2 (en) | Pronunciation learning through correction logs | |
US10114809B2 (en) | Method and apparatus for phonetically annotating text | |
CN103578464B (zh) | 语言模型的建立方法、语音辨识方法及电子装置 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US9070363B2 (en) | Speech translation with back-channeling cues | |
US11093110B1 (en) | Messaging feedback mechanism | |
US20170206897A1 (en) | Analyzing textual data | |
US11810471B2 (en) | Computer implemented method and apparatus for recognition of speech patterns and feedback | |
US20150170648A1 (en) | Ebook interaction using speech recognition | |
JP2013068952A (ja) | 音声認識結果の統合 | |
WO2016008128A1 (en) | Speech recognition using foreign word grammar | |
US10366173B2 (en) | Device and method of simultaneous interpretation based on real-time extraction of interpretation unit | |
JP2016521383A (ja) | 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体 | |
US9805740B2 (en) | Language analysis based on word-selection, and language analysis apparatus | |
JP5073024B2 (ja) | 音声対話装置 | |
WO2014181508A1 (en) | Information processing apparatus, information processing method, and program | |
CN111128181B (zh) | 背诵题评测方法、装置以及设备 | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
KR20170009486A (ko) | 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP6849977B2 (ja) | テキスト表示用同期情報生成装置および方法並びに音声認識装置および方法 | |
KR20160138613A (ko) | 이모티콘을 이용한 자동통역 방법 및 이를 이용한 장치 | |
JP6538399B2 (ja) | 音声処理装置、音声処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6538399 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |