JPWO2011121884A1 - 外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法 - Google Patents
外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法 Download PDFInfo
- Publication number
- JPWO2011121884A1 JPWO2011121884A1 JP2012508040A JP2012508040A JPWO2011121884A1 JP WO2011121884 A1 JPWO2011121884 A1 JP WO2011121884A1 JP 2012508040 A JP2012508040 A JP 2012508040A JP 2012508040 A JP2012508040 A JP 2012508040A JP WO2011121884 A1 JPWO2011121884 A1 JP WO2011121884A1
- Authority
- JP
- Japan
- Prior art keywords
- response
- foreign language
- intention
- request
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004590 computer program Methods 0.000 title claims description 12
- 238000003672 processing method Methods 0.000 title claims description 9
- 230000004044 response Effects 0.000 claims abstract description 122
- 238000000034 method Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims 2
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 3
- 230000009118 appropriate response Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
外国語の発話を音声データとして音声入力手段(201)が入力する。入力された音声データを音声認識手段(202)が音声認識する。音声データの認識結果を結果表示手段(203)が表示する。表示された認識結果に対する一般ユーザからの支援要求を支援要求受付手段(204)が受け付ける。受け付けられた支援要求に対応した応答意図を応答意図推定手段(205)が決定する。決定された応答意図に対応した応答文を応答文生成手段(206)が生成する。生成された応答文を外国語で結果表示手段(203)が出力する。従って、外国語の発話の音声認識された認識結果に対する一般ユーザの支援要求を、その外国語の応答文として出力することができる。これにより、外国語の発話の認識結果に対応した外国語の応答文を一般ユーザの意図に即してスムーズに生成することができる外国語会話支援装置を提供する。
Description
本発明は、外国語の会話を支援する外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法、に関する。
近年、様々な面でグローバル化が進み、電話やテレビ会議などの音声通信において、外国語を用いて外国語話者と会話を行う機会が増加している。それとともに外国語の習得についても力が入れられているが、バイリンガルほど外国語話者の発話を聞き取ることができるレベルの話者の数は少ないのが現状である。
そうした中、外国語話者の発話を音声認識技術を用いて認識しその結果を表示する、またはさらに自動翻訳技術を用いて認識結果を翻訳して表示することで、聞き取り能力が十分でない一般ユーザが外国語話者の発話内容を理解することを支援する装置が特許文献1に開示されている。
図8に示すように、この外国語会話支援装置100は、音声入力手段101と、音声認識手段102と、結果表示手段103と、を備える。このような構成を有する外国語会話支援装置100はつぎのように動作する。
すなわち、音声入力手段101は音声通信手段(図示せず)を通して得られる外国語話者の発話を音声データとして取り込み、音声認識手段102は音声データを入力として音声認識を行い、その音声認識結果を結果表示手段103が出力する(特許文献1)。
しかし、現状の音声認識手段には認識誤りが含まれているため、一般ユーザの聞き取れなかった部分の音声認識結果が正しいとは限らない。従って、認識結果が理解不能な文となり相手に聞き直したい場合や、認識結果が本当に正しいかを外国語話者に確認したい場合がしばしばある。
しかし、外国語の聞き取り能力が高くない一般ユーザの場合、このような不測の事態に対してすぐに適切な応答文を思いつくことができず会話が中断してしまうという課題がある。
また、聞き取れなかった原因が周囲の雑音であったり、外国語話者の発話速度が速すぎたりした時に、つぎの発声からはより聞き取りやすい発声を促すために、その原因について指摘する場合についても同様である。
本発明は上述のような課題に鑑みてなされたものであり、外国語の発話の認識結果に対応した外国語の応答文を一般ユーザの意図に即してスムーズに生成することができる外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法、を提供するものである。
本発明の外国語会話支援装置は、外国語の発話を音声データとして入力する音声入力手段と、入力された音声データを音声認識する音声認識手段と、音声データの認識結果を表示する結果表示手段と、表示された認識結果に対する一般ユーザからの支援要求を受け付ける要求受付手段と、受け付けられた支援要求に対応した応答意図を決定する意図推定手段と、決定された応答意図に対応した応答文を生成する応答文生成手段と、生成された応答文を外国語で出力する応答出力手段と、を有する。
本発明のコンピュータプログラムは、外国語の発話を音声データとして入力する音声入力処理と、入力された音声データを音声認識する音声認識処理と、音声データの認識結果を表示する結果出力処理と、表示された認識結果に対する一般ユーザからの支援要求を受け付ける要求受付処理と、受け付けられた支援要求に対応した応答意図を決定する意図推定処理と、決定された応答意図に対応した応答文を生成する応答文生成処理と、生成された応答文を外国語で出力する応答出力処理と、を外国語会話支援装置に実行させる。
本発明のデータ処理方法は、外国語の発話を音声データとして入力する音声入力動作と、入力された音声データを音声認識する音声認識動作と、音声データの認識結果を表示する結果出力動作と、表示された認識結果に対する一般ユーザからの支援要求を受け付ける要求受付動作と、受け付けられた支援要求に対応した応答意図を決定する意図推定動作と、決定された応答意図に対応した応答文を生成する応答文生成動作と、生成された応答文を外国語で出力する応答出力動作と、を有する。
なお、本発明の各種の構成要素は、その機能を実現するように形成されていればよく、例えば、所定の機能を発揮する専用のハードウェア、所定の機能がコンピュータプログラムにより付与されたデータ処理装置、コンピュータプログラムによりデータ処理装置に実現された所定の機能、これらの任意の組み合わせ、等として実現することができる。
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
また、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および動作を順番に記載してあるが、その記載の順番は複数の処理および複数の動作を実行する順番を限定するものではない。
また、本発明で云う外国語会話支援装置は、コンピュータプログラムを読み取って対応する処理動作を実行できるように、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、I/F(Interface)ユニット、等の汎用デバイスで構築されたハードウェア、所定の処理動作を実行するように構築された専用の論理回路、これらの組み合わせ、等として実施することができる。
本発明の外国語会話支援装置では、外国語の発話を音声データとして音声入力手段が入力する。入力された音声データを音声認識手段が音声認識する。音声データの認識結果を結果表示手段が表示する。表示された認識結果に対する一般ユーザからの支援要求を要求受付手段が受け付ける。受け付けられた支援要求に対応した応答意図を意図推定手段が決定する。決定された応答意図に対応した応答文を応答文生成手段が生成する。生成された応答文を外国語で応答出力手段が出力する。従って、外国語の発話の音声認識された認識結果に対する一般ユーザの支援要求を、その外国語の応答文として出力することができる。
上述した目的、および、その他の目的、特徴および利点は、以下に述べる好適な実施の形態、および、それに付随する以下の図面によって、さらに明らかになる。
本発明の実施の一形態を図1ないし図3を参照して以下に説明する。ただし、本実施の形態に関して前述した一従来例と同一の部分は、同一の名称を使用して詳細な説明は省略する。
つぎに、発明を実施するための最良の形態について図面を参照して詳細に説明する。図1を参照すると、本発明の実施の形態の外国語会話支援装置200は、外国語の発話を音声データとして入力する音声入力手段201と、入力された音声データを音声認識する音声認識手段202と、音声データの認識結果を表示する結果表示手段203と、表示された認識結果に対する一般ユーザからの支援要求を受け付ける支援要求受付手段204と、受け付けられた支援要求に対応した応答意図を決定する応答意図推定手段205と、決定された応答意図に対応した応答文を生成する応答文生成手段206と、生成された応答文を外国語で出力する応答出力手段である結果表示手段203と、を有する。
応答文生成手段206は、応答意図と認識結果とに対応した応答文を生成する。支援要求受付手段204は、複数の応答意図候補を選定自在に提示し、応答意図推定手段205は、提示された複数の応答意図候補の選定に対応して応答意図を決定する。
上述のような外国語会話支援装置200は、マイクロフォンやデータ通信ユニットなどの音声入力手段201や、ディスプレイユニットなどの結果表示手段203をハードウェアとして有するコンピュータ装置からなり、実装されているコンピュータプログラムに対応して上述のような各種手段が各種機能として論理的に実現される。
このようなコンピュータプログラムは、外国語の発話を音声データとして入力する音声入力処理と、入力された音声データを音声認識する音声認識処理と、音声データの認識結果を表示する結果出力処理と、表示された認識結果に対する一般ユーザからの支援要求を受け付ける要求受付処理と、受け付けられた支援要求に対応した応答意図を決定する意図推定処理と、決定された応答意図に対応した応答文を生成する応答文生成処理と、生成された応答文を外国語で出力する応答出力処理と、を外国語会話支援装置200に実行させるように記述されている。
つぎに、図2および図3のフローチャートを参照して、本実施の形態の外国語会話支援装置200のデータ処理方法を説明する。まず、図2に示すように、ステップS1において、音声入力手段201によって音声通信手段(図示せず)などを通して得られる外国語話者の発話を音声データとして入力する。
つぎに、ステップS2において、音声認識手段202によって、入力された音声データを音声認識し、その音声認識結果を出力する。つぎに、ステップS3において、結果表示手段203によって、音声認識結果を画面表示または合成音声などの形で出力し一般ユーザに知らせる。つぎに、ステップS1に戻り、つぎの入力音声を待つ。
また、図3に示すように、別のスレッドにて、まず、ステップS4において、支援要求受付手段204によって、一般ユーザからの支援要求を受け付ける。つぎに、ステップS5において、応答意図推定手段205によって、応答意図の候補を提示し、一般ユーザに応答意図を選択させる。
つぎに、ステップS6において、応答文生成手段206によって、選択された応答意図と応答文要求時においての最終出力の音声認識結果や認識時のスコアといった音声認識情報を用いて、一般ユーザの意図に即した適切な応答文を生成する。このような応答文の生成は、例えば、対話プログラムなどの既存のアルゴリズムを応用することで実現される。
つぎに、ステップS7において、結果表示手段203によって、生成された応答文を表示または音声合成などの形で出力し、一般ユーザに知らせる。つぎに、ステップS4に戻り、つぎの応答文要求を待つ。
本実施の形態では、上述のように一般ユーザが簡単に入力できる支援要求受付手段204と応答意図推定手段205を備えるため、外国語の応答文を一般ユーザの意図に即し、かつスムーズに生成することができる。従って、従来装置よりもスムーズな外国語会話を一般ユーザが行えるように外国語会話支援を行うことが可能である。
さらに、一般ユーザが相手の発話の聞き取りにくい発話や、音声認識手段202が誤りやすい発話に対して、その原因を外国語話者に簡単に伝えやすくなるため、その後の外国語会話のスムーズさも向上させることが可能である。
[第一の実施例]
つぎに、具体的な第一の実施例を用いて本発明を説明する。本実施例では、図4に示すように、支援要求受付手段204として、支援要求ボタンを結果表示手段203としての画面上の一部分に配置し、タッチパネルによる選択を行うことで一般ユーザからの支援要求を受け付ける。
つぎに、具体的な第一の実施例を用いて本発明を説明する。本実施例では、図4に示すように、支援要求受付手段204として、支援要求ボタンを結果表示手段203としての画面上の一部分に配置し、タッチパネルによる選択を行うことで一般ユーザからの支援要求を受け付ける。
支援要求を受け付けると応答意図推定手段205は、図5に示すように、下記の応答意図候補を画面上に表示する。例えば、応答意図候補は「再発声の要求」、「認識結果を用いた発話確認」、「聞き取り誤り原因の伝達」の三種類とする。
「再発声の要求」は一般ユーザが認識結果に誤りが含まれると感じた場合に、認識結果の一部または全体の再発声を促す場合、「認識結果を用いた発話確認」は一般ユーザが認識結果が正解かどうか分からない場合などに外国語話者に認識結果が正しいかどうかを確認する場合、「聞き取り誤り原因の伝達」は周囲の雑音や外国語話者の早口などによって、一般ユーザが聞き取れない、または音声認識手段202が正しく認識できない時に原因を外国語話者に伝えたい場合、にそれぞれ選択される。
応答文生成手段206は、応答意図推定手段205で選択された応答意図に従って応答文を生成する。まず、聞き取り誤りの範囲または音声認識誤りの範囲を推定する。音声認識時に信頼度を計算しておき、信頼度が一定の閾値以下の単語の範囲を聞き取り誤りの範囲または音声認識誤りの範囲と推定する。
選択された応答意図が「再発声の要求」の場合、誤り範囲に入りそうな単語の属性を誤り範囲の前後から推定する。ここで云う属性とは時間、場所、理由、金額といった対応する外国語の疑問詞(それぞれ、"When", "Where", "Why", "How much")を有するものである。
例えば、CRF(Conditional Random Fields)といった学習手法を用いて事前に各属性の出現確率を学習しておくことにより、誤り範囲部分に最も入りやすい属性を推定する。
推定した疑問詞を用いて、疑問文を生成することで、相手に推定された誤り範囲を問い直す応答文を生成することができる。選択された応答意図が「認識結果を用いた発話確認」の場合は、推定された誤り範囲を問い直すYes/No疑問文を生成する。
選択された応答意図が「聞き取り誤りの伝達」の場合、音声認識時に得られる状況検知情報を用いる。状況検知情報とは、例えば"音量が大きすぎる"、"雑音が大きすぎる"といった聞き誤りや認識誤りを引き起こす環境要因を検知するための情報のことで、それぞれパワー、SNR(Signal-to-Noise Ratio)を計算することで定量的に求められる。
推定された誤り範囲において、これらの値が閾値を越えていた場合、閾値を越えている環境要因があったことを、外国語話者に伝える応答文を提示する。応答文は各状況検知情報についてあらかじめ定めておけばよい。
図6に示すように、結果表示手段203は、応答文生成手段206が生成した応答文を画面上に出力する。
本実施例では、誤り範囲の属性や状況検知情報について例示を行ったが、それぞれは例示したもの以外の属性、情報を使ってもよい。また、結果表示手段については、音声認識結果だけでなく翻訳結果を表示してもよいし、その翻訳結果を音声合成して出力してもよい。
[第二の実施例]
第二の実施例としては、支援要求受付手段204は、結果表示手段203であるタッチパネル上に表示される音声認識結果の一部を選択することで実装される。一般ユーザが聞き直したい部分の単語を続けてタッチすることで応答文要求を受け付ける(図7)。
第二の実施例としては、支援要求受付手段204は、結果表示手段203であるタッチパネル上に表示される音声認識結果の一部を選択することで実装される。一般ユーザが聞き直したい部分の単語を続けてタッチすることで応答文要求を受け付ける(図7)。
なお、本発明は本実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で各種の変形を許容する。例えば、上記形態では外国語会話支援装置200の各部がコンピュータプログラムにより各種機能として論理的に実現されることを例示した。しかし、このような各部の各々を固有のハードウェアとして形成することもでき、ソフトウェアとハードウェアとの組み合わせとして実現することもできる。
この出願は、2010年03月30日に出願された日本出願特願2010−076776号を基礎とする優先権を主張し、その開示の全てを、ここに取り込む。
Claims (10)
- 外国語の発話を音声データとして入力する音声入力手段と、
入力された前記音声データを音声認識する音声認識手段と、
前記音声データの認識結果を表示する結果表示手段と、
表示された前記認識結果に対する一般ユーザからの支援要求を受け付ける要求受付手段と、
受け付けられた前記支援要求に対応した応答意図を決定する意図推定手段と、
決定された前記応答意図に対応した応答文を生成する応答文生成手段と、
生成された前記応答文を前記外国語で出力する応答出力手段と、
を有する外国語会話支援装置。 - 前記応答文生成手段は、前記応答意図と前記認識結果とに対応した前記応答文を生成する請求項1に記載の外国語会話支援装置。
- 前記要求受付手段は、複数の応答意図候補を選定自在に提示し、
前記意図推定手段は、提示された複数の前記応答意図候補の選定に対応して前記応答意図を決定する請求項1または2に記載の外国語会話支援装置。 - 前記要求受付手段は、前記応答意図候補として少なくとも再発声の要求を提示し、
前記応答文生成手段は、前記再発声の要求の選定に対応して前記発話の再発声を要求する前記応答文を生成する請求項3に記載の外国語会話支援装置。 - 前記応答文生成手段は、前記再発声の要求の選定に対応して誤り範囲に入りそうな単語の属性を誤り範囲の前後から推定して前記応答文を生成する請求項4に記載の外国語会話支援装置。
- 前記要求受付手段は、表示される前記認識結果に対して前記一般ユーザに入力される認識誤り推定範囲を受け付ける請求項1ないし5の何れか一項に記載の外国語会話支援装置。
- 前記要求受付手段は、前記応答意図候補として少なくとも聞き取り誤り原因の伝達を提示し、
前記応答文生成手段は、前記聞き取り誤り原因の伝達の選定に対応して前記原因を修正した前記発話の再発声を要求する前記応答文を生成する請求項3ないし6の何れか一項に記載の外国語会話支援装置。 - 前記要求受付手段は、前記応答意図候補として少なくとも前記認識結果を用いた発話確認を提示し、
前記応答文生成手段は、前記発話確認の選定に対応して前記認識結果の正否を問い直す疑問文として前記応答文を生成する請求項3ないし7の何れか一項に記載の外国語会話支援装置。 - 外国語の発話を音声データとして入力する音声入力処理と、
入力された前記音声データを音声認識する音声認識処理と、
前記音声データの認識結果を表示する結果出力処理と、
表示された前記認識結果に対する一般ユーザからの支援要求を受け付ける要求受付処理と、
受け付けられた前記支援要求に対応した応答意図を決定する意図推定処理と、
決定された前記応答意図に対応した応答文を生成する応答文生成処理と、
生成された前記応答文を前記外国語で出力する応答出力処理と、
を外国語会話支援装置に実行させるコンピュータプログラム。 - 外国語の発話を音声データとして入力する音声入力動作と、
入力された前記音声データを音声認識する音声認識動作と、
前記音声データの認識結果を表示する結果出力動作と、
表示された前記認識結果に対する一般ユーザからの支援要求を受け付ける要求受付動作と、
受け付けられた前記支援要求に対応した応答意図を決定する意図推定動作と、
決定された前記応答意図に対応した応答文を生成する応答文生成動作と、
生成された前記応答文を前記外国語で出力する応答出力動作と、
を有する外国語会話支援装置のデータ処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010076776 | 2010-03-30 | ||
JP2010076776 | 2010-03-30 | ||
PCT/JP2011/001100 WO2011121884A1 (ja) | 2010-03-30 | 2011-02-25 | 外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2011121884A1 true JPWO2011121884A1 (ja) | 2013-07-04 |
Family
ID=44711655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012508040A Pending JPWO2011121884A1 (ja) | 2010-03-30 | 2011-02-25 | 外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2011121884A1 (ja) |
WO (1) | WO2011121884A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10503767B2 (en) * | 2016-09-13 | 2019-12-10 | Microsoft Technology Licensing, Llc | Computerized natural language query intent dispatching |
CN111090733B (zh) * | 2019-12-24 | 2022-12-06 | 科大讯飞股份有限公司 | 人机交互方法、装置、设备及可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158975A (ja) * | 1991-12-11 | 1993-06-25 | Ricoh Co Ltd | 対話支援装置 |
JP2003030187A (ja) * | 2001-07-18 | 2003-01-31 | Nec Corp | 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム |
JP2008052178A (ja) * | 2006-08-28 | 2008-03-06 | Toyota Motor Corp | 音声認識装置と音声認識方法 |
-
2011
- 2011-02-25 JP JP2012508040A patent/JPWO2011121884A1/ja active Pending
- 2011-02-25 WO PCT/JP2011/001100 patent/WO2011121884A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2011121884A1 (ja) | 2011-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657812B2 (en) | Message playback using a shared device | |
US11495224B2 (en) | Contact resolution for communications systems | |
US10089981B1 (en) | Messaging account disambiguation | |
RU2349969C2 (ru) | Синхронное понимание семантических объектов, реализованное с помощью тэгов речевого приложения | |
US9293133B2 (en) | Improving voice communication over a network | |
US8370160B2 (en) | Methods and apparatus for implementing distributed multi-modal applications | |
RU2352979C2 (ru) | Синхронное понимание семантических объектов для высокоинтерактивного интерфейса | |
US10157614B1 (en) | Message playback using a shared device | |
US20120109632A1 (en) | Portable electronic device | |
EP2385520A2 (en) | Method and device for generating text from spoken word | |
US10699706B1 (en) | Systems and methods for device communications | |
US10186267B1 (en) | Message playback using a shared device | |
US20240304201A1 (en) | Audio-based processing method and apparatus | |
WO2021031308A1 (zh) | 音频处理方法、装置及存储介质 | |
US20230176813A1 (en) | Graphical interface for speech-enabled processing | |
CN111883135A (zh) | 语音转写方法、装置和电子设备 | |
JP7287006B2 (ja) | 話者決定装置、話者決定方法、および話者決定装置の制御プログラム | |
CN112562670A (zh) | 语音智能识别方法、语音智能识别装置及智能设备 | |
US11967338B2 (en) | Systems and methods for a computerized interactive voice companion | |
US10841411B1 (en) | Systems and methods for establishing a communications session | |
JP6950708B2 (ja) | 情報処理装置、情報処理方法、および情報処理システム | |
WO2019196645A1 (zh) | 对话信息处理方法、装置、移动终端及存储介质 | |
WO2011121884A1 (ja) | 外国語会話支援装置、そのコンピュータプログラムおよびデータ処理方法 | |
JP6824547B1 (ja) | アクティブラーニングシステム及びアクティブラーニングプログラム | |
JP6260138B2 (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム |