JP2019109424A - 計算機、言語解析方法、及びプログラム - Google Patents
計算機、言語解析方法、及びプログラム Download PDFInfo
- Publication number
- JP2019109424A JP2019109424A JP2017243880A JP2017243880A JP2019109424A JP 2019109424 A JP2019109424 A JP 2019109424A JP 2017243880 A JP2017243880 A JP 2017243880A JP 2017243880 A JP2017243880 A JP 2017243880A JP 2019109424 A JP2019109424 A JP 2019109424A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- text
- continuation character
- utterance
- converted text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】ユーザが発した音声に対応する音声信号を処理する計算機であって、計算機は、音声信号を複数の文字列から構成されるテキストに変換し、発話継続文字列が変換されたテキストに含まれるか否かを判定し、発話継続文字列が変換されたテキストに含まれる場合、記憶装置に変換されたテキストを蓄積し、発話継続文字列が変換されたテキストに含まれないと判定された場合、一つ以上の変換されたテキストを用いて出力テキストを生成し、出力テキストに基づいて、音声信号に対応する音声を発したユーザの発話意図を特定し、ユーザの発話に対する応答を行う装置に、特定されたユーザの発話意図を示す情報を送信する。
【選択図】図1
Description
101 通信装置
102 対話装置
103 ユーザ
105 ネットワーク
110 音声処理部
111 言語処理部
120 テキスト受信部
121 テキスト送信判定部
122 意図理解部
123 回答生成部
130 発話継続文字列情報
131 意図理解情報
132 回答生成情報
200 プロセッサ
201 メモリ
202 ネットワークインタフェース
Claims (15)
- ユーザが発した音声に対応する音声信号を処理する計算機であって、
演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続される通信インタフェースを備え、
前記演算装置は、
前記通信インタフェースを介して前記音声信号を受信し、
前記受信した音声信号を複数の文字列から構成されるテキストに変換し、
前記変換されたテキストを解析することによって、前記ユーザの発話が継続中であることを示す発話継続文字列が前記変換されたテキストに含まれるか否かを判定し、
前記発話継続文字列が前記変換されたテキストに含まれると判定された場合、前記記憶装置に前記変換されたテキストを蓄積し、
前記発話継続文字列が前記変換されたテキストに含まれないと判定された場合、一つ以上の前記変換されたテキストを用いて出力テキストを生成し、
前記出力テキストに基づいて、前記受信した音声信号に対応する音声を発した前記ユーザの発話意図を特定し、
前記ユーザの発話に対する応答を行う装置に、前記特定されたユーザの発話意図を示す情報を送信することを特徴とする計算機。 - 請求項1に記載の計算機であって、
前記計算機は、前記発話継続文字列を管理するための発話継続文字列情報を保持し、
前記演算装置は、
前記発話継続文字列情報を参照して、前記変換されたテキストの末尾に前記発話継続文字列が存在するか否かを判定し、
前記変換されたテキストの末尾に前記発話継続文字列が存在すると判定された場合、前記記憶装置に前記変換されたテキストを蓄積することを特徴とする計算機。 - 請求項1に記載の計算機であって、
前記計算機は、前記発話継続文字列を管理するための発話継続文字列情報を保持し、
前記発話継続文字列情報は、前記発話継続文字列及びテキストにおける前記発話継続文字列の出現位置から構成されるエントリを複数含み、
前記演算装置は、
前記発話継続文字列情報を参照して、前記変換されたテキストに前記発話継続文字列が含まれるか否かを判定し、
前記変換されたテキストに前記発話継続文字列が含まれると判定された場合、前記変換されたテキストに含まれる前記発話継続文字列の前記変換されたテキスト中の位置が、当該発話継続文字列に対応するエントリに設定される出現位置に一致するか否かを判定し、
前記変換されたテキストに含まれる前記発話継続文字列の前記変換されたテキスト中の位置が、当該発話継続文字列に対応するエントリに設定される出現位置に一致すると判定された場合、前記記憶装置に前記変換されたテキストを蓄積することを特徴とする計算機。 - 請求項1に記載の計算機であって、
前記演算装置は、
前記記憶装置に前記変換されたテキストを蓄積した後、待ち時間を計測するタイマが起動中か否かを判定し、
前記タイマが起動中でないと判定された場合、前記タイマを起動し、
前記タイマが起動中であると判定された場合、前記待ち時間が閾値より大きいか否かを判定し、
前記待ち時間が閾値以下であると判定された場合、前記待ち時間を初期化して、前記待ち時間の計測を継続し、
前記待ち時間が閾値より大きいと判定された場合、前記出力テキストを生成することを特徴とする計算機。 - 請求項1に記載の計算機であって、
前記演算装置は、
前記記憶装置に複数の前記変換されたテキストが格納される場合、前記複数の変換されたテキストから前記発話継続文字列を削除し、結合することによって前記出力テキストを生成し、
前記記憶装置に一つの前記変換されたテキストが格納される場合、前記一つの変換されたテキストを前記出力テキストとして生成することを特徴とする計算機。 - ユーザが発した音声に対応する音声信号を処理する計算機が実行する言語解析方法であって、
前記計算機は、演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続される通信インタフェースを備え、
前記言語解析方法は、
前記演算装置が、前記通信インタフェースを介して前記音声信号を受信し、前記受信した音声信号を複数の文字列から構成されるテキストに変換する第1のステップと、
前記演算装置が、前記変換されたテキストを解析することによって、前記ユーザの発話が継続中であることを示す発話継続文字列が前記変換されたテキストに含まれるか否かを判定する第2のステップと、
前記演算装置が、前記発話継続文字列が前記変換されたテキストに含まれると判定した場合、前記記憶装置に前記変換されたテキストを蓄積する第3のステップと、
前記演算装置が、前記発話継続文字列が前記変換されたテキストに含まれないと判定した場合、一つ以上の前記変換されたテキストを用いて出力テキストを生成する第4のステップと、
前記演算装置が、前記出力テキストに基づいて、前記受信した音声信号に対応する音声を発した前記ユーザの発話意図を特定する第5のステップと、
前記演算装置が、前記ユーザの発話に対する応答を行う装置に、前記特定されたユーザの発話意図を示す情報を送信する第6のステップと、を含むことを特徴とする言語解析方法。 - 請求項6に記載の言語解析方法であって、
前記計算機は、前記発話継続文字列を管理するための発話継続文字列情報を保持し、
前記第2のステップは、前記演算装置が、前記発話継続文字列情報を参照して、前記変換されたテキストの末尾に前記発話継続文字列が存在するか否かを判定するステップを含み、
前記第3のステップでは、前記演算装置が、前記変換されたテキストの末尾に前記発話継続文字列が存在すると判定した場合、前記記憶装置に前記変換されたテキストを蓄積することを特徴とする言語解析方法。 - 請求項6に記載の言語解析方法であって、
前記計算機は、前記発話継続文字列を管理するための発話継続文字列情報を保持し、
前記発話継続文字列情報は、前記発話継続文字列及びテキストにおける前記発話継続文字列の出現位置から構成されるエントリを複数含み、
前記第2のステップは、
前記演算装置が、前記発話継続文字列情報を参照して、前記変換されたテキストに前記発話継続文字列が含まれるか否かを判定するステップと、
前記演算装置が、前記変換されたテキストに前記発話継続文字列が含まれると判定した場合、前記変換されたテキストに含まれる前記発話継続文字列の前記変換されたテキスト中の位置が、当該発話継続文字列に対応するエントリに設定される出現位置に一致するか否かを判定するステップと、を含み、
前記第3のステップでは、前記演算装置が、前記変換されたテキストに含まれる前記発話継続文字列の前記変換されたテキスト中の位置が、当該発話継続文字列に対応するエントリに設定される出現位置に一致すると判定した場合、前記記憶装置に前記変換されたテキストを蓄積することを特徴とする言語解析方法。 - 請求項6に記載の言語解析方法であって、
前記第3のステップは、
前記演算装置が、前記記憶装置に前記変換されたテキストを蓄積した後に、待ち時間を計測するタイマが起動中か否かを判定するステップと、
前記タイマが起動中でないと判定された場合、前記演算装置が、前記タイマを起動するステップと、
前記タイマが起動中であると判定された場合、前記演算装置が、前記待ち時間が閾値より大きいか否かを判定するステップと、
前記待ち時間が閾値以下であると判定された場合、前記演算装置が、前記待ち時間を初期化して、前記待ち時間の計測を継続するステップと、
前記待ち時間が閾値より大きいと判定された場合、前記演算装置が、前記出力テキストを生成するステップと、を含むことを特徴とする言語解析方法。 - 請求項6に記載の言語解析方法であって、
前記第4のステップは、
前記記憶装置に複数の前記変換されたテキストが格納される場合、前記演算装置が、前記複数の変換されたテキストから前記発話継続文字列を削除し、結合することによって前記出力テキストを生成するステップと、
前記記憶装置に一つの前記変換されたテキストが格納される場合、前記演算装置が、前記一つの変換されたテキストを前記出力テキストとして生成するステップと、を含むことを特徴とする言語解析方法。 - ユーザが発した音声に対応する音声信号を処理する計算機に実行させるためのプログラムであって、
前記計算機は、演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続される通信インタフェースを備え、
前記プログラムは、
前記通信インタフェースを介して前記音声信号を受信し、前記受信した音声信号を複数の文字列から構成されるテキストに変換する第1の手順と、
前記変換されたテキストを解析することによって、前記ユーザの発話が継続中であることを示す発話継続文字列が前記変換されたテキストに含まれるか否かを判定する第2の手順と、
前記発話継続文字列が前記変換されたテキストに含まれると判定された場合、前記記憶装置に前記変換されたテキストを蓄積する第3の手順と、
前記発話継続文字列が前記変換されたテキストに含まれないと判定された場合、一つ以上の前記変換されたテキストを用いて出力テキストを生成する第4の手順と、
前記出力テキストに基づいて、前記受信した音声信号に対応する音声を発した前記ユーザの発話意図を特定する第5の手順と、
前記ユーザの発話に対する応答を行う装置に、前記特定されたユーザの発話意図を示す情報を送信する第6の手順と、を前記計算機に実行させるためのプログラム。 - 請求項11に記載のプログラムであって、
前記計算機は、前記発話継続文字列を管理するための発話継続文字列情報を保持し、
前記第2の手順は、前記発話継続文字列情報を参照して、前記変換されたテキストの末尾に前記発話継続文字列が存在するか否かを判定する手順を含み、
前記第3の手順では、前記変換されたテキストの末尾に前記発話継続文字列が存在すると判定された場合、前記記憶装置に前記変換されたテキストを蓄積させることを特徴とするプログラム。 - 請求項11に記載のプログラムであって、
前記計算機は、前記発話継続文字列を管理するための発話継続文字列情報を保持し、
前記発話継続文字列情報は、前記発話継続文字列及びテキストにおける前記発話継続文字列の出現位置から構成されるエントリを複数含み、
前記第2の手順は、
前記発話継続文字列情報を参照して、前記変換されたテキストに前記発話継続文字列が含まれるか否かを判定する手順と、
前記変換されたテキストに前記発話継続文字列が含まれると判定された場合、前記テキストに含まれる前記発話継続文字列の前記変換されたテキスト中の位置が、当該発話継続文字列に対応するエントリに設定される出現位置に一致するか否かを判定する手順と、を含み、
前記第3の手順では、前記変換されたテキストに含まれる前記発話継続文字列の前記変換されたテキスト中の位置が、当該発話継続文字列に対応するエントリに設定される出現位置に一致すると判定された場合、前記記憶装置に前記変換されたテキストを蓄積することを特徴とするプログラム。 - 請求項11に記載のプログラムであって、
前記第3の手順は、
前記記憶装置に前記変換されたテキストを蓄積した後に、待ち時間を計測するタイマが起動中か否かを判定する手順と、
前記タイマが起動中でないと判定された場合、前記タイマを起動する手順と、
前記タイマが起動中であると判定された場合、前記待ち時間が閾値より大きいか否かを判定する手順と、
前記待ち時間が閾値以下であると判定された場合、前記待ち時間を初期化して、前記待ち時間の計測を継続する手順と、
前記待ち時間が閾値より大きいと判定された場合、前記出力テキストを生成する手順と、を含むことを特徴とするプログラム。 - 請求項11に記載のプログラムであって、
前記第4の手順は、
前記記憶装置に複数の前記変換されたテキストが格納される場合、前記複数の変換されたテキストから前記発話継続文字列を削除し、結合することによって前記出力テキストを生成する手順と、
前記記憶装置に一つの前記変換されたテキストが格納される場合、前記一つの変換されたテキストを前記出力テキストとして生成する手順と、を含むことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017243880A JP6867939B2 (ja) | 2017-12-20 | 2017-12-20 | 計算機、言語解析方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017243880A JP6867939B2 (ja) | 2017-12-20 | 2017-12-20 | 計算機、言語解析方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019109424A true JP2019109424A (ja) | 2019-07-04 |
JP6867939B2 JP6867939B2 (ja) | 2021-05-12 |
Family
ID=67179683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017243880A Active JP6867939B2 (ja) | 2017-12-20 | 2017-12-20 | 計算機、言語解析方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6867939B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021153102A1 (ja) * | 2020-01-27 | 2021-08-05 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001272990A (ja) * | 2000-03-28 | 2001-10-05 | Fuji Xerox Co Ltd | 対話記録編集装置 |
JP2002032370A (ja) * | 2000-07-18 | 2002-01-31 | Fujitsu Ltd | 情報処理装置 |
JP2015069037A (ja) * | 2013-09-30 | 2015-04-13 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP2016057986A (ja) * | 2014-09-11 | 2016-04-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
JP2017058545A (ja) * | 2015-09-17 | 2017-03-23 | 本田技研工業株式会社 | 音声処理装置および音声処理方法 |
WO2017191713A1 (ja) * | 2016-05-02 | 2017-11-09 | ソニー株式会社 | 制御装置、制御方法及びコンピュータプログラム |
-
2017
- 2017-12-20 JP JP2017243880A patent/JP6867939B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001272990A (ja) * | 2000-03-28 | 2001-10-05 | Fuji Xerox Co Ltd | 対話記録編集装置 |
JP2002032370A (ja) * | 2000-07-18 | 2002-01-31 | Fujitsu Ltd | 情報処理装置 |
JP2015069037A (ja) * | 2013-09-30 | 2015-04-13 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP2016057986A (ja) * | 2014-09-11 | 2016-04-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
JP2017058545A (ja) * | 2015-09-17 | 2017-03-23 | 本田技研工業株式会社 | 音声処理装置および音声処理方法 |
WO2017191713A1 (ja) * | 2016-05-02 | 2017-11-09 | ソニー株式会社 | 制御装置、制御方法及びコンピュータプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021153102A1 (ja) * | 2020-01-27 | 2021-08-05 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6867939B2 (ja) | 2021-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
US10811005B2 (en) | Adapting voice input processing based on voice input characteristics | |
CN112466302B (zh) | 语音交互的方法、装置、电子设备和存储介质 | |
US8509396B2 (en) | Automatic creation of complex conversational natural language call routing system for call centers | |
US11120802B2 (en) | Diarization driven by the ASR based segmentation | |
JP7230806B2 (ja) | 情報処理装置、及び情報処理方法 | |
US10468031B2 (en) | Diarization driven by meta-information identified in discussion content | |
CN103956167A (zh) | 一种基于Web的可视化手语翻译方法及设备 | |
US10565982B2 (en) | Training data optimization in a service computing system for voice enablement of applications | |
US20200320976A1 (en) | Information processing apparatus, information processing method, and program | |
CN110136715A (zh) | 语音识别方法和装置 | |
JP6930538B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6625772B2 (ja) | 検索方法及びそれを用いた電子機器 | |
KR20190074508A (ko) | 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법 | |
JP6085149B2 (ja) | 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム | |
JP6867939B2 (ja) | 計算機、言語解析方法、及びプログラム | |
JP4881903B2 (ja) | 自然言語対話エージェントのためのスクリプト作成支援方法及びプログラム | |
CN112735421A (zh) | 一种语音通话的实时质检方法和装置 | |
CN113763921B (zh) | 用于纠正文本的方法和装置 | |
WO2021161856A1 (ja) | 情報処理装置及び情報処理方法 | |
JP6260138B2 (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム | |
JP2016024378A (ja) | 情報処理装置、その制御方法及びプログラム | |
US20250045509A1 (en) | Entity name audio-to-text translation | |
CN111667815B (zh) | 用于文本到语音转换的方法、设备、芯片电路和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210330 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6867939 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |