[go: up one dir, main page]

JP7019462B2 - Dialogue system - Google Patents

Dialogue system Download PDF

Info

Publication number
JP7019462B2
JP7019462B2 JP2018040467A JP2018040467A JP7019462B2 JP 7019462 B2 JP7019462 B2 JP 7019462B2 JP 2018040467 A JP2018040467 A JP 2018040467A JP 2018040467 A JP2018040467 A JP 2018040467A JP 7019462 B2 JP7019462 B2 JP 7019462B2
Authority
JP
Japan
Prior art keywords
word
character string
dialogue
character
determination unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018040467A
Other languages
Japanese (ja)
Other versions
JP2019154468A (en
Inventor
唯子 角森
可奈子 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2018040467A priority Critical patent/JP7019462B2/en
Publication of JP2019154468A publication Critical patent/JP2019154468A/en
Application granted granted Critical
Publication of JP7019462B2 publication Critical patent/JP7019462B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Toys (AREA)

Description

本発明は、対話システムに関する。 The present invention relates to a dialogue system.

所定のルールに従ってユーザと対話を行うシステムが知られている。例えば、相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行うような、いわゆる「しりとり」を行うシステムが知られている。「しりとり」は、前の単語の最後のかなで始まる単語を発することがプレイヤに要求される日本語のゲームである(”Shiritori” is a Japanese word game in which the players arerequired to say a word which begins with the final kana of the previous word.)。また、英語において、しりとりと同様のルールで対話を行うものとして、Word Chainが知られている。このようなルールに従って対話を行うシステムとして、特許文献1には、ユーザにより発話された単語の語尾と同一文字から始まる応答用単語を抽出してスピーカーを介して音声出力するシステムが開示されている。 A system is known that interacts with a user according to a predetermined rule. For example, there is known a system for performing so-called "shiritori" in which a user interacts with a user according to a rule of issuing a word having the ending character of the word issued by the other party at the beginning of the word. "Shiritori" is a Japanese word game in which the players are required to say a word which begins. with the final kana of the previous word.). Further, in English, Word Chain is known as having a dialogue according to the same rules as Shiritori. As a system for performing dialogue according to such a rule, Patent Document 1 discloses a system that extracts a response word starting from the same character as the ending of a word spoken by a user and outputs it by voice through a speaker. ..

特開2006-209077号公報Japanese Unexamined Patent Publication No. 2006-20907

相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行うシステムでは、相手方であるユーザにより入力された単語を正しく認識する必要がある。例えば、ユーザにより入力された単語が、例えば漢字に例示されるような「かな」以外の文字によりテキスト入力されたものである場合において、その単語に複数の読みが関連付けられ得るような場合には、システムは、ルールに従った単語が入力されたか否かが判別できず、入力された単語に応じた単語の出力もできない。また、音声入力により単語が入力された場合には、ユーザがルールに従った単語を発した場合であっても、音声認識処理における誤認識が発生する場合があり、システムは、ユーザが発した単語を正しく認識できない場合がある。 In a system that interacts with a user according to the rule of uttering a word having the ending character of the word uttered by the other party at the beginning, it is necessary to correctly recognize the word input by the other user. For example, when a word input by a user is a text input by a character other than "kana" as exemplified by a kanji, and the word can be associated with multiple readings. , The system cannot determine whether or not a word has been input according to the rules, and cannot output a word according to the input word. In addition, when a word is input by voice input, erroneous recognition in the voice recognition process may occur even if the user utters the word according to the rule, and the system is uttered by the user. Words may not be recognized correctly.

そこで、本発明は、上記問題点に鑑みてなされたものであり、相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行うシステムにおいて、ユーザが発した単語を正しく認識できる可能性を向上させることを目的とする。 Therefore, the present invention has been made in view of the above problems, and is a word uttered by the user in a system for interacting with the user according to the rule of uttering a word having the ending character of the word uttered by the other party at the beginning of the word. The purpose is to improve the possibility of correctly recognizing.

上記課題を解決するために、本発明の一形態に係る対話システムは、相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行う対話システムであって、対話システムが発した第1の単語に応じてユーザにより入力された単語である第2の単語を取得する取得部と、第1の単語の語尾の文字に基づいて、第2の単語を構成する文字列を判定する判定部と、判定部により判定された第2の単語の文字列に応じて、ルールに従った単語である第3の単語を出力する出力部と、を備える。 In order to solve the above problem, the dialogue system according to one form of the present invention is a dialogue system that interacts with a user according to a rule that a word having a character at the end of a word uttered by the other party is uttered at the beginning of the word. An acquisition unit that acquires a second word that is a word input by the user according to the first word issued by the system, and a character that constitutes the second word based on the character at the end of the first word. It includes a determination unit that determines a column, and an output unit that outputs a third word that is a word according to a rule according to the character string of the second word determined by the determination unit.

上記の形態によれば、第2の単語がルールに従って発せられた単語であれば、第2の単語は、第1の単語の語尾を語頭に有することに鑑みて、第2の単語を構成する文字列が第1の単語の語尾の文字に基づいて判定されるので、第2の単語の入力の態様に起因してその特定が困難である場合であっても、第2の単語を構成する文字列を正しく認識できる。 According to the above form, if the second word is a word uttered according to a rule, the second word constitutes the second word in view of having the ending of the first word at the beginning of the word. Since the character string is determined based on the character at the end of the first word, it constitutes the second word even if it is difficult to identify it due to the input mode of the second word. The character string can be recognized correctly.

相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行うシステムにおいて、ユーザが発した単語を正しく認識できる可能性を向上させることが可能となる。 It is possible to improve the possibility of correctly recognizing a word uttered by the user in a system that interacts with the user according to the rule of uttering a word having the ending character of the word uttered by the other party at the beginning of the word.

本実施形態の対話装置を含む対話システムの機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the dialogue system including the dialogue device of this embodiment. 対話装置のハードブロック図である。It is a hard block diagram of a dialogue device. 単語記憶部の構成及び記憶されているデータの例を示す図である。It is a figure which shows the structure of the word storage part, and the example of the stored data. 対話システムとユーザとのテキストによる対話の例を模式的に示す図である。It is a figure which shows typically the example of the text dialogue between a dialogue system and a user. 対話システムとユーザとの音声による対話の例を模式的に示す図である。It is a figure which shows typically the example of the voice dialogue between a dialogue system and a user. 対話システムとユーザとの音声による対話の例を模式的に示す図である。It is a figure which shows typically the example of the voice dialogue between a dialogue system and a user. 対話システムとユーザとの音声による対話の例を模式的に示す図である。It is a figure which shows typically the example of the voice dialogue between a dialogue system and a user. 本実施形態の対話方法の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the dialogue method of this embodiment. 対話プログラムの構成を示す図である。It is a figure which shows the structure of a dialogue program.

本発明に係る対話システムの実施形態について図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。 An embodiment of the dialogue system according to the present invention will be described with reference to the drawings. If possible, the same parts will be designated by the same reference numerals, and duplicate description will be omitted.

図1は、本実施形態に係る対話装置10を含む対話システム1の機能的構成を示す図である。本実施形態の対話システム1は、対話装置10により構成され、所定ルールに従ってユーザと対話を行うシステムである。所定ルールは、相手方が発した単語の語尾の文字を語頭に有する単語を発するというものである。このようなルールで行われるゲームとして、いわゆる「しりとり」(shiritori)がある。「しりとり」は、前の単語の最後のかなで始まる単語を発することがプレイヤに要求される日本語のゲームである。また、英語において、しりとりと同様のルールで対話を行うものとして、Word Chainが知られている。 FIG. 1 is a diagram showing a functional configuration of a dialogue system 1 including a dialogue device 10 according to the present embodiment. The dialogue system 1 of the present embodiment is a system composed of a dialogue device 10 and having a dialogue with a user according to a predetermined rule. The predetermined rule is to emit a word having a letter at the end of the word issued by the other party at the beginning of the word. There is a so-called "shiritori" as a game played according to such a rule. "Shiritori" is a Japanese game in which the player is required to emit a word starting with the last kana of the previous word. Further, in English, Word Chain is known as having a dialogue according to the same rules as Shiritori.

対話システム1とユーザとの対話において、対話システム1は、テキストにより入力された単語を取得できる。また、対話システム1は、音声により入力された単語を取得できる。対話システム1は、入力された単語に応じて、テキストの表示または音声の出力により単語を発する。 In the dialogue between the dialogue system 1 and the user, the dialogue system 1 can acquire the word input by the text. In addition, the dialogue system 1 can acquire words input by voice. The dialogue system 1 utters a word by displaying a text or outputting a voice according to the input word.

対話システム1または対話装置10を構成する装置は限定されないが、携帯端末及びパーソナルコンピュータ等の装置により構成されることとしてもよいし、コンピュータが組み込まれたロボットにより構成されてもよい。 The device constituting the dialogue system 1 or the dialogue device 10 is not limited, but may be configured by a device such as a mobile terminal and a personal computer, or may be configured by a robot incorporating a computer.

本実施形態では、対話システム1は、1つの装置である対話装置10により構成されているが、対話装置10に含まれる各機能部及び記憶手段が複数の装置に分散されて構成されてもよい。 In the present embodiment, the dialogue system 1 is composed of the dialogue device 10 which is one device, but each functional unit and the storage means included in the dialogue device 10 may be distributed and configured in a plurality of devices. ..

図1に示すように、対話装置10は、機能的には、取得部11、認識部12、判定部13、対話制御部14及び出力部15を備える。また、対話装置10は、単語記憶部20といった記憶手段を含む。これらの各機能部については後に詳述する。 As shown in FIG. 1, the dialogue device 10 functionally includes an acquisition unit 11, a recognition unit 12, a determination unit 13, a dialogue control unit 14, and an output unit 15. Further, the dialogue device 10 includes a storage means such as a word storage unit 20. Each of these functional parts will be described in detail later.

なお、図1に示したブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。 The block diagram shown in FIG. 1 shows a block of functional units. These functional blocks (components) are realized by any combination of hardware and / or software. Further, the means for realizing each functional block is not particularly limited. That is, each functional block may be realized by one physically and / or logically coupled device, or directly and / or indirectly by two or more physically and / or logically separated devices. (For example, wired and / or wireless) may be connected and realized by these plurality of devices.

例えば、本発明の一実施の形態における対話装置10は、コンピュータとして機能してもよい。図2は、本実施形態に係る対話装置10のハードウェア構成の一例を示す図である。対話装置10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。 For example, the dialogue device 10 in one embodiment of the present invention may function as a computer. FIG. 2 is a diagram showing an example of the hardware configuration of the dialogue device 10 according to the present embodiment. The dialogue device 10 may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。対話装置10のハードウェア構成は、図2に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。 In the following description, the word "device" can be read as a circuit, a device, a unit, or the like. The hardware configuration of the dialogue device 10 may be configured to include one or more of the devices shown in FIG. 2, or may be configured not to include some of the devices.

対話装置10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。 For each function in the interactive device 10, the processor 1001 performs an operation by loading predetermined software (program) on hardware such as the processor 1001 and the memory 1002, and the communication device 1004 communicates with the memory 1002 and the storage 1003. It is realized by controlling the reading and / or writing of the data in.

プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、図1に示した各機能部11~15などは、プロセッサ1001で実現されてもよい。 Processor 1001 operates, for example, an operating system to control the entire computer. The processor 1001 may be composed of a central processing unit (CPU) including an interface with a peripheral device, a control device, an arithmetic unit, a register, and the like. For example, each of the functional units 11 to 15 shown in FIG. 1 may be realized by the processor 1001.

また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、対話装置10の各機能部11~15は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。 Further, the processor 1001 reads a program (program code), a software module and data from the storage 1003 and / or the communication device 1004 into the memory 1002, and executes various processes according to these. As the program, a program that causes a computer to execute at least a part of the operations described in the above-described embodiment is used. For example, each functional unit 11 to 15 of the dialogue device 10 may be realized by a control program stored in the memory 1002 and operated by the processor 1001. Although it has been described that the various processes described above are executed by one processor 1001, they may be executed simultaneously or sequentially by two or more processors 1001. Processor 1001 may be mounted on one or more chips. The program may be transmitted from the network via a telecommunication line.

メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る棚割情報生成方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。 The memory 1002 is a computer-readable recording medium, and is composed of at least one such as a ROM (Read Only Memory), an EPROM (Erasable Programmable ROM), an EEPROM (Electrically Erasable Programmable ROM), and a RAM (Random Access Memory). May be done. The memory 1002 may be referred to as a register, a cache, a main memory (main storage device), or the like. The memory 1002 can store a program (program code), a software module, and the like that can be executed to implement the shelving allocation information generation method according to the embodiment of the present invention.

ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。 The storage 1003 is a computer-readable recording medium, for example, an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, an optical magnetic disk (for example, a compact disk, a digital versatile disk, a Blu-ray). It may consist of at least one (registered trademark) disk), smart card, flash memory (eg, card, stick, key drive), floppy (registered trademark) disk, magnetic strip, and the like. The storage 1003 may be referred to as an auxiliary storage device. The storage medium described above may be, for example, a database, server or other suitable medium containing memory 1002 and / or storage 1003.

通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。 The communication device 1004 is hardware (transmission / reception device) for communicating between computers via a wired and / or wireless network, and is also referred to as, for example, a network device, a network controller, a network card, a communication module, or the like.

入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。 The input device 1005 is an input device (for example, a keyboard, a mouse, a microphone, a switch, a button, a sensor, etc.) that receives an input from the outside. The output device 1006 is an output device (for example, a display, a speaker, an LED lamp, etc.) that outputs to the outside. The input device 1005 and the output device 1006 may have an integrated configuration (for example, a touch panel).

また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。 Further, each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information. The bus 1007 may be composed of a single bus or may be composed of different buses between the devices.

また、対話装置10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。 Further, the dialogue device 10 includes hardware such as a microprocessor, a digital signal processor (DSP: Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), a PLD (Programmable Logic Device), and an FPGA (Field Programmable Gate Array). It may be configured, and some or all of each functional block may be realized by the hardware. For example, the processor 1001 may be implemented on at least one of these hardware.

続いて、対話装置10の各機能部について説明する。取得部11は、対話装置10が発した第1の単語に応じてユーザにより入力された単語である第2の単語を取得する。具体的には、取得部11は、対話装置10の出力部15により出力された第1の単語に応じて、所定ルールに従ってユーザにより入力された第2の単語を取得する。取得部11は、音声またはテキストにより入力された第2の単語を取得する。 Subsequently, each functional unit of the dialogue device 10 will be described. The acquisition unit 11 acquires a second word, which is a word input by the user in response to the first word emitted by the dialogue device 10. Specifically, the acquisition unit 11 acquires the second word input by the user according to a predetermined rule according to the first word output by the output unit 15 of the dialogue device 10. The acquisition unit 11 acquires a second word input by voice or text.

認識部12は、取得部11が、音声により入力された第2の単語を取得した場合に、取得部11により取得された第2の単語に対する所定の音声認識処理を行い、第2の単語を構成する文字列を認識する。認識部12における音声認識処理には、周知の音声認識技術を適用しうる。 When the acquisition unit 11 acquires the second word input by voice, the recognition unit 12 performs a predetermined voice recognition process on the second word acquired by the acquisition unit 11, and obtains the second word. Recognize the constituent strings. A well-known voice recognition technique can be applied to the voice recognition process in the recognition unit 12.

認識部12は、第2の単語に対する音声認識処理により、第2の単語を構成する文字列の複数の候補を取得できる。複数の候補のそれぞれは、認識の確からしさを示すスコアを有していてもよい。 The recognition unit 12 can acquire a plurality of candidates of the character string constituting the second word by the voice recognition process for the second word. Each of the plurality of candidates may have a score indicating the certainty of recognition.

判定部13は、第1の単語の語尾の文字に基づいて、第2の単語を構成する文字列を判定する。具体的には、判定部13は、第1の単語の語尾の文字に基づいて、第2の単語の読みを構成する文字列の複数の候補から選択する。また、判定部13は、第2の単語に対する所定の認識処理により得られた文字列の語頭の文字を第1の単語の語尾の文字に修正する。 The determination unit 13 determines the character string constituting the second word based on the character at the end of the first word. Specifically, the determination unit 13 selects from a plurality of candidates of the character string constituting the reading of the second word based on the character at the end of the first word. Further, the determination unit 13 corrects the character at the beginning of the character string obtained by the predetermined recognition process for the second word to the character at the end of the first word.

判定部13は、第2の単語を構成する文字列の判定に際して、単語記憶部20を参照できる。図3は、単語記憶部20の構成及び記憶されているデータの例を示す図である。図3に示すように、単語記憶部20は、単語と当該単語の読みを構成する一以上の文字列とを関連付けて記憶している。単語記憶部20は、例えば、単語「寒気」の読みを構成する文字列として、「サムケ」及び「カンキ」を関連付けて記憶している。また、単語記憶部20は、例えば、単語「ラッパ」の読みを構成する文字列として「ラッパ」を関連付けて記憶している。判定部13による判定の処理については、後に、図4~図7を参照して詳述する。 The determination unit 13 can refer to the word storage unit 20 when determining the character string constituting the second word. FIG. 3 is a diagram showing an example of the configuration of the word storage unit 20 and the stored data. As shown in FIG. 3, the word storage unit 20 stores a word in association with one or more character strings constituting the reading of the word. The word storage unit 20 stores, for example, "Samke" and "Kanki" in association with each other as a character string constituting the reading of the word "cold air". Further, the word storage unit 20 stores, for example, the "trumpet" in association with the character string constituting the reading of the word "trumpet". The process of determination by the determination unit 13 will be described in detail later with reference to FIGS. 4 to 7.

対話制御部14は、判定部13により判定された第2の単語の文字列に応じて、本実施形態の対話システム1における対話に関する所定ルールに従って出力する単語である第3の単語を取得する。所定ルールは、前述のとおり、例えば、「しりとり」及び「Word Chain」等のゲームに用いられるルールであって、対話制御部14は、第2の単語を構成する文字列の末尾の文字を語頭に有する単語を第3の単語として取得する。 The dialogue control unit 14 acquires a third word, which is a word to be output according to a predetermined rule regarding dialogue in the dialogue system 1 of the present embodiment, according to the character string of the second word determined by the determination unit 13. As described above, the predetermined rule is a rule used in games such as "Shiritori" and "Word Chain", and the dialogue control unit 14 starts with the last character of the character string constituting the second word. The word possessed by is acquired as the third word.

具体的には、対話制御部14は、対話制御のための大量の単語を記憶している所定のデータベースを参照して、第2の単語の語尾の文字を語頭に有する単語を抽出する。なお、対話制御部14は、単語記憶部20を参照して第3の単語を取得してもよい。 Specifically, the dialogue control unit 14 refers to a predetermined database that stores a large number of words for dialogue control, and extracts a word having a character at the end of the second word at the beginning of the word. The dialogue control unit 14 may acquire a third word by referring to the word storage unit 20.

出力部15は、判定部13により判定された第2の単語を構成する文字列に応じて取得された第3の単語を出力する。出力部15は、例えば、ディスプレイに表示することにより第3の単語を出力する。また、出力部15は、例えば、音声により第3の単語を出力する。 The output unit 15 outputs the third word acquired according to the character string constituting the second word determined by the determination unit 13. The output unit 15 outputs a third word by displaying it on a display, for example. Further, the output unit 15 outputs a third word by voice, for example.

次に、図4~図7を参照して、判定部13による判定及び対話の例を説明する。図4は、対話システム1とユーザとのテキストによる対話の例を模式的に示す図である。図4の対話例ex1に示すように、対話装置10の出力部15は、対話におけるシステム出力として、第1の単語ws11としての「カンナ」をディスプレイに出力する。 Next, an example of determination and dialogue by the determination unit 13 will be described with reference to FIGS. 4 to 7. FIG. 4 is a diagram schematically showing an example of a textual dialogue between the dialogue system 1 and the user. As shown in the dialogue example ex1 of FIG. 4, the output unit 15 of the dialogue device 10 outputs "canna" as the first word ws11 to the display as the system output in the dialogue.

これに対して、ユーザが第2の単語wu11として、漢字からなる「生物」をテキストにより入力する。判定部13は、単語記憶部20を参照して、単語「生物」の読みを構成する文字列の候補として、「セイブツ」及び「ナマモノ」を抽出する。そして、判定部13は、判定処理ps11において、第1の単語の語尾の文字である「ナ」を語頭に有する「ナマモノ」を、第2の単語を構成する文字列として選択する。 On the other hand, the user inputs "organism" consisting of Chinese characters as the second word woo11 by text. The determination unit 13 refers to the word storage unit 20 and extracts "saves" and "real person" as candidates for the character string constituting the reading of the word "organism". Then, the determination unit 13 selects, in the determination process ps11, a "real person" having "na", which is a character at the end of the first word, as a character string constituting the second word.

第2の単語を構成する文字列が「ナマモノ」であることが判定されたので、対話制御部14は、「ナマモノ」の語尾の文字「ノ」を語頭に有する単語「ノミ」を対話のための所定のデータベースから取得する。出力部15は、第3の単語ws12として、「ノミ」をディスプレイに出力する。 Since it was determined that the character string constituting the second word is "real person", the dialogue control unit 14 uses the word "nomi" at the beginning of the word "no" at the end of "real person" for dialogue. Obtained from the specified database of. The output unit 15 outputs "flea" to the display as the third word ws12.

図5は、対話システム1とユーザとの音声による対話の例を模式的に示す図である。図5の対話例ex2に示すように、対話装置10の出力部15は、対話におけるシステム出力として、第1の単語ws21としての「ゴリラ」をスピーカにより出力する。 FIG. 5 is a diagram schematically showing an example of a voice dialogue between the dialogue system 1 and the user. As shown in the dialogue example ex2 of FIG. 5, the output unit 15 of the dialogue device 10 outputs "gorilla" as the first word ws21 as a system output in the dialogue by the speaker.

これに対して、ユーザが第2の単語wu21として、音声からなる「ラッパ」を、マイクを介して入力する。認識部12は、第2の単語wu21に対する音声認識処理ps21を実施する。この対話例ex2においては、認識部12は、第2の単語wu21を構成する文字列が「ハッパ」であると誤認識したものとする。 On the other hand, the user inputs, as the second word woo21, a "trumpet" composed of voice through a microphone. The recognition unit 12 carries out voice recognition processing ps21 for the second word woo21. In this dialogue example ex2, it is assumed that the recognition unit 12 erroneously recognizes that the character string constituting the second word woo21 is "happa".

続いて、判定部13は、認識された文字列の「ハッパ」の語頭の文字「ハ」を、第1の単語ws21「ゴリラ」の語尾の文字「ラ」に修正する処理ps22を行い、修正文字列「ラッパ」を得る。判定部13は、このように得られた修正文字列「ラッパ」を第2の単語を構成する文字列として判定してもよい。また、判定部13は、修正文字列「ラッパ」が単語記憶部20において単語の読みとして記憶されている場合に、修正文字列「ラッパ」を第2の単語を構成する文字列として判定してもよい。 Subsequently, the determination unit 13 performs a process ps22 for correcting the character "ha" at the beginning of the recognized character string "happa" to the character "la" at the end of the first word ws21 "gorilla". Get the string "trumpet". The determination unit 13 may determine the modified character string "trumpet" thus obtained as a character string constituting the second word. Further, when the correction character string "trumpet" is stored as a word reading in the word storage unit 20, the determination unit 13 determines the correction character string "trumpet" as a character string constituting the second word. May be good.

第2の単語を構成する文字列が「ラッパ」であることが判定されたので、対話制御部14は、「ラッパ」の語尾の文字「パ」を語頭に有する単語「パンダ」を対話のための所定のデータベースから取得する。出力部15は、第3の単語ws22として、「パンダ」を、スピーカにより出力する。 Since it was determined that the character string constituting the second word is "trumpet", the dialogue control unit 14 uses the word "panda" at the beginning of the word "pa" at the end of "trumpet" for dialogue. Obtained from the specified database of. The output unit 15 outputs "panda" as the third word ws22 by the speaker.

図6は、対話システム1とユーザとの音声による対話の例を模式的に示す図である。図6の対話例ex3に示すように、対話装置10の出力部15は、対話におけるシステム出力として、第1の単語ws31としての「ゴリラ」をスピーカにより出力する。 FIG. 6 is a diagram schematically showing an example of a voice dialogue between the dialogue system 1 and the user. As shown in the dialogue example ex3 of FIG. 6, the output unit 15 of the dialogue device 10 outputs "gorilla" as the first word ws31 as a system output in the dialogue by the speaker.

これに対して、ユーザが第2の単語wu31として、音声からなる「ラッパ」を、マイクを介して入力する。認識部12は、第2の単語wu31に対する音声認識処理ps31を実施する。この対話例ex3においては、認識部12は、認識の確からしさを示すスコアの順に並べられた、第2の単語を構成する文字列の候補のリスト「1.ハッパ 2.ラッパ 3.カッパ」を取得する。 On the other hand, the user inputs the "trumpet" composed of voice as the second word woo31 through the microphone. The recognition unit 12 carries out voice recognition processing ps31 for the second word woo31. In this dialogue example ex3, the recognition unit 12 provides a list of candidate character strings constituting the second word "1. Happa 2. Trumpet 3. Kappa" arranged in the order of scores indicating the certainty of recognition. get.

続いて、判定部13は、リストの上位から第2の単語を構成する文字列の候補を参照し、第1の単語ws31「ゴリラ」の語尾の文字「ラ」を語頭に有する文字列を選択する処理ps32を行う。即ち、判定部13は、リストの第2位の文字列「ラッパ」を選択する。判定部13は、このように選択された文字列「ラッパ」を第2の単語を構成する文字列として判定してもよい。また、判定部13は、選択された文字列「ラッパ」が単語記憶部20において単語の読みとして記憶されている場合に、修正文字列「ラッパ」を第2の単語を構成する文字列として判定してもよい。 Subsequently, the determination unit 13 refers to the candidate character strings constituting the second word from the top of the list, and selects a character string having the character "la" at the end of the first word ws31 "gorilla" at the beginning of the word. Processing ps32 is performed. That is, the determination unit 13 selects the second character string "trumpet" in the list. The determination unit 13 may determine the character string "trumpet" selected in this way as the character string constituting the second word. Further, when the selected character string "trumpet" is stored as a word reading in the word storage unit 20, the determination unit 13 determines the modified character string "trumpet" as a character string constituting the second word. You may.

第2の単語を構成する文字列が「ラッパ」であることが判定されたので、対話制御部14は、「ラッパ」の語尾の文字「パ」を語頭に有する単語「パンダ」を対話のための所定のデータベースから取得する。出力部15は、第3の単語ws32として、「パンダ」を、スピーカにより出力する。 Since it was determined that the character string constituting the second word is "trumpet", the dialogue control unit 14 uses the word "panda" at the beginning of the word "pa" at the end of "trumpet" for dialogue. Obtained from the specified database of. The output unit 15 outputs "panda" as the third word ws32 by the speaker.

図7は、対話システム1とユーザとの英語の音声による対話の例を模式的に示す図である。図7の対話例ex4に示すように、対話装置10の出力部15は、対話におけるシステム出力として、第1の単語ws41としての「noon」をスピーカにより出力する。 FIG. 7 is a diagram schematically showing an example of an English voice dialogue between the dialogue system 1 and the user. As shown in the dialogue example ex4 of FIG. 7, the output unit 15 of the dialogue device 10 outputs "noon" as the first word ws41 as the system output in the dialogue by the speaker.

これに対して、ユーザが第2の単語wu41として、音声からなる「night」を、マイクを介して入力する。認識部12は、第2の単語wu41に対する音声認識処理ps31を実施する。この対話例ex4においては、認識部12は、入力された音声に基づいて、第2の単語が発音記号[nait]により表される単語であることを認識し、発音記号[nait]により表される単語の候補のリスト「1.knight 2.night」を取得する。 On the other hand, the user inputs "night" composed of voice as the second word woo41 through the microphone. The recognition unit 12 carries out voice recognition processing ps31 for the second word woo41. In this dialogue example ex4, the recognition unit 12 recognizes that the second word is a word represented by the phonetic symbol [nait] based on the input voice, and is represented by the phonetic symbol [nait]. The list of candidate words "1. night 2. night" is acquired.

続いて、判定部13は、第2の単語の候補を参照し、第1の単語ws41「Noon」の語尾の文字「n」を語頭に有する文字列を選択する処理ps42を行う。即ち、判定部13は、リスト中の単語「night」を選択する。判定部13は、このように選択された文字列「night」を第2の単語を構成する文字列として判定する。 Subsequently, the determination unit 13 refers to the candidate of the second word, and performs the process ps42 of selecting the character string having the character "n" at the end of the first word ws41 "Noon" at the beginning of the word. That is, the determination unit 13 selects the word "night" in the list. The determination unit 13 determines the character string "night" selected in this way as the character string constituting the second word.

第2の単語を構成する文字列が「night」であることが判定されたので、対話制御部14は、「night」の語尾の文字「t」を語頭に有する単語「time」を対話のための所定のデータベースから取得する。出力部15は、第3の単語ws42として、「time」を、スピーカにより出力する。 Since it was determined that the character string constituting the second word is "night", the dialogue control unit 14 uses the word "time" at the beginning of the word "t" at the end of "night" for dialogue. Obtained from the specified database of. The output unit 15 outputs "time" as the third word ws42 by the speaker.

次に、図8を参照して、対話システム1における対話方法について説明する。図8は、本実施形態の対話方法の処理内容の例を示すフローチャートである。 Next, a dialogue method in the dialogue system 1 will be described with reference to FIG. FIG. 8 is a flowchart showing an example of the processing content of the dialogue method of the present embodiment.

ステップS1において、対話システム1は、ユーザとの対話の処理を開始する。ステップS2において、出力部15は、第1の単語を出力する。 In step S1, the dialogue system 1 starts processing the dialogue with the user. In step S2, the output unit 15 outputs the first word.

ステップS3において、取得部11は、ステップS2において出力された第1の単語又はステップS5において出力された第3の単語に応じてユーザにより入力された第2の単語を取得する。 In step S3, the acquisition unit 11 acquires the second word input by the user according to the first word output in step S2 or the third word output in step S5.

ステップS4において、判定部13は、第1の単語の語尾の文字に基づいて、ステップS3において取得された第2の単語を構成する文字列を判定する。そして、ステップS5において、出力部15は、判定部13により判定された第2の単語を構成する文字列に応じて取得された第3の単語を出力する。第3の単語は、例えば、対話制御部14により所定のデータベースを参照して取得される。 In step S4, the determination unit 13 determines the character string constituting the second word acquired in step S3 based on the character at the end of the first word. Then, in step S5, the output unit 15 outputs the third word acquired according to the character string constituting the second word determined by the determination unit 13. The third word is acquired by, for example, the dialogue control unit 14 with reference to a predetermined database.

ステップS6において、対話システム1は、ユーザとの対話の処理を終了させるか否かを判定する。対話を終了させると判定された場合には、処理は終了する。一方、対話を終了させると判定されなかった場合には、処理はステップS3に戻る。 In step S6, the dialogue system 1 determines whether or not to end the processing of the dialogue with the user. If it is determined to end the dialogue, the process ends. On the other hand, if it is not determined to end the dialogue, the process returns to step S3.

次に、コンピュータを、本実施形態の対話装置10として機能させるための対話プログラムについて説明する。図8は、対話プログラムP1の構成を示す図である。 Next, a dialogue program for making the computer function as the dialogue device 10 of the present embodiment will be described. FIG. 8 is a diagram showing the configuration of the dialogue program P1.

対話プログラムP1は、対話装置10における対話処理を統括的に制御するメインモジュールm10、取得モジュールm11、認識モジュールm12、判定モジュールm13、対話制御モジュールm14及び出力モジュールm15を備えて構成される。そして、各モジュールm11~m15により、対話装置10における取得部11、認識部12、判定部13、対話制御部14及び出力部15のための各機能が実現される。なお、対話プログラムP1は、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図9に示されるように、記録媒体M1に記憶される態様であってもよい。なお、認識モジュールm12及び対話制御モジュールm14は、対話プログラムP1における必須の構成ではない。 The dialogue program P1 includes a main module m10, an acquisition module m11, a recognition module m12, a determination module m13, a dialogue control module m14, and an output module m15 that collectively control dialogue processing in the dialogue device 10. Then, each module m11 to m15 realizes each function for the acquisition unit 11, the recognition unit 12, the determination unit 13, the dialogue control unit 14, and the output unit 15 in the dialogue device 10. The dialogue program P1 may be transmitted via a transmission medium such as a communication line, or may be stored in the recording medium M1 as shown in FIG. The recognition module m12 and the dialogue control module m14 are not essential configurations in the dialogue program P1.

以上説明した本実施形態の対話システム1、対話装置10、対話方法及び対話プログラムP1では、第2の単語がルールに従って発せられた単語であれば、第2の単語は、第1の単語の語尾を語頭に有することに鑑みて、第2の単語を構成する文字列が第1の単語の語尾の文字に基づいて判定されるので、第2の単語の入力の態様に起因してその特定が困難である場合であっても、第2の単語を構成する文字列を正しく認識できる。 In the dialogue system 1, dialogue device 10, dialogue method and dialogue program P1 of the present embodiment described above, if the second word is a word uttered according to a rule, the second word is the ending of the first word. Is determined at the beginning of a word, and the character string constituting the second word is determined based on the character at the end of the first word. Even if it is difficult, the character string constituting the second word can be correctly recognized.

また、別の形態に係る対話システムでは、取得部は、ユーザによりテキストにより入力された第2の単語を取得し、判定部は、第2の単語の読みを構成する文字列の複数の候補から、第1の単語の語尾の文字を語頭に有する文字列を選択することとしてもよい。 Further, in the dialogue system according to another form, the acquisition unit acquires the second word input by the user as a text, and the determination unit is from a plurality of candidates of the character string constituting the reading of the second word. , You may select a character string having the character at the end of the first word at the beginning of the word.

上記形態によれば、テキストにより入力された第2の単語に関して複数の読み(文字列)が関連付けられている場合において、第1の単語の語尾の文字を語頭に有する文字列が選択される。これにより、ユーザにより発せられた第2の単語を構成する文字列である可能性が高い文字列を選択できる。 According to the above form, when a plurality of readings (character strings) are associated with respect to the second word input by text, a character string having a character at the end of the first word at the beginning of the word is selected. This makes it possible to select a character string that is likely to be a character string that constitutes the second word issued by the user.

また、別の形態に係る対話システムでは、判定部は、単語と当該単語の読みを構成する一以上の文字列とを関連付けて記憶している単語記憶部を参照して、第2の単語の読みを構成する文字列の候補を取得することとしてもよい。 Further, in the dialogue system according to another form, the determination unit refers to the word storage unit that stores the word in association with one or more character strings constituting the reading of the word, and refers to the second word. It may be possible to acquire the candidate character strings that make up the reading.

上記形態によれば、単語と当該単語の読みを構成する文字列とを関連付けている記憶手段が参照されるので、第2の単語の読みを構成する文字列の候補として適切な文字列が取得される。 According to the above form, since the storage means that associates the word with the character string that constitutes the reading of the word is referred to, an appropriate character string is obtained as a candidate for the character string that constitutes the reading of the second word. Will be done.

また、別の形態に係る対話システムでは、取得部は、ユーザにより音声により入力された第2の単語を取得し、判定部は、第2の単語に対する所定の音声認識処理により得られた文字列の語頭の文字を第1の単語の語尾の文字に修正した修正文字列を、第2の単語を構成する文字列として判定することとしてもよい。 Further, in the dialogue system according to another form, the acquisition unit acquires a second word input by voice by the user, and the determination unit obtains a character string obtained by a predetermined voice recognition process for the second word. The modified character string in which the first character of the word is modified to the character at the end of the first word may be determined as the character string constituting the second word.

上記形態によれば、音声により入力された第2の単語に対する音声認識処理により得られた文字列の語頭が第1の単語の語尾の文字に修正した修正文字列が取得される。これにより、ユーザにより音声入力された第2の単語を構成する文字列である可能性が高い文字列を取得できる。 According to the above embodiment, a modified character string obtained by correcting the beginning of the character string obtained by the voice recognition process for the second word input by voice to the character at the end of the first word is acquired. As a result, it is possible to acquire a character string that is likely to be a character string constituting the second word voice-input by the user.

また、別の形態に係る対話システムでは、判定部は、単語と当該単語の読みを構成する一以上の文字列とを関連付けて記憶している単語記憶部を参照して、修正文字列が、単語記憶部において単語の読みとして記憶されている場合に、修正文字列を第2の単語を構成する文字列として判定することとしてもよい。 Further, in the dialogue system according to another form, the determination unit refers to the word storage unit that stores the word in association with one or more character strings constituting the reading of the word, and the correction character string is determined. When it is stored as a word reading in the word storage unit, the modified character string may be determined as a character string constituting the second word.

上記形態によれば、単語と当該単語の読みを構成する文字列とを関連付けている記憶手段を参照して、修正文字列が、単語の読みとして記憶されているか否かが判定される。これにより、修正文字列が、実在する単語であるか否かが判定される。そして、修正文字列が実在する単語であることが判定された場合に、修正文字列が第2の単語を構成する文字列として判定されるので、第2の単語を構成する文字列である可能性が高い文字列を確実に取得できる。 According to the above embodiment, it is determined whether or not the modified character string is stored as the reading of the word by referring to the storage means that associates the word with the character string constituting the reading of the word. As a result, it is determined whether or not the modified character string is a real word. Then, when it is determined that the modified character string is an existing word, the modified character string is determined as a character string constituting the second word, so that the modified character string may be a character string constituting the second word. You can surely get a high-quality character string.

また、別の形態に係る対話システムでは、取得部は、ユーザにより音声により入力された第2の単語を取得し、判定部は、第2の単語に対する所定の音声認識処理により得られた、第2の単語を構成する文字列の複数の候補から、第1の単語の語尾の文字を語頭に有する文字列を選択し、選択された文字列を第2の単語を構成する文字列として判定することとしてもよい。 Further, in the dialogue system according to another embodiment, the acquisition unit acquires the second word input by the user by voice, and the determination unit obtains the second word by a predetermined voice recognition process. From a plurality of candidates for the character string constituting the second word, a character string having the character at the end of the first word at the beginning of the word is selected, and the selected character string is determined as the character string constituting the second word. It may be that.

上記形態によれば、音声により入力された第2の単語に対する音声認識処理により得られた複数の文字列から、第1の単語の語尾の文字を語頭に有する文字列が選択される。これにより、ユーザにより発せられた第2の単語を構成する文字列である可能性が高い文字列を選択できる。 According to the above embodiment, a character string having a character at the end of the first word at the beginning is selected from a plurality of character strings obtained by voice recognition processing for the second word input by voice. This makes it possible to select a character string that is likely to be a character string that constitutes the second word issued by the user.

また、別の形態に係る対話システムでは、判定部は、単語と当該単語の読みを構成する一以上の文字列とを関連付けて記憶している単語記憶部を参照して、選択された文字列が、単語記憶部において単語の読みとして記憶されている場合に、選択された文字列を第2の単語を構成する文字列として判定することとしてもよい。 Further, in the dialogue system according to another form, the determination unit refers to the word storage unit that stores the word in association with one or more character strings constituting the reading of the word, and selects the character string. However, when it is stored as a word reading in the word storage unit, the selected character string may be determined as a character string constituting the second word.

上記形態によれば、単語と当該単語の読みを構成する文字列とを関連付けている記憶手段を参照して、音声認識処理により得られた複数の文字列から選択された文字列が、単語の読みとして記憶されているか否かが判定される。これにより、選択された文字列が、実在する単語であるか否かが判定される。そして、選択された文字列が実在する単語であることが判定された場合に、選択された文字列が第2の単語を構成する文字列として判定されるので、第2の単語を構成する文字列である可能性が高い文字列を確実に取得できる。 According to the above embodiment, the character string selected from the plurality of character strings obtained by the voice recognition process is the word, with reference to the storage means that associates the word with the character string constituting the reading of the word. It is determined whether or not it is stored as a reading. As a result, it is determined whether or not the selected character string is a real word. Then, when it is determined that the selected character string is a real word, the selected character string is determined as the character string constituting the second word, so that the character constituting the second word is determined. You can be sure to get the string that is likely to be a column.

以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。 Although the present embodiment has been described in detail above, it is clear to those skilled in the art that the present embodiment is not limited to the embodiments described in the present specification. This embodiment can be implemented as an amendment or modification without departing from the spirit and scope of the present invention as determined by the description of the scope of claims. Therefore, the description herein is for purposes of illustration only and has no limiting implications for this embodiment.

本明細書で説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G、5G、FRA(Future Radio Access)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。 Each aspect / embodiment described herein includes LTE (Long Term Evolution), LTE-A (LTE-Advanced), SUPER 3G, IMT-Advanced, 4G, 5G, FRA (Future Radio Access), W-CDMA. (Registered Trademarks), GSM (Registered Trademarks), CDMA2000, UMB (Ultra Mobile Broadband), IEEE 802.11 (Wi-Fi), IEEE 802.16 (WiMAX), IEEE 802.20, UWB (Ultra-WideBand), It may be applied to Bluetooth®, other systems that utilize suitable systems and / or next-generation systems that are extended based on them.

本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。 The processing procedures, sequences, flowcharts, and the like of each aspect / embodiment described in the present specification may be rearranged in order as long as there is no contradiction. For example, the methods described herein present elements of various steps in an exemplary order and are not limited to the particular order presented.

情報等は、上位レイヤ(または下位レイヤ)から下位レイヤ(または上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。 Information and the like can be output from the upper layer (or lower layer) to the lower layer (or upper layer). Input / output may be performed via a plurality of network nodes.

入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。 The input / output information and the like may be stored in a specific place (for example, a memory) or may be managed by a management table. Information to be input / output may be overwritten, updated, or added. The output information and the like may be deleted. The input information or the like may be transmitted to another device.

判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。 The determination may be made by a value represented by 1 bit (0 or 1), by a boolean value (Boolean: true or false), or by comparing numerical values (for example, a predetermined value). It may be done by comparison with the value).

本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。 Each aspect / embodiment described in the present specification may be used alone, in combination, or may be switched and used according to the execution. Further, the notification of predetermined information (for example, the notification of "being X") is not limited to the explicit one, but is performed implicitly (for example, the notification of the predetermined information is not performed). May be good.

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。 Software, whether referred to as software, firmware, middleware, microcode, hardware description language, or other names, is an instruction, instruction set, code, code segment, program code, program, subprogram, software module. , Applications, software applications, software packages, routines, subroutines, objects, executable files, execution threads, procedures, features, etc. should be broadly interpreted.

また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。 Further, software, instructions, and the like may be transmitted and received via a transmission medium. For example, the software may use wired technology such as coaxial cable, fiber optic cable, twisted pair and digital subscriber line (DSL) and / or wireless technology such as infrared, wireless and microwave to website, server, or other. When transmitted from a remote source, these wired and / or wireless technologies are included within the definition of transmission medium.

本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。 The information, signals, etc. described herein may be represented using any of a variety of different techniques. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description are voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. It may be represented by a combination of.

なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。 The terms described herein and / or the terms necessary for understanding the present specification may be replaced with terms having the same or similar meanings.

本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。 The terms "system" and "network" used herein are used interchangeably.

また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。 Further, the information, parameters, etc. described in the present specification may be represented by an absolute value, a relative value from a predetermined value, or another corresponding information. ..

本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 The phrase "based on" as used herein does not mean "based on" unless otherwise stated. In other words, the statement "based on" means both "based only" and "at least based on".

本明細書で「第1の」、「第2の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1および第2の要素への参照は、2つの要素のみがそこで採用され得ること、または何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。 As used herein by designations such as "first", "second", etc., any reference to that element does not generally limit the quantity or order of those elements. These designations can be used herein as a convenient way to distinguish between two or more elements. Thus, references to the first and second elements do not mean that only two elements can be adopted there, or that the first element must somehow precede the second element.

「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。 As long as "include", "including", and variations thereof are used herein or within the scope of the claims, these terms are similar to the term "comprising". In addition, it is intended to be inclusive. Moreover, the term "or" as used herein or in the claims is intended to be non-exclusive.

本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。 In the present specification, a plurality of devices shall be included unless the device has only one device apparently in context or technically.

本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。 The entire disclosure is intended to include more than one, unless the context clearly indicates the singular.

1…対話システム、10…対話装置、11…取得部、12…認識部、13…判定部、14…対話制御部、15…出力部、20…単語記憶部、M1…記録媒体、m10…メインモジュール、m11…取得モジュール、m12…認識モジュール、m13…判定モジュール、m14…対話制御モジュール、m15…出力モジュール、P1…対話プログラム。 1 ... Dialogue system, 10 ... Dialogue device, 11 ... Acquisition unit, 12 ... Recognition unit, 13 ... Judgment unit, 14 ... Dialogue control unit, 15 ... Output unit, 20 ... Word storage unit, M1 ... Recording medium, m10 ... Main Module, m11 ... acquisition module, m12 ... recognition module, m13 ... judgment module, m14 ... dialogue control module, m15 ... output module, P1 ... dialogue program.

Claims (4)

相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行う対話システムであって、
前記対話システムが発した第1の単語に応じてユーザにより入力された単語である第2の単語を取得する取得部と、
前記第1の単語の語尾の文字に基づいて、前記第2の単語を構成する文字列を判定する判定部と、
前記判定部により判定された前記第2の単語の文字列に応じて、前記ルールに従った単語である第3の単語を出力する出力部と、
を備え
前記取得部は、ユーザによりテキストにより入力された前記第2の単語を取得し、
前記判定部は、前記第2の単語の読みを構成する文字列の複数の候補から、前記第1の単語の語尾の文字を語頭に有する文字列を選択する、
対話システム。
It is a dialogue system that interacts with the user according to the rule of issuing a word that has the last letter of the word spoken by the other party at the beginning of the word.
An acquisition unit that acquires a second word that is a word input by the user according to the first word issued by the dialogue system, and an acquisition unit.
A determination unit for determining a character string constituting the second word based on the character at the end of the first word, and a determination unit.
An output unit that outputs a third word, which is a word according to the rule, according to the character string of the second word determined by the determination unit.
Equipped with
The acquisition unit acquires the second word input by the user in text, and obtains the second word.
The determination unit selects a character string having a character at the end of the first word at the beginning of the word from a plurality of candidates of the character string constituting the reading of the second word.
Dialogue system.
前記判定部は、単語と当該単語の読みを構成する一以上の文字列とを関連付けて記憶している単語記憶部を参照して、前記第2の単語の読みを構成する文字列の候補を取得する、
請求項に記載の対話システム。
The determination unit refers to a word storage unit that stores a word in association with one or more character strings that constitute the reading of the word, and selects a candidate character string that constitutes the reading of the second word. get,
The dialogue system according to claim 1 .
相手方が発した単語の語尾の文字を語頭に有する単語を発するというルールに従ってユーザと対話を行う対話システムであって、It is a dialogue system that interacts with the user according to the rule of issuing a word that has the last letter of the word spoken by the other party at the beginning of the word.
前記対話システムが発した第1の単語に応じてユーザにより入力された単語である第2の単語を取得する取得部と、 An acquisition unit that acquires a second word that is a word input by the user according to the first word issued by the dialogue system, and an acquisition unit.
前記第1の単語の語尾の文字に基づいて、前記第2の単語を構成する文字列を判定する判定部と、 A determination unit for determining a character string constituting the second word based on the character at the end of the first word, and a determination unit.
前記判定部により判定された前記第2の単語の文字列に応じて、前記ルールに従った単語である第3の単語を出力する出力部と、 An output unit that outputs a third word, which is a word according to the rule, according to the character string of the second word determined by the determination unit.
を備え、 Equipped with
前記取得部は、ユーザにより音声により入力された前記第2の単語を取得し、 The acquisition unit acquires the second word input by voice by the user, and obtains the second word.
前記判定部は、前記第2の単語に対する所定の音声認識処理により得られた文字列の語頭の文字を前記第1の単語の語尾の文字に修正した修正文字列を前記第2の単語を構成する文字列として判定し、または、 The determination unit constitutes the second word with a modified character string obtained by modifying the first character of the character string obtained by a predetermined voice recognition process for the second word to the last character of the first word. Judgment as a character string to be used, or
前記第2の単語に対する所定の音声認識処理により得られた、前記第2の単語を構成する文字列の複数の候補から、前記第1の単語の語尾の文字を語頭に有する文字列を前記第2の単語を構成する文字列として選択する、 From a plurality of candidates of the character string constituting the second word obtained by a predetermined voice recognition process for the second word, the character string having the character at the end of the first word at the beginning of the word is the first. Select as a string that makes up two words,
対話システム。 Dialogue system.
前記判定部は、単語と当該単語の読みを構成する一以上の文字列とを関連付けて記憶している単語記憶部を参照して、前記修正文字列または前記選択された文字列が、前記単語記憶部において前記単語の読みとして記憶されている場合に、前記修正文字列または前記選択された文字列を前記第2の単語を構成する文字列として判定する、
請求項に記載の対話システム。
The determination unit refers to a word storage unit that stores a word in association with one or more character strings constituting the reading of the word, and the modified character string or the selected character string is the word. When the word is stored as a reading in the storage unit, the corrected character string or the selected character string is determined as a character string constituting the second word.
The dialogue system according to claim 3 .
JP2018040467A 2018-03-07 2018-03-07 Dialogue system Active JP7019462B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018040467A JP7019462B2 (en) 2018-03-07 2018-03-07 Dialogue system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018040467A JP7019462B2 (en) 2018-03-07 2018-03-07 Dialogue system

Publications (2)

Publication Number Publication Date
JP2019154468A JP2019154468A (en) 2019-09-19
JP7019462B2 true JP7019462B2 (en) 2022-02-15

Family

ID=67992836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018040467A Active JP7019462B2 (en) 2018-03-07 2018-03-07 Dialogue system

Country Status (1)

Country Link
JP (1) JP7019462B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667091B (en) * 2019-10-16 2024-11-29 北京搜狗科技发展有限公司 Cloud association method and related device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004037910A (en) 2002-07-04 2004-02-05 Denso Corp Interaction system and interactive verse capping system
JP2014215396A (en) 2013-04-24 2014-11-17 日本電信電話株式会社 Pronunciation application method, device therefor and program
JP2015118222A (en) 2013-12-18 2015-06-25 株式会社日立超エル・エス・アイ・システムズ Voice synthesis system and voice synthesis method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59181468U (en) * 1983-05-20 1984-12-04 カシオ計算機株式会社 electronic learning device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004037910A (en) 2002-07-04 2004-02-05 Denso Corp Interaction system and interactive verse capping system
JP2014215396A (en) 2013-04-24 2014-11-17 日本電信電話株式会社 Pronunciation application method, device therefor and program
JP2015118222A (en) 2013-12-18 2015-06-25 株式会社日立超エル・エス・アイ・システムズ Voice synthesis system and voice synthesis method

Also Published As

Publication number Publication date
JP2019154468A (en) 2019-09-19

Similar Documents

Publication Publication Date Title
US11145292B2 (en) Method and device for updating language model and performing speech recognition based on language model
JP7062056B2 (en) Creation text evaluation device
JP7222082B2 (en) Recognition error correction device and correction model
US9425821B2 (en) Converting device and converting method
US20050102141A1 (en) Voice operation device
JP7019462B2 (en) Dialogue system
US7565624B2 (en) Method of learning character segments during text input, and associated handheld electronic device
WO2021070819A1 (en) Scoring model learning device, scoring model, and determination device
US20160110339A1 (en) Information processing apparatus, information processing method, and program
JPWO2018016143A1 (en) INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM
US11663420B2 (en) Dialogue system
JP6840862B2 (en) Utterance sentence generation system and utterance sentence generation program
WO2021215352A1 (en) Voice data creation device
WO2021215262A1 (en) Punctuation mark delete model training device, punctuation mark delete model, and determination device
US9817881B2 (en) Hidden markov model processing engine
JP6040819B2 (en) Information processing apparatus and program
US20080004859A1 (en) Method of learning character segments from received text, and associated handheld electronic device
JP7541474B2 (en) Speech evaluation system
US11862167B2 (en) Voice dialogue system, model generation device, barge-in speech determination model, and voice dialogue program
WO2020054201A1 (en) Response sentence creation device
JP7522060B2 (en) Voice Recognition Device
JP7429193B2 (en) Dialogue device and dialogue program
JPWO2020105317A1 (en) Dialogue device and dialogue program
JP6945325B2 (en) Name identification support device
US20240303445A1 (en) Text generation model generating device, text generation model, and text generating device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200813

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220202

R150 Certificate of patent or registration of utility model

Ref document number: 7019462

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150