JP2003186872A - Language processing system - Google Patents
Language processing systemInfo
- Publication number
- JP2003186872A JP2003186872A JP2002312100A JP2002312100A JP2003186872A JP 2003186872 A JP2003186872 A JP 2003186872A JP 2002312100 A JP2002312100 A JP 2002312100A JP 2002312100 A JP2002312100 A JP 2002312100A JP 2003186872 A JP2003186872 A JP 2003186872A
- Authority
- JP
- Japan
- Prior art keywords
- language processing
- status information
- processing
- information
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 262
- 230000004044 response Effects 0.000 claims abstract description 16
- 238000013519 translation Methods 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 59
- 230000008569 process Effects 0.000 claims description 45
- 230000006870 function Effects 0.000 abstract description 20
- 238000007726 management method Methods 0.000 description 62
- 238000010586 diagram Methods 0.000 description 28
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 11
- 230000008676 import Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102100035248 Alpha-(1,3)-fucosyltransferase 4 Human genes 0.000 description 1
- 101001022185 Homo sapiens Alpha-(1,3)-fucosyltransferase 4 Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004800 psychological effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、言語処理システム
に関し、特に別個の計算機上で動作可能な複数の言語処
理の機能を相互に利用した言語処理システムに関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a language processing system, and more particularly to a language processing system that mutually utilizes a plurality of language processing functions that can operate on separate computers.
【0002】ここで、言語処理とは、機械翻訳、自動抄
録、情報検索、かな漢字変換、音声認識、文字認識(O
CR)、OCR機能を持つ全文検索などのように、複数
の言語処理に基づいた情報変換、情報認識機能を総称す
るものである。Here, language processing means machine translation, automatic abstraction, information retrieval, kana-kanji conversion, voice recognition, character recognition (O
(CR), OCR function, full-text search, etc., is a generic term for information conversion and information recognition functions based on a plurality of language processes.
【0003】[0003]
【従来の技術】近年、計算機ネットワークの高速化と大
容量化の発達にともない、計算機ネットワーク上に分散
した記憶資源、CPU資源、デバイス資源などの計算機
資源を共有する各種情報システムの実用化が進んでい
る。今後、パーソナルコンピュータ、エンジニアリング
ワークステーション、スーパーコンピュータなど異種の
計算機、異種のオペレーティングシステムが計算機ネッ
トワークに結合され、異種の計算機で動作する複数の情
報処理機能を有機的に結合、利用することがますます盛
んになっていくと予測される。2. Description of the Related Art In recent years, with the development of high speed and large capacity computer networks, various information systems sharing computer resources such as storage resources, CPU resources and device resources distributed on the computer network have been put into practical use. I'm out. In the future, heterogeneous computers such as personal computers, engineering workstations, and supercomputers, and heterogeneous operating systems will be connected to computer networks, and it will be possible to organically combine and use multiple information processing functions that operate on different computers. It is expected to become popular.
【0004】このような分散計算機環境で稼働するシス
テムとして実現する利点は、異なるシステムで稼働する
情報処理機能を有機的に結合することが容易であり、新
しい情報処理アプリケーションシステムを実現できると
いう点にある。また、全く同じ機能を他の計算機システ
ムやオペレーティングシステムで稼働するように移植す
る手間やコストが不要になるという点も大きな利点であ
る。The advantage realized as a system operating in such a distributed computer environment is that it is easy to organically combine the information processing functions operating in different systems, and a new information processing application system can be realized. is there. Another major advantage is that it eliminates the labor and cost of porting the exact same functions to run on other computer systems or operating systems.
【0005】このような状況にあって、従来、本発明で
述べる種類の言語処理(機能)アプリケーションシステ
ムにあっては、単独の計算機で稼働するシステムが大半
であったため、使用できる計算機システムやオペレーテ
ィングシステムが限定されるという問題点があった。ま
た、分散計算機環境に対応するシステムであっても、単
にグラフィカルユーザインタフェースの部分だけをネッ
トワーク対応として分離し、他の計算機上で稼働するよ
うにしたシステムが存在する。In such a situation, in the conventional language processing (function) application system of the type described in the present invention, since most of the systems were operated by a single computer, a computer system or an operating system that can be used. There was a problem that the system was limited. In addition, even in a system compatible with a distributed computer environment, there is a system in which only the graphical user interface part is separated as a network compatible component so that it can be operated on another computer.
【0006】しかし、言語処理の根幹に関わる処理部
は、一つの計算機システムに閉じており、別の言語処理
システムを有機的に結合するという段階には至っていな
い。However, the processing unit related to the core of language processing is closed in one computer system and has not reached the stage of organically connecting another language processing system.
【0007】計算機ネットワークを介して異なる計算機
上で稼働することで、システム開発のコストや手間の大
幅な削減が期待される。By operating on different computers via a computer network, it is expected that the cost and labor of system development will be greatly reduced.
【0008】一方、機械翻訳、かな漢字変換、自動抄
録、文書検索などの言語処理システムは、従来、個別の
処理システムとして実現され、辞書情報や、ユーザカス
タマイズ等の情報を個別に管理する必要があった。例え
ば、ポストエディタを有する英日機械翻訳システムを例
にとると、この言語処理アプリケーションシステムで
は、複数の言語処理(機能)システムとしてかな漢字変
換システムと、英日機械翻訳システムを保有することに
なる。従来のこの種のシステムでは、翻訳システムの辞
書にある言語−訳語対を登録したとしても、かな漢字変
換システムの辞書には登録されない。このため、利用者
は、かな漢字変換システムの辞書にも新たに同じ語を登
録する必要があり、多大な手間がかかってしまってい
た。On the other hand, a language processing system such as machine translation, kana-kanji conversion, automatic abstraction, and document retrieval has heretofore been realized as an individual processing system, and it is necessary to individually manage dictionary information and user customization information. It was For example, taking an English-Japanese machine translation system having a post editor as an example, this language processing application system has a Kana-Kanji conversion system and an English-Japanese machine translation system as a plurality of language processing (function) systems. In this type of conventional system, even if a language-translated word pair is registered in the dictionary of the translation system, it is not registered in the dictionary of the Kana-Kanji conversion system. For this reason, the user needs to newly register the same word in the dictionary of the Kana-Kanji conversion system, which takes a lot of time and effort.
【0009】すなわち、複数の言語処理システムを利用
した言語処理アプリケーションシステムでは、それぞれ
の言語処理システムが別個に動作するだけでは、その機
能を十分に発揮することができないという問題点が存在
した。That is, in a language processing application system using a plurality of language processing systems, there is a problem that the functions cannot be sufficiently exhibited only by operating each language processing system separately.
【0010】[0010]
【発明が解決しようとする課題】本発明では、上述の問
題を解決するためになされたもので、それぞれの言語処
理(システム)が異なる計算機システムで稼働可能であ
り、それらの複数の言語処理を結合/利用した言語処理
システムにおいて、言語処理間でユーザカスタマイズ情
報、辞書情報、分野情報等の状況情報を共有することに
より、それぞれの言語処理機能の高性能化を図ることを
目的としている。SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and each language processing (system) can be operated by a different computer system, and the plurality of language processings can be performed. In the combined / used language processing system, the purpose is to improve the performance of each language processing function by sharing status information such as user customization information, dictionary information, and field information between language processings.
【0011】[0011]
【課題を解決するための手段】本発明は、2つ以上の言
語処理を有する言語処理システムにおいて、第1の言語
処理の過程で獲得する状況情報を、第2の言語処理の過
程において利用することを特徴とする言語処理方法及び
装置である。ここで、状況情報とは、言語処理過程で獲
得または生成する中間データであって、その言語処理シ
ステムが処理している入力データの特徴の一部を数値化
あるいは記号化したものである。According to the present invention, in a language processing system having two or more language processings, the situation information obtained in the first language processing step is used in the second language processing step. A language processing method and device characterized by the above. Here, the situation information is intermediate data acquired or generated in the language processing process, and is obtained by digitizing or symbolizing some of the characteristics of the input data processed by the language processing system.
【0012】具体的に、複数の言語処理を行うため複数
の言語処理手段を有する言語処理システムにあって、入
力データに対し第1の言語処理を行うための第1の言語
処理手段と、前記第1言語処理手段による言語処理の過
程で獲得または生成される情報であって、第1の言語処
理手段が処理している前記入力データの特徴である状況
情報を、前記第1の言語処理手段から受信し、受信した
前記状況情報を他の言語処理手段からの取り込み要求に
応じて送信するための状況情報管理手段と、この状況情
報管理手段に状況情報の取り込み要求を行い前記状況情
報を受信し、この状況情報を反映させた第2の言語処理
を行うための第2の言語処理手段とを有することを特徴
とする。[0012] Specifically, in a language processing system having a plurality of language processing means for performing a plurality of language processing, a first language processing means for performing a first language processing on input data; The information acquired or generated in the course of the language processing by the first language processing means, and the status information which is the characteristic of the input data processed by the first language processing means, is used as the first language processing means. And a status information management means for transmitting the received status information in response to a loading request from another language processing means, and sending a status information loading request to the status information management means and receiving the status information. However, the second language processing means for performing the second language processing reflecting the situation information is provided.
【0013】また、状況情報管理手段は、受信した状況
情報と同じ特徴を有する状況情報がすでに記憶手段に記
憶している場合、所定の優先順位をもとに、優先順位の
低い言語処理手段によって生成された状況情報を削除す
ることを特徴とする。Further, when the status information having the same characteristics as the received status information is already stored in the storage means, the status information management means uses the low priority language processing means based on the predetermined priority order. It is characterized in that the generated status information is deleted.
【0014】また、前記第1の言語処理として機械翻訳
処理を、前記第2の言語処理として音声認識処理を実行
するための言語処理システムであって、前記第1の言語
処理手段は、前記機械翻訳処理における翻訳の過程で得
られた訳語情報を状況情報として前記状況情報管理手段
に送信し、前記第2の言語処理手段は、前記状況情報管
理手段から状況情報である訳語情報を受信し、受信した
前記訳語情報をもとに、認識すべき語彙を限定して前記
音声認識処理を行うことを特徴とする。A language processing system for executing machine translation processing as the first language processing and voice recognition processing as the second language processing, wherein the first language processing means is the machine. The translated word information obtained in the translation process in the translation process is transmitted to the situation information managing means as situation information, and the second language processing means receives the translated word information which is the situation information from the situation information managing means, It is characterized in that the voice recognition processing is performed by limiting the vocabulary to be recognized based on the received translated word information.
【0015】また、前記第1の言語処理として全文検索
処理を、前記第2の言語処理として文字認識処理を実行
するための言語処理システムであって、前記第1の言語
処理手段は、前記全文検索処理において文書データベー
スから得られた格納している文書の分野情報を状況情報
として前記状況情報管理手段に送信し、前記第2の言語
処理手段は、前記状況情報管理手段から状況情報である
分野情報を受信し、受信した前記分野情報をもとに、認
識辞書を切り替えて文字認識処理を行うことを特徴とす
る。A language processing system for executing full-text search processing as the first language processing and character recognition processing as the second language processing, wherein the first language processing means is the full-text processing. The field information of the stored document obtained from the document database in the search process is transmitted to the status information management unit as status information, and the second language processing unit is the field that is the status information from the status information management unit. Character recognition processing is performed by receiving information and switching the recognition dictionary based on the received field information.
【0016】また、前記第1の言語処理として全文検索
処理を、前記第2の言語処理として機械翻訳処理を実行
するための言語処理システムであって、前記第1の言語
処理手段は、前記全文検索処理において文書データベー
スから得られた格納している文書の分野情報を状況情報
として前記状況情報管理手段に送信し、前記第2の言語
処理手段は、前記状況情報管理手段から状況情報である
分野情報を受信し、受信した前記分野情報をもとに、翻
訳辞書を切り替えて機械翻訳処理を行うことを特徴とす
る。A language processing system for executing full-text search processing as the first language processing and machine translation processing as the second language processing, wherein the first language processing means is the full-text processing. The field information of the stored document obtained from the document database in the search process is transmitted to the status information management unit as status information, and the second language processing unit is the field that is the status information from the status information management unit. It is characterized in that information is received, and the machine translation processing is performed by switching the translation dictionary based on the received field information.
【0017】このように本願発明によれば、複数の言語
処理間において、1つの言語処理において得られた状況
情報が共有できるため、それらの言語処理の格段な性能
アップが図れる。その結果、高性能で使い勝手のよい言
語処理システムを容易に実現することが可能になる。As described above, according to the present invention, the situation information obtained in one language process can be shared among a plurality of language processes, so that the performance of those language processes can be remarkably improved. As a result, it is possible to easily realize a high-performance and easy-to-use language processing system.
【0018】[0018]
【発明の実施の形態】(実施例1)本発明の実施例を図
面に基づいて説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS (Embodiment 1) An embodiment of the present invention will be described with reference to the drawings.
【0019】図1は、本発明の実施例の機能ブロックを
図示している。それぞれ別の言語処理(機能)を果たす
言語処理サーバ(1)104、言語処理サーバ(2)1
05、言語処理サーバ(3)106、状況情報を記憶す
る状況情報記憶部103、該状況情報の更新を制御する
状況情報管理部102、言語処理サーバを制御して、全
体的な言語処理アプリケーションを構成する言語処理ア
プリケーション制御部101からなる。図において、太
線はデータ線、細線は制御線を表している。FIG. 1 illustrates the functional blocks of an embodiment of the present invention. Language processing server (1) 104 and language processing server (2) 1 that perform different language processing (functions)
05, the language processing server (3) 106, the status information storage unit 103 that stores status information, the status information management unit 102 that controls updating of the status information, and the language processing server to control the overall language processing application. It is composed of a language processing application control unit 101 that constitutes it. In the figure, thick lines represent data lines and thin lines represent control lines.
【0020】図2は、本発明を構成するための機器構成
の一例を図示している。複数の計算機が計算機ネットワ
ークを介して結合している。FIG. 2 shows an example of a device configuration for configuring the present invention. A plurality of computers are connected via a computer network.
【0021】言語処理アプリケーション制御部101が
計算機(1)201で、言語処理サーバ(1)104、
言語処理サーバ(2)105、言語処理サーバ(3)1
06が計算機(2)202で動作している場合を仮定す
ると、言語処理アプリケーションは、計算機(2)20
2で動作する言語処理サーバの各機能を適宜使い分けて
所与の機能を実現することになる。The language processing application control unit 101 is a computer (1) 201, a language processing server (1) 104,
Language processing server (2) 105, language processing server (3) 1
Assuming that 06 is operating on the computer (2) 202, the language processing application is
The respective functions of the language processing server operating in No. 2 are properly used to realize a given function.
【0022】図3は、状況情報として言語処理サーバ
が、状況情報管理部102に送る状況情報の形式を表現
した図である。状況情報は、状況情報を発生した言語処
理サーバを使用している言語処理アプリケーション名、
該言語処理アプリケーションを使用しているユーザ名、
言語処理サーバ自体の名前、状況情報本体からなる。こ
れから1ブロックを状況情報の単位として、状況情報管
理部102は状況情報記憶部103において記憶/管理
を行う。状況情報は、言語処理サーバが言語処理過程で
獲得または生成する中間データであって、その言語処理
サーバが処理している入力されたデータの特徴の一部を
数値化あるいは記号化したものを定義としている。FIG. 3 is a diagram expressing the format of the status information sent from the language processing server to the status information management unit 102 as status information. The status information is the name of the language processing application using the language processing server that generated the status information,
User name using the language processing application,
It consists of the name of the language processing server itself and the status information body. The situation information management unit 102 stores / manages in the situation information storage unit 103, with one block as a unit of situation information. The status information is intermediate data acquired or generated by the language processing server during the language processing process, and defines a part of the characteristics of the input data processed by the language processing server, which is digitized or symbolized. I am trying.
【0023】図4は、ある言語処理サーバが、状況情報
を状況情報管理部102に送る時の手順の一例を示して
いる。一方、図5は、ある言語処理サーバが状況情報を
状況情報管理部102から取り込む際の手順の一例を示
したものである。FIG. 4 shows an example of a procedure when a language processing server sends status information to the status information management unit 102. On the other hand, FIG. 5 shows an example of a procedure when a language processing server fetches status information from the status information management unit 102.
【0024】言語処理サーバが状況情報を状況情報管理
部102に送る際、まず初めに言語処理サーバが状況情
報管理部102に対して状況情報書き込みを行う。書き
込みに成功した場合、状況情報管理部102は書き込み
成功である旨を言語処理サーバに伝え、書き込み処理を
終える(図4において「状況情報書き込み1」、「書き
込み成功1」がこの手順に相当する)。When the language processing server sends the status information to the status information management unit 102, the language processing server first writes the status information to the status information management unit 102. When the writing is successful, the status information management unit 102 notifies the language processing server that the writing is successful, and finishes the writing process (“writing status information 1” and “successful writing 1” in FIG. 4 correspond to this procedure. ).
【0025】状況情報記憶部103の記憶領域が足りな
いなどの原因で、書き込みに失敗した場合、状況情報管
理部102は言語処理サーバに対して、書き込み失敗の
旨を伝える。この時、言語処理サーバは状況情報の再送
を行う(図4において「状況情報書き込み2」、「書き
込み失敗2」、「状況情報再送2」がこの手順に相当す
る)。When writing fails due to a lack of storage area in the status information storage unit 103, the status information management unit 102 informs the language processing server that writing has failed. At this time, the language processing server resends the status information (“status information writing 2”, “writing failure 2”, and “status information resending 2” in FIG. 4 correspond to this procedure).
【0026】状況情報管理部102から言語処理サーバ
が状況情報を取り込む手順は、図5に示す通りである。
まず初めに状況情報管理部102は、新しい状況情報を
受け取った場合、接続している言語処理サーバすべてに
対して状況情報が到着した旨をブロードキャストする。
次に、言語処理サーバが状況情報取り込みの要求を出
し、それに応じて状況情報管理部102は言語処理サー
バに状況情報を転送する(図5において「状況情報到着
通知1」、「状況情報取り込み要求1」、「状況情報取
り込み1」がこの手順に相当する)。The procedure by which the language processing server fetches the status information from the status information management unit 102 is as shown in FIG.
First, when the status information management unit 102 receives new status information, the status information management unit 102 broadcasts that the status information has arrived to all connected language processing servers.
Next, the language processing server issues a request for status information fetching, and in response thereto, the status information managing unit 102 transfers the status information to the language processing server (“status information arrival notification 1” and “status information fetching request in FIG. 5”). 1 "and" acquisition of status information 1 "correspond to this procedure).
【0027】対応する状況情報か存在しないなどの理由
で取り込みに失敗した場合、状況情報取り込み失敗の旨
を状況情報管理部102から言語処理サーバへ通知する
(図5において「状況情報到着通知2」、「状況情報取
り込み要求2」、「状況情報取り込み失敗2」がこの手
順に相当する。When the import fails due to the fact that the corresponding status information does not exist, the status information management unit 102 notifies the language processing server of the failure of importing the status information (“status information arrival notification 2” in FIG. 5). "Status information import request 2" and "Status information import failure 2" correspond to this procedure.
【0028】図6、7に状況情報管理部102の処理の
流れを図示する。図6、7では、状況情報記憶部102
をキュー構造にすることを仮定した処理である。したが
って、最新の状況情報が順次先頭に配せられ、古い状況
情報は末尾に回される。状況情報記憶部102に空き領
域がない場合、最も古い状況情報を削除することによ
り、書き込み失敗となることはない。6 and 7 show the processing flow of the status information management unit 102. 6 and 7, the situation information storage unit 102
Is a process assuming that the queue structure is. Therefore, the latest status information is sequentially arranged at the beginning and the old status information is arranged at the end. When there is no free area in the status information storage unit 102, the oldest status information is deleted so that the writing fails.
【0029】状況情報を受け取った時に図6の処理が開
始され、まず初めに、状況情報記憶部103に空きがあ
るか否かをチェック(501)し、空きがない場合最も
古い状況情報を削除する(502)。そして、受け取っ
た状況情報を状況情報記憶部103に書き込みを行う
(503)。次に書き込みに成功したことを、状況情報
の書き込みを行った言語処理サーバに伝える(504)
とともに、新しい状況情報が到着したことをブロードキ
ャストする(505)。When the status information is received, the processing shown in FIG. 6 is started. First, it is checked whether there is a space in the status information storage unit 103 (501). If there is no space, the oldest status information is deleted. Yes (502). Then, the received status information is written in the status information storage unit 103 (503). Next, inform the language processing server that wrote the status information that the writing was successful (504).
At the same time, it broadcasts that new status information has arrived (505).
【0030】状況情報の取り込み要求を受け取った場合
図7の処理が開始され、状況情報管理部102は、状況
情報記憶部103に格納されている状況情報の中から、
状況情報の取り込み要求を行った言語処理サーバを使用
しているユーザ、言語処理アプリケーションのそれぞれ
の名前と一致する対応フィールドを持つ状況情報であっ
て、状況情報の取り込み要求を行った言語処理サーバの
名前とは違う状況情報の最新のものが存在するか否かを
チェックする(701)。When a request for importing status information is received, the processing of FIG. 7 is started, and the status information management unit 102 selects from the status information stored in the status information storage unit 103,
The status information has corresponding fields that match the names of the user of the language processing server that requested the acquisition of status information and the language processing application. It is checked whether or not the latest status information different from the name exists (701).
【0031】見つかった場合、その状況情報を取り込み
要求を行った言語処理サーバに転送する(702)。一
方、見つからなかった場合は、取り込みに失敗したこと
を言語処理サーバに通知し、処理を終える(703)。
図8、9に、言語処理サーバの処理のうち、状況情報の
受渡しに関する部分を図示する。If found, the status information is transferred to the language processing server that has made the request (702). On the other hand, if it is not found, the language processing server is notified that the import has failed, and the processing ends (703).
8 and 9 show a part of the processing of the language processing server relating to the delivery of status information.
【0032】図示した以外の処理については、言語処理
サーバの機能に応じて固有のものであり、本発明の主旨
ではないのて、図示していない。Processes other than those shown are not shown because they are unique to the function of the language processing server and are not the subject of the present invention.
【0033】図8の状況情報書き込み時においては、ま
ず初めに書き込むべき状況情報を状況情報管理部102
へ転送する(801)。転送後、状況情報管理部102
からの応答を待ち(802)、書き込みが成功した場合
(803)は処理を終える。一方、書き込みが失敗した
場合(803)、状況情報を再送する。When writing the status information in FIG. 8, the status information to be written first is the status information management unit 102.
(801). After the transfer, the status information management unit 102
The process waits for a response from (802), and if the writing is successful (803), the process ends. On the other hand, if the writing has failed (803), the status information is retransmitted.
【0034】図9の状況情報取り込みは、状況情報管理
部102からの状況情報到着通知を受け取った場合に起
動される。この処理では、まず初めに、状況情報取り込
み要求を状況情報管理部102に通知した後(90
1)、状況情報管理部102からの応答を待つ(90
2)。状況情報管理部102から状況情報が送られて来
た場合は(903)、その状況情報を自身の言語処理へ
の反映を行う(904)。一方、状況情報の取り込みに
失敗した場合は(903)、そのまま処理を終える。The status information fetching shown in FIG. 9 is activated when a status information arrival notification is received from the status information management unit 102. In this process, first, a status information acquisition request is notified to the status information management unit 102 (90
1) Wait for a response from the status information management unit 102 (90
2). When the status information is sent from the status information management unit 102 (903), the status information is reflected in its own language processing (904). On the other hand, if the acquisition of the status information has failed (903), the process is terminated.
【0035】本実施例では、図3で図示した状況情報の
ブロックを、キュー構造に記憶することを仮定した。し
かし、状況情報のブロックに新たに記憶した時間のフィ
ールドを設けるようにすることも可能である。この場
合、キュー構造で記憶する必要はない。In this embodiment, it is assumed that the status information block shown in FIG. 3 is stored in the queue structure. However, it is also possible to provide a newly stored time field in the status information block. In this case, it is not necessary to store in the queue structure.
【0036】状況情報を時間で管理する場合、状況情報
管理部102が言語処理サーバから状況情報を受け取る
処理において、状況情報を削除する方法は、以下のよう
な変形が可能である。
1.記憶した時間が最も古い状況情報を削除する
2.一定の時間を経た状況情報を削除するWhen the status information is managed by time, the method of deleting the status information in the process in which the status information management unit 102 receives the status information from the language processing server can be modified as follows. 1. 1. Delete the status information with the oldest stored time 2. Delete status information after a certain amount of time
【0037】2の場合、状況情報を状況情報記憶部10
3に書き込む際、必ずしも空きがあるとは限らない。こ
のため、書き込みに失敗した場合、その通知を言語処理
サーバに対して行う必要がある。In the case of 2, the status information is stored in the status information storage unit 10.
There is not always a vacant space when writing to No. 3. Therefore, when the writing fails, the notification needs to be sent to the language processing server.
【0038】また、図8で図示した言語処理サーバの状
況情報書き込み処理では、書き込みが成功するまで、何
度も状況情報の再送を行うようになっているが、この処
理についても、デッドロックを避けるために規定回数だ
け再送を行った場合は、処理を終了するように変形する
ことも可能である。Further, in the status information writing process of the language processing server shown in FIG. 8, the status information is retransmitted many times until the writing is successful, but this process also causes a deadlock. In order to avoid this, when the retransmission is performed a prescribed number of times, it is possible to modify so that the processing is terminated.
【0039】実施例では、状況情報を管理する状況情報
管理部を有していたが、言語処理サーバ同士で直接状況
情報のやりとりを行うように変形を行うことは容易に実
現できる。In the embodiment, the situation information management section for managing the situation information is provided, but it is easy to realize a modification in which the situation information is directly exchanged between the language processing servers.
【0040】(実施例2)実施例1では、特定の言語処
理に限定しない言語処理アプリケーションに関しての実
施例であったが、実施例2以降では、より具体的な実施
例を示し、状況情報についても具体的に説明する。(Second Embodiment) In the first embodiment, the language processing application is not limited to a specific language processing, but in the second and subsequent embodiments, a more specific embodiment will be shown and the status information will be described. Will also be specifically described.
【0041】図10に、本発明の一実施例である音声対
話システムを図示する。本実施例では、言語処理サーバ
として、音声認識サーバ604、音声合成サーバ60
5、ならびに音声対話システム全体を制御する制御部6
01、状況情報管理部602、状況情報記憶部603、
マイクから入力される音声アナログ信号をディジタル信
号に変換するA/D変換器606、音声合成サーバから
のディジタル信号を音声アナログ信号に変換するD/A
変換器607から構成される。FIG. 10 shows a voice dialogue system which is an embodiment of the present invention. In this embodiment, a speech recognition server 604 and a speech synthesis server 60 are used as language processing servers.
5, and a control unit 6 for controlling the entire voice dialogue system
01, status information management unit 602, status information storage unit 603,
A / D converter 606 that converts a voice analog signal input from a microphone into a digital signal, D / A that converts a digital signal from the voice synthesis server into a voice analog signal
It is composed of a converter 607.
【0042】音声認識ならびに音声合成についての処理
の根幹部分については、本発明の主旨ではない。例え
ば、音声認識については、文献1(「不特定話者音声自
由対話システムTOSBURG II −マルチモーダ
ル応答と音声応答キャンセルの利用−」,竹林洋一他,
電子情報通信学会論文誌(A). Vol.J77−
A, No.2, pp.241−250)などで開示
されている音声入力信号のパワーを測定する処理を含む
手法、音声合成については、文献1などで開示されてい
る音声合成のパワーを制御することのできる手法を流用
することが出来る。また、音声対話システム制御部60
1についても文献1などで開示されている手法を利用す
るものである。ここでは、本発明の主旨である状況情報
の取り込みと、その利用に関わる処理に限定して説明す
る。The essential part of the processing for speech recognition and speech synthesis is not the gist of the present invention. For example, as for voice recognition, reference 1 (“TOSBURG II free-speaker free speech dialogue system-use of multimodal response and voice response cancellation-”, Yoichi Takebayashi et al.,
IEICE Transactions (A). Vol. J77-
A, No. 2, pp. For the method including the process of measuring the power of the voice input signal disclosed in H.241-250) and the like, and for the voice synthesis, the method capable of controlling the power of the voice synthesis disclosed in Document 1 is used. You can In addition, the voice dialogue system control unit 60
Also for No. 1, the method disclosed in Document 1 is used. Here, the description will be limited to the process of fetching the situation information and the use thereof, which is the main purpose of the present invention.
【0043】図11、12に、本実施例における状況情
報の授受についての、それぞれの言語処理サーバの処理
の流れを図示する。図11に音声認識側、図12に音声
合成側の処理を示している。11 and 12 show the flow of processing of each language processing server for the transmission and reception of status information in this embodiment. FIG. 11 shows processing on the voice recognition side, and FIG. 12 shows processing on the voice synthesis side.
【0044】音声認識サーバ604では、音声認識処理
のため、マイク608から入力されA/D変換器606
で変換される入力信号についての音量のパワーを測定
し、所与のパワーを越えた時点を音声入力の始端とす
る。また、所与のパワーより小さくなった時点を音声入
力の終端として検出する。In the voice recognition server 604, an A / D converter 606 is input from the microphone 608 for voice recognition processing.
The power of the sound volume of the input signal converted by is measured, and the time when the power exceeds a given power is regarded as the start point of the voice input. Also, the time when the power becomes smaller than the given power is detected as the end of the voice input.
【0045】そして、これらの始端と終端の間の音声区
間に関して認識処理を行う。図11、12に図示した流
れ図は、背景雑音のパワーを状況情報として状況情報管
理部602に伝達するための処理を示しており、始端検
出時に起動される。すなわち、音声区間の始端の直前の
所与の区間についての入力のパワーの平均を背景雑音パ
ワーとして、状況情報管理部602に転送する処理を行
う。Then, recognition processing is performed on the voice section between the start end and the end. The flow charts shown in FIGS. 11 and 12 show a process for transmitting the power of background noise to the situation information management unit 602 as situation information, which is activated when the start edge is detected. That is, a process of transferring the average of the input power for a given section immediately before the start of the voice section to the situation information management unit 602 as the background noise power is performed.
【0046】具体的には、まず初めに音声区間の始端の
直前の所与の区間についての入力のパワーの平均を背景
雑音パワーとして求め、この値を状況情報として状況情
報管理部602に転送する(1001)。次に、状況情
報管理部602からの応答を待ち(1002)、書き込
みが成功した場合(1003)処理を終える。Specifically, first, the average of the input powers for a given section immediately before the beginning of the speech section is obtained as background noise power, and this value is transferred to the status information management unit 602 as status information. (1001). Next, the response from the status information management unit 602 is waited for (1002), and if the writing is successful (1003), the process is ended.
【0047】音声合成サーバでは、状況情報到着通知を
受けた場合、割込み処理として図12の処理が行われ
る。すなわち、状況情報取り込み要求を状況情報管理部
へ通知(1004)した後、状況情報管理部から応答が
返ってくるのを待つ(1005)。取り込みに成功した
場合(1006)、取り込まれた状況情報が背景雑音で
あることを、状況情報に設けられている言語処理フェー
ズのフィールドをチェックして判定する。背景雑音であ
る場合(1007)、背景雑音の大きさに応じて、音声
合成のパワーを変更し(1008)、処理を終える。When the voice synthesis server receives the status information arrival notice, the process shown in FIG. 12 is performed as an interrupt process. That is, after notifying the situation information management unit of the situation information acquisition request (1004), it waits for a response from the situation information management unit (1005). When the capture is successful (1006), it is determined that the captured situation information is background noise by checking the language processing phase field provided in the situation information. If it is background noise (1007), the power of voice synthesis is changed according to the size of the background noise (1008), and the process is ended.
【0048】図13に、上記音声認識サーバにより、状
況情報記憶部に書き込まれる状況情報の一例を図示す
る。FIG. 13 shows an example of status information written in the status information storage section by the voice recognition server.
【0049】図において、「sumita」がユーザ名
としてユーザ名のフィールドに、「voice IF」
が言語処理アプリケーション名として言語処理アプリケ
ーション名のフィールドに、「voice Recog
」が言語処理サーバ名として言語処理サーバ名のフィ
ールドに、「background Noise」が言
語処理フェーズとして言語処理フェーズのフィールド
に、「60」が状況情報本体のフィールドにそれぞれ記
述されている。これは、「sumita」というユーザ
が、「voice IF」という言語処理アプリケーシ
ョンにおいて、「voice Recog 」という言
語処理サーバを用いており、その「voice Rec
og 」という言語処理サーバが、背景雑音として「6
0」という値を取り込んだことを意味している。In the figure, "sumita" is the user name in the user name field, and "voice IF" is displayed.
Is displayed in the field of the language processing application name as the language processing application name.
Is described in the language processing server name field as the language processing server name, “background Noise” is described in the language processing phase field as the language processing phase, and “60” is described in the situation information body field. This is because a user "sumita" uses a language processing server "voice Recog" in a language processing application "voice IF", and the "voice Rec" is used.
A language processing server called "og" uses "6" as background noise.
It means that the value of "0" is taken in.
【0050】本実施例では、背景雑音のパワーを音声認
識サーバ604が状況情報として取り込むことにより、
背景雑音が大きい場合、音声合成の音量を大きくするこ
とができる。この結果、背景雑音が大きく聞き取りにく
いということが防げ、了解性の良い音声対話システムを
構築できる。In the present embodiment, the voice recognition server 604 takes in the power of background noise as situation information,
When background noise is large, the volume of voice synthesis can be increased. As a result, it is possible to prevent the background noise from being large and difficult to hear, and it is possible to construct a voice dialogue system with good intelligibility.
【0051】本実施例では、背景雑音のパワーを状況情
報として取り込んだが、電話回線を想定した音声対話シ
ステムを仮定した場合、音声入力のパワーを状況情報と
して状況情報管理部602へ書き込むように変形するこ
とが可能である。この場合、音声合成サーバ605で
の、音声入力の音の大きさが大きい時に、音声合成の音
を小さくするようにすることができる。In this embodiment, the power of background noise is taken in as situation information. However, assuming a voice dialogue system assuming a telephone line, the power of voice input is modified as situation information to be written in the situation information management unit 602. It is possible to In this case, when the voice input server 605 has a large voice input sound volume, the voice synthesis sound can be reduced.
【0052】音声認識では、声を大きく発生した場合、
音韻特性が変化し、認識率が低くなるという傾向があ
る。上記のような変形を行うことにより、音声の発声者
に声の大きさを制御する心理的な効果が期待でき、ひい
ては音声認識の認識率向上が望める。In voice recognition, when a large voice is generated,
The phonological characteristics change, and the recognition rate tends to decrease. By carrying out the above-described modification, a voice speaker can be expected to have a psychological effect of controlling the loudness of the voice, and thus, the recognition rate of voice recognition can be improved.
【0053】音声合成サーバ605が出力した単語を、
状況情報として状況情報管理部602で管理するように
変形することも可能である。この変形の下で、音声認識
サーバが認識時の単語として音声合成した単語を優先す
ように処理を変形することが可能である。人間同士の対
話においても、相手の言った単語を繰り返し発生する場
合か多くある。このような変形を行うことにより、音声
対話システムにおける音声認識率が向上する。The words output by the speech synthesis server 605 are
The situation information can be modified so that it is managed by the situation information management unit 602. Under this modification, it is possible to modify the process so that the speech recognition server gives priority to a word synthesized by speech as a word at the time of recognition. Even in human-to-human dialogue, there are many cases in which the words said by the other party occur repeatedly. By performing such a modification, the voice recognition rate in the voice dialogue system is improved.
【0054】(実施例3)実施例3では、音声認識サー
バと機械翻訳システムという2つの言語処理サーバを利
用した音声対話型機械翻訳システムについて述べる。(Third Embodiment) In a third embodiment, a voice interactive machine translation system using two language processing servers, a voice recognition server and a machine translation system, will be described.
【0055】図14に本実施例の音声対話型機械翻訳シ
ステムの機能構成を図示する。アプリケーションシステ
ム全体の制御を行う機械翻訳システム制御部1101、
状況情報を管理する状況情報管理部1102、状況情報
を記憶する状況情報記憶部1103、音声認識処理を行
う音声認識サーバ1104、機械翻訳処理を行う機械翻
訳サーバ1105の5つの機能ブロックから構成されて
いる。FIG. 14 illustrates the functional configuration of the voice interactive machine translation system of this embodiment. A machine translation system control unit 1101 that controls the entire application system,
The status information management unit 1102 manages status information, the status information storage unit 1103 stores status information, the voice recognition server 1104 performs voice recognition processing, and the machine translation server 1105 performs machine translation processing. There is.
【0056】機械翻訳サーバにおける機械翻訳自体の処
理については、本願の発明の主旨ではない。例えば、特
公平3−10984号公報などで開示されている既存の
技術を流用すれば良い。The processing of machine translation itself in the machine translation server is not the gist of the invention of the present application. For example, the existing technology disclosed in Japanese Patent Publication No. 3-10984 may be used.
【0057】また音声認識サーバにおける音声認識の処
理自体についても、本願の発明主旨ではなく、認識候補
となる語彙集合に基づいて音声単語認識を行う、例えば
文献1で開示されている既存の技術を流用すれば良い。
そこで、以下では本願の発明の根幹である状況情報の利
用に関して中心に説明する。Regarding the voice recognition process itself in the voice recognition server, the voice word recognition is performed based on the vocabulary set which is a recognition candidate, not in the gist of the invention of the present application. For example, the existing technique disclosed in Document 1 is used. You can divert it.
Therefore, the use of the situation information, which is the basis of the invention of the present application, will be mainly described below.
【0058】図15に、対話型機械翻訳システムの機械
翻訳システム制御部1102の処理の流れを図示する。FIG. 15 illustrates a processing flow of the machine translation system control unit 1102 of the interactive machine translation system.
【0059】制御部1102の処理では、まず初めに原
文を1文取り出す(1201)。次に第2言語に翻訳す
るために機械翻訳サーバに原文を転送し、その結果を受
け取る(1202)。この結果は、例えば図16に示す
ように一般に複数の訳語候補を持っており、最初の訳文
の提示においては、それぞれの訳語についての第1候補
の単語を表示する(1203)。次に、制御部1102
は音声認識サーバ1104に音声入力の依頼を行い、ユ
ーザからの音声コマンドの入力を待つ(1204)。音
声コマンドが入力された場合、その音声入力された単語
が「OK」かどうかをチェックする(1205)。「O
K」であった場合、ユーザが提示されている訳文に満足
していることを表示しているので、次の原文の翻訳に進
むことになる(1206)。In the processing of the control unit 1102, first, one original sentence is extracted (1201). Next, the original sentence is transferred to the machine translation server for translation into the second language, and the result is received (1202). For example, as shown in FIG. 16, this result generally has a plurality of translated word candidates, and the first candidate word for each translated word is displayed in the first translation sentence presentation (1203). Next, the control unit 1102
Requests the voice recognition server 1104 for voice input, and waits for a voice command input from the user (1204). When a voice command is input, it is checked whether the voice input word is "OK" (1205). "O
In the case of “K”, it means that the user is satisfied with the presented translated sentence, and thus the process proceeds to the translation of the next original sentence (1206).
【0060】一方、「OK」以外の単語が音声入力され
た場合、音声入力を待つ。入力された音声が表示されて
いる訳語である場合、その訳語と対応する訳語候補を表
示する。さらに、その時点で音声コマンドの入力を待つ
(1207)。音声入力がされた場合、入力された語が
表示されている訳語候補のいずれかである場合(120
8)、その指示された訳語候補を第1候補とし、表示し
ている訳文を書き換える(1209)。On the other hand, when a word other than "OK" is input by voice, the input of voice is awaited. When the input voice is the displayed translation word, the translation word candidate corresponding to the translation word is displayed. Furthermore, at that point, the input of a voice command is awaited (1207). When a voice is input, or when the input word is one of the displayed translation candidates (120
8) Then, the indicated translated word candidate is set as the first candidate, and the displayed translated sentence is rewritten (1209).
【0061】例えば、図16のような結果を機械翻訳サ
ーバから受け取った場合、最初に表示される訳文は「私
はコンピュータを買った」である。この状況においてユ
ーザが「買った」の訳を「購入した」に置き換えたい場
合について、具体的に処理の流れを説明する。For example, when the result shown in FIG. 16 is received from the machine translation server, the first translated sentence displayed is "I bought a computer". In this situation, the flow of the process will be specifically described in the case where the user wants to replace the translation of “buy” with “buy”.
【0062】この場合、ステップ1203において「私
はコンピュータを買った」という表示がなされているこ
とになる。この時ユーザが「修正」という語を音声入力
すると、ステップ1205で「OK」でないことがわか
るので、訳語選択モード(ステップ1207以降)に入
る。ステップ1207で音声入力を待っている段階で、
ユーザが「買った」を入力すると、ステップ1208で
表示されている訳語であることがわかるので、ステップ
1209で「買った」についての候補、すなわち「買っ
た」、「購入した」、「手に入れた」の3つが表示され
る。そして、ステップ1210で次の音声コマンドを待
つ。ユーザがそこで「購入した」という語を音声入力す
ると、ステップ1211でのチェックの後、ステップ1
212が実行されるので、訳文が「私はコンピュータを
購入した」というう、所望の訳文が得られることにな
る。In this case, the message "I bought a computer" is displayed in step 1203. At this time, when the user voice-inputs the word "correction", it is found in step 1205 that the word is not "OK", so the translation word selection mode (step 1207 and thereafter) is entered. While waiting for voice input in step 1207,
When the user inputs "Bought", it is understood that it is the translated word displayed in step 1208. Therefore, in step 1209, the candidates for "Bought", that is, "Bought", "Purchased", and "Handed" are obtained. "Entered" is displayed. Then, in step 1210, the next voice command is waited for. When the user voice-inputs the word "purchased" there, after checking in step 1211, step 1
Since 212 is executed, a desired translated sentence such as "I purchased a computer" is obtained.
【0063】本実施例の音声認識処理では、置き換える
訳語を音声により指示する。したがって、大規模な語彙
の中から適切な語を認識することが求められる。しか
し、一般に音声認識では、認識すべき語彙が大規模にな
るにつれ、認識の性能が落ちる傾向にある。本実施例で
は状況情報管理部1102により、認識時における語彙
を小規模なものに限定することが可能である。In the voice recognition processing of this embodiment, the translated word to be replaced is designated by voice. Therefore, it is necessary to recognize an appropriate word from a large vocabulary. However, in general, in speech recognition, the recognition performance tends to deteriorate as the vocabulary to be recognized becomes large. In this embodiment, the situation information management unit 1102 can limit the vocabulary at the time of recognition to a small vocabulary.
【0064】図17、18に、状況情報の授受に関する
処理の流れを図示する。機械翻訳側を図17に、音声認
識側を図18にそれぞれ示している。17 and 18 show the flow of processing relating to the exchange of status information. The machine translation side is shown in FIG. 17, and the voice recognition side is shown in FIG.
【0065】機械翻訳サーバでは、訳文が得られた段階
で、図17に図示した処理を起動する。すなわち、まず
始めに、訳文内の訳語候補すべてを状況情報として、状
況情報管理部1102に転送する(1301)。そし
て、状況情報管理部1102からの応答を待ち(130
2)、書き込みが成功したという応答を受け取った場合
(1303)に、処理を終える。The machine translation server starts the process shown in FIG. 17 when the translated text is obtained. That is, first, all the translated word candidates in the translated sentence are transferred to the status information management unit 1102 as status information (1301). Then, it waits for a response from the status information management unit 1102 (130
2) When the response that the writing is successful is received (1303), the processing is ended.
【0066】一方、音声認識サーバ(1104)側で
は、状況情報管理部1102からの状況情報到着通知を
受け取った場合、図18の処理が割込み処理として行わ
れる。すなわち、状況情報取り込み要求を状況情報管理
部1102へ通知した後(1304)、状況情報管理部
1103から応答が返ってくるのを待つ(1305)。On the other hand, on the side of the voice recognition server (1104), when the status information arrival notification is received from the status information management unit 1102, the processing of FIG. 18 is performed as an interrupt processing. That is, after notifying the status information management unit 1102 of the status information acquisition request (1304), it waits for a response from the status information management unit 1103 (1305).
【0067】取り込みに成功した場合(1306)、取
り込まれた状況情報が訳語候補であることを、状況情報
に設けられている言語処理フェーズのフィールドをチェ
ックして判定する(1307)。訳語候補である場合、
訳語候補と「OK」と「修正」に認識語彙を限定して
(1308)処理を終える。If the import is successful (1306), it is determined that the imported status information is a translation word candidate by checking the language processing phase field provided in the status information (1307). If it is a translation candidate,
The recognition vocabulary is limited to the translated word candidates and "OK" and "correction" (1308), and the process is ended.
【0068】音声認識の語彙を訳語+αの小規模な語彙
集合に限定しているので、高精度の音声認識が可能であ
る。さらに、翻訳の対象となる訳文が代わる度に、その
語彙集合は適応的に変更されていくので、ユーザにとっ
ては仮想的に非常に大規模な語彙集合で音声単語の入力
が行え、使用語の限定というような制約を感じないシス
テムを構築できる。Since the vocabulary for speech recognition is limited to a small vocabulary set of translated words + α, highly accurate speech recognition is possible. Furthermore, the vocabulary set is adaptively changed each time the translated sentence to be translated is changed, so that the user can virtually input a voice word with a very large vocabulary set, and It is possible to build a system that does not feel restrictions such as limitations.
【0069】本実施例では、音声でのコマンドを入力す
る機械翻訳システムについて述べたが、入力手段はキー
ボードでも構わない。英日機械翻訳においては、訳語が
日本語で表示される。この表示された語を、修正する場
合、ユーザはかな漢字変換によって入力することにな
る。本実施例を変形することにより容易に実現すること
が可能であるかな漢字変換サーバと機械翻訳サーバを持
つ、機械翻訳システムでは、かな漢字変換処理におい
て、変換候補を限定することにより変換精度が著しく上
がることになる。Although the machine translation system for inputting voice commands is described in the present embodiment, the input means may be a keyboard. In English-Japanese machine translation, the translated word is displayed in Japanese. When correcting the displayed word, the user inputs it by kana-kanji conversion. In a machine translation system having a kana-kanji conversion server and a machine translation server that can be easily realized by modifying this embodiment, conversion accuracy is significantly improved by limiting conversion candidates in kana-kanji conversion processing. become.
【0070】(実施例4)実施例4では、文字認識サー
バと、全文文書検索サーバを持つ、ドキュメントリーダ
機能を持つ全文文書検索システムについて述べる。この
実施例において状況情報は、文書データベースを分析す
ることによって得られる分野情報であり、この分野情報
を文字認識における精度向上に使用する。(Fourth Embodiment) In the fourth embodiment, a full-text document search system having a document reader function, which has a character recognition server and a full-text document search server, will be described. In this embodiment, the situation information is field information obtained by analyzing a document database, and this field information is used for improving accuracy in character recognition.
【0071】本実施例の機能構成を図19に図示する。
全体制御部1501、状況情報管理部1502、状況情
報記憶部1503、全文文書検索サーバ1504、文字
認識サーバ1505、文書を格納しておく文書データベ
ース記憶部1506、文書データベース記憶部に格納さ
れている文書データベースからその分野を同定する分野
同定部1507からなる。The functional configuration of this embodiment is shown in FIG.
Overall control unit 1501, status information management unit 1502, status information storage unit 1503, full-text document search server 1504, character recognition server 1505, document database storage unit 1506 for storing documents, documents stored in the document database storage unit It comprises a field identification unit 1507 that identifies the field from the database.
【0072】文字認識サーバにおける文字認識処理は、
本発明の主旨ではない。すでに商用の文書リーダが存在
し、これを実現している文字認識処理を流用することが
可能である。文字認識を行うためのアルゴリズムとして
は、例えば文献2(「パターン認識」,飯島泰蔵,コロ
ナ社)などに開示されている技術を流用することが可能
である。文字認識処理では、文字認識のための認識辞書
を持ち、この認識辞書には、標準的な文字のパターン情
報が格納されている。認識時には、入力された文字の文
字パターン情報と、認識辞書に格納されている標準文字
の文字パターン情報とを比較照合し、最も類似する文字
を認識結果とする。本実施例では、この文字認識におい
て、分野別に認識辞書を分割し保持する。Character recognition processing in the character recognition server is as follows:
It is not the gist of the present invention. A commercial document reader already exists, and the character recognition processing that realizes it can be used. As an algorithm for performing character recognition, it is possible to use the technology disclosed in, for example, Document 2 (“Pattern recognition”, Taizo Iijima, Corona Co.). The character recognition process has a recognition dictionary for character recognition, and this recognition dictionary stores standard character pattern information. At the time of recognition, the character pattern information of the input character is compared and collated with the character pattern information of the standard character stored in the recognition dictionary, and the most similar character is set as the recognition result. In the present embodiment, in this character recognition, the recognition dictionary is divided and held for each field.
【0073】制御部1501の処理の流れを図20に図
示する。制御部は起動されると、利用者からのコマンド
の入力を待つ(1601)。利用者からのコマンドが入
力された場合、まず始めに検索実行コマンドであるか否
かをチェックする(1602)。検索実行コマンドであ
る場合、利用者からの検索条件入力待ちを行う(160
3)。検索条件が入力されると、全文文書検索サーバを
起動し、検索条件に相応する文書を文書DB1506よ
り検索する(1604)。そして、検索結果を利用者に
呈示する(1605)。The flow of processing of the control unit 1501 is shown in FIG. When the control unit is activated, it waits for a command input from the user (1601). When a command is input from the user, it is first checked whether the command is a search execution command (1602). If it is a search execution command, it waits for the search condition input from the user (160
3). When the search condition is input, the full-text document search server is activated and a document corresponding to the search condition is searched from the document DB 1506 (1604). Then, the search result is presented to the user (1605).
【0074】一方、ステップ1601で入力されるコマ
ンドが文書読込コマンドである場合、ステップ1606
におけるチェックにより、ステップ1607が実行され
る。ステップ1607では、文字認識サーバを起動し、
文書読込を行う。そして、全文文書検索サーバを起動
し、読み込んだ文書を文書DB1506に格納する(1
608)。On the other hand, if the command input in step 1601 is a document read command, step 1606
The step 1607 is executed by the check. In step 1607, the character recognition server is started,
Read the document. Then, the full-text document search server is activated, and the read document is stored in the document DB 1506 (1
608).
【0075】さらに、ステップ1601で入力されるコ
マンドが終了コマンドである場合(1609)、チェッ
クを経て、制御部の処理が終了する。Further, when the command input in step 1601 is the end command (1609), a check is performed and the processing of the control unit is ended.
【0076】全文文書検索サーバ1504の処理の流れ
を図21、22に図示する。図20に図示したステップ
1604で起動された全文文書検索サーバ1504は、
文書検索を実行する。すなわち、検索条件に相応する文
書を文書DB1506より検索し(1701)、検索結
果を制御部1501に返し(1702)、処理を終え
る。ステップ1701における全文検索処理は、例えば
文献5(「テキスト検索プロセッサ」,高橋恒介,
(社)電子情報通信学会)等に開示されている処理を利
用すれば良い。The processing flow of the full text document search server 1504 is shown in FIGS. The full-text document search server 1504 started in step 1604 shown in FIG.
Perform a document search. That is, a document corresponding to the search condition is searched from the document DB 1506 (1701), the search result is returned to the control unit 1501 (1702), and the process ends. The full-text search process in step 1701 is described in, for example, Document 5 (“Text Search Processor”, Tsunesuke Takahashi,
The processing disclosed in (Institute of Electronics, Information and Communication Engineers) and the like may be used.
【0077】図20に図示したステップ1608で起動
された全文文書検索サーバは、図22において文書格納
を実行する。まず始めに入力された文書を文書DB15
06に格納した後(1703)、あらかじめ定められた
定数Nで格納文書を割った剰余が0である場合(170
4)、ステップ1705を実行する。すなわち分野同定
部1507を起動し、文書DB1506に格納されてい
る文書の分野を同定する。The full-text document search server activated in step 1608 shown in FIG. 20 executes document storage in FIG. The document input first is the document DB 15
After storing in 06 (1703), the remainder obtained by dividing the stored document by a predetermined constant N is 0 (170
4), Step 1705 is executed. That is, the field identification unit 1507 is activated to identify the field of the document stored in the document DB 1506.
【0078】ステップ1705で同定した分野を状況情
報として状況情報管理部1502に転送するとともに
(1706)、ステップ1707において状況情報管理
部1502からの応答を待つ。ステップ1708で書き
込みに成功したことをチェックし処理を終える。The field identified in step 1705 is transferred to the status information management unit 1502 as status information (1706), and in step 1707, a response from the status information management unit 1502 is waited for. In step 1708, it is checked that the writing has been successful, and the process ends.
【0079】分野同定部1507では、文書データベー
ス内に含まれている文書の分野同定を行う。この分野同
定を行うにあたっては、文書分類に関する既存の技術
(例えば、文献3(「意味属性の学習結果にもとづく文
書自動分類方式」,河合敦夫,情報処理学会論文誌,V
ol.33, No.9, pp.1114−112
2, 1933)が利用できる。すなわち、文書データ
ベース中に格納されている個々の文書について、その分
野を決定する。そして、すべての文書についての分野の
判定結果のうちより数の多い分野を、その文書データベ
ースの分野とすればよい。The field identification unit 1507 identifies fields of documents contained in the document database. In order to identify this field, existing techniques related to document classification (for example, Document 3 (“Automatic Document Classification Method Based on Learning Result of Semantic Attribute”, Atsuo Kawai, Transactions of Information Processing Society of Japan, V
ol. 33, No. 9, pp. 1114-112
2, 1933) are available. That is, the field of each document stored in the document database is determined. Then, the field having the larger number of the field determination results for all the documents may be set as the field of the document database.
【0080】また、例えば、以下のような式によって、
各文書ごとに各分野に対する得点を求めるとともに、D
Bへ格納した経過時間によって決まる重みづけによっ
て、その得点を加重平均した値を求め、この値が最大と
なる分野jを、対象としている文書DBの分野とする。
Σiwi * Pij (1)
ただし、Pijは文書iの分野jに対する得点。wi
は、文書iをDBに格納してからの経過時間によって決
まる重みであり、ΣiΣj wi *Pijが1になる
ように正規化されている。Further, for example, by the following equation,
The score for each field is calculated for each document, and D
A weighted average of the scores is obtained by weighting determined by the elapsed time stored in B, and the field j having the maximum value is set as the field of the target document DB. Σiwi * Pij (1) where Pij is the score for field j of document i. wi
Is a weight determined by the elapsed time from the storage of the document i in the DB, and is normalized so that ΣiΣj wi * Pij becomes 1.
【0081】図23に、文字認識部における状況情報の
取り込みに関する処理の流れを図示する。状況情報到着
通知を検知した時に、図示の処理が起動される。状況情
報の取り込み要求を状況情報管理部に通知し(180
1)、状況情報管理部1502からの応答を待つ(18
02)。状況情報の取り込みに成功した場合(180
3)、取り込んだ状況情報が分野情報か否かをチェック
し(1804)、分野情報である場合、取り込んだ分野
情報に対応する認識辞書に切替を行う(1805)。状
況情報の取り込みに失敗するか、又は分野情報でなけれ
ば終了する。FIG. 23 shows the flow of processing relating to the acquisition of status information in the character recognition section. When the status information arrival notice is detected, the illustrated process is started. Notify the status information management unit of the request to import status information (180
1) Wait for a response from the status information management unit 1502 (18
02). If the status information is successfully imported (180
3) Then, it is checked whether the acquired status information is the field information (1804), and if it is the field information, the recognition dictionary corresponding to the acquired field information is switched (1805). If the acquisition of status information fails, or if it is not field information, the processing ends.
【0082】文字認識では、認識する文字の集合が少け
れば少いほど、認識誤りの低減が望める。本実施例で
は、分野別の辞書を切替えて使用することにより、認識
する文字の集合を減らすことが可能である。これによ
り、認識性能の著しい向上が望める。In character recognition, the smaller the set of recognized characters, the more reduction in recognition error can be expected. In the present embodiment, it is possible to reduce the set of recognized characters by switching and using dictionaries for each field. As a result, a significant improvement in recognition performance can be expected.
【0083】(実施例5)実施例5では、文字認識サー
バと、全文文書検索サーバ、機械翻訳サーバ機能を持
つ、ドキュメントリーダ機能を持つ他言語全文文書検索
システムについて述べる。この実施例において状況情報
は、全文文書検索サーバが獲得する分野情報であり、こ
の分野情報によって文字認識サーバでの認識精度の向
上、機械翻訳における精度向上に流用される。(Fifth Embodiment) In the fifth embodiment, a full-text document search system for other languages having a document reader function, which has a character recognition server, a full-text document search server, and a machine translation server function will be described. In this embodiment, the situation information is field information acquired by the full-text document search server, and is used for improving the recognition accuracy in the character recognition server and the machine translation accuracy by this field information.
【0084】本実施例の機能構成を図24に図示する
(全体)制御部1901、状況情報管理部1902、状
況情報記憶部1903、全文文書検索サーバ1904、
文字認識サーバ1905、機械翻訳サーバ1906、文
書を格納しておく文書データベース記憶部1907、文
書データベース記憶部に格納されている文書データベー
スからその分野を同定する分野同定部1908、文字認
識のための分野別認識辞書1909、機械翻訳のための
分野別翻訳辞書1910からなる。The functional configuration of the present embodiment is shown in FIG. 24 (whole) control unit 1901, status information management unit 1902, status information storage unit 1903, full-text document search server 1904,
Character recognition server 1905, machine translation server 1906, document database storage unit 1907 for storing documents, field identification unit 1908 for identifying the field from the document database stored in the document database storage unit, field for character recognition It includes a separate recognition dictionary 1909 and a field-specific translation dictionary 1910 for machine translation.
【0085】制御部1901の処理の流れを図25に図
示する。制御部1901は起動されると、利用者からの
コマンドの入力を待つ(2001)。利用者からのコマ
ンドが入力された場合、まず始めに検索実行コマンドで
あるか否かをチェックする(2002)。検索実行コマ
ンドである場合、利用者からの検索条件入力待ちを行う
(2003)。検索条件が入力されると、全文文書検索
サーバを起動し、検索条件に相応する文書を文書DB1
907より検索する(2004)。そして、機械翻訳サ
ーバを起動し検索結果を翻訳した後(2005)、その
翻訳結果を利用者に呈示する(2006)。The flow of processing of the control unit 1901 is shown in FIG. When activated, the control unit 1901 waits for a command input from the user (2001). When a command is input from the user, it is first checked whether the command is a search execution command (2002). If the command is a search execution command, it waits for the search condition input from the user (2003). When the search condition is input, the full-text document search server is started, and the document corresponding to the search condition is searched in the document DB 1
Search from 907 (2004). Then, after the machine translation server is activated to translate the search result (2005), the translation result is presented to the user (2006).
【0086】一方、ステップ2001で入力されるコマ
ンドが文書読込コマンドである場合、ステップ2007
におけるチェックにより、ステップ2008が実行され
る。ステップ2008では、文字認識サーバを起動し、
文書読込を行う。そして、全文文書検索サーバを起動
し、読み込んだ文書を文書DB1907に格納する(2
009)。On the other hand, if the command input in step 2001 is a document read command, step 2007
Step 2008 is executed by the check in. In step 2008, the character recognition server is started,
Read the document. Then, the full-text document search server is activated, and the read document is stored in the document DB 1907 (2
009).
【0087】さらに、ステップ2001で入力されるコ
マンドが終了コマンドである場合、ステップ2010に
おけるチェックを経て、制御部の処理が終了する。Furthermore, when the command input in step 2001 is the end command, the processing of the control unit ends after the check in step 2010.
【0088】全文文書検索サーバの処理は実施例4と同
一であるので説明を省略する。Since the processing of the full-text document search server is the same as that of the fourth embodiment, its explanation is omitted.
【0089】文字認識サーバの処理も実施例4と同一で
あるので説明を省略する。Since the processing of the character recognition server is also the same as that of the fourth embodiment, its explanation is omitted.
【0090】機械翻訳サーバにおける機械翻訳自体の処
理については、本願の発明の主旨ではない。例えば特公
平3−10984号公報などで開示されている既存の技
術を流用すれば良い。The processing of machine translation itself in the machine translation server is not the gist of the present invention. For example, the existing technology disclosed in Japanese Patent Publication No. 3-10984 may be used.
【0091】図26に機械翻訳での状況情報取り込み処
理に関する処理の流れを図示する。状況情報到着通知を
検知した時に、図示の処理が起動される。状況情報の取
り込み要求を状況情報管理部に通知し(2101)、状
況情報管理部からの応答を待つ(2102)。状況情報
の取り込みに成功した場合(2103)、取り込んだ状
況情報が分野情報か否かをチェックし(2104)、分
野情報である場合、取り込んだ分野情報に対応する翻訳
辞書に切替を行う(2105)。FIG. 26 shows a flow of processing relating to status information fetching processing by machine translation. When the status information arrival notice is detected, the illustrated process is started. The status information management unit is notified of the status information acquisition request (2101) and waits for a response from the status information management unit (2102). If the acquisition of the status information is successful (2103), it is checked whether the acquired status information is the field information (2104), and if it is the field information, the translation dictionary corresponding to the acquired field information is switched (2105). ).
【0092】本実施例では、全文文書検索サーバで獲得
した分野情報を、他の複数の言語処理サーバで利用する
ことにより、それぞれの言語処理サーバの処理性能を向
上させることが可能である。In this embodiment, it is possible to improve the processing performance of each language processing server by utilizing the field information acquired by the full-text document search server in a plurality of other language processing servers.
【0093】(実施例6)本発明の第6の実施例につい
て述べる。第6の実施例では、状況情報管理部1902
において、状況情報の間の相互作用の調停を行うことを
特長とする。例えば、複数の言語処理サーバが同じ種類
の状況情報を獲得し、しかもそれらの状況情報が競合す
る場合、この調整を行う。(Embodiment 6) A sixth embodiment of the present invention will be described. In the sixth embodiment, the status information management unit 1902
In, the feature is that mediation of interaction between situation information is performed. For example, when a plurality of language processing servers acquire the same kind of status information and the status information conflicts with each other, this adjustment is performed.
【0094】図27に本実施例の状況情報管理部190
2の処理のうち、状況情報を受け取った場合の処理の流
れを図示する。これは、実施例1において図6に図示し
た処理を変形したものである。図6との違いは、新たに
受け取った状況情報を状況情報記憶部に書き込んだ(ス
テップ2203)後、ステップ2204において、書き
込んだ状況情報の言語処理フェーズのフィールドの値と
同じ値の状況情報が状況情報記憶部に存在するか否かを
チェックする(ユーザ名、言語アプリケーション名も同
一)こと、さらに、同じ値の状況情報が存在する場合、
ステップ2206において、優先順位の低い状況情報を
削除することである。FIG. 27 shows the status information management section 190 of this embodiment.
Of the two processes, the flow of the process when the status information is received is illustrated. This is a modification of the process shown in FIG. 6 in the first embodiment. The difference from FIG. 6 is that after the newly received status information is written in the status information storage unit (step 2203), the status information having the same value as the value of the field of the language processing phase of the written status information is written in step 2204. Check whether or not it exists in the status information storage section (user name and language application name are the same), and if status information with the same value exists,
In step 2206, the status information with lower priority is deleted.
【0095】状況情報の優先度を決めるにあたって、例
えば、以下のように複数の言語処理サーバについての優
先順位をあらかじめ与えておく(不等号は優先順位を表
す)。
全文検索サーバ > 文字認識サーバ > 機械翻訳サ
ーバ
これにより、競合する状況情報が状況情報記憶部存在す
る場合、より優先順位の低い言語処理サーバが発行した
状況情報を削除すれば良い。In determining the priority of the status information, for example, the priorities of a plurality of language processing servers are given in advance as follows (the inequality sign indicates the priority). Full-text search server> Character recognition server> Machine translation server Due to this, when competing status information exists in the status information storage unit, the status information issued by the language processing server having a lower priority may be deleted.
【0096】状況情報の優先順位を決めるにあたって、
図3に図示した状況情報のブロックに確度を記述するフ
ィールドを設け、その確度の大きさにしたがって、削除
する状況情報を決定するように変形することも可能であ
る。この確度は、状況情報を書き込む言語処理サーバ
が、その状況情報を獲得した場合に求めることができ
る。例えば、実施例4の場合、全文文書検索サーバが文
書DBに格納された文書から分野を求める時に、式
(1)を最大化する分野を求める。式(1)の値は、格
納されている文書の分野が分散していると、最大値が小
さくなる傾向にあるので、この値を確度として採用する
ことが可能である。In determining the priority of status information,
It is also possible to provide a field for describing the certainty in the block of the situation information shown in FIG. 3 and modify it so that the situation information to be deleted is determined according to the magnitude of the certainty. This accuracy can be obtained when the language processing server that writes the status information acquires the status information. For example, in the case of the fourth embodiment, when the full-text document search server obtains a field from the documents stored in the document DB, the field that maximizes Expression (1) is obtained. The maximum value of the value of the expression (1) tends to be small when the fields of the stored document are dispersed, and thus this value can be adopted as the accuracy.
【0097】尚、上述した全ての実施例では処理結果を
表示する表示部を図示・説明していないが、各制御部
(例えば、言語処理アプリケーション制御部101等)
に接続し表示するものとする。Although the display unit for displaying the processing result is not shown or described in all the above-mentioned embodiments, each control unit (for example, the language processing application control unit 101, etc.)
Shall be connected to and displayed.
【0098】[0098]
【発明の効果】本発明によれば、ある言語処理サーバが
獲得した状況情報を、他の言語処理サーバが利用するこ
とにより精度や性能などの著しい向上が図れる。According to the present invention, the situation information acquired by a certain language processing server can be used by another language processing server to significantly improve accuracy and performance.
【図1】 実施例1の機能ブロック図FIG. 1 is a functional block diagram of a first embodiment.
【図2】 実施例1の機器構成図。FIG. 2 is a device configuration diagram of the first embodiment.
【図3】 実施例1の状況情報記憶部におけるデータ構
造図。FIG. 3 is a data structure diagram in the situation information storage unit of the first embodiment.
【図4】 実施例1の状況情報管理部と言語処理サーバ
の間の通信プロトコル(状況情報書き込み時)を示す
図。FIG. 4 is a diagram illustrating a communication protocol (when writing status information) between a status information management unit and a language processing server according to the first embodiment.
【図5】 実施例1の状況情報管理部と言語処理サーバ
の間の通信プロトコル(状況情報取り込み時)を示す
図。FIG. 5 is a diagram illustrating a communication protocol (at the time of capturing status information) between a status information management unit and a language processing server according to the first embodiment.
【図6】 実施例1の状況情報管理部の処理の流れを示
す図。FIG. 6 is a diagram showing a flow of processing of a situation information management unit of the first embodiment.
【図7】 実施例1の状況情報管理部の処理の流れを示
す図。FIG. 7 is a diagram showing a processing flow of a situation information management unit of the first embodiment.
【図8】 実施例1の言語処理サーバにおける状況情報
の授受に関する処理の流れを示す図。FIG. 8 is a diagram showing a flow of processing relating to exchange of status information in the language processing server according to the first embodiment.
【図9】 実施例1の言語処理サーバにおける状況情報
の授受に関する処理の流れを示す図。FIG. 9 is a diagram showing a flow of processing relating to exchange of status information in the language processing server according to the first embodiment.
【図10】 実施例2の機能ブロック図。FIG. 10 is a functional block diagram of the second embodiment.
【図11】 実施例2の音声認識サーバ、音声合成サー
バにおける状況情報の授受に関する処理の流れを示す
図。FIG. 11 is a diagram showing a flow of processing relating to the exchange of status information in the voice recognition server and the voice synthesis server according to the second embodiment.
【図12】 実施例2の音声認識サーバ、音声合成サー
バにおける状況情報の授受に関する処理の流れを示す
図。FIG. 12 is a diagram showing a flow of processing relating to the exchange of status information in the voice recognition server and the voice synthesis server according to the second embodiment.
【図13】 実施例2の状況情報の一例を示す図。FIG. 13 is a diagram showing an example of situation information according to the second embodiment.
【図14】 実施例3の機能ブロック図。FIG. 14 is a functional block diagram of a third embodiment.
【図15】 実施例3における制御部の処理の流れを示
す図。FIG. 15 is a diagram showing the flow of processing of the control unit in the third embodiment.
【図16】 実施例3の訳語候補の例を示す図。FIG. 16 is a diagram showing an example of translation word candidates according to the third embodiment.
【図17】 実施例3の機械翻訳サーバ、音声認識サー
バにおける状況情報の授受に関する処理の流れを示す
図。FIG. 17 is a diagram showing the flow of processing relating to the exchange of status information in the machine translation server and the voice recognition server of the third embodiment.
【図18】 実施例3の機械翻訳サーバ、音声認識サー
バにおける状況情報の授受に関する処理の流れを示す
図。FIG. 18 is a diagram showing the flow of processing relating to the exchange of status information in the machine translation server and the voice recognition server in the third embodiment.
【図19】 実施例4の機能ブロック図。FIG. 19 is a functional block diagram of the fourth embodiment.
【図20】 実施例4の制御部の処理の流れを示す図。FIG. 20 is a diagram showing a processing flow of a control unit of the fourth embodiment.
【図21】 実施例4の全文文書検索サーバの処理の流
れを示す図。FIG. 21 is a diagram showing a processing flow of the full-text document search server according to the fourth embodiment.
【図22】 実施例4の全文文書検索サーバの処理の流
れを示す図。FIG. 22 is a diagram showing a processing flow of the full-text document search server according to the fourth embodiment.
【図23】 実施例4の文字認識サーバにおける状況情
報の授受に関する処理の流れを示す図。FIG. 23 is a diagram showing the flow of processing relating to the exchange of status information in the character recognition server of the fourth embodiment.
【図24】 実施例5の機能ブロック図。FIG. 24 is a functional block diagram of the fifth embodiment.
【図25】 実施例5の制御部の処理の流れを示す図。FIG. 25 is a diagram showing a processing flow of a control unit of the fifth embodiment.
【図26】 実施例5の機械翻訳サーバにおける状況情
報の授受に関する処理の流れを示す図。FIG. 26 is a diagram showing the flow of processing relating to the exchange of status information in the machine translation server of the fifth embodiment.
【図27】 実施例6における状況情報管理部における
状況情報受け取り時に関する処理の流れを示す図。FIG. 27 is a diagram showing a flow of processing regarding reception of status information in the status information management unit in the sixth embodiment.
101 言語処理アプリケーション制御部 102 状況情報管理部 103 状況情報記憶部 104 言語処理サーバ(1) 105 言語処理サーバ(2) 106 言語処理サーバ(3) 101 Language processing application control unit 102 Status Information Management Department 103 status information storage unit 104 Language Processing Server (1) 105 Language Processing Server (2) 106 Language Processing Server (3)
フロントページの続き (72)発明者 金澤 博史 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B009 KB00 LA01 ME12 VA02 VA09 VC03 5B091 CB12 CC01 CD03 CD15 EA17Continued front page (72) Inventor Hiroshi Kanazawa 1st Komukai Toshiba-cho, Sachi-ku, Kawasaki-shi, Kanagawa Inside the Toshiba Research and Development Center F term (reference) 5B009 KB00 LA01 ME12 VA02 VA09 VC03 5B091 CB12 CC01 CD03 CD15 EA17
Claims (5)
手段を有する言語処理システムにあって、 入力データに対し第1の言語処理を行うための第1の言
語処理手段と、 この第1言語処理手段による言語処理の過程で獲得また
は生成される情報であって、第1の言語処理手段が処理
している前記入力データの特徴である状況情報を、前記
第1の言語処理手段から受信し、受信した前記状況情報
を他の言語処理手段からの取り込み要求に応じて送信す
るための状況情報管理手段と、 この状況情報管理手段に状況情報の取り込み要求を行い
前記状況情報を受信し、この状況情報を反映させた第2
の言語処理を行うための第2の言語処理手段と、を有す
ることを特徴とする言語処理システム。1. A language processing system having a plurality of language processing means for performing a plurality of language processing, comprising: first language processing means for performing a first language processing on input data; From the first language processing means, status information, which is information acquired or generated in the course of language processing by the language processing means and is characteristic of the input data processed by the first language processing means, is received. Then, the status information management means for transmitting the received status information in response to the acquisition request from another language processing means, and the status information management means is requested to acquire the status information, and the status information is received, The second reflecting this situation information
And a second language processing means for performing the language processing of the above.
同じ特徴を有する状況情報がすでに記憶手段に記憶して
いる場合、所定の優先順位をもとに、優先順位の低い言
語処理手段によって生成された状況情報を削除すること
を特徴とする請求項1記載の言語処理装置。2. The status information management means, when the status information having the same characteristics as the received status information is already stored in the storage means, based on a predetermined priority order, the language processing means with a low priority order. The language processing apparatus according to claim 1, wherein the generated status information is deleted.
を、前記第2の言語処理として音声認識処理を実行する
ための言語処理システムであって、 前記第1の言語処理手段は、前記機械翻訳処理における
翻訳の過程で得られた訳語情報を状況情報として前記状
況情報管理手段に送信し、 前記第2の言語処理手段は、前記状況情報管理手段から
状況情報である訳語情報を受信し、受信した前記訳語情
報をもとに、認識すべき語彙を限定して前記音声認識処
理を行うことを特徴とする請求項1記載の言語処理シス
テム。3. A language processing system for executing machine translation processing as the first language processing and voice recognition processing as the second language processing, wherein the first language processing means is the machine. The translated word information obtained in the translation process in the translation process is transmitted to the situation information management means as situation information, and the second language processing means receives the translated word information which is the situation information from the situation information management means, The language processing system according to claim 1, wherein the speech recognition processing is performed by limiting a vocabulary to be recognized based on the received translated word information.
を、前記第2の言語処理として文字認識処理を実行する
ための言語処理システムであって、 前記第1の言語処理手段は、前記全文検索処理において
文書データベースから得られた格納している文書の分野
情報を状況情報として前記状況情報管理手段に送信し、 前記第2の言語処理手段は、前記状況情報管理手段から
状況情報である分野情報を受信し、受信した前記分野情
報をもとに、認識辞書を切り替えて文字認識処理を行う
ことを特徴とする請求項1記載の言語処理システム。4. A language processing system for executing full-text search processing as the first language processing and character recognition processing as the second language processing, wherein the first language processing means comprises the full-text processing. Field information of the stored document obtained from the document database in the search processing is transmitted to the status information management means as status information, and the second language processing means is the status information field from the status information management means. 2. The language processing system according to claim 1, wherein information is received, and character recognition processing is performed by switching a recognition dictionary based on the received field information.
を、前記第2の言語処理として機械翻訳処理を実行する
ための言語処理システムであって、 前記第1の言語処理手段は、前記全文検索処理において
文書データベースから得られた格納している文書の分野
情報を状況情報として前記状況情報管理手段に送信し、 前記第2の言語処理手段は、前記状況情報管理手段から
状況情報である分野情報を受信し、受信した前記分野情
報をもとに、翻訳辞書を切り替えて機械翻訳処理を行う
ことを特徴とする請求項1記載の言語処理システム。5. A language processing system for executing full-text search processing as the first language processing and machine translation processing as the second language processing, wherein the first language processing means is the full-text processing. Field information of the stored document obtained from the document database in the search processing is transmitted to the status information management means as status information, and the second language processing means is the status information field from the status information management means. The language processing system according to claim 1, wherein the language processing system receives information and performs machine translation processing by switching a translation dictionary based on the received field information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002312100A JP2003186872A (en) | 2002-10-28 | 2002-10-28 | Language processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002312100A JP2003186872A (en) | 2002-10-28 | 2002-10-28 | Language processing system |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6201210A Division JPH0863478A (en) | 1994-08-26 | 1994-08-26 | Method and processor for language processing |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003186872A true JP2003186872A (en) | 2003-07-04 |
Family
ID=27606736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002312100A Pending JP2003186872A (en) | 2002-10-28 | 2002-10-28 | Language processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003186872A (en) |
-
2002
- 2002-10-28 JP JP2002312100A patent/JP2003186872A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7213943B2 (en) | Audio processing method, device, device and storage medium for in-vehicle equipment | |
RU2349969C2 (en) | Synchronous understanding of semantic objects realised by means of tags of speech application | |
EP2529372B1 (en) | Integration of embedded and network speech recognizers | |
KR102517387B1 (en) | Utilizes a local text-response map to render responses to the user's spoken utterances | |
US9761241B2 (en) | System and method for providing network coordinated conversational services | |
US8682640B2 (en) | Self-configuring language translation device | |
US9489940B2 (en) | Apparatus and methods to update a language model in a speech recognition system | |
CN102782751B (en) | Digital media voice tags in social networks | |
JP3581648B2 (en) | Speech recognition system, information processing device, control method thereof, and program | |
US20170116993A1 (en) | Speech recognition and transcription among users having heterogeneous protocols | |
JP2002538534A (en) | Dynamic semantic control of speech recognition systems. | |
JPH0863478A (en) | Method and processor for language processing | |
US12165636B1 (en) | Natural language processing | |
WO2000021075A1 (en) | System and method for providing network coordinated conversational services | |
WO2023272616A1 (en) | Text understanding method and system, terminal device, and storage medium | |
CN118885242A (en) | Client application adapted to feature phones based on experimental parameters | |
CN114860910B (en) | Intelligent dialogue method and system | |
JPH07222248A (en) | Method of using voice information in portable information terminals | |
KR20190074508A (en) | Method for crowdsourcing data of chat model for chatbot | |
JP2929959B2 (en) | Voice input network service system | |
JP2000075887A (en) | Device, method and system for pattern recognition | |
JP2005249829A (en) | Computer network system performing speech recognition | |
CN110809796B (en) | Speech recognition system and method with decoupled wake phrases | |
JP4000828B2 (en) | Information system, electronic equipment, program | |
CN105630869A (en) | Voice data storage method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040514 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040713 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050415 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050901 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050930 |