[go: up one dir, main page]

JP2695772B2 - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JP2695772B2
JP2695772B2 JP61188444A JP18844486A JP2695772B2 JP 2695772 B2 JP2695772 B2 JP 2695772B2 JP 61188444 A JP61188444 A JP 61188444A JP 18844486 A JP18844486 A JP 18844486A JP 2695772 B2 JP2695772 B2 JP 2695772B2
Authority
JP
Japan
Prior art keywords
kana
kanji conversion
input
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61188444A
Other languages
English (en)
Other versions
JPS6345676A (ja
Inventor
義光 大島
正博 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61188444A priority Critical patent/JP2695772B2/ja
Publication of JPS6345676A publication Critical patent/JPS6345676A/ja
Application granted granted Critical
Publication of JP2695772B2 publication Critical patent/JP2695772B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は仮名入力を漢字仮名混じり文に変換する仮名
漢字変換装置に関わり、特に文節単位に分ち書きされて
いない仮名入力文を、変換キー等の特別な変換開始指示
手段なしに、入力に追随して変換を行なう仮名漢字変換
装置に関する。 〔従来の技術〕 従来、文節単位に分ち書きされていない仮名入力(い
わゆるべた書き入力)の文を漢字仮名混じり文に変換す
る方式はいくつか知られているが、その一つとして特開
昭60−189565「仮名漢字変換装置」に記されている方法
がある。ここで示されている方法は、仮名入力を漢字仮
名混じり文へ精度良く変換すること、変換の結果に曖昧
さがある場合は、それに対する複数の候補を効率良く抽
出し、保持し、その中から正しい変換結果を素速く容易
に選択する手段を提供している。 また、日経コンピュータ1985年11月25日号「全文仮名
漢字変換方式の技術」で述べられている方式は、仮名文
字の入力と並行して、それまでに入力されている仮名文
字列の任意の部分文字列に対応する自立語の辞書引きを
行なうとともに、簡単な文節マツチングを行なつて、そ
の結果一定量(最長4文節)の仮名文字列の入力が認識
されると、自動的に正規の仮名漢字変換を開始するとい
う方式である。操作者が変換キーを押して変換開始の指
示をすることなく変換が行なわれ、操作者の認識を容易
にする方式である。 さらに、特開昭60−22226「かな漢字変換装置」では
1文字入力されるたびに最長一致で辞書検索を行ない、
仮名漢字変換を即時に高速に実行する方式が述べられて
いる。 〔発明が解決しようとする問題点〕 上記三者の従来技術のうち、最初のものは、先にある
程度仮名文を入力し、その後変換キーを押して仮名漢字
変換の開始を指示する必要があり、変換キーを押してか
ら変換結果が得られるまでに時間がかかること、また文
節単位の変換方式ではないにしろ、操作者が入力文の区
切りを意識して変換キーを押さなくてはならず、煩わし
いという問題点があつた。 二番目の従来例は、この問題点を解消しようとするも
のである。しかし、入力文節数が4以上になつてから変
換を開始するために、変換結果を得るまでの時間の問題
は完全に解消されていないこと、前処理での4文節の切
り出しは完全なものでなく、後に続く変換過程で修正を
施す必要があり、処理に重複する部分があるという問題
点がある。また、変換処理の前に全ての自立語を辞書か
ら読み出しているが、その多くは後の処理では不要にな
るので、この部分でも処理に無駄がある。 最後の例は、変換処理は高速に実行することが可能で
あるが、専ら辞書照合を最長一致のみで行なつており、
第一の従来例と比べ、変換精度の点で問題がある。 本発明は、このような従来技術による仮名漢字変換に
おいて、相伴に解決することが困難であつた変換精度と
処理時間の問題を改善し、高速かつ高精度な変換処理手
段を提供し、かつまた修正にあたつても容易に他の候補
を取り出すことが可能な仮名変換装置を提供することを
目的とする。 〔問題点を解決するための手段〕 上記目的を達成するために、次のような手段を用い
る。 (1)仮名を含む文字を入力するキーボードと、入力し
た文字列を貯えるメモリと、単語の読みを牽引した手段
として単語の表記、品詞などの情報を格納してある辞書
と、該入力文字列メモリから部分文字列を切り出して該
辞書内の対応する読みを持つ語を検索する辞書検索手段
と、検索された語をもとに前後の語との接続検定を含む
仮名漢字変換を行なう手段と、変換処理により生成され
る複数の仮名漢字変換候補を記憶する手段と、変換候補
を尤度の順に表示する手段と、表示された候補から正し
い語を選択する手段を具備し、該辞書検索手段は該入力
文字列メモリ内の文字列を直接読み出し、またメモリ内
の文字が不足する場合には文字入力処理を行ない、文字
列の入力と辞書検索を逐次交代的に処理することによ
り、文字の入力に追随して仮名漢字変換を実行する手段
を設ける。 (2)また、直前の入力誤りを修正するための後退キー
(バツクスペースキー)を設けるとともに、後退キーの
入力に対応して既に入力されている入力文字列メモリ内
の末尾文字を削除する手段、これに対応して削除された
入力文字を含む変換候補を変換記憶手段から削除する手
段、および変換候補記憶手段中に残されている各変換候
補の末尾または変換候補列の先頭位置から新たな変換候
補の作成を開始する手段を設ける。 (3)さらにまた、上記のように複数候補が発生する処
理の開始時点において、各候補に対する変換処理の開始
を記憶管理する手段と、この記憶管理手段に記憶されて
いる実行可能な処理を順に取り出して処理を実行する手
段と、実行中の処理が辞書検索中新しい入力仮名文字列
の入力待ち状態になつたときに、この処理が入力待ち状
態になつたことを上記の記憶管理手段に登録するととも
に、実行待ち状態にある別の実行可能な処理を取り出し
て実行を再開させる手段を設ける。 〔作用〕 前記第1の手段(1)により、仮名文字の入力と並行
して変換処理を行なうことが可能となる。したがつて、
前記第1の従来例(特開昭60−189565)のように、ある
程度文字列を入力後変換キーを押して変換を実行すると
いうような手順をとる必要がなく、操作者を待たせるこ
となく変換処理を実行できる。しかも本手段を上記従来
例の一部として組み込むことも可能で、これにより高精
度かつ高速な仮名漢字変換装置を実現できる。 第2の手段(2)は後退キーの機能に対する内部的な
処理手段について記したもので、ここに記した各手段を
連繋動作させることにより、実現される。また、可能な
位置からの再変換を開始させることにより、削除後の新
たな入力文字に対する変換にも対応させることができ
る。 第3の手段(3)は並列処理の対象範囲を拡げ、より
徹底した並列処理を行なうことにより、処理の効率を上
げ高速化をはかるためのものである。 手段(1)および手段(3)により、前記第2の従来
例よりも高速かつ即時的な変換処理が可能となる。 〔実施例〕 以下、本発明を実施例を用いて詳細に説明する。 第1図に本発明に基づく仮名漢字変換装置の一実施例
を示す。1は入力用キーボード、2は入力した文字列と
貯える入力文字列メモリ、3は変換用辞書、4は辞書検
索部、5は辞書検索部から得られた語をもとに仮名漢字
変換を行なう変換部、6は変換候補の記憶部、7は変換
候補の表示および選択の制御を行なう表示選択制御部、
8は変換候補を見やすい形で画面に表示する表示部であ
る。 第2図は、第1図の仮名漢字変換部5,変換候補記憶部
6,表示選択制御部7における処理をまとめてフローチヤ
ートである。 変換処理が開始されると、まず、ステツプ201で、入
力文字列メモリ2の文節変換開始位置を示すポインタi
を初期値0にセツトし、入力文字列の先頭(未だ文字を
入力していない状態)に位置づける。次にステツプ202
でその位置が文節と文節の間の区切り、すなわち文節端
であるかどうかチエツクする。入力文字列の先頭は文節
端と見なしうるので、この場合は次のステツプ203の文
節変換へと進む。 文節変換では、第1図の構成図からわかるように、キ
ーボードから仮名等の文字を入力しつつ、順次それを文
節を構成する形態素へと変換していく。ここで文節とは
一つの自立語を中心としてその前に一つ以上の省略可能
な接頭語、その後ろにやはり一つ以上の省略可能な接尾
語、さらにその後ろに省略可能な一つ以上の付属語が連
なつた形式のものを指する。複合語は其を構成する一つ
の自立語を含むブロツクに分け、それぞれを文節と見な
す。例えば「産業上の利用分野」に対しては、「産業上
の」(自立語1,接尾語1,付属語1)、「利用」「分野」
(各々自立語1)それぞれ一つの文節である。この文節
単位の仮名漢字変換の方式としては、NHK技術研究第25
巻第5号(昭和48年5月)「計算機によるカナ漢字変
換」に示されている方法が良く知られており、ここでも
基本的にその方法を適用することができる。ここで一つ
の完全な文節が抽出されると、次にステツプ204で変換
候補の確からしさの尤度を判定し、変換候補記憶部6に
保持すべきか、捨てる(「枝切り」と呼ぶ)べきかを決
める。確からしさの尤度は、昭和53年度情報処理学会第
19回全国大会論文集5E−4「べた書き文のカナ漢字変換
システム」や、昭和56年情報処理学会計算言語学研究会
資料25−6「表形式を用いた文節構造分析アルゴリズム
とその能率について」などで述べられているように、入
力文字列をより長い文節の列、別の言い方をすればより
少ない文節の列に分解する方が尤度が高くなるように決
める。ただし「この」「その」などの連体詞や、「こ
と」「もの」などの形式名詞などは他の文節に付属して
使用されることが多いので、名詞や動詞のように独立し
た文節とは見なさず、文節数を数える場合、1より小さ
な値とする。このように、品詞および出現頻度等を考慮
した重みをかけて文節数を求め、その数が少ない程尤度
が高いとする。具体的には、名詞,動詞,形容詞,形容
動詞,等には重み1,形式名詞,補助動詞,連体詞等には
0.1、接頭語,接尾語は準自立語扱いして0.5の重みを与
える、などとする。 枝刈りは、文字列先頭から現在判定の対象となつてい
る文節の後端までの尤度を求め、それをその文節後端の
文字位置における尤度と定めて、もし既に同じ文字位置
において尤度がもとまつている場合はその値と比較し
て、その値がある許容値を超える場合枝刈りを実行す
る。許容値としては、例えば、同じ文字位置における重
みつきの文節数に最小値+1などをとる。 ステツプ204の枝刈りをパスした各文節は、ステツプ2
05で変換候補記憶部6内に格納される。また、ステツプ
206では、それまでに得られている各文節のうちでも最
も尤度の高い候補の文節列を表示部8の画面上に表示す
る(実際には、各文節の処理ごとに、最も尤度の高い候
補を追加表示していく)。 ステツプ207でiに1を加えてポインタを次の入力文
字位置に進める。ステツプ208ではポインタiの文字位
置に入力文字がまだあるかどうか判定し、あればステツ
プ202へ戻る。 なお、文字の入力はステツプ203の文節変換中に並行
して行なわれる。入力が継続して行われていれば、ステ
ツプ208では入力終りには達しえないので、第2図のル
ープは繰り返して処理される。また、文字の入力が終了
していても、入力文字列中に未処理の文字が残つている
ときはループを繰り返す。 以上のループを繰り返し、入力文字をすべて取り込
み、またそれに対する変換処理が終了すると、ステツプ
209へ進み、操作者から選択入力を受け付け、各部分の
候補中から操作者の意図したものを順に選び結果を確定
していく。選択操作および処理の詳細はここでは述べな
いが、例えば特開昭60−189565に示してある方法により
実施することができる。 以上に述べた処理に従つて変換候補記憶部6のなかに
形成されるデータの具体例を第3図に示す。例としてと
つた入力文字列は「すうがくかいせきじようでは」であ
るが、これを図の上部に示してある。図の下部には変換
処理の結果作成される複数の変換候補のデータを示して
ある。変換候補のデータの重複を防ぐためにネツトワー
ク状のデータ構造を採用し、記憶容量の節約をはかつて
いる。 第4図に、第2図ステツプ203の文節変換の処理フロ
ーを示す。接頭語処理(ステツプ311)、自立語処理
(ステツプ312)、接尾語処理(ステツプ313)、付属語
処理(ステツプ314)から構成される。図から明らかな
ように、自立語処理のみが必須で他の処理は省略可能と
なつている。これは、前述した文節の定義をそのまま図
式化したものとなつており、実際には接頭語,接尾語,
付属語の処理それぞれについて、その処理を実施する場
合と実施しない場合の各々の組合せに対するすべての場
合について処理を実行し、可能な文節変換候補を全て抽
出することを試みる。また、付属語については一つだけ
でなく複数連なる場合もあるが、それらについても全て
の処理を試みる。これらの意味で、第4図は通常のフロ
ーチヤートの表現とは異なり、説明の補助用のものであ
る。 第4図の各処理においては入力文字列メモリ2上でポ
インタiが指す仮名文字から始まる読みを持つ語を辞書
と照合しつつ取り出すとともに、充分な文字が入力文字
列メモリ2上にそろつていないときは、キーボード1か
ら入力文字を待つ。また、辞書との照合により一致した
語を取り出し、先行する語との接続チエツクを行なう。 第5図に自立語処理のフローを示す。接頭語処理,接
尾語処理,付属語処理も基本的構造は自立語処理と同様
なので、以下自立語処理で代表させて説明する。 ステツプ321でまず辞書検索部4に要求を出し、入力
文字列メモリ2内の部分文字列と一致する語を辞書3か
ら読み出す。このとき入力文字列メモリ2上で先頭の文
字位置を同じくする(ポインタiの値が同じ)語は全て
取り出す。第2図の例では,「巣」「酢」「数」「吸
う」「数学」などが、先頭から変換候補として抽出され
る。次にステップ322で変換候補として抽出されたもの
を一つずつ取り出し、ステツプ323で先行する形態素
(語)との接続チエツクを行なう。上の例では、取り出
し開始点が入力文字列の先頭、すなわち文節の先頭であ
るので、全ての自立語は接続条件を満足し、「巣」
「酢」「数」「吸う」「数学」などがステツプ324のチ
エツクをパスし、文節候補の一部と認定される。そし
て、ステツプ325で既存の部分以降(この場合は先頭)
につながれる。一般の位置の例では、第3図で助詞の
「が」(付属語に相当)を切り出している部分がある
が、助詞「が」は格助詞の場合と接続助詞の場合があ
り、それぞれ名詞などの体言および動詞などの用言と接
続可能であるので、図のように「数」には格助詞の
「が」が、「吸う」には接続助詞の「が」が切り出され
て接続される。このようしにて取り出された変換候補全
てについて接続チエツクが完了する(ステツプ326)と
自立語処理が終了する。 接頭語処理,接尾語処理,付属語処理も処理内容はほ
ぼ同様である。 第5図ステツプ321における辞書検索部4の処理フロ
ーを第6図に示す。ステツプ401でまず入力文字列メモ
リ2上で辞書検索する語の読みの後端を表わすポインタ
kを語の先端位置ポインタiの値に初期化する。次にス
テップ402で、入力文字列メモリ2上のポインタkの位
置に既に入力文字が登録されているかチエツクし、あれ
ば下へ進む。入力文字がない場合はキーボードから文字
が入力されるのを待つ(ステツプ403)。文字が入力さ
れたらそれを読み取り、入力文字列メモリ2のポインタ
kの位置へ登録する(ステツプ404)。ステツプ405では
iとkではさまれる区間の文字列を読みとして辞書の検
索を行なう。検索の結果、一致する語が得られたときは
(ステツプ406)、それを辞書検索語バツフアに登録す
る(ステツプ407)。ここで辞書検索語バツフアとは辞
書検索部4内に設けられた一時記憶用のメモリである。
次にステツプ408でポインタkを一つ進め、ループの先
頭に戻る。ステツプ406で、辞書中に一致する語を見つ
からなかつたときは、ループを脱出して処理を終わる。
また辞書検索部バツフアに登録されている語は第5図の
ステツプ322に渡される。 なお、ステツプ406で辞書中に一致する語が見つから
なかつたときは処理を終わるとしたが、この処理フロー
では短い読みから長い読みの方向へ向かつて処理を行な
つているので、一致する読みの語がたまたまなくても、
さらに読みの長さを長くすると一致する語が見つかる場
合がある。例えば「すうがく」という文字列が入力文字
列メモリ2内にあるとき、読み「すう」に対する語とし
ては「数」「吸う」があるが、「すうが」に対する語は
ない。しかしさらに読みを延長して「すうがく」とする
と、「数学」という語がある。 このような状況に対処するためには、辞書の牽引部の
構造を、例えば第7図のような読み順の木構造にすれば
よい。上記の例で言えば、読み「す」に対しては「巣」
「酢」などが、「すう」に対しては「数」「吸う」など
の語があることがわかる。「すうが」に対しては対応す
る語はないが、さらに読みを伸ばしたときには一致する
語があることが簡単に判定できるようになつている。ま
た、「すうがく」の「く」まで来たときには、それより
先には一致する語がないことが直ちにわかるようになつ
ている。この点を利用して、「数学」を検索した時点で
それより長い語がないことを検知し、第6図のループを
余分に回ることなく、直ちにループを脱出するように第
6図のフローを変更することも出来る。 なお、第6図のように与えられた文字列に対応する複
数の長さの読みの語を得るような場合、検索の結果得ら
れた語のいちいちバツフア(辞書検索語バツフア)に貯
めこむことなく、語が得られるたびに次のステツプ(こ
の場合は第5図のステツプ322)へその語を渡していく
ような制御をとることができる。このようにすれば、辞
書から全ての語が得られるまで、接続チエツク等の他の
処理を待たせる必要がなく並列して実行できるので、処
理効率を上げることが出来る。 ところで、自立語は接頭語,接尾語あるいは付属語と
比べて読みの長さが長いものが多い。この場合、短い読
みのものから長い読みのものまで全てに対して、接続チ
エツクなどの処理をしても無駄になることが多い。実用
的には最長一致あるいは次最長一致(最長一致の語の読
みに次いで一致する長さの語)により得られる語に制限
しても、仮名漢字変換の精度上は殆ど問題ない。したが
つて、この場合、まず最長一致の語が得られるまで次々
に読みの長さを伸ばしていき、最長一致の語が得られた
あと次最長一致の語を検索するというようにすることが
出来る。 以上、文字が誤りなく入力されている場合の例につい
て説明してきたが、人間がキーボードから文字を入力し
ている場合、時として入力ミスを犯すことがある。しか
し、入力ミスはその場で気がつく場合が多い。キーボー
ドには通常これを修正するために、直前の入力文字を取
り消すための後退キーが設けられている。次に、この後
退キーに関する動作について説明する。 第8図に、後退キー処理のフローチヤートを示す。後
退キーが押されると、まずステツプ341で入力文字列メ
モリ2内の末尾の文字を1文字削除する。次にステツプ
342では、辞書検索部4で実行中のその文字を含む辞書
アクセスのキヤンセルを行なう。またステツプ343で
は、変換候補記憶部6内で削除された文字を含む形態素
(語)の変換候補をネツトワークから削除する。最後に
(ステツプ344)、ネツトワーク上の各形態素(語)の
末尾および変換文字列の先頭から再度変換処理を試み
る。この場合、既に切り出されている形態素(語)につ
いては再度処理を行なう必要はなく、削除された文字の
部分から先へ新しく入力される文字を含む文字列につい
て変換処理すなわち辞書検索を行なえばよい。また、辞
書中にある語の読みの最大長がわかつている場合は、ネ
ツトワーク上の全ての形態素(語)の末尾および変換候
補列の先頭から再変換処理を行なう必要はなく、入力文
字列の最後端から辞書中の語の読みの最大長分遡つたと
ころまでの範囲で再変換処理を行なえばよい。 以上で第1の実施例の説明を終わる。 ところで、第3図から明らかなように、一般に変換対
象の入力文字列が与えられたとき、それに対応する仮名
漢字変換候補は複数存在する。単なる同音語だけでな
く、入力文字列の語への分割のしかた、あるいはその品
詞についても複数の候補が存在しうる。このとき、第1
の実施例で示した第1図の各部の処理が充分高速で、1
文字入力されるだびに必要な処理が実行され、次の入力
が入る前までに処理が終了するのならば問題ないが、実
際には、第1図の各部の処理には有限の実行時間を必要
とするので、キーボードからの文字の入力に処理の速度
が追いつかなくなる状況が生じる可能性がある。これは
例えば、熟練した操作者が非常な高速で文字を入力した
とき、あるいは並列に存在しうる変換候補が非常に多数
生じたときなどに起こる。 このような状況においても、効率的に仮名漢字変換を
実行することが出来る第2の実施例を次に説明する。 第9図に本実施例の構成を示す。第9図において、1
〜8は第1図におけるものと同一である。は、上述の並
列に存在する複数候補の処理を次々に切り換えて実行さ
せるための並列処理制御部である。 第10図に示した具体例を用いて、本実施例における仮
名漢字変換装置の動作を説明する。この例は、最終的に
第3図のような結果になる過程で「すうがくか」まで入
力された状態を示している。「すうがく」の部分では変
換候補が明らかになり、「か」およびそれ以降の処理を
開始した状態にある。「か」については副助詞の「か」
あるいは接尾語の「科」「化」などがあり、これらは既
にネツトワークに登録されている。さらに両者ともこの
位置で文節を終了しうるので、その後端から次の文節の
処理が開始されている。また「か」とそれに続く入力文
字列からなる文節の処理も開始されていることを示して
いる。 第1図の実施例で仮名漢字変換を実行中、第6図のス
テツプ402およびステツプ403でキーボード入力待ち状態
に入つたときに、第10図のような状況になつている場合
を考える。このとき、副助詞「か」と接尾語「科」
「化」が切り出されたあと「か」とそれに続く入力文字
列からなる文節の処理を開始しているときは問題ない
が、これが逆に「か」または「科」「化」が切り出され
る前に、「か」それに続く入力文字列に対する文節の処
理の途中で入力待ちの状態に入つてしまい、「か」また
は「科」「化」の処理が実行可能であるにも拘わらず待
たされてしまう場合がある。このようなとき、一つの文
節の処理が入力待ちの状態に入つたことを検知し、その
空き時間を利用して別の実行可能な処理を取り出して実
行するような構成にすれば、どちらの処理が先になろう
とも、そのとき実行可能な処理を全て実行することが可
能となる。 このような、キーボード入力の待ちの状態を利用する
並列処理の候補としては次のようなものがある。 (1)入力文字列メモリ2上で、文節開始点を異にする
複数の文節処理、およびそれに続く処理。 (2)接頭語,自立語,接尾語,付属語など前後の接続
関係が異なる複数の処理。また、品詞,活用などの多義
による複数の処理。 (3)始点を同一にするが、終点すなわち長さの異なる
語に対する複数の処理。 これらについて、多義が生じる時点でそれぞれ処理の
実行開始を並列処理制御部9へ通知登録し、各処理が辞
書アクセス中にキーボード入力待ちになつたとき、並列
処理制御部9が既登録の処理のかなかから実行可能なも
のを選び出して起動する。なお、多義が生じる時点と
は、例えば、第2図でポインタiを移動させながら文節
端の有無を調べつつ文節変換を起動するところ、第4図
で、接頭語処理,接尾語処理,付属語処理に実行有無に
関する分岐部分などである。 〔発明の効果〕 以上述べたごとく、本発明によれば、文節単位に分ち
書きされていない仮名文字列を入力としてこれを仮名漢
字変換する装置において、特別な変換キーを押すことな
しに仮名漢字変換を行なうことが可能となり、しかも入
力に追随して変換が行なわれるので、変換結果の確認が
容易となり、操作性の良い仮名漢字変換装置が実現可能
となる。また、本発明を従来例(特開昭60−189565)の
一部として組み込まれることにより、高精度かつ高速な
仮名漢字変換装置で実現できる。 なお、本発明は順番に入力される仮名文字列を逐次的
に変換していく構成であつて、対話型による音声入力装
置のように逐次的に仮名文字列が入力されるような装置
に対しても有効なことは言うまでもない。
【図面の簡単な説明】 第1図は本発明の第一の実施例を示す図、第2図は仮名
漢字変換処理の全体フロー、第3図はこの処理により変
換候補記憶部6内に形成されるデータの具体例である。
第4図は文節変換の処理フロー、第5図は自立語処理の
処理フロー、第6図は辞書検索部4の処理フローであ
る。第7図は、第6図の処理フローで使用する辞書の牽
引部の構成を示す。第8図は後退キー処理のフローであ
る。第9図は第二の実施例の構成を示したもので、第10
図はその動作を説明するための具体例を示したものであ
る。 1…キーボード、2…入力文字列メモリ、3…辞書、4
…辞書検索部、5…仮名漢字変換部、6…変換候補の記
憶部、7…表示選択制御部、8…表示部、9…並列処理
制御部。

Claims (1)

  1. (57)【特許請求の範囲】 1.仮名を含む文字を入力するキーボードと、 入力した文字列を蓄える入力文字列メモリと、 単語の表記及び品詞の少なくともいずれかを含む情報を
    格納する辞書と、 上記入力文字列メモリから部分文字列を切り出して上記
    辞書内の対応する読みを持つ語を検索する辞書検索手段
    と、 検索された語をもとに先行する語との接続検定を行うこ
    とを含む仮名漢字変換処理を行い、複数の仮名漢字変換
    候補を生成する手段と、 仮名漢字変換処理によって生成された複数の仮名漢字変
    換候補を記憶する手段と、 上記複数の仮名漢字変換候補を尤度の順に表示する手段
    と、 表示された仮名漢字変換候補から正しい語を選択する手
    段とを備え、上記キーボードからの文字の入力と並行し
    て上記辞書検索手段による上記辞書の検索を順次行うよ
    うに構成した仮名変換装置であって、 上記キーボードの入力待ち状態中に実行可能な処理を選
    択して並列列処理として起動する並列処理手段 を備えたことを特徴とする仮名漢字変換装置。 2.特許請求の範囲第1項において、入力された文字列
    に多義が生じる時点で上記辞書の検索の実行が開始され
    ることを特徴とする仮名漢字変換装置。 3.特許請求の範囲第1項または第2項において、上記
    辞書は、読み順の木構造の索引部を有することを特徴と
    する仮名漢字変換装置。 4.特許請求の範囲第1項または第2項において、上記
    仮名漢字変換処理を行う手段は、上記入力文字列をより
    長い文節の列に分解する方が尤度が高くなるように尤度
    を決め、複数の仮名漢字変換候補を生成することを特徴
    とする仮名漢字変換装置。 5.特許請求の範囲第1項または第2項において、上記
    複数の仮名漢字変換候補を記憶する手段は、ネットワー
    ク状のデータ構造を有することを特徴とする仮名漢字変
    換装置。 6.仮名を含む文字を入力するキーボードと、 入力した文字列を蓄える入力文字列メモリと、 単語の表記及び品詞の少なくともいずれかを含む情報を
    格納する辞書と、 上記入力文字列メモリから部分文字列を切り出して上記
    辞書内の対応する読みを持つ語を検索する辞書検索手段
    と、 検索された語をもとに先行する語との接続検定を行うこ
    とを含む仮名漢字変換処理を行い、複数の仮名漢字変換
    候補を生成する手段と、 仮名漢字変換処理によって生成された複数の仮名漢字変
    換候補を記憶する手段と、 上記複数の仮名漢字変換候補を尤度の順に表示する手段
    と、 表示された仮名漢字変換候補から正しい語を選択する手
    段と、 上記キーボードの入力待ち状態中に実行可能な処理を選
    択して並列列処理として起動する並列処理手段とを備
    え、上記キーボードからの文字の入力と並行して上記辞
    書検索手段による上記辞書の検索を順次行うように構成
    した仮名変換装置であって、 上記キーボードの一部に直前に入力された文字を取り消
    すための後退キーを有し、 上記後退キーの入力に対応して既に入力されている上記
    入力文字列メモリ内の末尾文字を削除する手段と、 その削除する文字をすくむ仮名漢字変換候補を上記複数
    の仮名漢字変換候補を記憶する記憶手段から削除する手
    段と、 上記複数の仮名漢字変換候補を記憶する記憶手段に残さ
    れている各仮名漢字変換候補の末尾及び各仮名漢字変換
    候補の先頭の少なくともいずれかから再度仮名漢字変換
    処理を行う手段と、 を備えたことを特徴とする仮名漢字変換装置。
JP61188444A 1986-08-13 1986-08-13 仮名漢字変換装置 Expired - Fee Related JP2695772B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61188444A JP2695772B2 (ja) 1986-08-13 1986-08-13 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61188444A JP2695772B2 (ja) 1986-08-13 1986-08-13 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPS6345676A JPS6345676A (ja) 1988-02-26
JP2695772B2 true JP2695772B2 (ja) 1998-01-14

Family

ID=16223791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61188444A Expired - Fee Related JP2695772B2 (ja) 1986-08-13 1986-08-13 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP2695772B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58169617A (ja) * 1982-03-31 1983-10-06 Fujitsu Ltd 日本語入力処理方式
JPS6022226A (ja) * 1983-07-18 1985-02-04 Matsushita Electric Ind Co Ltd かな漢字変換装置
JPS6148063A (ja) * 1984-08-14 1986-03-08 Ricoh Co Ltd カナ漢字変換方式
JPS61145676A (ja) * 1984-12-20 1986-07-03 Ricoh Co Ltd べた書き仮名漢字変換方式

Also Published As

Publication number Publication date
JPS6345676A (ja) 1988-02-26

Similar Documents

Publication Publication Date Title
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
JP3691844B2 (ja) 文書処理方法
US5418717A (en) Multiple score language processing system
EP0180888A2 (en) Method and apparatus for natural language processing
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH0567144A (ja) 前編集支援方法およびその装置
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2633824B2 (ja) 仮名漢字変換装置
JP2695772B2 (ja) 仮名漢字変換装置
JP2959769B2 (ja) 日本語文字列の形態素解析方法及び装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JPH0140372B2 (ja)
JP3628565B2 (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JP2634596B2 (ja) かな漢字変換装置
JPS6389976A (ja) 言語解析装置
JPH0816910B2 (ja) 言語解析装置
JPS5998236A (ja) 日本文入力装置
JPH0350669A (ja) 情報処理装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH10240735A (ja) 形態素解析方法及び形態素解析装置
JP2001034606A (ja) 中国語入力装置及び中国語入力方法
JPH05225232A (ja) テキスト自動前編集装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees