JP2011164924A - プログラムおよび情報処理装置 - Google Patents
プログラムおよび情報処理装置 Download PDFInfo
- Publication number
- JP2011164924A JP2011164924A JP2010026824A JP2010026824A JP2011164924A JP 2011164924 A JP2011164924 A JP 2011164924A JP 2010026824 A JP2010026824 A JP 2010026824A JP 2010026824 A JP2010026824 A JP 2010026824A JP 2011164924 A JP2011164924 A JP 2011164924A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- phrase
- character
- specified
- specified position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 208000008771 Lymphadenopathy Diseases 0.000 description 19
- 208000018555 lymphatic system disease Diseases 0.000 description 19
- 206010003445 Ascites Diseases 0.000 description 10
- 230000002159 abnormal effect Effects 0.000 description 9
- 230000005856 abnormality Effects 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】処理対象の文字列における指定位置の前の文字列の後に続くと推測された文字列と、処理対象の文字列における指定位置の後の文字列の前に接続されると推測される文字列と、の両方の文字列を表示させる。
【解決手段】情報処理装置10の入力受付部120は、処理対象の文字列である対象テキストにおける指定位置を受け付ける。フレーズDB110は、複数のフレーズを記憶する。候補フレーズ取得部140は、フレーズDB110から、対象テキストにおける指定位置の前の文字列から始まるフレーズと、対象テキストにおける指定位置の後の文字列で終わる含むフレーズと、を特定する。出力処理部160は、候補フレーズのうち対象テキストと異なるフレーズを表示装置に表示させる。
【選択図】図1
【解決手段】情報処理装置10の入力受付部120は、処理対象の文字列である対象テキストにおける指定位置を受け付ける。フレーズDB110は、複数のフレーズを記憶する。候補フレーズ取得部140は、フレーズDB110から、対象テキストにおける指定位置の前の文字列から始まるフレーズと、対象テキストにおける指定位置の後の文字列で終わる含むフレーズと、を特定する。出力処理部160は、候補フレーズのうち対象テキストと異なるフレーズを表示装置に表示させる。
【選択図】図1
Description
本発明は、プログラムおよび情報処理装置に関する。
テキストの入力を支援する技術が知られている。例えば、特許文献1には、利用者により入力された漢字やひらがなを含む文字列に続く文字列を予測する技術が開示されている。特許文献1に記載の技術では、ひらがな、漢字、または漢字混じりひらがなから成る複数の文字列を辞書に収容しておき、入力された文字列をキーとして前述の辞書の中から抽出した文字列を、入力された文字列に続く予測文字列として出力する。
特許文献2には、ペン入力コンピュータにおいて、入力および/または既に確定した文字列に基づいて、複数の単語および複数の文例を格納した辞書格納手段から検索した1以上の候補単語を表示手段に表示させ、表示させた候補単語の中から所望の単語をユーザに選択させることで文章入力を行う技術が開示されている。
特許文献3には、省略記号を含む文章の入力を受け付け、その省略記号の部分に相当する文字列を補完する技術が開示されている。特許文献3に記載の技術では、単語とその使用頻度を記憶した単語辞書を参照して、入力された文章中の省略記号の前後の文字から省略された単語の候補を抽出し、単語間の遷移情報と単語間の遷移確率を記憶した遷移辞書に基づいて、抽出された候補単語の中から1つの単語を決定する。
ところで、入力済みのテキストを修正する場合、ユーザは、テキストにおいて指定した位置の前の文字列の後に続く文字列の入力を望むこともあるし、指定した位置の後の文字列の前に接続される文字列の入力を望むこともある。
本発明は、処理対象の文字列における指定位置の前の文字列の後に続くと推測された文字列と、処理対象の文字列における指定位置の後の文字列の前に接続されると推測された文字列と、の両方の文字列を表示させるプログラムおよび情報処理装置を提供することを目的とする。
請求項1に係る発明は、処理対象の文字列である対象文字列における指定位置を受け付ける受付ステップと、記憶手段に記憶された複数の文字列から、前記対象文字列における前記指定位置の前の文字列から始まる文字列と、前記対象文字列における前記指定位置の後の文字列で終わる文字列と、を特定する特定ステップと、前記特定ステップにおいて特定された文字列のうち前記対象文字列と異なる文字列を表示手段に表示させる指示を含む表示制御情報を出力する出力ステップと、をコンピュータに実行させるためのプログラムである。
請求項2に係る発明は、請求項1に係る発明において、前記記憶手段は、さらに、ある文書の集合における前記複数の文字列それぞれの出現頻度に基づいて予め求められた前記複数の文字列それぞれの重要度を記憶し、前記特定ステップにおいて、さらに、前記対象文字列における前記指定位置の前の文字列から始まる文字列および前記対象文字列における前記指定位置の後の文字列で終わる文字列それぞれの前記重要度を特定し、前記表示制御情報は、さらに、前記特定ステップにおいて特定された各文字列の前記重要度を用いて決定された各文字列の順位に応じて、前記特定ステップにおいて特定された文字列のうち前記対象文字列と異なる文字列を前記表示手段に表示させる指示を含む。
請求項3に係る発明は、請求項1または2に係る発明において、前記特定ステップにおいて特定された文字列のそれぞれから、前記指定位置の前の文字列および前記指定位置の後の文字列を削除する削除ステップ、をさらに前記コンピュータに実行させ、前記表示制御情報は、さらに、前記削除ステップの処理を行った結果の文字列を表示の対象とする指示を含む。
請求項4に係る発明は、請求項3に係る発明において、前記表示制御情報は、前記指定位置の前の文字列および前記指定位置の後の文字列の両方を含む文字列と、前記指定位置の前の文字列のみを含む文字列と、前記指定位置の後の文字列のみを含む文字列と、のそれぞれに対して前記削除ステップの処理を行った結果の文字列を、互いに異なる態様で前記表示手段に表示させる指示をさらに含む。
請求項5に係る発明は、請求項2から4のいずれか1項に係る発明において、前記各文字列の順位は、前記特定ステップにおいて特定された各文字列の前記重要度に基づいて、かつ、前記特定された各文字列が前記対象文字列における前記指定位置の前および後の文字列のいずれを含むかに応じて決定される。
請求項6に係る発明は、請求項2から5のいずれか1項に係る発明において、前記各文字列の順位は、前記特定ステップにおいて特定された各文字列の長さにさらに基づいて決定される。
請求項7に係る発明は、請求項1から6のいずれか1項に係る発明において、前記対象文字列および前記記憶手段に記憶された複数の文字列は、それぞれ、当該文字列を含む文書において、予め設定された区切り文字によって区切られる単位の文字列である。
請求項8に係る発明は、処理対象の文字列である対象文字列における指定位置を受け付ける受付手段と、記憶手段に記憶された複数の文字列から、前記対象文字列における前記指定位置の前の文字列から始まる文字列と、前記対象文字列における前記指定位置の後の文字列で終わる文字列と、を特定する特定手段と、前記特定手段で特定された文字列のうち前記対象文字列と異なる文字列を表示手段に表示させる指示を含む表示制御情報を出力する出力手段と、を備えることを特徴とする情報処理装置である。
請求項1または8に係る発明によると、処理対象の文字列における指定位置の前の文字列の後に続くと推測された文字列と、その指定位置の後の文字列の前に接続されると推測された文字列と、の両方の文字列をユーザに提示できる。
請求項2に係る発明によると、ある文書の集合における各文字列の出現頻度に基づく重要度を用いて決定された順位に応じて、前記両方の文字列をユーザに提示できる。
請求項3に係る発明によると、前記両方の文字列のそれぞれについて、対象文字列と重複しない部分だけをユーザに提示できる。
請求項4に係る発明によると、前記両方の文字列のそれぞれについて、処理対象の文字列における指定位置の前および後の文字列のいずれに接続すると推測したかを区別可能な態様でユーザに提示できる。
請求項5に係る発明によると、前記両方の文字列について、処理対象の文字列における指定位置の前および後の文字列のいずれを含むかを考慮した順位付けを行うことができる。
請求項6に係る発明によると、前記両方の文字列について、当該文字列の長さを考慮した順位付けを行うことができる。
請求項7に係る発明によると、完成された1つの文または句である処理対象の文字列に対する修正の候補をユーザに提示できる。
図1は、本発明の一実施形態の例による情報処理装置の内部構成の概略を示す。図1の例の情報処理装置10は、文書DB(データベース)100、フレーズDB110、入力受付部120、対象テキスト取得部130、候補フレーズ取得部140、候補フレーズ加工部150、出力処理部160、および候補フレーズ挿入部170を備える。
文書DB100は、電子文書を記憶する。文書DB100は、例えば、特定の分野において用いられる文書を記憶しておいてよい。後述する情報処理装置10の各部の処理は、文書DB100に記憶された電子文書中のテキスト(文字列)を処理対象として行なわれることもある。
フレーズDB110は、文書DB100に記憶された電子文書において出現する複数のフレーズを記憶する。ここで、フレーズとは、文または文を構成する句など、文書において1つの単位として捉えられる表現を意味する。本実施形態の例では、予め設定された区切り文字によって区切られる文字列の単位を1つのフレーズとして扱う。予め設定された区切り文字として、本例では、句読点、疑問符、感嘆符、および改行記号を用いる。フレーズDB110は、各フレーズを構成する文字列と、当該フレーズのスコアと、を関連づけて記憶する。各フレーズのスコアは、当該フレーズの重要度を表す数値であり、文書DB100に記憶された電子文書における当該フレーズの出現頻度に基づいて予め求められてフレーズDB110に記憶される。各フレーズの出現頻度をそのまま各フレーズのスコアとしてもよい。あるいは、例えば、各フレーズについて予め定められた有用性を表す数値によって出現頻度を重み付けした結果の値を当該フレーズのスコアとしてもよい。フレーズの有用性は、例えば、文書DB100に記憶された電子文書の内容の分野に応じて定められる。例えば、ある特定の分野(医療、工業、経済、法律など)の文書において頻繁に用いられるフレーズを予測可能である場合がある。よって、特定の分野の電子文書が文書DB100に記憶されている場合、当該分野で頻繁に用いられると予測されるフレーズについて、文書DB100中の電子文書における実際の出現頻度に対して重み付けして、当該出現頻度よりも大きな値を当該フレーズのスコアとして設定してもよい。また、頻繁に用いられると予測される複数のフレーズ間で、使用頻度に差があると予測されることも考えられる。このような場合、その使用頻度の差を反映させて各フレーズの実際の出現頻度に対する重み付けを行えばよい。例えば、使用頻度がより高いと予測されるフレーズの重みをより大きくすればよい。
なお、フレーズDB110中の各フレーズの出現頻度は、文書DB100中の電子文書に変更が生じること(新規登録、更新、および削除など)により変化し得る。よって、文書DB100中の電子文書の変更とそれに伴う各フレーズの出現頻度の変化に応じて、フレーズDB110中の各フレーズのスコアを更新してもよい。フレーズDB110における各フレーズのスコアの更新は、例えば、文書DB100中の電子文書の変更の時点で行ってもよいし、一定期間ごとに行ってもよい、あるいは、例えば、ユーザまたは管理者などにより指示されたタイミングでフレーズDB110の更新を行ってもよい。
入力受付部120は、マウスおよびキーボードなどの入力装置を介したユーザの入力を受け付ける。入力受付部120は、受け付けた入力の情報を、その内容に応じて対象テキスト取得部130または候補フレーズ挿入部170に渡す。
対象テキスト取得部130は、文書DB100中の電子文書または入力受付部120で受け付けられた入力テキストから、処理対象のテキストを取得する。対象テキスト取得部130は、例えば、表示装置(図示しない)に表示されたテキストにおいてユーザが指定した位置の前後の文字列を処理対象として取得する。例えば図2を参照し、文書DB100中の電子文書または入力受付部120で受け付けられた入力テキストを表示装置に表示させた表示画面200において、ユーザが入力装置を用いて矢印Cで示す位置にカーソルを合わせたとする。この例の場合、対象テキスト取得部130は、入力受付部120を介してカーソルの位置を表す情報を取得し、このカーソル位置をユーザによる指定位置とみなして指定位置の前後の文字列を取得する。このとき、表示画面200に文書DB100中の電子文書が表示されていれば文書DB100から該当する文字列が取得され、入力受付部120で受け付けられた入力テキストが表示画面200に表示されていれば入力テキストを記憶する一時記憶装置(図示しない)から該当する文字列が取得される。また、このとき取得される文字列は、指定位置の前方向および後方向において最初に現れるフレーズの区切り文字の間の文字列であってよい。例えば、指定位置から前方向および後方向の文字列を一文字ずつ調べて、予め設定されたフレーズの区切り文字(句点、感嘆符、疑問符、改行記号など)を発見した時点で、指定位置と当該区切り文字との間の文字列を取得する。ここで用いられる区切り文字は、上述のフレーズDB110に記憶されるフレーズを決定するために予め設定される区切り文字と同様であってよい。図2の例では、指定位置を含む一文「有意なリンパ節腫大は認められません」が取得される。
なお、本実施形態の例の説明において、指定位置の「前後」の文字列とは、横書きの文書であれば指定位置の「左右」の文字列を意味し、縦書きの文書であれば指定位置の「上下」の文字列を意味する。
再び図1を参照し、候補フレーズ取得部140は、対象テキスト取得部130が取得した処理対象テキストにおける指定位置の前の文字列を前半部分に含むフレーズおよびそのスコアと、指定位置の後の文字列を後半部分に含むフレーズおよびそのスコアと、をフレーズDB110から取得する。「指定位置の前の文字列を前半部分に含むフレーズ」は、当該フレーズの最初の文字から始まる文字列が指定位置の前の文字列と一致するフレーズである。「指定位置の後の文字列を後半部分に含むフレーズ」は、当該フレーズの最後の文字で終わる文字列が指定位置の後の文字列と一致するフレーズである。以下、候補フレーズ取得部140が取得するフレーズを「候補フレーズ」とも呼ぶ。候補フレーズは、処理対象のテキストに挿入される文字列の候補を含むフレーズであると言える。
図2を参照して説明した処理対象テキストの例「有意なリンパ節腫大は認められません」の場合、候補フレーズ取得部140は、指定位置の前の文字列「有意なリンパ節腫大」を検索キーとしてフレーズDB110を検索して当該文字列を前半部分に含むフレーズとそのスコアを取得する。本例で候補フレーズ取得部140が文字列「有意なリンパ節腫大」を検索キーとして検索して取得する候補フレーズとそのスコアの例を図3に示す。さらに、候補フレーズ取得部140は、指定位置の後の文字列「は認められません」を検索キーとしてフレーズDB110を検索して当該文字列を後半部分に含むフレーズとそのスコアを取得する。本例で候補フレーズ取得部140が文字列「は認められません」を検索キーとして検索して取得する候補フレーズとそのスコアの例を図4に示す。
図1の説明に戻り、候補フレーズ加工部150は、候補フレーズ取得部140が取得した候補フレーズに対する処理を行う。例えば、候補フレーズ加工部150は、各候補フレーズについて取得されたスコアを用いて、候補フレーズを順位付けする。また例えば、候補フレーズ加工部150は、各候補フレーズから、処理対象のテキストに含まれる文字列を削除する。例えば、図3の行L2の候補フレーズ「有意なリンパ節腫大や腹水の貯溜は認められません」の場合、処理対象のテキスト中の文字列「有意なリンパ節腫大」および「は認められません」を当該候補フレーズから削除して、文字列「や腹水の貯溜」を生成する。また、図4の行M1の候補フレーズ「特に異常は認められません」の例の場合、処理対象のテキスト中の文字列「は認められません」を削除し、文字列「特に異常」を生成する。候補フレーズ加工部150のより詳細な処理については後述する。
出力処理部160は、候補フレーズ加工部150の処理の結果を出力する。出力処理部160は、例えば、候補フレーズ加工部150が処理対象のテキストに含まれる文字列を削除した後の候補フレーズを、候補フレーズ加工部150が行った順位付けに従って表示装置(図示しない)に表示させる処理を行う。出力処理部160は、例えば、表示の内容および態様を指示する表示制御情報を生成し、生成した表示制御情報を表示装置に対して出力することで、表示装置への表示を実現する。出力処理部160による表示の内容および態様の具体例は後述する。
候補フレーズ挿入部170は、出力処理部160が表示させた候補フレーズの中から1つの候補フレーズをユーザが選択した場合に、入力受付部120を介してユーザの選択した候補フレーズを特定し、特定した候補フレーズを処理対象テキストの指定位置に挿入する処理を行う。処理対象のテキストが文書DB100中の電子文書から取得されていれば、当該電子文書における指定位置に、特定した候補フレーズを挿入する。入力受付部120が受け付けた入力テキストを記憶した一時記憶装置から処理対象のテキストが取得されていれば、当該一時記憶装置における入力テキスト中の指定位置に、特定した候補フレーズを挿入する。
以下、情報処理装置10の処理の例を説明する。図5は、情報処理装置10が行う処理の手順の例を示すフローチャートである。情報処理装置10は、例えば、表示装置に表示されたテキスト中の特定の位置を指定する入力をユーザが行った場合に、図5の例の手順の処理を開始する。
まず、入力受付部120は、ユーザが入力装置を用いて指定した、テキスト中の指定位置を取得する(ステップS10)。
入力受付部120から指定位置を取得した対象テキスト取得部130は、指定位置の前後の文字列を取得して処理対象テキストとする(ステップS12)。本実施形態の例において、対象テキスト取得部130は、ステップS12で、指定位置の前後で最初に現れる予め設定された区切り文字と、指定位置と、の間の文字列を取得する。対象テキスト取得部130は、取得した処理対象テキストを候補フレーズ取得部140に渡す。
なお、以下の処理手順については、図2を参照して上述した処理対象テキストの例「有意なリンパ節腫大は認められません」(指定位置は、図2の矢印cのカーソルの位置)がステップS12で取得された場合を例にとり説明する。
候補フレーズ取得部140は、対象テキスト取得部130から受け取った処理対象テキストに挿入される文字列の候補を含む候補フレーズをフレーズDB110から取得する(ステップS14)。ステップS14で、候補フレーズ取得部140は、例えば、候補フレーズを指定位置で分割し、指定位置の前の文字列および指定位置の後の文字列のそれぞれを検索キーとしてフレーズDB110を検索する。そして、指定位置の前の文字列を前半部分に含むフレーズおよびそのスコアと、指定位置の後の文字列を後半部分に含むフレーズおよびそのスコアと、をフレーズDB110から取得する。
本例において、ステップS14で、指定位置の前の文字列「有意なリンパ節腫大」を前半部分に含むフレーズおよびそのスコアとして図3の表に例示する候補フレーズおよびスコアの組が取得され、指定位置の後の文字列「は認められません」を後半部分に含むフレーズおよびそのスコアとして図4の表に例示する候補フレーズおよびスコアの組が取得されるとする。図3および図4を参照し、指定位置の前の文字列および指定位置の後の文字列の両方を含む候補フレーズは、フレーズDB110から2回取得される。例えば、候補フレーズ「有意なリンパ節腫大は認められません」,「有意なリンパ節腫大や腹水の貯溜は認められません」は、それぞれ、指定位置の前の文字列を前半部分に含むフレーズとして取得され、かつ、指定位置の後の文字列を後半部分に含むフレーズとして取得される(図3の行L1,L2および図4の行M2,M3参照)。また、ステップS14では、処理対象テキストと同一の文字列が取得されることもある(図3の行L1および図4の行M2参照)。
なお、候補フレーズ取得部140は、ステップS14で取得した候補フレーズおよびそのスコアを、指定位置の前および後のいずれの文字列を含むフレーズとして取得したかを表す情報と共に、候補フレーズ加工部150に渡す。
候補フレーズおよびそのスコアを候補フレーズ取得部140から受け取った候補フレーズ加工部150は、各候補フレーズのスコアを用いて候補フレーズを順位付けする(ステップS16)。本実施形態の例では、ステップS16で、候補フレーズ加工部150は、まず、各候補フレーズが指定位置の前および後のいずれの文字列を含むかに応じて、当該候補フレーズのスコアを用いて新たなスコアを決定する。次に、各候補フレーズについて決定した新スコアの大きい順に候補フレーズを順位付けする。
各候補フレーズの新スコアは、例えば、次の式(1)に従って計算される。
S=s1×α+s2×β (1)
S=s1×α+s2×β (1)
式(1)において、s1は、指定位置の前の文字列を含む候補フレーズのスコアを表し、s2は、指定位置の後の文字列を含む候補フレーズのスコアを表す。αおよびβは、重み付け係数である。αおよびβの値は、例えば、予め設定される定数であってよい。あるいは、αおよびβの値として、計算対象の候補フレーズの長さ(候補フレーズに含まれる文字の数)を用いてもよい。候補フレーズの長さを用いる場合、α=βとなる。
指定位置の前および後のいずれか一方の文字列だけを含む候補フレーズについて式(1)の値Sを計算する場合、指定位置の前および後のいずれの文字列を含むかに応じてs1およびs2の一方に当該候補フレーズのスコアを代入し、他方に値「0」を代入して計算する。指定位置の前および後の両方の文字列を含む候補フレーズの場合、s1およびs2の両方に当該候補フレーズのスコアを代入して計算する。例えば、図3の行L1および図4の行M2の候補フレーズ「有意なリンパ節腫大は認められません」の場合、スコアは「189」であり、指定位置の前の文字列を含み、かつ指定位置の後の文字列を含むことから、式(1)のS=189×α+189×βとなる。また、図3の行L2および図4の行M3の候補フレーズ「有意なリンパ節腫大や腹水の貯溜は認められません」の場合(スコアは「167」)も、指定位置の前および後の文字列を含むことから、式(1)のS=167×α+167×βとなる。また、指定位置の前の文字列だけを含む候補フレーズの例として、図3の行L3「有意なリンパ節腫大は指摘できません」の場合(スコアは「105」)、式(1)のS=105×α+0×βとなる。指定位置の後の文字列だけを含む候補フレーズの例として、図4の行M1「特に異常は認められません」の場合(スコアは「288」)、式(1)のS=0×α+288×βとなる。
図6に、図3および図4に例示する各候補フレーズについて式(1)に従って決定される新スコアの例を示す。図6は、式(1)において、α=2.0,β=1.0とした場合の例である。図6では、候補フレーズを、決定された新スコアが大きい順に示す。候補フレーズ加工部150は、図5のステップS16で、図6の例の表の行K1〜K5の候補フレーズの順に高い順位を付ける。
図5の例の手順の説明に戻り、ステップS16の後、候補フレーズ加工部150は、指定位置の前および後の文字列を、各候補フレーズから削除する(ステップS18)。ステップS18では、各候補フレーズにおいて、処理対象テキストと重複する部分が削除される。よって、例えば図6の行K1のように、処理対象テキスト「有意なリンパ節腫大は認められません」と同一の文字列から構成される候補フレーズについては、ステップS18で、候補フレーズの集合から当該候補フレーズ自体が削除されることになる。図7に、図6に例示する各候補フレーズに対してステップS18の処理を行った結果の例を示す。図7を参照すると、図6の行K1(処理対象テキストと同一の候補フレーズ)は、図7の例の表には存在しない。また、図7の行K2〜K5に示すフレーズは、それぞれ、図6の行K2〜K5の候補フレーズから、処理対象テキストと重複する部分(つまり、処理対象テキストにおける指定位置の前の文字列および後の文字列)を削除したものである。
再び図5を参照し、候補フレーズ加工部150は、ステップS16およびステップS18の処理の結果を出力処理部160に渡す。候補フレーズ加工部150は、さらに、各候補フレーズが指定位置の前および後のいずれの文字列を含むフレーズとしてフレーズDB110から取得されたものであるかを表す情報を出力処理部160に渡す。
出力処理部160は、処理対象テキストと重複する部分を削除した結果の各候補フレーズを、候補フレーズ加工部150が付した順位に従って表示装置(図示しない)に表示させる処理を行う(ステップS20)。また、本実施形態の例では、ステップS20において、出力処理部160は、各候補フレーズが指定位置の前および後のいずれの文字列を含むフレーズとしてフレーズDB110から取得されたかに応じて異なる態様で各候補フレーズを表示装置に表示させる。つまり、各候補フレーズが、(i)指定位置の前の文字列を前半部分に含むフレーズとしてのみ取得された場合、(ii)指定位置の後の文字列を後半部分に含むフレーズとしてのみ取得された場合、および、(iii)指定位置の前の文字列を前半部分に含むフレーズとして、かつ指定位置の後の文字列を後半部分に含むフレーズとして取得された場合、の3つの場合に応じて異なる態様で各候補フレーズを表示させる。
図8に、ステップS20で表示装置に表示される表示画面の例を示す。図8の例において、処理対象テキストを含む元のテキストの表示画面200と、候補フレーズの表示画面300と、が表示される。表示画面300は、処理対象テキスト「有意なリンパ節腫大は認められません」の下方に配置されている。また、表示画面300において、図7の例の表の候補フレーズ「や腹水の貯溜」,「特に異常」,「は指摘できません」,「などの異状を指摘できません」が、新スコアの高い順(ステップS16で決定された順位の高い順)に表示されている。表示画面300中の候補フレーズのうち、「や腹水の貯溜」は、上記(iii)の場合に、「特に異常」は、上記(ii)の場合に、「は指摘できません」および「などの異状を指摘できません」は、上記(i)の場合に該当する。表示画面300において、各候補フレーズは、(i),(ii),(iii)の場合に応じて異なる地模様の枠内に表示されている。また、各候補フレーズは、当該候補フレーズに対して処理対象テキストの指定位置の前および後のいずれの文字列が接続されるかに応じて、指定位置の前側または後側に配置される。例えば、(ii)に該当する候補フレーズ「特に異常」に対しては、その後に指定位置の後の文字列が接続され、指定位置の前の文字列が接続されることはないことから、当該候補フレーズは、指定位置の前側に配置される。また、その他の3つの候補フレーズは、いずれも、指定位置の前の文字列の後に接続されることから、指定位置の後側に配置される。
なお、図8の表示画面300の変形例として、各候補フレーズを(i),(ii),(iii)の場合に応じて異なる地模様の枠内に表示させる代わりに、異なる色の枠内に表示させてもよい。さらに他の例では、各候補フレーズを(i),(ii),(iii)の場合に応じて異なる文字色またはフォントで表示させてもよい。
図9は、ステップS20で表示装置に表示される表示画面の他の例を示す。図9の例において、処理対象テキストを含む元のテキストの表示画面200と、候補フレーズの表示画面302と、が表示される。表示画面302は、処理対象テキスト「有意なリンパ節腫大は認められません」の下方に、その左上の角を指定位置に合わせて配置されている。表示画面302において、図8の例の表示画面300と同様、候補フレーズ「や腹水の貯溜」,「特に異常」,「は指摘できません」,「などの異状を指摘できません」が、ステップS16で決定された順位の高い順に表示されている。表示画面302において、各候補フレーズに対応づけて示される「前 後」,「後」,「前」の文字列は、各候補フレーズが上記(i),(ii),(iii)のいずれの場合に該当するかに応じて異なる。上記(iii)に該当する候補フレーズ「や腹水貯溜」は、処理対象テキストの指定位置の前の文字列「有意なリンパ節腫大」の後に続き、さらに、当該候補フレーズの後に処理対象テキストの指定位置の後の文字列「は認められません」が続く。このことから、候補フレーズ「や腹水貯溜」に対応づけて、当該候補フレーズが指定位置の「前」および「後」の文字列に接続される旨を表す文字列「前 後」が示される。また、上記(ii)に該当する候補フレーズ「特に異常」は、処理対象テキストの指定位置の後の文字列「は認められません」の前に接続され、指定位置の前の文字列には接続されない。このことを表す文字列「後」が候補フレーズ「特に異常」に対応づけられて示される。また、上記(iii)に該当する候補フレーズ「は指摘できません」,「などの異状を指摘できません」は、それぞれ、処理対象テキストの指定位置の前の文字列「有意なリンパ節腫大」の後に接続され、指定位置の後の文字列には接続されない。このことを表す文字列「前」が、これらの各候補フレーズに対応づけられて示される。
なお、図9の表示画面302において、その変形例として、(i),(ii),(iii)のいずれの場合に該当するかに応じて、異なる地模様または色の枠内に候補フレーズを表示させたり、異なる文字色またはフォントで候補フレーズを表示させたりしてもよい。
再び図5を参照し、入力受付部120において、ステップS20で表示された候補フレーズのうちの1つのユーザによる選択を受け付ける(ステップS22)。ステップS22では、例えば、図8または図9に例示するような候補フレーズの表示画面を確認したユーザが、入力装置を用いて表示画面中の候補フレーズのうちの1つを選択する指示を入力した場合に、当該入力を入力受付部120が受け付ける。入力受付部120は、選択された候補フレーズを特定する情報を候補フレーズ挿入部170に渡す。
選択された候補フレーズを特定する情報を入力受付部120から受け取った候補フレーズ挿入部170は、選択された候補フレーズを処理対象テキストにおける指定位置に挿入する(ステップS24)。ステップS24の後、図5の例の手順の処理は終了する。
なお、図5を参照して以上で説明した処理の例は、情報処理装置10の処理手順の一例に過ぎず、上記で説明した例に限定されるものではない。例えば、図5の例の手順において、ステップS16とステップS18との処理の順番を入れ替えてもよい。すなわち、ステップS14で取得された各候補フレーズから、処理対象テキストと重複する部分を削除した(ステップS18)後、ステップS16を参照して上述したように各候補フレーズの順位付けを行ってもよい。この例では、ステップS14で取得された候補フレーズのうち、処理対象テキストと同一の候補フレーズを除外した上で各候補フレーズの新スコアの決定および順位付けが行われる。
図5の例の手順の他の変形例として、ステップS16で、各候補フレーズの新スコアを決定および順位付けを行う代わりに、各候補フレーズの新スコアを決定する処理だけを行ってもよい。この例の場合、ステップS20で候補フレーズを出力するときに、出力処理部160において、新スコアの大きい順に各候補フレーズを順位付けして出力すればよい。
さらに他の変形例として、ステップS24で、選択された候補フレーズを処理対象テキストの指定位置に挿入する処理を常に行う代わりに、当該候補フレーズが指定位置の前および後のいずれの文字列を含むフレーズとして取得されたものであるかに応じて、処理対象テキストの一部を候補フレーズで置換してもよい。例えば、図9を参照し、指定位置の文字列の前および後の文字列に接続する候補フレーズ「や腹水貯溜」が選択された場合は指定位置に挿入し、指定位置の文字列の後の文字列だけに接続する候補フレーズ「特に異常」が選択された場合は、指定位置の前の文字列「有意なリンパ節腫大」を当該候補フレーズ「特に異常」で置換するようにする。また、指定位置の文字列の前の文字列だけに接続する候補フレーズ「は指摘できません」または「などの異状を指摘できません」が選択された場合は、指定位置の後の文字列「は認められません」を選択された候補フレーズで置換するようにする。
以上に例示した情報処理装置10は、典型的には、汎用のコンピュータにて上述の情報処理装置10の各部の機能又は処理内容を記述したプログラムを実行することにより実現される。コンピュータは、例えば、ハードウエアとして、図10に示すように、CPU(中央演算装置)80、メモリ(一次記憶)82、各種I/O(入出力)インタフェース84等がバス86を介して接続された回路構成を有する。また、そのバス86に対し、例えばI/Oインタフェース84経由で、ハードディスクドライブ(HDD)88やCDやDVD、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体を読み取るためのディスクドライブ90が接続される。このようなドライブ88又は90は、メモリに対する外部記憶装置として機能する。実施形態の処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク経由で、HDD88等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがメモリに読み出されCPUにより実行されることにより、実施形態の処理が実現される。
なお、以上では、情報処理装置10を1台のコンピュータにより実現する例の実施形態を説明したが、情報処理装置10の上述の例の各種の機能を複数のコンピュータに分散させて実現してもよい。
10 情報処理装置、80 CPU、82 メモリ、84 I/Oインタフェース、86 バス、88 HDD、90 ディスクドライブ、100 文書DB、110 フレーズDB、120 入力受付部、130 対象テキスト取得部、140 候補フレーズ取得部、150 候補フレーズ加工部、160 出力処理部、170 候補フレーズ挿入部。
Claims (8)
- 処理対象の文字列である対象文字列における指定位置を受け付ける受付ステップと、
記憶手段に記憶された複数の文字列から、前記対象文字列における前記指定位置の前の文字列から始まる文字列と、前記対象文字列における前記指定位置の後の文字列で終わる文字列と、を特定する特定ステップと、
前記特定ステップにおいて特定された文字列のうち前記対象文字列と異なる文字列を表示手段に表示させる指示を含む表示制御情報を出力する出力ステップと、
をコンピュータに実行させるためのプログラム。 - 前記記憶手段は、さらに、ある文書の集合における前記複数の文字列それぞれの出現頻度に基づいて予め求められた前記複数の文字列それぞれの重要度を記憶し、
前記特定ステップにおいて、さらに、前記対象文字列における前記指定位置の前の文字列から始まる文字列および前記対象文字列における前記指定位置の後の文字列で終わる文字列それぞれの前記重要度を特定し、
前記表示制御情報は、さらに、前記特定ステップにおいて特定された各文字列の前記重要度を用いて決定された各文字列の順位に応じて、前記特定ステップにおいて特定された文字列のうち前記対象文字列と異なる文字列を前記表示手段に表示させる指示を含む、
ことを特徴とする請求項1に記載のプログラム。 - 前記特定ステップにおいて特定された文字列のそれぞれから、前記指定位置の前の文字列および前記指定位置の後の文字列を削除する削除ステップ、
をさらに前記コンピュータに実行させ、
前記表示制御情報は、さらに、前記削除ステップの処理を行った結果の文字列を表示の対象とする指示を含む、
ことを特徴とする請求項1または2に記載のプログラム。 - 前記表示制御情報は、前記指定位置の前の文字列および前記指定位置の後の文字列の両方を含む文字列と、前記指定位置の前の文字列のみを含む文字列と、前記指定位置の後の文字列のみを含む文字列と、のそれぞれに対して前記削除ステップの処理を行った結果の文字列を、互いに異なる態様で前記表示手段に表示させる指示をさらに含む、
ことを特徴とする請求項3に記載のプログラム。 - 前記各文字列の順位は、前記特定ステップにおいて特定された各文字列の前記重要度に基づいて、かつ、前記特定された各文字列が前記対象文字列における前記指定位置の前および後の文字列のいずれを含むかに応じて決定される、
ことを特徴とする請求項2から4のいずれか1項に記載のプログラム。 - 前記各文字列の順位は、前記特定ステップにおいて特定された各文字列の長さにさらに基づいて決定される、
ことを特徴とする請求項2から5のいずれか1項に記載のプログラム。 - 前記対象文字列および前記記憶手段に記憶された複数の文字列は、それぞれ、当該文字列を含む文書において、予め設定された区切り文字によって区切られる単位の文字列である、
ことを特徴とする請求項1から6のいずれか1項に記載のプログラム。 - 処理対象の文字列である対象文字列における指定位置を受け付ける受付手段と、
記憶手段に記憶された複数の文字列から、前記対象文字列における前記指定位置の前の文字列から始まる文字列と、前記対象文字列における前記指定位置の後の文字列で終わる文字列と、を特定する特定手段と、
前記特定手段で特定された文字列のうち前記対象文字列と異なる文字列を表示手段に表示させる指示を含む表示制御情報を出力する出力手段と、
を備えることを特徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010026824A JP2011164924A (ja) | 2010-02-09 | 2010-02-09 | プログラムおよび情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010026824A JP2011164924A (ja) | 2010-02-09 | 2010-02-09 | プログラムおよび情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011164924A true JP2011164924A (ja) | 2011-08-25 |
Family
ID=44595534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010026824A Pending JP2011164924A (ja) | 2010-02-09 | 2010-02-09 | プログラムおよび情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011164924A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014219834A (ja) * | 2013-05-08 | 2014-11-20 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
-
2010
- 2010-02-09 JP JP2010026824A patent/JP2011164924A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014219834A (ja) * | 2013-05-08 | 2014-11-20 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US10025772B2 (en) | 2013-05-08 | 2018-07-17 | Sony Corporation | Information processing apparatus, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007004633A (ja) | 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 | |
JP4502615B2 (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
WO2013140497A1 (ja) | シーケンスプログラム作成装置 | |
JP2008250708A (ja) | 入力文字列予測装置および入力文字列予測プログラム | |
JP2018503917A (ja) | キーワードに基づくテキスト検索の方法及び装置 | |
JP2000187658A (ja) | 文字列予測方法、及び文字列予測装置 | |
JP5482236B2 (ja) | プログラムおよび情報処理装置 | |
JP2011164924A (ja) | プログラムおよび情報処理装置 | |
JP2019148859A (ja) | フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法 | |
JP4416644B2 (ja) | 予測機能付き文字処理装置、方法、記録媒体およびプログラム | |
KR100918489B1 (ko) | 텍스트 비교 방법 및 텍스트 비교 시스템 | |
JP4302918B2 (ja) | ハングル文字の生成方法及び辞書引方法 | |
JP5393816B2 (ja) | 情報検索装置および情報検索方法 | |
JP6051780B2 (ja) | 情報検索装置、情報検索方法、およびプログラム | |
JP7092992B2 (ja) | 文書管理プログラム、文書管理装置および文書管理方法 | |
JP6884172B2 (ja) | 計算機システム及び文書の評価方法 | |
Miller et al. | Cluster-based find and replace | |
US20250013708A1 (en) | Information processing system, method of controlling information processing system, and storage medium | |
US20180052819A1 (en) | Predicting terms by using model chunks | |
JP4057166B2 (ja) | 文字列検索装置および方法ならびに文字列検索プログラムを記録したコンピュータで読取可能な記録媒体 | |
JP5861382B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
JPH03266066A (ja) | 属性付き文字列置換装置 | |
JP5742454B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
JP5768561B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
JP6213656B2 (ja) | 情報検索装置、情報検索方法、およびプログラム |