[go: up one dir, main page]

JP5573257B2 - Character input program and communication terminal device - Google Patents

Character input program and communication terminal device Download PDF

Info

Publication number
JP5573257B2
JP5573257B2 JP2010057346A JP2010057346A JP5573257B2 JP 5573257 B2 JP5573257 B2 JP 5573257B2 JP 2010057346 A JP2010057346 A JP 2010057346A JP 2010057346 A JP2010057346 A JP 2010057346A JP 5573257 B2 JP5573257 B2 JP 5573257B2
Authority
JP
Japan
Prior art keywords
character string
conversion
reply
replacement
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010057346A
Other languages
Japanese (ja)
Other versions
JP2011192002A (en
Inventor
拓也 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2010057346A priority Critical patent/JP5573257B2/en
Publication of JP2011192002A publication Critical patent/JP2011192002A/en
Application granted granted Critical
Publication of JP5573257B2 publication Critical patent/JP5573257B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、電子メールの送信および受信を行う機能を具備するコンピュータに、文字を入力する操作に応じて送信対象のメールに前記操作に応じた文字列を入力する処理を実行させるためのプログラム、およびこのプログラムを用いた通信端末装置に関する。   The present invention provides a program for causing a computer having a function of transmitting and receiving an e-mail to execute a process of inputting a character string corresponding to the operation to a mail to be transmitted according to an operation of inputting characters, The present invention also relates to a communication terminal device using this program.

日本国内の携帯電話には、文字入力の煩雑さを解消するために、入力対象の文字の読みを構成する仮名文字を入力する操作が行われる都度、その入力時点での読みに対応する変換候補を表示する機能が設定されている(以下、この機能を「予測変換機能」という。)。この予測変換機能により、ユーザは、読みを全て入力しなくとも、目的とする文字列が変換候補として表示されたときに、その変換候補を選択して確定することができるので、文字入力にかかる手間は大幅に軽減される。   For mobile phones in Japan, conversion candidates corresponding to reading at the time of input each time an operation is performed to input kana characters that make up the reading of the characters to be input, in order to eliminate the complexity of character input Is set (hereinafter, this function is referred to as “predictive conversion function”). This predictive conversion function allows the user to select and confirm the conversion candidate when the target character string is displayed as a conversion candidate without inputting all the readings. The effort is greatly reduced.

さらに、利便性をより向上させた機種として、受信したメールに対する返信用のメールを作成する場合に、受信メールに含まれている単語に対応する読みが入力されたことに応じて、受信メール中の該当単語を上位の変換候補として表示する機能を有するものがある。以下では、この機能を「返信自動学習機能」という。
返信自動学習機能は、受信メールに対する返信用のメールが作成されているときのみ有効となる。
In addition, when creating a reply email for a received email as a model that has improved convenience, a response corresponding to the word included in the received email is entered, Have a function of displaying the corresponding word as an upper conversion candidate. Hereinafter, this function is referred to as “reply automatic learning function”.
The reply automatic learning function is effective only when a reply mail for the received mail is created.

上記の返信自動学習機能に関する先行技術文献として、たとえば、特許文献1が存在する。
特許文献1には、受信メールを基にした返信メールの作成が指示されたことを契機に、受信メールに対する単語の抽出を行い、未登録の単語が抽出された場合には、その単語を使用頻度が0の状態で登録し、既登録の単語が抽出された場合には、その単語に使用頻度例外フラグをセットすることや、受信メールに基づいた返信の場合にのみ、入力された読みにより抽出された変換候補のうち使用頻度が0のもの、または使用頻度例外フラグがセットされているものを上位に表示することが記載されている。
For example, Patent Document 1 exists as a prior art document related to the automatic reply learning function.
In Patent Literature 1, when an instruction to create a reply mail based on the received mail is given, a word is extracted from the received mail, and if an unregistered word is extracted, the word is used. If you register with a frequency of 0 and an already registered word is extracted, set the usage frequency exception flag for that word, or reply only based on the received mail. Among the extracted conversion candidates, it is described that the one with a usage frequency of 0 or the one with the usage frequency exception flag set is displayed at the top.

また、特許文献2には、受信メールに記載されていない文字列であっても、受信メールの内容から入力される可能性が高くなると思われる文字列を表示することを課題とする発明が開示されている。具体的にこの特許文献2には、辞書内の単語を複数のカテゴリに分類し、受信メールに対する返信メールの作成指示を受けた場合に、受信メールを解析して文書中の単語に対応する分類を特定し、読みの入力に対し、受信メールに対する処理で特定された分類に対応する単語を優先して表示することが記載されている。この処理により、たとえば、「大阪」という地名に属する単語を含む受信メールに対する返信メールが作成されているときに、「う」という読みの入力があったときには、「梅田」などの地名を変換候補として表示させることが可能になる。   Further, Patent Document 2 discloses an invention in which even a character string that is not described in a received mail displays a character string that is likely to be input from the contents of the received mail. Has been. Specifically, this Patent Document 2 classifies words in a dictionary into a plurality of categories, and when receiving a reply mail creation instruction for the received mail, analyzes the received mail and classifies the words corresponding to the words in the document. It is described that the word corresponding to the classification specified in the processing for the received mail is preferentially displayed with respect to the input of reading. With this process, for example, when a reply mail is created for a received mail containing a word that belongs to the place name "Osaka", if a reading of "U" is entered, the place name such as "Umeda" Can be displayed.

特開2006−344039号公報JP 2006-344039 A 特開2007−94786号公報JP 2007-94786 A

返信自動学習機能は利便性の高い機能であるが、この機能が常に役にたつとは限らない。その一例を図15を用いて説明する。
図15では、受信メールの一例を示すとともに、この受信メールに対する返信メールの作成画面として、返信自動学習機能および予測変換機能が適用された画面(A)と、予測変換機能のみが適用された画面(B)とを例示する。いずれの例でも、受信メールの中の「花見に行きませんか?」という問いかけに対し、「い」という読みが入力され、その読みに対応する変換候補が表示されている。双方の画面の比較や受信メールの内容から明らかなように、画面(A)の変換候補のうち、第1位の「行きませんか」と第2位の「今から」が返信自動学習機能により抽出されたものであり、第3位以下の変換候補は予測変換機能により抽出されたものである。
The automatic reply learning function is a highly convenient function, but this function is not always useful. An example of this will be described with reference to FIG.
FIG. 15 shows an example of the received mail, and as a reply mail creation screen for the received mail, a screen (A) to which the automatic reply learning function and the predictive conversion function are applied, and a screen to which only the predictive conversion function is applied (B) is illustrated. In either example, in response to the question “Would you like to go to cherry blossom viewing?” In the received mail, a reading “I” is entered, and conversion candidates corresponding to the reading are displayed. As is clear from the comparison of both screens and the contents of the received mail, among the conversion candidates on screen (A), the first “Do not go” and the second “From now” reply automatic learning function The conversion candidates of the third and lower ranks are extracted by the predictive conversion function.

通常、上記の例の「行きませんか?」のように、活用語を含む問いかけに対し、同じ活用語を用いて返答する場合には、「行きます」や「行きません」のように、問いかけとは異なる言い回しが用いられるはずである。
しかし、一般的な返信自動学習機能では、受信メール中に含まれる文節単位の文字列がそのまま登録されるから、活用形を含む語に対しても、画面(A)のように、受信メールに含まれる表現「行きませんか」がそのまま表示される。図15の画面(A)には、「行く」という変換候補も表示されているが、この表示は予測変換機能によるものである。予測変換機能による候補の抽出では、過去の使用頻度に基づいて変換候補の表示順序が定められるので、「行く」の使用頻度が高くない場合には、優先的に表示されることはない。また、図示例の場合、「行きましょう」「行きます」など、応答として使用される可能性の高い候補が表示されていないので、目的とする候補を呼び出すのに手間がかかる。
Normally, when you answer a question that includes a usage word, such as “Would you like to go?” In the example above, like “I will go” or “I will not go”. A different wording from the question should be used.
However, in the general automatic reply learning function, the character string of the phrase unit included in the received mail is registered as it is, so even a word including a utilization form is also displayed in the received mail as shown in the screen (A). The included expression “Would you like to go?” Is displayed as it is. The screen (A) in FIG. 15 also displays a conversion candidate “go”. This display is based on the predictive conversion function. In candidate extraction by the predictive conversion function, since the display order of conversion candidates is determined based on the past use frequency, when the use frequency of “go” is not high, it is not preferentially displayed. In the illustrated example, candidates that are likely to be used as a response such as “Let's go” and “I will go” are not displayed, so it takes time to call the target candidate.

本発明は上記の問題点に着目し、活用語を含むメールを受信したことに応じて返信自動学習機能を作用させる場合に、受信メール中の活用語を用いた表現を他の表現に置き換えたものが変換候補として優先的に表示されるようにすることにより、返信自動学習機能の利便性を大幅に向上することを、課題とする。   The present invention pays attention to the above-mentioned problems, and when using the automatic reply learning function in response to the reception of the mail including the usage word, the expression using the usage word in the received mail is replaced with another expression. It is an object of the present invention to greatly improve the convenience of the automatic reply learning function by displaying things preferentially as conversion candidates.

本発明によるプログラムは、電子メールの送信および受信を行う機能を具備するコンピュータを、以下の変換ルール記憶手段、形態素解析手段、変換後文字列記憶手段、学習処理手段、候補抽出手段、候補表示手段、入力文字列確定手段として機能させることにより、上記の課題を解決する。 The program according to the present invention converts a computer having a function of transmitting and receiving an e-mail into the following conversion rule storage means, morpheme analysis means, converted character string storage means, learning processing means, candidate extraction means, candidate display means. The above problem is solved by functioning as an input character string determination means.

変換ルール記憶手段は、複数種の活用パターンについて、それぞれそのパターンの活用形による表現を他の表現に置き換えるための変換ルールとして、置き換え前の活用形と付属語との組み合わせに置き換え後の活用形と付属語との組み合わせを紐付けた構成の変換ルールを記憶し、変換後文字列記憶手段には、前記変換ルールの適用により作成される変換後文字列が保存される。形態素解析手段は、受信したメールの1つに対する形態素解析を実行する。学習処理手段は、受信したメールの1つに対する返信を指示する操作が行われたことに応じて、前記形態素解析手段に返信対象のメールに対する形態素解析を行わせた後、この形態素解析処理により抽出された活用語を含む文節を文節毎に処理対象として、処理対象文節の文字列中の活用語の活用パターンおよびその活用形と処理対象文節中の付属語との組み合わせにより前記変換ルール記憶手段を検索して当該組み合わせに適合する変換ルールを抽出するステップと、抽出された変換ルールに設定されている置き換え後の活用形と付属語との組み合わせを処理対象文節に適用して変換後文字列を作成するステップとを各処理対象文節に対して実行する。そして、作成された変換後文字列を前記返信を指示する操作に対する返信用メールの作成画面が立ち上げられている間に限り有効になるようにして、当該変換後文字列の読みに対応づけて変換後文字列記憶手段に保存するThe conversion rule storage means, for multiple types of usage patterns, is a conversion rule for replacing the expression in the usage form of the pattern with another expression, and the usage form after replacement with the combination of the usage form before replacement and the attached word. A conversion rule having a configuration in which a combination of an adjunct is associated is stored, and a post-conversion character string created by applying the conversion rule is stored in the post-conversion character string storage means . The morpheme analysis means executes morpheme analysis for one of the received mails. The learning processing means causes the morpheme analysis means to perform a morpheme analysis on the reply target mail in response to an operation for instructing a reply to one of the received mails, and then extracts by this morpheme analysis process for processing the clause for each clause comprising utilizing word that is, utilization pattern of use words in a string to be processed clauses and the conversion rule storing means by the combination with the accompanying word in its conjugations processed clause Search and extract the conversion rule that matches the combination, and apply the combination of the replacement usage type and the attached word set in the extracted conversion rule to the processing target clause, The step to be created is executed for each clause to be processed. Then, the created converted character string is made valid only while the reply mail creation screen for the operation for instructing the reply is activated, and is associated with the reading of the converted character string. Save in the character string storage means after conversion .

候補抽出手段は、返信を指示する操作に応じて立ち上げられた返信用メールの作成画面に対して入力対象の文字列の読みを入力する操作が行われたとき、前記変換後文字列記憶手段に有効な状態で保存されている変換後文字列を対象に前記入力された読みを用いた検索を実行し、読みが適合する変換後文字列を変換候補として抽出する。候補表示手段は、候補抽出手段により抽出された変換候補を含む候補表示欄を返信用メールの作成画面に表示する。
入力文字列確定手段は、候補表示欄に表示された変換候補の1つを選択する操作に応じて、選択された変換候補の文字列を返信用メールへの入力文字列として確定する。
The candidate extraction unit is configured to store the post-conversion character string storage unit when an operation of inputting a reading of a character string to be input is performed on a reply mail creation screen launched in response to an operation to instruct a reply. A search using the input reading is executed on the converted character string stored in a valid state, and a converted character string that matches the reading is extracted as a conversion candidate. The candidate display means displays a candidate display field including the conversion candidate extracted by the candidate extracting means on the reply mail creation screen.
The input character string confirming means confirms the selected conversion candidate character string as an input character string to the reply mail in response to an operation of selecting one of the conversion candidates displayed in the candidate display field.

上記に記載した2種類の記憶手段のうち、変換ルール記憶手段は、変換ルールを示す電子データが格納されたデータファイルを主体とするものである。この記憶手段は、プログラムがインストールされるコンピュータのメモリに格納される。変換後文字列記憶手段も、プログラムがインストールされるコンピュータのメモリに設定されるが、インストールされた時点ではデータは格納されておらず、学習処理手段による処理が行われて変換後文字列が作成されたときに、その変換後文字列が読みと共に格納される。 Of the two types of storage means described above, the conversion rule storage means is mainly a data file in which electronic data indicating the conversion rule is stored. This storage means is stored in the memory of a computer where the program is installed. The converted character string storage means is also set in the memory of the computer where the program is installed, but no data is stored at the time of installation, and processing by the learning processing means is performed to create a converted character string. When converted, the converted character string is stored together with the reading.

「活用パターン」とは、活用語の各活用形における変化のパターンを指す。たとえば、動詞に関しては、五段活用、下一段活用、上一段活用、カ行変格活用、サ行変格活用などの活用パターンがあげられる。また動詞の場合であれば、いずれの活用パターンでも、未然形、連用形、終止形、連体形、仮定形、命令形の各活用形に関して、変換ルールを設定することができる。   “Utilization pattern” refers to a pattern of change in each utilization form of utilization words. For example, with regard to verbs, there are utilization patterns such as five-stage utilization, lower-stage utilization, upper-stage utilization, ka-line modification utilization, sa-line modification utilization, and the like. In the case of a verb, in any utilization pattern, conversion rules can be set for each of the utilization forms of the green form, the continuous form, the end form, the combined form, the hypothesis form, and the instruction form.

なお、変換ルールとしては、ある活用形を用いた表現を他の活用形を用いた表現に置き換えるためのルールのほか、活用形を変化させずに付属語のみを変化させた表現に置き換えるためのルールを設定することもできる。   As conversion rules, in addition to rules for replacing an expression using a certain usage form with an expression using another usage form, it is possible to replace only an ancillary word without changing the usage form. You can also set rules.

上記のプログラムがインストールされたコンピュータによれば、活用語を含むメールを受信したことに応じて、ユーザがその受信メールへの返信を指示する操作を行い、形態素解析手段により受信メールから活用語を含む文節が抽出されると、この文節を処理対象として、学習処理手段により、処理対象文節を他の表現を示す文字列に変換する処理が実行される。この変換処理により生じた変換後文字列は、その文字列の読みに対応づけられて変換後文字列記憶手段に記憶される。さらに、返信用メールの作成画面に対し、変換後文字列に対応する読みが入力されると、変換後文字列記憶手段から読みに該当する変換後文字列が変換候補として抽出され、候補表示欄に表示される。さらに、表示された変換後文字列を選択する操作が行われると、この変換後文字列は入力文字列として確定され、返信用メールに入力される。 According to the computer in which the above program is installed, the user performs an operation to instruct a reply to the received mail in response to receiving the mail including the used word, and the used word is obtained from the received mail by the morphological analysis means. When the included phrase is extracted, processing for converting the processing target phrase into a character string representing another expression is executed by the learning processing unit with this clause as a processing target. The converted character string generated by this conversion processing is stored in the converted character string storage unit in association with the reading of the character string. Furthermore, when a reading corresponding to the converted character string is input to the reply mail creation screen, the converted character string corresponding to the reading is extracted as a conversion candidate from the converted character string storage means, and is displayed in the candidate display field. Is displayed. Further, when an operation for selecting the displayed converted character string is performed, the converted character string is determined as an input character string and input to the reply mail.

したがって、各種の活用パターンについて、それぞれ十分な数の変換ルールを設定して変換ルール記憶手段に記憶させておけば、受信メール中の活用語を含む文節を様々な表現の文字列に置き換え、これらを変換候補として表示させることが可能になる。よって、ユーザが、受信メールと同じ活用語を用いて受信メールとは異なる表現の文字列を入力しようとして、その文字列の読みを入力した場合に、目的の文字列を変換候補として候補表示欄に表示することが可能になる。   Therefore, if a sufficient number of conversion rules are set for each usage pattern and stored in the conversion rule storage means, the phrases containing the usage words in the received mail are replaced with character strings of various expressions. Can be displayed as conversion candidates. Therefore, when the user tries to input a character string having a different expression from the received mail using the same language as the received mail and inputs the reading of the character string, the target character string is displayed as a candidate for conversion as the target character string. Can be displayed.

本発明によるプログラムの好ましい態様では、学習処理手段は、受信したメールの1つに対する返信を指示する操作に応じて前記変換後文字列記憶手段をクリアした後に各処理対象文節に対する処理を実行する。また候補抽出手段は、前記返信を指示する操作に応じてクリアされた後の変換後文字列記憶手段を対象にした検索を実行するIn a preferred aspect of the program according to the present invention, the learning processing means executes processing for each processing target clause after clearing the converted character string storage means in response to an operation for instructing a reply to one of the received mails. The candidate extracting unit executes a search for the converted character string storage unit after being cleared in response to the operation for instructing the reply .

本発明によるプログラムが導入されたコンピュータによれば、所定の活用語の活用形と付属語との組み合わせによる文字列を、同じ活用語を用いた他の表現を示す文字列に容易に変換することが可能になる。 According to the computer in which the program according to the present invention is introduced, it is possible to easily convert a character string based on a combination of a predetermined usage word and an attached word into a character string indicating another expression using the same usage word. Is possible.

さらに本発明によるプログラムの他の好ましい態様では、変換ルール記憶手段が記憶する各変換ルールには、それぞれその変換ルールの使用頻度を示す情報が含まれる。また候補表示手段により変換候補として表示された変換後文字列が入力文字列確定手段により前記返信用メールへの入力文字列として確定されたときに、確定した文字列への変換に用いられた変換ルールの使用頻度を更新する使用頻度更新手段としてコンピュータを機能させるプログラムがさらに含まれる。また候補表示手段は、候補抽出手段により複数の変換後文字列が抽出されたとき、これらの変換後文字列の表示順序を、それぞれの文字列への変換に用いられた変換ルールの使用頻度を用いて決定するように構成される。   Furthermore, in another preferred aspect of the program according to the present invention, each conversion rule stored by the conversion rule storage means includes information indicating the use frequency of the conversion rule. Also, when the converted character string displayed as the conversion candidate by the candidate display means is confirmed as the input character string to the reply mail by the input character string confirmation means, the conversion used for the conversion to the confirmed character string Further included is a program that causes a computer to function as a usage frequency update means for updating the usage frequency of a rule. Further, when a plurality of converted character strings are extracted by the candidate extracting means, the candidate display means determines the display order of these converted character strings by using the frequency of use of the conversion rules used for conversion into the respective character strings. Configured to be used.

より好ましい実施態様では、変換ルール記憶手段が記憶する各変換ルールは、変換処理の観念が類似するもの毎に紐付けられ、使用頻度更新手段は、入力文字列確定手段により確定された文字列への変換に用いられた変換ルールの使用頻度とともに、この変換ルールに紐付けられている変換ルールの使用頻度を更新するように構成される。   In a more preferred embodiment, each conversion rule stored in the conversion rule storage unit is linked to each conversion rule having a similar concept, and the usage frequency update unit converts the conversion rule to the character string determined by the input character string determination unit. The usage frequency of the conversion rule used for the conversion rule is updated together with the usage frequency of the conversion rule associated with the conversion rule.

上記の各態様によれば、ユーザが好んで使用する表現への変換に用いられた変換ルールの使用頻度が高められると共に、この変換ルールにより変換された文字列の候補が上位に表示されるようになる。よって、ユーザが好んで使用する表現に適合する変換候補を上位に表示することが可能になるので、候補を選択する操作を行いやすくなり、文字入力における利便性をより一層向上することが可能になる。   According to each of the above aspects, the use frequency of the conversion rule used for the conversion to the expression that the user prefers is increased, and the character string candidates converted by the conversion rule are displayed at the top. become. Therefore, it is possible to display conversion candidates that match the expression that the user likes and uses at the top, making it easier to perform operations for selecting candidates and further improving convenience in character input. Become.

本発明が適用される通信端末装置は、電子メールの送信および受信を行う送受信部と、仮名文字が割り当てられたキーを複数含む操作部と、電子メールの文書の作成画面を表示するための表示部とを具備する。さらに、この通信端末装置には、上記のプログラムによる変換ルール記憶手段、変換後文字列記憶手段、形態素解析手段、学習処理手段、候補抽出手段、候補表示手段、入力文字列確定手段の各手段が設けられる。
この通信端末装置は、たとえば、携帯電話,PDAなどのモバイル型の通信機器として構成される。また、パーソナルコンピュータも、上記のプログラムを組み込むことによって、通信端末装置として機能する。
A communication terminal device to which the present invention is applied includes a transmission / reception unit for transmitting and receiving an e-mail, an operation unit including a plurality of keys to which kana characters are assigned, and a display for displaying an e-mail document creation screen Part. Further, the communication terminal device includes a conversion rule storage means, a converted character string storage means, a morpheme analysis means, a learning processing means, a candidate extraction means, a candidate display means, and an input character string determination means according to the above program. Provided.
The communication terminal device is configured as a mobile communication device such as a mobile phone or a PDA. The personal computer also functions as a communication terminal device by incorporating the above program.

本発明によれば、活用語を含む受信メールに対する返信用のメールを作成する際に、受信メール中の活用語を含む表現を他の表現に置き換えた文字列を容易に入力することが可能になるから、文字入力における利便性を大幅に高めることが可能になる。よって、携帯電話などの操作性の悪い通信端末装置でも、効率良く返信メールを作成することが可能になる。   According to the present invention, it is possible to easily input a character string in which an expression including a usage word in a received mail is replaced with another expression when creating a reply mail for a received mail including the usage word. Therefore, it is possible to greatly improve the convenience in character input. Therefore, even a communication terminal device with poor operability such as a mobile phone can efficiently create a reply mail.

本発明が適用された携帯電話の外観を示す図である。It is a figure which shows the external appearance of the mobile telephone to which this invention was applied. 携帯電話の構成を示すブロック図である。It is a block diagram which shows the structure of a mobile telephone. 受信メールの例と、この受信メールに対する返信メールの作成画面における変換候補の表示例とを示す図である。It is a figure which shows the example of a received mail, and the example of a display of the conversion candidate in the preparation screen of the reply mail with respect to this received mail. 文字入力システムの構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of a character input system. 言い回し置換テーブルのデータ構成例を示す図である。It is a figure which shows the data structural example of a wording replacement table. 活用形テーブルのデータ構成例を示す図である。It is a figure which shows the data structural example of a utilization form table. 形態素解析の処理対象の文節と、この文節に対する形態素解析の結果とを示す図である。It is a figure which shows the clause of the processing target of morphological analysis, and the result of the morphological analysis with respect to this clause. 活用語を含む文節に対する変換処理の具体例を示す図である。It is a figure which shows the specific example of the conversion process with respect to the phrase containing a utilization word. 活用語を含む文節に対する変換処理の具体例を示す図である。It is a figure which shows the specific example of the conversion process with respect to the phrase containing a utilization word. 返信自動学習処理の概略手順を示すフローチャートである。It is a flowchart which shows the schematic procedure of a reply automatic learning process. 図10の処理のうち、辞書データの作成処理(ステップS5)に関する詳細な手順を示すフローチャートである。FIG. 11 is a flowchart showing a detailed procedure related to a dictionary data creation process (step S5) in the process of FIG. 図11の処理のうち、変換処理(ステップS16)に関する詳細な手順を示すフローチャートである。It is a flowchart which shows the detailed procedure regarding a conversion process (step S16) among the processes of FIG. 言い回し置換テーブルの他の構成例を示す図である。It is a figure which shows the other structural example of a wording replacement table. 図13の言い回し置換テーブルに対する使用頻度の更新処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the update process of the usage frequency with respect to the wording replacement table of FIG. 従来の返信自動学習機能や予測変換機能を用いた返信メールの作成画面における変換候補の表示例を示す図である。It is a figure which shows the example of a display of the conversion candidate in the creation screen of the reply mail using the conventional reply automatic learning function and the prediction conversion function.

図1は、本発明の適用例としての携帯電話の外観を、図2は、この携帯電話の電気構成を、それぞれ示す。
この実施例の携帯電話1は、表示部2や操作部3が設けられた筐体1Aの内部に、カメラ4、画像プロセッサ5、通信回路6、制御回路10などが収容された構成のもので、通話のほか、インターネットに接続したり、電子メールの送受信を行う機能を具備する。また、画像プロセッサ5による制御下でカメラによる撮像を実行し、生成された画像をパーソナルコンピュータなどの外部機器に出力したり、生成された画像を電子メールに添付して送信することもできる。
FIG. 1 shows the appearance of a mobile phone as an application example of the present invention, and FIG. 2 shows the electrical configuration of the mobile phone.
The mobile phone 1 of this embodiment has a configuration in which a camera 4, an image processor 5, a communication circuit 6, a control circuit 10, and the like are accommodated in a housing 1A provided with a display unit 2 and an operation unit 3. In addition to calling, it has functions to connect to the Internet and send and receive e-mails. It is also possible to execute imaging by the camera 4 under the control of the image processor 5 and output the generated image to an external device such as a personal computer, or transmit the generated image attached to an e-mail.

制御回路10は、CPU11のほか、主メモリ12、作業メモリ13などが含まれる。主メモリ12は、フラッシュメモリなどの不揮発性のメモリであって、プログラムや設定用のデータなどが保存される。一方、作業用メモリ13は揮発性メモリ(RAM)であって、後記する文字入力処理で抽出された変換候補や自動学習用辞書などが保存される。 Control circuit 10, in addition to the CPU 11, main memory 12, and the like work memory 13. The main memory 12 is a non-volatile memory such as a flash memory, and stores programs, setting data, and the like. On the other hand, the work memory 13 is a volatile memory (RAM), and stores conversion candidates and automatic learning dictionaries extracted by character input processing described later.

表示部2は液晶パネルにより構成される。操作部3には、「0」〜「9」の数字が割り当てられた文字キー31や十字キー32を含む複数のキーが配備される。各文字キー31には、それぞれ数字のほかに、50音の1行分の平仮名文字や、複数のアルファベット文字または記号が割り当てられる。なお、操作部3の構成は上記に限らず、たとえば、可動キーボードを表示したタッチパネルディスプレイを操作部として機能させてもよい。   The display unit 2 is composed of a liquid crystal panel. The operation unit 3 is provided with a plurality of keys including a character key 31 and a cross key 32 to which numbers “0” to “9” are assigned. In addition to numbers, each character key 31 is assigned a hiragana character of one line of 50 sounds or a plurality of alphabet characters or symbols. In addition, the structure of the operation part 3 is not restricted above, For example, you may make a touch panel display which displayed the movable keyboard function as an operation part.

メールの作成時などに日本語入力のモードが設定されると、同じ文字キー31が連続して押下されている間は、そのキーに割り当てられている仮名文字を順に呼び出し、他のキーの操作に応じて直前に呼び出された仮名文字を確定する方法により、読みを表す仮名文字列(以下、「読み文字列」という。)が組み立てられる。また、読み文字列の変化に連動して変換候補の抽出や表示が行われ、表示された変換候補の1つを選択する操作が行われたとき、その選択された候補の文字列が入力文字列として確定される。   When a Japanese input mode is set, such as when composing an email, while the same character key 31 is being pressed continuously, the kana characters assigned to that key are called in order, and other key operations are performed. A kana character string representing the reading (hereinafter referred to as “reading character string”) is assembled by a method of determining the kana character called immediately before according to the above. In addition, when conversion candidates are extracted and displayed in conjunction with changes in the reading character string and an operation for selecting one of the displayed conversion candidates is performed, the character string of the selected candidate is the input character. Confirmed as a column.

さらに、この実施例の携帯電話には返信自動学習機能が組み込まれており、受信したメールに対する返信用のメールが作成される場合に、受信メールに含まれる自立語の読みが入力されると、該当する自立語を含む変換候補が優先して表示される状態となる。特にこの実施例では、受信メール中の活用語に対応する読みが入力された場合には、該当する活用語を、受信メールとは異なる表現に変換した構成の文字列を、変換候補として表示することができる。   Furthermore, the mobile phone of this embodiment has a built-in automatic reply learning function, and when an email for replying to a received email is created, when reading of an independent word included in the received email is input, A conversion candidate including the corresponding independent word is preferentially displayed. In particular, in this embodiment, when a reading corresponding to a usage word in a received mail is input, a character string having a configuration in which the corresponding usage word is converted into an expression different from that of the received mail is displayed as a conversion candidate. be able to.

図3は、動詞の連用形を含む文節「走りませんか?」を含むメールを受信して、この受信メールに対する返信用のメールが作成している例を示す。この例の返信メールの作成画面には、「は」という読みが入力されたことに応じて候補表示欄20が立ち上げられ、読みが「は」から始まる複数の変換候補が表示されている。候補表示欄20に表示されている候補の中には、受信メールの「走りませんか?」という文節から派生した6つの候補(「走ります」「走りません」「走る」「走った」「走って」「走らない」)と、予測変換機能により抽出された候補(「早い」「花」など)が含まれている。   FIG. 3 shows an example in which a mail containing the phrase “Do you want to run?” Containing the verb continuous form is received and a reply mail for the received mail is created. In the reply mail creation screen in this example, a candidate display column 20 is activated in response to the input of “ha”, and a plurality of conversion candidates whose readings begin with “ha” are displayed. Among the candidates displayed in the candidate display column 20, there are six candidates derived from the phrase “Do you want to run?” In the received mail (“Run”, “Do not run”, “Run”, “Run”) “Run” and “do not run”) and candidates extracted by the predictive conversion function (such as “fast” and “flower”).

図4は、上記の文字入力に関わるシステムの構成を、機能ブロック図により示す。
この実施例の文字入力システム100は、制御処理部101、読み文字列組立部102、候補抽出部103、返信自動学習処理部104、形態素解析部105などの処理部と、予測変換用辞書111、返信自動学習用辞書112、形態素解析用辞書113、言い回し置換テーブル114、活用形テーブル115などの記憶部とにより構成される。各記憶部は、主メモリ12に格納されたデータファイルにより構成される。処理部の実体は、主メモリ12に格納されたプログラムを実行するCPU11である。
FIG. 4 is a functional block diagram showing a system configuration related to the above character input.
The character input system 100 of this embodiment includes a control processing unit 101, a reading character string assembly unit 102, a candidate extraction unit 103, a reply automatic learning processing unit 104, a morpheme analysis unit 105, and a processing unit, a prediction conversion dictionary 111, It is composed of a storage unit such as an automatic reply learning dictionary 112, a morphological analysis dictionary 113, a word replacement table 114, and a utilization table 115. Each storage unit is constituted by a data file stored in the main memory 12. The entity of the processing unit is the CPU 11 that executes a program stored in the main memory 12.

図中、左上に示すメーラー200は、図に示した通信回路6と協働してメールの送信および受信を行うほか、送信対象のメールの作成、受信メールの閲覧、受信フォルダおよび送信フォルダの管理などを行う。文字入力システム100は、受信メールに対する返信用のメールを作成する操作、または新規メールの作成を指示する操作に応じて起動し、操作部に対して実行された操作に応じて、読み文字列の組み立てから入力文字列の確定までの処理を実行し、確定した入力文字列をメーラー200に出力する。 In the figure, the mailer 200 shown in the upper left performs transmission and reception of mail in cooperation with the communication circuit 6 shown in FIG. 2 , creation of mail to be transmitted, browsing of received mail, reception folder and transmission folder. Perform management. The character input system 100 is activated in response to an operation for creating a reply mail for a received mail or an operation for instructing creation of a new mail, and a character string to be read in accordance with an operation performed on the operation unit 3 . The process from assembly to confirmation of the input character string is executed, and the confirmed input character string is output to the mailer 200.

形態素解析用辞書113には、テキストデータを単語の単位に分解し、それぞれの単語の品詞や活用形などを認識するのに必要な情報が格納されている。予測変換用辞書111には、複数の単語がそれぞれその読みに対応づけられて登録されている。
なお、図4では、形態素解析用辞書113や予測変換用辞書111の辞書ファイルを1つずつ示しているが、これに限らず、いずれの辞書も、複数の辞書ファイルにより構成することができる。
The morpheme analysis dictionary 113 stores information necessary for resolving text data into units of words and recognizing the part of speech and usage of each word. A plurality of words are registered in the predictive conversion dictionary 111 in association with the readings.
In FIG. 4, one dictionary file for the morphological analysis dictionary 113 and one for the predictive conversion dictionary 111 is shown. However, the present invention is not limited to this, and any dictionary can be composed of a plurality of dictionary files.

返信自動学習用辞書112は、返信自動学習機能により作成された辞書データを記憶するためのものであり、受信メールに対する返信用のメールの作成が行われている場合のみ有効化される。また、返信自動学習辞書112に格納された辞書データは、特定の返信メールに対してのみ使用されるもので、この返信メールが作成された後は、次の返信メールの作成が指示されたことに応じてクリアされる。 The automatic reply learning dictionary 112 is for storing dictionary data created by the automatic reply learning function, and is validated only when a reply mail for the received mail is created. Further, the dictionary data stored in the reply automatic learning dictionary 112 is intended to be used only for certain reply mail, after the reply mail is created, the creation of the next reply mail is instructed Cleared accordingly.

言い回し置換テーブル114および活用形テーブル115には、各種の活用語による言い回し(表現)を、同じ活用語による他の表現に置き換えるための変換ルールが格納されている。図5は言い回し置換テーブルのデータ構成例を示し、図6は活用形テーブルのデータ構成例を示す。   The wording replacement table 114 and the utilization form table 115 store conversion rules for replacing expressions (expressions) by various utilization words with other expressions by the same utilization words. FIG. 5 shows a data configuration example of the wording replacement table, and FIG. 6 shows a data configuration example of the utilization type table.

再び図4を参照して、文字入力システム100の基本的な動作を説明する。制御処理部101は、各種キー操作の受け付けや他の処理部との連絡を行いながら、表示部2への文字表示や作成中のメールへの文字入力処理を実行する。
まず、仮名文字が割り当てられた文字キー31が操作されると、制御処理部101は、どのキーが操作されたかを読み文字列組立部102に連絡して、読み文字列を組み立てさせ、組み立てられた読み文字列を表示部2に表示する。
With reference to FIG. 4 again, the basic operation of the character input system 100 will be described. The control processing unit 101 performs character display on the display unit 2 and character input processing for a mail being created while receiving various key operations and communicating with other processing units.
First, when the character key 31 to which the kana character is assigned is operated, the control processing unit 101 informs the reading character string assembling unit 102 which key has been operated to assemble the reading character string. The read character string is displayed on the display unit 2.

また、制御処理部101は、候補表示欄20を立ち上げて、新たな仮名文字の入力により読み文字列が変化する都度、候補抽出部103に変更後の読み文字列を渡して変換を指示する。候補抽出部103は、この指示に応じて予測変換用辞書111を検索し、読み文字列に前方一致する読みを有する変換候補を抽出する。さらに、候補抽出部103では、抽出された変換候補の表示順序を決定する処理を行い、決定した順序による変換候補のリストを作成して、これを制御処理部101に渡す。制御処理部101は、このリストに基づき、候補表示欄20に各変換候補を表示する。   In addition, the control processing unit 101 starts up the candidate display field 20, and whenever the reading character string changes due to the input of a new kana character, the changed reading character string is passed to the candidate extraction unit 103 to instruct conversion. . In response to this instruction, the candidate extraction unit 103 searches the predictive conversion dictionary 111 and extracts conversion candidates having a reading that matches the reading character string in the forward direction. Further, the candidate extraction unit 103 performs processing for determining the display order of the extracted conversion candidates, creates a list of conversion candidates in the determined order, and passes this to the control processing unit 101. The control processing unit 101 displays each conversion candidate in the candidate display column 20 based on this list.

また、受信メールに対する返信用のメールを作成する操作が行われた場合には、制御処理部101は、返信自動学習処理部104に受信メールのテキストデータを渡して、返信自動学習用の辞書データの作成を指示する。   When an operation for creating a reply mail for the received mail is performed, the control processing unit 101 passes the text data of the received mail to the reply automatic learning processing unit 104, and dictionary data for automatic reply learning Instruct the creation of.

上記の指示を受けた返信自動学習処理部104は、形態素解析部105に受信メールのテキストデータを渡して、形態素解析を実行させる。形態素解析部105は、形態素解析用辞書113を用いてテキストデータを文節の単位に区切って認識し、さらに各文節を、それぞれ自立語と付属語とに分けて認識する。返信自動学習処理部104は、この形態素解析の結果を用いて、受信メール中の各自立語に対応する辞書データを作成し、返信自動学習用辞書112に格納すると共に、候補抽出処理のために返信自動学習用辞書112を有効に設定する。この設定に応じて、候補抽出部103は、予測変換用辞書111および返信自動学習用辞書112の双方を検索して変換候補を抽出し、返信自動学習用辞書112から抽出された変換候補を優先して表示する。   Receiving the above instruction, the automatic reply learning processing unit 104 passes the text data of the received mail to the morpheme analysis unit 105 to execute morpheme analysis. The morpheme analysis unit 105 recognizes the text data by dividing it into phrase units using the morpheme analysis dictionary 113, and further recognizes each phrase separately into independent words and attached words. The reply automatic learning processing unit 104 creates dictionary data corresponding to each independent word in the received mail using the result of the morphological analysis, stores it in the reply automatic learning dictionary 112, and performs candidate extraction processing. The reply automatic learning dictionary 112 is set to be valid. In accordance with this setting, the candidate extraction unit 103 searches both the prediction conversion dictionary 111 and the automatic reply learning dictionary 112 to extract conversion candidates, and prioritizes the conversion candidates extracted from the automatic reply learning dictionary 112. And display.

返信自動学習処理部104は、形態素解析により抽出された自立語のうち、名詞などの非活用語に関しては、抽出された単語またはその単語を含む文節に読みを対応づけた辞書データを作成する。一方、動詞などの活用語に対しては、返信自動学習処理部104は、言い回し置換テーブル114および活用形テーブル115を用いて、この活用語を含む文節を構成する文字列を同じ活用語による他の表現を示す文字列に変換し、この変換後文字列と読みとを対応づけた辞書データを作成する。   The reply auto-learning processing unit 104 creates dictionary data that associates readings with the extracted words or phrases containing the extracted words or words that are not used among the independent words extracted by the morphological analysis. On the other hand, for verbs such as verbs, the automatic reply learning processing unit 104 uses the word replacement table 114 and the usage table 115 to change the character string that constitutes the phrase including the usage word to the same usage word. Is converted into a character string representing the expression of, and dictionary data in which the converted character string and the reading are associated with each other is created.

以下、活用語を対象にした返信自動学習処理について、詳細に説明する。
図7は、先の図3に示した受信メールに含まれる文節「走りませんか?」に対する形態素解析の結果を示す。この文節は、自立語の「走り」と付属語「ませんか?」とに分けて認識されている。さらに、自立語の「走り」は、語幹の「走」と活用語尾「り」とに分解され、語幹の読み(はし)、品詞の種類、活用パターンおよび活用形なども認識されている。
In the following, the automatic reply learning process for the target words will be described in detail.
FIG. 7 shows the result of morphological analysis for the phrase “Would you like to run?” Included in the received mail shown in FIG. This clause is recognized as being divided into the independent word “run” and the ancillary word “isn't it?”. Furthermore, the independent word “run” is broken down into the stem “run” and the inflection ending “ri”, and the reading of the stem, the type of part of speech, the utilization pattern and the utilization form are also recognized.

また、この実施例の形態素解析では、品詞の認識結果に活用パターンの認識結果を組み合わせた情報(以下、「品詞情報」という。)を作成する。また、活用形も、活用パターンに組み合わせて表現される。
たとえば、図7の例では、自立語の「走り」に対する認識結果として、ラ行五段活用の動詞であることを示す品詞情報「ラ行五段動詞」が設定されると共に、活用形に関して、「五段活用の連用形」であることを示す情報「五段連用形」が設定されている。このほか、語幹の読みや活用語尾に関しても、認識結果を示す情報が設定される。
In the morphological analysis of this embodiment, information (hereinafter referred to as “part of speech information”) in which the recognition result of the utilization pattern is combined with the recognition result of the part of speech is created. In addition, utilization forms are expressed in combination with utilization patterns.
For example, in the example of FIG. 7, the part-of-speech information “La line five-stage verb” indicating that the verb is a La line five-stage inflection is set as a recognition result for the independent word “run”. Information "5-stage continuous form" indicating that "5-stage continuous form" is set. In addition, information indicating the recognition result is set for the reading of the stem and the ending of the usage.

図5に示す言い回し置換テーブル114には、各種活用パターンに属する活用形毎に、その活用形を用いた表現を他の表現に置き換えるためのルール(以下、「置き換えルール」という。)が、複数格納されている。この例の置き換えルールは、置き換え前の表現を表す活用形および付属語パターンに、置き換え後の表現を表す置換パターンと、標準優先度と、使用頻度とを対応づけた構成のものである。図5では、五段活用の動詞の連用形を例に、具体的な置き換えルールのデータ構成を示している。   The wording replacement table 114 shown in FIG. 5 includes a plurality of rules (hereinafter referred to as “replacement rules”) for replacing the expression using the utilization form with another expression for each utilization form belonging to various utilization patterns. Stored. The replacement rule in this example has a configuration in which a replacement pattern representing an expression after replacement, a standard priority, and a usage frequency are associated with a utilization form and an attached word pattern representing an expression before replacement. FIG. 5 shows a specific data structure of a replacement rule, taking an example of a verb continuous form utilizing five steps.

また、この実施例の言い回し置換テーブル114では、各置き換えルールをID番号により管理している。以後、図5に示されている7つの置き換えルールに個別に言及する場合には、それぞれのID番号を用いて「置き換えルール1」「置き換えルール2」のようにいう。   Further, in the wording replacement table 114 of this embodiment, each replacement rule is managed by an ID number. Hereinafter, when individually referring to the seven replacement rules shown in FIG. 5, they are referred to as “replacement rule 1” and “replacement rule 2” using the respective ID numbers.

付属語パターンとは、変換前の表現に含まれる付属語の先頭部分の言い回しのパターンである。たとえば、図中の置き換えルール1および2の付属語パターン「ません〜」には、「ません」が先頭に置かれた付属語(『ません』『ませんか』『ませんよ』『ませんね』など。)が含まれ、置き換えルール3の付属語パターン「ましょう〜」には、「ましょう」が先頭に置かれた付属語(『ましょう』『ましょうか』『ましょうよ』『ましょうね』など。)が含まれる。また、付属語パターンが「任意」とされているものは、任意の文字列が付属語として設定されているもののほか、活用形によっては、付属語が設定されていないものも含まれる。   An ancillary word pattern is a wording pattern of the head part of an ancillary word included in the expression before conversion. For example, in the replacement rule 1 and 2 in the figure, the attached word pattern "None ~" has an attached word preceded by "Not" ("No" "Is it not" "No" "" ”Is included), and the adjunct pattern“ Masho ~ ”of replacement rule 3 includes an adjunct (“ Masho ”,“ Makesho ”,“ Let ’s do it ”). Yo ”,“ Masho Ne ”, etc.). In addition, the case where the adjunct pattern is “arbitrary” includes not only the case where an arbitrary character string is set as an adjunct but also the case where no adjunct is set depending on the utilization form.

置換パターンとは、変換後の表現における活用と付属語との組み合わせのパターンを示すものであるが、置き換えルール4〜7のように、活用形のみを定義した置換パターンもある。
標準優先度や使用頻度は、置き換えルールに基づき作成された変換候補の表示順序を決める際に用いられる。標準優先度は、置換パターンの一般的な使用頻度などに基づき定められたもので、この実施例では各標準優先度の値は固定されている。これに対し、使用頻度は、対応する置き換えルールにより作成された辞書データが変換候補として表示され、実際に選択されたことに応じて更新される。
The replacement pattern indicates a combination pattern of utilization and ancillary words in the expression after conversion, but there is also a replacement pattern in which only the utilization form is defined, such as replacement rules 4-7.
The standard priority and use frequency are used when determining the display order of conversion candidates created based on the replacement rule. The standard priority is determined based on the general usage frequency of the replacement pattern, and the value of each standard priority is fixed in this embodiment. On the other hand, the use frequency is updated in accordance with the fact that dictionary data created by the corresponding replacement rule is displayed as a conversion candidate and actually selected.

なお、図5の例によれば、置き換えパターン1を用いた変換処理では、活用形は変換前と同じ連用形で、付属語のみが変化した文字列が作成される。置き換えパターン2,3では、付属語パターンの末尾(〜の部分)が削除される以外は、変換前と同じ文字列が作成される。また置き換えパターン4,5,6によれば、付属語が付かず、活用形のみから成る文字列が作成される。   According to the example of FIG. 5, in the conversion process using the replacement pattern 1, the utilization form is the same continuous form as before conversion, and a character string in which only the attached words are changed is created. In the replacement patterns 2 and 3, the same character string as before conversion is created except that the end of the attached word pattern (the part of ˜) is deleted. In addition, according to the replacement patterns 4, 5, and 6, a character string having only an inflected form is created without an attached word.

図6に示す活用形テーブル115には、品詞情報の種類毎に、変換前の表現における活用語の語幹末尾の読み、変換後の活用形、変換後の語幹の読み、変換後の活用語尾の各情報を組み合わせたものが、複数登録される。活用形テーブル115に格納される1レコード分の情報は、置換パターンに定義された活用形を変換後文字列に適用して具体的な表記を導き出す際のルールを示すものである。以下、このルールを「活用形設定ルール」という。   In the utilization form table 115 shown in FIG. 6, for each type of part-of-speech information, the reading of the stem of the utilization word in the expression before conversion, the utilization form after conversion, the reading of the stem after conversion, and the utilization ending after conversion are stored. A plurality of combinations of information are registered. The information for one record stored in the utilization form table 115 indicates a rule for deriving a specific notation by applying the utilization form defined in the replacement pattern to the converted character string. Hereinafter, this rule is referred to as “utilization setting rule”.

活用形テーブル115の各活用形設定ルールには、アルファベットと数字との組み合わせによるIDコードが付与されている。具体例として図6では、ラ行五段活用の動詞に関する活用形設定ルールA1〜A5と、カ行変格活用の動詞(カ変動詞)の活用形設定ルールB1〜B5とを示している。活用形設定ルールA1〜A5のように、変換前の語幹の末尾が「任意」に設定されているものは、末尾の読みを特に考慮せずにルールがあてはめられる。また、変換後の語幹の読みが「無変換」に設定されているものは、変換前の語幹の読みを維持することを意味し、活用語尾を「無し」としたものは、活用語尾を付けないことを意味する。   Each utilization form setting rule of the utilization form table 115 is given an ID code by a combination of alphabets and numbers. As a specific example, FIG. 6 shows utilization form setting rules A1 to A5 related to verbs utilizing the five-stage ra line and utilization form setting rules B1 to B5 for verbs utilizing the K line modification (ka variation). As in the utilization form setting rules A1 to A5, when the end of the stem before conversion is set to “arbitrary”, the rule is applied without considering the reading at the end. In addition, if the stem reading after conversion is set to “No Conversion”, it means that the reading of the stem before conversion is maintained, and if the usage ending is “None”, the usage ending is added. Means no.

返信自動学習処理部104は、形態素解析の結果に基づき、受信メールから抽出された活用語を含む文節の文字列(以下、「変換対象文字列」という。)の品詞情報や付属語を認識し、これらに適合する置き換えルールを言い回し置換テーブル114から読み出す。   Based on the result of the morphological analysis, the reply automatic learning processing unit 104 recognizes part-of-speech information and ancillary words of a phrase character string (hereinafter referred to as a “character string to be converted”) including a utilization word extracted from the received mail. The replacement rules that match these are read from the wording replacement table 114.

さらに、返信自動学習処理部104は、変換前文字列の活用形の品詞情報および語幹の読みと、言い回し置換テーブル114から抽出した置き換えルールの置換パターンに定義されている活用形とに基づき活用形テーブル115を検索し、これらの情報の組み合わせに適合する活用形設定ルールを特定する。そして、特定した活用形設定ルールに定義されている変換後文字列の語幹の読みおよび活用語尾を、変換対象文字列の活用語に適用することによって、活用形の具体的な表記を導出し、これに置換パターンの付属語の定義をあてはめることによって、変換後文字列を作成する。   Further, the automatic reply learning processing unit 104 uses the prevailing form part-of-speech information and stem reading, and the utilization form defined in the replacement pattern of the replacement rule extracted from the wording replacement table 114. The table 115 is searched, and a utilization type setting rule that matches the combination of these information is specified. And, by applying the reading of the stem of the converted character string defined in the specified usage rule and the usage ending to the usage word of the conversion target character string, a concrete notation of the usage is derived, A post-conversion character string is created by applying the definition of the substitution pattern appendix to this.

図8は、ラ行五段活用の動詞の連用形を用いた文字列の例として、図3に例示した変換対象文字列「走りませんか?」をあげて、この変換対象文字列を上記の言い回し置換テーブル114および活用形テーブル115を用いて他の表現による文字列に変換する場合の処理を示す。以下、この図8を先の図5,6と合わせて参照して、言い回し置換テーブル114および活用形テーブル115を用いた変換処理を具体的に説明する。   FIG. 8 shows an example of a character string using the verb continuous form utilizing the five-stage La row, and gives the conversion target character string “Would you like to run?” Illustrated in FIG. The process in the case of converting into a character string by another expression using the wording replacement table 114 and the utilization type table 115 is shown. Hereinafter, the conversion process using the word replacement table 114 and the utilization type table 115 will be specifically described with reference to FIG. 8 together with FIGS.

図8の変換対象文字列「走りませんか?」の活用形と付属語との組み合わせにより図5に示した言い回し置換テーブル114を検索すると、この組み合わせに適合するものとして、置き換えルール1,2,4,5,6,7が抽出される。   When the word replacement table 114 shown in FIG. 5 is searched by the combination of the utilization form of the conversion target character string “Would you like to run?” In FIG. 8 and the attached word, the replacement rules 1 and 2 are assumed to be suitable for this combination. , 4, 5, 6, and 7 are extracted.

置き換えルール1は、変換対象文字列の活用語を連用形で表記したものに付属語『ます』を付けることを定義する。図6の活用形テーブル115を対象に、ラ行五段活用の動詞を連用形で表す場合の活用形設定ルールを検索すると、ルールA2がヒットする。この活用形設定ルールA2を変換対象文字列の自立語「走り」に適用すると、連用形の表記「走り」がそのまま維持される。さらに置き換えルール1の置換パターンに基づき、この表記に付属語『ます』を付けることにより、変換対象文字列とは異なる表現を示す文字列『走ります』が設定される。 The replacement rule 1 defines that an attached word “mass” is attached to a word in which a conjugation word of a conversion target character string is expressed in a continuous form. When a utilization form setting rule is retrieved for the utilization form table 115 shown in FIG. When this utilization form setting rule A2 is applied to the independent word “run” of the conversion target character string, the continuous form notation “run” is maintained as it is. Furthermore, based on the replacement pattern of the replacement rule 1, by adding the attached word “mass” to this notation, a character string “run” indicating an expression different from the conversion target character string is set.

置き換えルール2は、変換対象文字列の活用語を連用形で表記したものに付属語『ません』を付けることを定義する。この場合にも、置き換えルール1と同様に、活用形設定ルールA2が適用され、活用形の表記として『走り』が導出される。よって、この表記に、置き換えルール2の置換パターンが定義する付属語『ません』を付けることにより、変換後文字列として『走りません』が設定される。   The replacement rule 2 defines that an attached word “not” is attached to a word in which a conjugation word of a conversion target character string is expressed in a continuous form. Also in this case, similarly to the replacement rule 1, the utilization form setting rule A2 is applied, and “run” is derived as the utilization form notation. Therefore, by adding the attached word “not” defined by the replacement pattern of replacement rule 2 to this notation, “does not run” is set as the converted character string.

つぎに、置き換えルール4は、変換対象文字列の活用語を終止形で表記して、付属語を付けないことを定義する。図6の活用形テーブル115に対し、ラ行五段活用の動詞を終止形で表す場合の活用形設定ルールを検索すると、ルールA1がヒットする。よって、この活用形設定ルールA1に基づき、変換対象文字列の活用語「走り」の語幹の読みを維持し、活用語尾を『る』に変更することにより、『走る』が導出される。置き換えルール4の置換パターンには付属語が定義されていないので、この『走る』が変換後文字列として設定される。   Next, the replacement rule 4 defines that the word to be used in the conversion target character string is expressed in a terminal form and no additional word is attached. When the utilization form setting rule in the case of expressing the verb of the fifth row utilization in the last form is searched for the utilization form table 115 of FIG. 6, rule A1 is hit. Therefore, based on this utilization form setting rule A1, “run” is derived by maintaining the reading of the stem of the utilization word “run” of the conversion target character string and changing the utilization ending to “ru”. Since an attached word is not defined in the replacement pattern of the replacement rule 4, this “run” is set as a converted character string.

以下も同様に、置き換えルール5が適用される場合には、活用形設定ルールA4が適用されて、変換後文字列中の自立語「走り」が連体タ形の表記『走った』に変換され、これが変換後文字列に設定される。また、置き換えルール6が適用される場合には、活用形設定ルールA5が適用されて、変換後文字列中の活用語「走り」が連用テ形の表記『走って』に変換され、これが変換後文字列に設定される。
置き換えルール7が適用される場合には、活用形設定ルールA3が適用されて、未然形の表記として『走ら』が導出される。さらに、この表記に置き換えルール7の置換パターンに定義されている付属語『ない』が組み合わせられて、変換後文字列として『走らない』が設定される。
Similarly, when the replacement rule 5 is applied, the utilization type setting rule A4 is applied, and the free-standing word “run” in the converted character string is converted into the combined form “run”. , This is set to the converted string. In addition, when the replacement rule 6 is applied, the utilization form setting rule A5 is applied, and the utilization word “run” in the converted character string is converted into the continuous form of the notation “run”, which is converted Set to the back string.
When the replacement rule 7 is applied, the utilization type setting rule A3 is applied, and “run” is derived as an unwritten form. Further, this notation is combined with the attached word “none” defined in the replacement pattern of the replacement rule 7 to set “do not run” as the converted character string.

図9は、カ行変格活用の動詞「来る」の連用形を用いた文字列「来ませんか?」を変換対象文字列とした場合の変換処理の例を示す。
図5には記載していないが、カ行変格活用の動詞の連用形にも、置き換えルール1〜7と同内容の置き換えルールが設定されている。図9では、これらの置き換えルールのID番号を101〜107とし、変換対象文字列「来ませんか?」に対し、置き換えルール101,102,104,105,106,107が抽出されているものとする。
FIG. 9 shows an example of conversion processing when the character string “Would you like to come?” Using the continuous form of the verb “Kuru”, which utilizes the Ka-line transformation, is used as the conversion target character string.
Although not shown in FIG. 5, the replacement rules having the same contents as the replacement rules 1 to 7 are also set in the continuous form of the verb for utilizing the Ka-line modification. In FIG. 9, the ID numbers of these replacement rules are 101 to 107, and the replacement rules 101, 102, 104, 105, 106, and 107 are extracted for the conversion target character string "Will you come?" And

図6の活用形テーブル115によれば、置き換えルール101,102が適用される場合には、活用形設定ルールB2に基づき連用形の活用形『来(き)』が導出され、これに付属語が組み合わせた文字列『来ます』『来ません』が変換後文字列に設定される。また置き換えルール104が適用される場合には、活用形設定ルールB1に基づき終止形の『来る』が導出され、これがそのまま変換後文字列に設定される。 According to the utilization form table 115 in FIG. 6, when the replacement rules 101 and 102 are applied, the utilization form “Ki” is derived based on the utilization form setting rule B2, and the attached word is added to this. The combined character strings “coming” and “not coming” are set in the converted character string. Also, when the replacement rule 104 is applied, the end type “coming” is derived based on the utilization type setting rule B1, and this is set as it is in the converted character string.

置き換えルール105が適用される場合には、活用形設定ルールB4に基づき連体タ形の表記『来た』が導出され、これが変換後文字列に設定される。置き換えルール106が適用される場合には、活用形設定ルールB5に基づき連用テ形の『来て』が導出され、これが変換後文字列に設定される。置き換えルール107が適用される場合には、活用形設定ルールB3に基づき未然形の『来(こ)』が導出され、これに置き換えルール107に定義されている付属語の『ない』を組み合わせた文字列『来ない』が変換後文字列に設定される。 When the replacement rule 105 is applied, the notation “Kita” in the form of a combined form is derived based on the utilization type setting rule B4, and this is set in the converted character string. When the replacement rule 106 is applied, the continuous type “Come” is derived based on the utilization type setting rule B5, and this is set in the converted character string. When the replacement rule 107 is applied, the original form “K” is derived based on the utilization form setting rule B 3, and this is combined with “None” of the ancillary word defined in the replacement rule 107. The character string “Do not come” is set as the converted character string.

上記の各例に示すように、この実施例では、活用パターンおよび活用形の組み合わせ毎に複数の置き換えルールが設定され、さらに各種活用形について、具体的な表記を導出するための活用形設定ルールが個別に定められているので、変換の際に文法上の誤りが生じるおそれがない。よって、受信メールとは異なる表現による文字列を複数辞書データに設定することが可能になるから、活用語に対する返信自動学習機能を高めることが可能になる。   As shown in the above examples, in this embodiment, a plurality of replacement rules are set for each combination of utilization pattern and utilization form, and utilization form setting rules for deriving specific notation for various utilization forms. Are defined individually, there is no risk of grammatical errors during conversion. Therefore, it is possible to set a plurality of dictionary data in a character string with an expression different from that of the received mail, so that it is possible to enhance the automatic reply learning function for the used words.

なお、この実施例では、言い回し置換テーブル114では、置き換え後の文字列の活用形を定義するにとどめ、活用形の具体的な表記を導出するためのルールを活用形テーブル115に格納したが、これに限らず、全てのルールを言い回し置換テーブル114に統合してもよい。   In this embodiment, in the wording replacement table 114, only the usage form of the character string after replacement is defined, and the rules for deriving a specific notation of the usage form are stored in the usage form table 115. Not limited to this, all the rules may be integrated into the wording replacement table 114.

また、この実施例では、変換対象文字列の活用形と付属語との組み合わせに基づいて、使用する置き換えルールを限定したが、この限定の範囲は、定義、変更が可能であり、変換対象文字列の活用形パターンに対応する全ての置き換えルールを用いて変換処理を行ってもよい。たとえば、図8の例では、置き換えルール3を使用していないが、これも使用して『走りましょう』という変換後文字列を作成することも可能である。   Further, in this embodiment, the replacement rule to be used is limited based on the combination of the utilization form of the conversion target character string and the attached word, but this limitation range can be defined and changed, and the conversion target character The conversion process may be performed using all the replacement rules corresponding to the column utilization pattern. For example, although the replacement rule 3 is not used in the example of FIG. 8, it is also possible to create a post-conversion character string “Let's run” using this rule.

また、上記の実施例では、動詞を例にして、変換に用いられるルールや変換処理を説明したが、形容動詞や形容詞に関しても同様に、それぞれの品詞に応じた活用パターン毎に変換のルールを設定して、返信自動学習用の辞書データを作成することができる。   In the above embodiment, the rules and conversion processing used for the conversion have been described using the verb as an example. Similarly, the conversion rules for the adjective verbs and adjectives are converted for each utilization pattern corresponding to each part of speech. It is possible to create dictionary data for automatic reply learning by setting.

ここで、返信自動学習処理部104により実行される処理の概略手順について、図10のフローチャートを用いて説明する。
この処理では、まず、返信自動学習用辞書112を初期化し(ステップS1)、形態素解析部105に、処理対象の受信メールに対する形態素解析を実行させる(ステップS2)。
Here, a schematic procedure of processing executed by the automatic reply learning processing unit 104 will be described with reference to the flowchart of FIG.
In this process, first, the automatic reply learning dictionary 112 is initialized (step S1), and the morpheme analysis unit 105 is caused to execute morpheme analysis on the received mail to be processed (step S2).

形態素解析により、受信メールから所定数の文節が抽出されると、以後は、未処理の文節がなくなるまで、各文節に順に着目してステップS3〜S7を実行する。具体的に、このループでは、未処理の文節の中の先頭の文節を抽出し、この文節の文字列を変換対象文字列に設定し(ステップS4)、この変換対象文字列を用いて辞書データを作成する(ステップS5)。さらに、作成された辞書データを返信自動学習用辞書112に登録する処理を実行する(ステップS6)。
最後に、変換対象文字列の文節を処理済みに設定し(ステップS7)、ステップS3に戻る。
When a predetermined number of clauses are extracted from the received mail by morphological analysis, thereafter, steps S3 to S7 are executed while paying attention to each clause until there is no unprocessed clause. Specifically, in this loop, the first clause in the unprocessed clause is extracted, the character string of this clause is set as a conversion target character string (step S4), and dictionary data is used using this conversion target character string. Is created (step S5). Further, a process of registering the created dictionary data in the reply automatic learning dictionary 112 is executed (step S6).
Finally, the phrase of the conversion target character string is set as processed (step S7), and the process returns to step S3.

全ての文節に対して上記の処理が実行され(ステップS3が「NO」)、返信自動学習用辞書112に辞書データが格納されると(ステップS8が「YES」)、返信自動学習処理部104は、返信自動学習辞書112を有効に設定する(ステップS9)。この有効設定処理により、以後は、返信メールの作成画面での読み文字列の組み立てに応じて、予測変換用辞書111および返信自動学習用辞書112の両方を対象にした検索処理により、変換候補が抽出されることになる。なお、返信メールの作成が終了すると、返信自動学習用辞書112は無効化される。 When the above processing is executed for all the phrases (“NO” in step S3) and dictionary data is stored in the automatic reply learning dictionary 112 (“YES” in step S8), the automatic reply learning processing unit 104. It is effectively set the reply automatic learning dictionary 112 (step S9). After this effective setting process, conversion candidates are obtained by a search process for both the predictive conversion dictionary 111 and the automatic reply learning dictionary 112 in accordance with the assembly of the read character string on the reply mail creation screen. Will be extracted. When the creation of the reply mail is completed, the reply automatic learning dictionary 112 is invalidated.

返信自動学習用辞書112に辞書データが全く格納されなかった場合(ステップS8が「NO」)には、返信自動学習用辞書112を有効に設定せずに処理を終了する。この場合には、返信メールの作成処理では、予測変換用辞書111のみを対象にした検索処理により変換候補が抽出される。
なお、辞書データが格納されない例としては、受信メールにテキストデータが含まれていない場合(たとえば、画像が添付されているだけのメール)が考えられる。
If no dictionary data is stored in the automatic reply learning dictionary 112 (“NO” in step S8), the process ends without setting the automatic automatic reply dictionary 112 valid. In this case, in the reply mail creation process, conversion candidates are extracted by a search process for only the prediction conversion dictionary 111.
As an example in which dictionary data is not stored, a case where text data is not included in the received mail (for example, mail with an image attached) can be considered.

つぎに、上記ステップS5の辞書データの生成処理の詳細について、図11を用いて説明する。
この実施例では、作業用メモリ13に辞書データリストを格納するファイルを設定しており、ステップS11では、この辞書データリストを初期化する処理(前回の処理で生成されたリストをクリアする処理)を実行する。つぎに、変換対象文字列に含まれる自立語の品詞情報を確認し(ステップS12)、自立語が活用語であれば(ステップS13が「YES」)、ステップS14〜S18のループを実行する。
Next, details of the dictionary data generation process in step S5 will be described with reference to FIG.
In this embodiment, a file for storing a dictionary data list is set in the working memory 13, and in step S11, processing for initializing this dictionary data list (processing for clearing the list generated in the previous processing) is performed. Execute. Next, the part-of-speech information of the independent word included in the conversion target character string is confirmed (step S12). If the independent word is a useful word ("YES" in step S13), a loop of steps S14 to S18 is executed.

ステップS14では、変換対象文字列により言い回し置換テーブル114を検索する。
この検索では、変換対象文字列の活用語の活用パターンおよび活用形、ならびに付属語により、テーブル中の各置き換えルールの活用形の情報や付属語パターンを照合する。この結果、変換対象文字列に適合する置き換えルールが見つかると(ステップS15が「YES」)、その置き換えルールを用いて変換対象文字列を変換する処理を実行する(ステップS16)。
In step S14, the wording replacement table 114 is searched for the conversion target character string.
In this search, information on the utilization form of each replacement rule and an attachment word pattern in the table are collated based on the utilization pattern and utilization form of the utilization word of the conversion target character string and the attached word. As a result, when a replacement rule that matches the conversion target character string is found (“YES” in step S15), processing for converting the conversion target character string is executed using the replacement rule (step S16).

ステップS16に関しては、図12に詳細な手順を示しており、以下、この図12を用いて説明する。
この変換処理では、変換対象文字列の品詞情報および活用語の語幹の末尾の読み、ならびにステップS14の検索により見つけた置き換えルール内の置換パターンの活用形を組み合わせたものを、検索キーに設定する(ステップS21)。そして、活用形テーブル115から当該検索キーに適合する活用形設定ルールを読み出す(ステップS22)。
The detailed procedure for step S16 is shown in FIG. 12, and will be described below with reference to FIG.
In this conversion processing, the combination of the part-of-speech information of the character string to be converted and the end of the stem of the usage word and the usage form of the replacement pattern in the replacement rule found by the search in step S14 is set as the search key. (Step S21). Then, the utilization form setting rule that matches the search key is read from the utilization form table 115 (step S22).

つぎのステップS23では、読み出した活用形設定ルールを変換対象文字列の活用語に適用して、置き換えルールの定義に応じた活用形を表す文字列およびその読みを導出する。さらに、上記の置き換えルール内の置換パターンに付属語が定義されているか否かをチェックし、定義されている場合(ステップS24が「YES」)には、ステップS23で導出した活用形にその付属語を組み合わせたものを変換後文字列に設定する(ステップS25)。さらに、活用形の読みに付属語の読みを加えたものを、変換後文字列の読みに設定する(ステップS26)。   In the next step S23, the read utilization type setting rule is applied to the utilization word of the conversion target character string, and a character string representing the utilization form corresponding to the definition of the replacement rule and its reading are derived. Further, it is checked whether or not an attached word is defined in the replacement pattern in the replacement rule. If it is defined (“YES” in step S24), the attached form is attached to the utilization form derived in step S23. A combination of words is set as a converted character string (step S25). Further, the reading of the utilization form plus the reading of the attached word is set as the reading of the converted character string (step S26).

上記に対し、置換パターンに付属語が定義されていない場合(ステップS24が「NO」)には、ステップS23で導出された活用形のみを変換後文字列に設定し(ステップS27)、その活用形の読みを変換後文字列の読みに設定する(ステップS28)。   On the other hand, if no ancillary word is defined in the replacement pattern (“NO” in step S24), only the utilization form derived in step S23 is set as the converted character string (step S27), and its utilization is performed. The shape reading is set to the converted character string reading (step S28).

図11に参照を戻して説明を続ける。ステップS21〜S28の処理を含むステップS16が実行されることにより、変換対象文字列は、置き換えルールの定義に適合する表記の変換後文字列に変換される。ステップS17では、この変換処理に用いた置き換えルールに含まれる標準優先度および使用頻度を加算する演算により優先度を算出する。ステップS18では、上記の変換後文字列およびその読み、優先度、ならびに変換処理に用いられた置き換えルールのID番号を組み合わせたものを、辞書データとして辞書データリストに格納する。   The description will be continued with reference back to FIG. By executing step S16 including the processing of steps S21 to S28, the conversion target character string is converted into a post-conversion character string having a notation that conforms to the definition of the replacement rule. In step S17, the priority is calculated by an operation of adding the standard priority and the usage frequency included in the replacement rule used for the conversion process. In step S18, a combination of the converted character string, its reading, priority, and the ID number of the replacement rule used in the conversion process is stored in the dictionary data list as dictionary data.

この後は、再びステップS14に戻り、さらに変換対象文字列に適合する置き換えルールを探す処理を実行する。適合する置き換えルールが見つかれば、その置き換えルールを用いた変換処理(ステップS16)および優先度の算出処理(ステップS17)を実行し、さらに、これらの結果に基づく辞書データを生成して辞書リストに格納する処理(ステップS18)を実行する。言い回し置換テーブル114には、活用パターンおよび活用形の組み合わせ毎に、複数の置き換えルールが設定されているので、上記のループを置き換えルールが抽出できない状態になるまで(ステップS15が「NO」となるまで)実行することにより、辞書データリストに複数の辞書データを格納することができる。 Thereafter, the process returns to step S14, and a process for searching for a replacement rule that matches the conversion target character string is executed. If a suitable replacement rule is found, a conversion process (step S16) and a priority calculation process (step S17) using the replacement rule are executed, and further, dictionary data based on these results is generated and stored in the dictionary list. The storing process (step S18) is executed. In the wording replacement table 114 , since a plurality of replacement rules are set for each combination of the utilization pattern and utilization form, until the replacement rule cannot be extracted from the above loop (step S15 becomes “NO”). By executing, a plurality of dictionary data can be stored in the dictionary data list.

変換対象文字列の自立語が活用語でなかった場合(ステップS13が「NO」)には、その自立語を読みとともに辞書データリストに格納する(ステップS19)。これにより、名詞などの非活用語についても、その単語による辞書データに設定することが可能になる。   If the independent word of the character string to be converted is not a use word (step S13 is “NO”), the independent word is read and stored in the dictionary data list (step S19). This makes it possible to set non-use words such as nouns in dictionary data based on the words.

つぎに、上記の図10〜12に示した処理により作成された辞書データを、変換候補として抽出する場合の処理について説明する。
図11を参照して説明したように、活用語を含む変換対象文字列から導出された辞書データには、それぞれ変換に用いられた置き換えルールに設定されている標準優先度と使用頻度とを加算した値が優先度として設定される。この辞書データが格納された返信自動学習用辞書112が有効に設定されると、候補抽出部103は、読みを構成する仮名文字の入力に応じて読み文字列が組み立てられる都度、予測変換用辞書111および返信自動学習用辞書112の双方を対象にした検索処理を実行するが、このとき、候補抽出部103は、返信自動学習用辞書112から抽出された変換候補の優先度に所定量の重みを加算する。これにより、返信自動学習用の辞書112から抽出された変換候補を、予測変換用辞書111から抽出された変換候補よりも優先して表示することが可能になる。
Next, a process for extracting dictionary data created by the processes shown in FIGS. 10 to 12 as conversion candidates will be described.
As described with reference to FIG. 11, the standard priority set in the replacement rule used for conversion and the usage frequency are added to the dictionary data derived from the conversion target character string including the use word. The selected value is set as the priority. When the automatic reply learning dictionary 112 in which the dictionary data is stored is set to be valid, the candidate extracting unit 103 uses the predictive conversion dictionary each time a reading character string is assembled in response to input of kana characters constituting the reading. 111 and the automatic reply learning dictionary 112 are searched. At this time, the candidate extraction unit 103 assigns a predetermined amount of weight to the priority of the conversion candidates extracted from the automatic reply learning dictionary 112. Is added. As a result, the conversion candidates extracted from the automatic reply learning dictionary 112 can be displayed with priority over the conversion candidates extracted from the predictive conversion dictionary 111.

たとえば、図3に示した返信メールの作成画面には、図8に示した変換処理により生成された6個の変換後文字列が全て表示されている。特に、置き換えルール1から導出された『走ります』や、置き換えルール2から導出された『走りません』は、それぞれ対応する標準優先度や使用頻度が他のものより高く、これに上記の重みが加算されたことにより、第1位および第2位に表示されている。
このような候補表示制御により、ユーザが受信メール中の活用語に関連する表現を入力する場合の利便性が高められ、効率良く、入力対象の文字列を確定することが可能になる。
For example, on the reply mail creation screen shown in FIG. 3, all six converted character strings generated by the conversion process shown in FIG. 8 are displayed. In particular, “run” derived from replacement rule 1 and “do not run” derived from replacement rule 2 each have a higher standard priority and frequency of use than others, and the above weights Is added to the first place and the second place.
By such candidate display control, the convenience when the user inputs an expression related to the utilization word in the received mail is improved, and the character string to be input can be determined efficiently.

さらにこの実施例では、返信自動学習用辞書112から抽出された変換候補が選択され、確定された場合には、その変換候補の文字列に作成された置き換えルールの使用頻度を更新するようにしている。この更新処理は、制御処理部101から確定された変換候補の連絡を受けた返信自動学習処理部104により実施される。   Furthermore, in this embodiment, when the conversion candidate extracted from the automatic reply learning dictionary 112 is selected and confirmed, the use frequency of the replacement rule created in the character string of the conversion candidate is updated. Yes. This update process is performed by the automatic reply learning processing unit 104 that has received notification of the conversion candidate determined from the control processing unit 101.

上記のように選択された変換候補の作成に用いられた置き換えルールの使用頻度を更新することにより、以後の自動学習処理で再び同じ置き換えルールを用いて辞書データが作成された場合には、その辞書データに前回よりも高い優先度を設定することができる。よって、使用頻度の高い置き換えルールによる変換候補が上位に設定されやすい状態を設定することができる。   When dictionary data is created again using the same replacement rule in the subsequent automatic learning process by updating the frequency of use of the replacement rule used to create the conversion candidate selected as described above, A higher priority than the previous time can be set for the dictionary data. Therefore, it is possible to set a state in which conversion candidates based on frequently used replacement rules are likely to be set higher.

ただし、上記の更新処理では、選択された変換候補の活用語とは異なる活用パターンの単語にまで、選択の効果を及ぼすことはできない。つぎに説明する実施例は、この問題を解決し、活用パターンの違いに関わらず、過去に選択された変換候補に類似する観念の表現を表す変換候補が優先して表示されるようにすることを、目的とする。   However, in the above update process, the selection effect cannot be applied to words having a utilization pattern different from the utilization word of the selected conversion candidate. The embodiment described next solves this problem so that a conversion candidate representing an expression of an idea similar to a conversion candidate selected in the past is preferentially displayed regardless of a difference in utilization pattern. With the goal.

この実施例では、上記の目的を達成するために、言い回し置換テーブル114を、図13に示すように構成する。この言い回し置換テーブル114の置き換えルールには、図5に示したものと同様の定義が設定されるほか、類似IDおよび相反IDが登録される。類似IDは、他の置き換えルールのうちで置換パターンの観念が類似するルールのID番号であり、相反IDは、他の置き換えルールのうち置換パターンの観念が相反するルールのID番号である。   In this embodiment, in order to achieve the above object, the word replacement table 114 is configured as shown in FIG. In the replacement rule of the wording replacement table 114, a definition similar to that shown in FIG. 5 is set, and a similar ID and a conflict ID are registered. The similar ID is an ID number of a rule having a similar concept of the replacement pattern among other replacement rules, and the conflict ID is an ID number of a rule having an opposite concept of the replacement pattern among other replacement rules.

図13の例によれば、置換パターンに付属語として丁寧な表現(「ます」「ません」「ましょう」)が設定されている置き換えルール1,2,3,101,102,103の間では、それぞれのID番号が相互に類似IDとして登録されている。一方、置き換えルール7,107には、置き換えルール2および102の置換パターンに概念は類似する(否定的な表現)が、丁寧ではない表現の置換パターンが設定されているため、置き換えルール7,107のID番号は、置き換えルール2,102に相反IDとして登録されている。同様に、置き換えルール7,107にも、置き換えルール2,102の各ID番号が相反IDとして登録されている。
なお、類似ID、相反IDの設定の態様は図13の例に限定されるものではない。
According to the example of FIG. 13, between the replacement rules 1, 2, 3, 101, 102, and 103 in which polite expressions (“mas”, “no”, “mashou”) are set as the appendix in the replacement pattern. Then, the respective ID numbers are registered as similar IDs. On the other hand, the replacement rules 7 and 107 have a similar concept to the replacement patterns of the replacement rules 2 and 102 (negative expression), but a replacement pattern of an expression that is not polite is set. This ID number is registered as a conflict ID in the replacement rules 2 and 102. Similarly, in the replacement rules 7 and 107, the ID numbers of the replacement rules 2 and 102 are registered as conflict IDs.
Note that the manner of setting the similar ID and the conflict ID is not limited to the example of FIG.

図13の構成の言い回し置換テーブル114を用いて返信自動学習用の辞書データが作成され、その辞書データが変換候補として表示され、選択された場合には、返信自動学習処理部104は、使用頻度を更新する処理として、図14に示す処理を実行する。 When dictionary data for automatic reply learning is created using the phrase replacement table 114 having the configuration shown in FIG. 13 and the dictionary data is displayed as a conversion candidate and selected, the automatic reply learning processing unit 104 uses the frequency of use. As the process for updating the process, the process shown in FIG. 14 is executed.

図14を参照して具体的な手順を説明する。
まず、最初のステップS51では、選択された変換候補を確定する処理を行った制御処理部101からの連絡に基づき、この変換候補の作成に用いられた置き換えルールのID番号を取得する。なお、このID番号を取得できるのは、辞書データを作成したときに当該辞書データに含められたID番号(図11のステップS18を参照。)が変換候補に引き継がれたことによる。
A specific procedure will be described with reference to FIG.
First, in the first step S51, the ID number of the replacement rule used for creating this conversion candidate is acquired based on the communication from the control processing unit 101 that has performed the process of determining the selected conversion candidate. This ID number can be acquired because the ID number (see step S18 in FIG. 11) included in the dictionary data when the dictionary data is created is taken over by the conversion candidate.

上記のID番号を取得すると、返信自動学習処理部104は、このID番号の置き換えルールを対象に、使用頻度をインクリメントする処理を実行する(ステップS52)。さらに、この置き換えルールに類似IDが設定されている場合(ステップS53が「YES」)には、類似IDに対応する置き換えルールの使用頻度をインクリメントする(ステップS54)。また、当該置き換えルールに相反IDが設定されている場合(ステップS54が「YES」)には、相反IDに対応する置き換えルールの使用頻度をディクリメントする(ステップS55)。   When the ID number is acquired, the automatic reply learning processing unit 104 executes a process of incrementing the usage frequency for the ID number replacement rule (step S52). Further, when a similar ID is set in this replacement rule (“YES” in step S53), the use frequency of the replacement rule corresponding to the similar ID is incremented (step S54). If a conflict ID is set for the replacement rule (“YES” in step S54), the use frequency of the replacement rule corresponding to the conflict ID is decremented (step S55).

なお、類似IDや相反IDが複数設定されている場合には、ステップS53やS55では、各IDに対応する置き換えルール毎に、使用頻度のインクリメントまたはディクリメントを実行する。   If a plurality of similar IDs or conflicting IDs are set, the use frequency is incremented or decremented for each replacement rule corresponding to each ID in steps S53 and S55.

上記の処理によれば、活用語に対する返信自動学習処理により作成された辞書データを変換候補として表示する場合には、その変換候補の作成に利用された置き換えルールが過去に利用されたか否かに関わらず、ユーザが好んで選択する表現に類似する観念を表す変換候補を、優先して表示することが可能になる。したがって、活用パターンの種別を問わず、ユーザの好みの表現に適合する変換候補が上位に表示されるようになるので、候補の選択操作が容易になり、操作性を向上することができる。   According to the above process, when displaying the dictionary data created by the automatic reply learning process for the utilization word as a conversion candidate, whether or not the replacement rule used for creating the conversion candidate has been used in the past Regardless, it is possible to preferentially display conversion candidates that represent an idea similar to the expression that the user likes and selects. Therefore, conversion candidates that match the user's preferred expression are displayed at the top regardless of the type of utilization pattern, so that candidate selection operations are facilitated and operability can be improved.

なお、図13,14の例では、選択された変換候補の作成に用いられた置き換えルールに観念が類似する置き換えルールの使用頻度を上昇させると共に、観念が相反するルールの使用頻度を減少させたが、後者の処理は必ずしも必要ではない。また、使用頻度の更新の単位も一度ずつに限らず、複数度数を一単位として更新してもよい。   In the examples of FIGS. 13 and 14, the frequency of use of a replacement rule whose idea is similar to the replacement rule used to create the selected conversion candidate is increased, and the frequency of use of a rule whose idea is contradictory is reduced. However, the latter process is not always necessary. In addition, the unit for updating the usage frequency is not limited to one time, and a plurality of frequencies may be updated as one unit.

1 携帯電話
2 表示部
3 操作部
10 制御部
11 CPU
12 主メモリ
13 作業メモリ
20 候補表示欄
31 文字キー
100 文字入力システム
101 制御処理部
102 読み文字列組立部
103 候補抽出部
104 返信自動学習処理部
105 形態素解析部
112 返信自動学習用辞書
113 形態素解析用辞書
114 言い回し置換テーブル
115 活用形テーブル
200 メーラー
DESCRIPTION OF SYMBOLS 1 Mobile phone 2 Display part 3 Operation part 10 Control part 11 CPU
12 main memory 13 a working memory 20 candidate display column 31 character key 100 the character input system 101 control processor 102 reads the character string assembly unit 103 candidate extraction unit 104 replies the automatic learning processing unit 105 the morphological analysis unit 112 replies dictionary 113 morpheme for automatic learning Dictionary for analysis 114 Phrase replacement table 115 Practical table 200 Mailer

Claims (5)

電子メールの送信および受信を行う機能を具備するコンピュータに、文字を入力する操作に応じて送信対象のメールに前記操作に応じた文字列を入力する処理を実行させるためのプログラムであって、
複数種の活用パターンについて、それぞれそのパターンの活用形による表現を他の表現に置き換えるための変換ルールとして、置き換え前の活用形と付属語との組み合わせに置き換え後の活用形と付属語との組み合わせを紐付けた構成の変換ルールを記憶する変換ルール記憶手段、
前記変換ルールの適用により作成される変換後文字列を保存するための変換後文字列記憶手段、
受信したメールの1つに対する形態素解析を実行する形態素解析手段、
受信したメールの1つに対する返信を指示する操作が行われたことに応じて、前記形態素解析手段に返信対象のメールに対する形態素解析を行わせた後、この形態素解析により抽出された活用語を含む文節を文節毎に処理対象として、処理対象文節の文字列中の活用語の活用パターンおよびその活用形と処理対象文節中の付属語との組み合わせにより前記変換ルール記憶手段を検索して当該組み合わせに適合する変換ルールを抽出するステップと、抽出された変換ルールに設定されている置き換え後の活用形と付属語との組み合わせを処理対象文節に適用して変換後文字列を作成するステップとを各処理対象文節に対して実行し、作成された変換後文字列を前記返信を指示する操作に対する返信用メールの作成画面が立ち上げられている間に限り有効になるようにして、当該変換後文字列の読みに対応づけて前記変換後文字列記憶手段に保存する学習処理手段、
前記返信を指示する操作に応じて立ち上げられた返信用メールの作成画面に対して入力対象の文字列の読みを入力する操作が行われたとき、前記変換後文字列記憶手段に有効な状態で保存されている変換後文字列を対象に前記入力された読みを用いた検索を実行し、読みが適合する変換後文字列を変換候補として抽出する候補抽出手段、
前記候補抽出手段により抽出された変換候補を含む候補表示欄を前記返信用メールの作成画面に表示する候補表示手段、
前記候補表示欄に表示された変換候補の1つを選択する操作に応じて、選択された変換候補の文字列を前記返信用メールへの入力文字列として確定する入力文字列確定手段、
の各手段として、前記コンピュータを機能させることを特徴とする、文字入力用のプログラム。
A program for causing a computer having a function of transmitting and receiving an e-mail to execute a process of inputting a character string corresponding to the operation to a mail to be transmitted according to an operation of inputting characters,
For multiple types of usage patterns, as a conversion rule for replacing the expression in the usage form of the pattern with another expression, the combination of the usage form and the adjunct after replacement with the combination of the usage form before the replacement and the adjunct Conversion rule storage means for storing a conversion rule having a configuration associated with
A post-conversion character string storage means for storing a post-conversion character string created by applying the conversion rule;
Morphological analysis means for performing morphological analysis on one of the received emails;
In response to an operation for instructing a reply to one of the received mails, the morpheme analysis unit includes morpheme analysis for the reply target mail , and then includes a use word extracted by the morpheme analysis. Using the phrase as a processing target for each phrase, the conversion rule storage means is searched by the combination of the usage pattern of the word used in the character string of the processing target clause and the usage pattern and the attached word in the processing target clause, and the combination is obtained. A step of extracting a suitable conversion rule, and a step of creating a converted character string by applying a combination of a replacement usage form and an attached word set in the extracted conversion rule to a processing target clause. performed on the processing target clause, while the reply mail creation screen is raised with respect to the operation of the post-conversion string produced instructs the reply Ri as enabled, the learning processing means for storing the converted character string storage means in association with reading of the converted character string,
When the operation to input the reading of the character string to be input is performed on the reply e-mail creation screen launched in response to the operation to instruct the reply, the converted character string storage unit is in an effective state Candidate extraction means for performing a search using the input reading on the converted character string stored in the above, and extracting the converted character string matching the reading as a conversion candidate,
Candidate display means for displaying a candidate display field containing conversion candidates extracted by the candidate extraction means on the reply mail creation screen;
An input character string determining means for determining a character string of the selected conversion candidate as an input character string to the reply mail in response to an operation of selecting one of the conversion candidates displayed in the candidate display field;
A program for inputting characters, characterized by causing the computer to function as each means.
前記学習処理手段は、前記受信したメールの1つに対する返信を指示する操作に応じて前記変換後文字列記憶手段をクリアした後に各処理対象文節に対する処理を実行し、
前記候補抽出手段は、前記返信を指示する操作に応じてクリアされた後の変換後文字列記憶手段を対象にした検索を実行する請求項1に記載された文字入力用のプログラム。
The learning processing means executes processing for each processing target clause after clearing the converted character string storage means in response to an operation to instruct a reply to one of the received mails,
The program for character input according to claim 1, wherein the candidate extraction unit executes a search for the converted character string storage unit after being cleared in response to the operation to instruct the reply .
請求項1または2に記載されたプログラムにおいて、
前記変換ルール記憶手段が記憶する各変換ルールには、それぞれその変換ルールの使用頻度を示す情報が含まれると共に、前記候補表示手段により変換候補として表示された変換後文字列が前記入力文字列確定手段により返信用メールへの入力文字列として確定されたときに、確定した文字列への変換に用いられた変換ルールの使用頻度を更新する使用頻度更新手段として前記コンピュータを機能させるプログラムが、さらに含まれており、
前記候補表示手段は、前記候補抽出手段により複数の変換後文字列が抽出されたとき、これらの変換後文字列の表示順序を、それぞれの文字列への変換に用いられた変換ルールの使用頻度を用いて決定する、文字入力用のプログラム。
In the program according to claim 1 or 2,
Each conversion rule stored by the conversion rule storage means includes information indicating the frequency of use of the conversion rule, and the converted character string displayed as a conversion candidate by the candidate display means is determined as the input character string. A program that causes the computer to function as a use frequency update unit that updates the use frequency of the conversion rule used for conversion to the confirmed character string when the input character string is confirmed by the means as the input character string to the reply mail; Included,
The candidate display means, when a plurality of converted character strings are extracted by the candidate extraction means, the display order of these converted character strings, the frequency of use of the conversion rule used for conversion to each character string A program for character input that is determined using.
請求項3に記載されたプログラムにおいて、
前記変換ルール記憶手段が記憶する各変換ルールは、変換処理の観念が類似するもの毎に紐付けられており、
前記使用頻度更新手段は、前記入力文字列確定手段により確定された文字列への変換に用いられた変換ルールの使用頻度とともに、この変換ルールに紐付けられている変換ルールの使用頻度を更新する、文字入力用のプログラム。
In the program according to claim 3,
Each conversion rule stored in the conversion rule storage means is associated with each of the conversion concepts that are similar in concept.
The usage frequency update unit updates the usage frequency of the conversion rule associated with the conversion rule together with the usage frequency of the conversion rule used for conversion into the character string determined by the input character string determination unit. A program for character input.
電子メールの送信および受信を行う送受信部と、仮名文字が割り当てられたキーを複数含む操作部と、電子メールの文書の作成画面を表示するための表示部とを具備する通信端末装置において、
複数種の活用パターンについて、それぞれそのパターンの活用形による表現を他の表現に置き換えるための変換ルールとして、置き換え前の活用形と付属語との組み合わせに置き換え後の活用形と付属語との組み合わせを紐付けた構成の変換ルールを記憶する変換ルール記憶手段、
前記変換ルールの適用により作成される変換後文字列を保存するための変換後文字列記憶手段、
受信したメールの1つに対する形態素解析を実行する形態素解析手段、
受信したメールの1つに対する返信を指示する操作が行われたことに応じて、前記形態素解析手段に返信対象のメールに対する形態素解析を行わせた後、この形態素解析により抽出された活用語を含む文節を文節毎に処理対象として、処理対象文節の文字列中の活用語の活用パターンおよびその活用形と処理対象文節中の付属語との組み合わせにより前記変換ルール記憶手段を検索して当該組み合わせに適合する変換ルールを抽出するステップと、抽出された変換ルールに設定されている置き換え後の活用形と付属語との組み合わせを処理対象文節に適用して変換後文字列を作成するステップとを各処理対象文節に対して実行し、作成された変換後文字列を前記返信を指示する操作に対する返信用メールの作成画面が立ち上げられている間に限り有効になるようにして、当該変換後文字列の読みに対応づけて前記変換後文字列記憶手段に保存する学習処理手段、
前記返信を指示する操作に応じて立ち上げられた返信用メールの作成画面に対して入力対象の文字列の読みを入力する操作が行われたとき、前記変換後文字列記憶手段に有効な状態で保存されている変換後文字列を対象に前記入力された読みを用いた検索を実行し、読みが適合する変換後文字列を変換候補として抽出する候補抽出手段、
前記候補抽出手段により抽出された変換候補を含む候補表示欄を前記返信用メールの作成画面に表示する候補表示手段、
前記候補表示欄に表示された変換候補の1つを選択する操作に応じて、選択された変換候補の文字列を前記返信用メールへの入力文字列として確定する入力文字列確定手段、
の各手段を具備する、通信端末装置。
In a communication terminal device comprising a transmission / reception unit for transmitting and receiving an e-mail, an operation unit including a plurality of keys assigned with kana characters, and a display unit for displaying an e-mail document creation screen,
For multiple types of usage patterns, as a conversion rule for replacing the expression in the usage form of the pattern with another expression, the combination of the usage form and the adjunct after replacement with the combination of the usage form before the replacement and the adjunct Conversion rule storage means for storing a conversion rule having a configuration associated with
A post-conversion character string storage means for storing a post-conversion character string created by applying the conversion rule;
Morphological analysis means for performing morphological analysis on one of the received emails;
In response to an operation for instructing a reply to one of the received mails, the morpheme analysis unit includes morpheme analysis for the reply target mail , and then includes a use word extracted by the morpheme analysis. Using the phrase as a processing target for each phrase, the conversion rule storage means is searched by the combination of the usage pattern of the word used in the character string of the processing target clause and the usage pattern and the attached word in the processing target clause, and the combination is obtained. A step of extracting a suitable conversion rule, and a step of creating a converted character string by applying a combination of a replacement usage form and an attached word set in the extracted conversion rule to a processing target clause. performed on the processing target clause, while the reply mail creation screen is raised with respect to the operation of the post-conversion string produced instructs the reply Ri as enabled, the learning processing means for storing the converted character string storage means in association with reading of the converted character string,
When the operation to input the reading of the character string to be input is performed on the reply e-mail creation screen launched in response to the operation to instruct the reply, the converted character string storage unit is in an effective state Candidate extraction means for performing a search using the input reading on the converted character string stored in the above, and extracting the converted character string matching the reading as a conversion candidate,
Candidate display means for displaying a candidate display field containing conversion candidates extracted by the candidate extraction means on the reply mail creation screen;
An input character string determining means for determining a character string of the selected conversion candidate as an input character string to the reply mail in response to an operation of selecting one of the conversion candidates displayed in the candidate display field;
A communication terminal device comprising the means described above.
JP2010057346A 2010-03-15 2010-03-15 Character input program and communication terminal device Active JP5573257B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010057346A JP5573257B2 (en) 2010-03-15 2010-03-15 Character input program and communication terminal device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010057346A JP5573257B2 (en) 2010-03-15 2010-03-15 Character input program and communication terminal device

Publications (2)

Publication Number Publication Date
JP2011192002A JP2011192002A (en) 2011-09-29
JP5573257B2 true JP5573257B2 (en) 2014-08-20

Family

ID=44796844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010057346A Active JP5573257B2 (en) 2010-03-15 2010-03-15 Character input program and communication terminal device

Country Status (1)

Country Link
JP (1) JP5573257B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5959072B2 (en) 2014-09-29 2016-08-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method for displaying conversion candidates associated with input character string, electronic device and server computer thereof, program for electronic device and program for server computer

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000048018A (en) * 1998-07-27 2000-02-18 Toshiba Corp Input prediction device, its method and recording medium recording input prediction program
JP2006344039A (en) * 2005-06-09 2006-12-21 Casio Hitachi Mobile Communications Co Ltd Electronic mail apparatus and program
JP2007310504A (en) * 2006-05-16 2007-11-29 Toshiba Corp Portable information terminal

Also Published As

Publication number Publication date
JP2011192002A (en) 2011-09-29

Similar Documents

Publication Publication Date Title
US7477165B2 (en) Handheld electronic device and method for learning contextual data during disambiguation of text input
JP4277903B2 (en) Electronic device and program with dictionary function
US8712756B2 (en) Character input device and program for displaying next word candidates based on the candidates' usage history
JP5429377B2 (en) Candidate display method for character input
US8307281B2 (en) Predicting conversion candidates based on the current context and the attributes of previously selected conversion candidates
US8612210B2 (en) Handheld electronic device and method for employing contextual data for disambiguation of text input
JP5309480B2 (en) Character string input device, character string input method and program
US20030190181A1 (en) Apparatus and method for inputting alphabet characters on keypad
JP5471457B2 (en) Information processing device
JP4661924B2 (en) Electronic device and program with dictionary function
JP2008059392A (en) Dictionary search apparatus and dictionary search processing program
JP5573257B2 (en) Character input program and communication terminal device
US20130073572A1 (en) Method of learning character segments from received text, and associated handheld electronic device
JP6315439B2 (en) Text editing support device, program, and text editing support system
JP5320925B2 (en) Information search method, information search device, and information search program
JP6221275B2 (en) Character input program and character input device
JP5849690B2 (en) Character input program and information processing apparatus
JP2009258842A (en) Electronic apparatus
JP2006268217A (en) Dictionary optimization system and method for portable terminal
JP6702119B2 (en) Speech recognition result creating device, method and program
JP2002312354A (en) Input method for pin-yin, information processor using the method and program for chinese input
JP5556115B2 (en) Portable terminal device and character input candidate extraction method
JP5186080B2 (en) Portable terminal
JP2002207729A (en) Method of converting character string, character input device and mobile information processor using the method, and recording medium for inputting character
JP2009217632A (en) Program for character input and character input device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140616

R150 Certificate of patent or registration of utility model

Ref document number: 5573257

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250