JP6502279B2 - Outlier location extraction device, method and program - Google Patents
Outlier location extraction device, method and program Download PDFInfo
- Publication number
- JP6502279B2 JP6502279B2 JP2016035300A JP2016035300A JP6502279B2 JP 6502279 B2 JP6502279 B2 JP 6502279B2 JP 2016035300 A JP2016035300 A JP 2016035300A JP 2016035300 A JP2016035300 A JP 2016035300A JP 6502279 B2 JP6502279 B2 JP 6502279B2
- Authority
- JP
- Japan
- Prior art keywords
- fragment
- difficulty
- class
- text
- difficulty level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この発明は、テキストに含まれる少なくとも1つの断片の中で所定の基準以上に難易度が外れている断片を判定及び/又は抽出する技術に関する。 The present invention relates to a technique for determining and / or extracting a fragment out of at least one fragment included in a text whose degree of difficulty is higher than a predetermined standard.
テキストの難易度の推定を行う研究は古くから行われてきている。しかし、その多くは、テキスト全体の難易度を推定することを目的として提案されており、一部の文章や語句、言い回しに関する情報をフィードバックすることによって文章作成支援に利用できるものではない。 Research to estimate the degree of difficulty of the text has been conducted since ancient times. However, many of them have been proposed for the purpose of estimating the degree of difficulty of the entire text, and can not be used to support writing by feeding back information on some sentences, phrases, and phrases.
例えば、非特許文献1では、難易度の推定に文字bigramのみを特徴量として用いる。そのため、対象テキストには一定以上の分量の文字が含まれることが要求される。また、非特許文献1では、有効文字bigram が25 以上あれば、相関係数0.9 以上という高い相関で難易度を推定できると報告している(例えば、非特許文献1参照。)。
For example, in Non-Patent
また、非特許文献2では、一文に含まれる平均述語数とテキスト全体のひらがなの割合を変数とし、対象学年(難易度)を推定する重回帰式を提案している。非特許文献2の場合、推定のために必要なテキストの分量は少なくてもよいという利点がある。しかしながら、述語数や割合だけを利用しているため、個々の語の難しさなどをフィードバックすることはできない(例えば、非特許文献2参照。)。
Further, Non-Patent
これまでの難易度の推定技術は、テキスト全体の難易度の推定を行うことを目的に提案されており、テキスト中の一部について要求される難易度と一致しないことを示したり、一致しない箇所のフィードバックを行ったりすることができなかった。 The previous difficulty level estimation techniques have been proposed for the purpose of estimating the level of difficulty of the entire text, and show that the level of difficulty required for a part of the text does not match or does not match Was unable to give feedback.
この発明の目的は、テキストに含まれる少なくとも1つの断片の中で所定の基準以上に難易度が外れている断片を、テキストの外れ値箇所であると判定する及び/又はテキストの外れ値箇所として抽出する外れ値箇所抽出装置、方法及びプログラムを提供することである。 An object of the present invention is to determine a fragment having a degree of difficulty exceeding a predetermined level among at least one fragment included in the text as an outlier point of the text and / or as an outlier point of the text An outlier location extracting apparatus, method and program for extracting are provided.
この発明の一態様による外れ値箇所抽出装置は、入力されたテキストに含まれ、テキストを所定の単位で分割した各断片の難易度クラスを推定する断片難易度推定部と、テキストの難易度クラスを推定する全体難易度推定部と、推定された各断片の難易度クラスと推定されたテキストの難易度クラスとの比較に基づいて、推定されたテキストの難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する外れ値箇所抽出部と、を備えており、断片難易度推定部は、各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを推定された各断片の難易度クラスとし、全体難易度推定部は、テキストに含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、テキストが各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを推定されたテキストの難易度クラスとする。 The outlier location extracting device according to one aspect of the present invention includes a fragment difficulty level estimation unit for estimating the difficulty level class of each fragment obtained by dividing the text in a predetermined unit, included in the input text; Have a degree of difficulty away from the estimated class of difficulty of the text, based on a comparison of the overall class of difficulty estimation part and the class of difficulty of each estimated segment and the class of estimated complexity of the text And an outlier location extraction unit for extracting an outlier location which is a text fragment, and the fragment difficulty level estimation unit is configured to calculate the appearance frequency of each word n-gram included in each segment and the difficulty level for each class. The likelihood of each fragment belonging to each difficulty class is estimated based on the occurrence probability of each word obtained in advance, and the difficulty class of the highest likelihood is defined as the difficulty class of each fragment, Overall difficulty estimation part Estimate the likelihood that the text belongs to each difficulty level based on the appearance frequency of each word n-gram included in the text and the occurrence probability of each word previously determined for each difficulty level class The degree of difficulty is assumed to be the estimated degree of difficulty of the text .
この発明の一態様による外れ値箇所抽出装置は、入力されたテキストに含まれ、テキストを所定の単位で分割した各断片の難易度クラスを推定する断片難易度推定部と、推定された各断片の難易度クラスと所定の難易度クラスとの比較に基づいて、所定の難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する外れ値箇所抽出部と、を備えており、断片難易度推定部は、各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを推定された各断片の難易度クラスとする。 The outlier location extracting device according to one aspect of the present invention includes a fragment difficulty level estimation unit for estimating the difficulty level class of each fragment obtained by dividing the text in predetermined units, included in the input text, and each estimated fragment And an outlier location extraction unit for extracting an outlier location, which is a fragment of text, having a degree of difficulty separated from the predetermined difficulty level class based on comparison between the difficulty level class and the predetermined difficulty level class The fragment difficulty level estimation unit determines the difficulty level of each fragment based on the appearance frequency of each word n-gram included in each fragment and the occurrence probability of each word previously determined for each difficulty level class. The likelihood belonging to the class is estimated, and the highest likelihood difficulty class is taken as the difficulty class of each fragment estimated .
テキストに含まれる少なくとも1つの断片の中で所定の基準以上に難易度が外れている断片を、テキストの外れ値箇所であると判定する及び/又はテキストの外れ値箇所として抽出することができる。 Among the at least one fragment included in the text, a fragment whose degree of difficulty is higher than a predetermined level can be determined to be an outlier point of the text and / or extracted as an outlier point of the text.
以下、図面を参照して、外れ値箇所抽出装置及び方法の実施形態について説明する。 Hereinafter, embodiments of the outlier location extraction apparatus and method will be described with reference to the drawings.
[第一実施形態]
第一実施形態の外れ値箇所抽出装置は、図1に示すように、前処理部1、断片難易度推定部31、全体難易度推定部32、外れ値箇所抽出部4、代替表現提示部5、代替表現置換部6、記憶部71、記憶部72及び代替表現記憶部8を例えば備えている。
First Embodiment
As shown in FIG. 1, the outlier location extracting apparatus according to the first embodiment includes a preprocessing
外れ値箇所抽出方法は、例えば、外れ値箇所抽出装置の各部が図3のステップS1からステップS6の処理を行うことにより実現される。 The outlier location extraction method is realized, for example, by each unit of the outlier location extraction apparatus performing the process from step S1 to step S6 in FIG. 3.
<前処理部1>
前処理部1には、テキストが入力される。
<Pre-processing
Text is input to the preprocessing
前処理部1は、入力されたテキストに対して、形態素解析、構文解析、固有表現抽出、項構造解析等の前処理を行い、その前処理の結果を断片難易度推定部31及び全体難易度推定部32に出力する(ステップS1)。前処理として形態素解析が行われる場合には、形態素解析の結果が出力される。
The preprocessing
形態素解析、構文解析、固有表現抽出、項構造解析等の前処理の技術としては、既存の技術を用いることができる。 An existing technique can be used as a pre-processing technique such as morphological analysis, syntactic analysis, specific expression extraction, and term structure analysis.
以下、前処理の一例である形態素解析の結果の例について説明する。以下は、「親子のコミュニケーションの契機になるように」というテキストの形態素解析の結果の例である。
「親子」:名詞, 普通名詞, 一般,*,*,*, オヤコ, 親子, 親子, オヤコ, 親子, オヤコ, 和,*,*,*,*
「の」:助詞, 格助詞,*,*,*,*, ノ, の, の, ノ, の, ノ, 和,*,*,*,*
「コミュニケーション」:名詞, 普通名詞, サ変可能,*,*,*, コミュニケーション, コミュニケーション-communication, コミュニケーション, コミュニケーション, コミュニケーション, コミュニケーション, 外,*,*,*,*
「の」:助詞, 格助詞,*,*,*,*, ノ, の, の, ノ, の, ノ, 和,*,*,*,*
「契機」:名詞, 普通名詞, 一般,*,*,*, ケイキ, 契機, 契機, ケーキ, 契機, ケーキ, 漢,*,*,*,*
「に」:助詞, 格助詞,*,*,*,*, ニ, に, に, ニ, に, ニ, 和,*,*,*,*
「なる」:動詞, 非自立可能,*,*, 五段-ラ行, 連体形-一般, ナル, 成る, なる, ナル, なる, ナル, 和,*,*,*,*
「よう」:形状詞, 助動詞語幹,*,*,*,*, ヨウ, 様, よう, ヨー, よう, ヨー, ,*,*,*,*
「に」:助動詞,*,*,*, 助動詞-ダ, 連用形-ニ, ダ, だ, に, ニ, だ, ダ, 和,*,*,*,*
Hereinafter, an example of a result of morphological analysis which is an example of preprocessing will be described. The following is an example of the result of morphological analysis of the text "To be a trigger for parent-child communication".
"Parent": noun, common noun, general, *, *, *, oyster, parent and child, parent and child, oyster, parent and child, oyster, sum, *, *, *, *
"No": particle, case particle, *, *, *, *, no, of, no, of, no, sum, *, *, *, *
"Communication": noun, common noun, changeable, *, *, *, communication, communication-communication, communication, communication, communication, communication, outside, *, *, *, *
"No": particle, case particle, *, *, *, *, no, of, no, of, no, sum, *, *, *, *
"Occurrence": noun, common noun, general, *, *, *, keiki, opportunity, occasion, cake, opportunity, cake, han, *, *, *, *
"Ni": particle, case particle, *, *, *, *, ni, to, ni, to, ni, sum, *, *, *, *
"Naru": Verb, non-independent, *, *, 5 steps-La line, adjective form-general, null, consists, becomes, null, becomes, null, sum, *, *, *, *
"Yo": shape verb, auxiliary verb stem, *, *, *, *, yo, yo, yo, yo, yo, yo, yo,, *, *, *, *
"Ni": auxiliary verbs, *, *, *, auxiliary verbs-da, continuous forms-da, da, d, di, da, da, sum, *, *, *, *
<断片難易度推定部31>
断片難易度推定部31には、テキスト及び前処理の結果が入力される。
<Shard difficulty
The fragment difficulty
断片難易度推定部31は、入力されたテキストに含まれる各断片の難易度クラスを推定する(ステップS31)。推定された各断片の難易度クラスは、外れ値箇所抽出部4に出力される。
The fragment difficulty
入力されたテキストは、所定の単位で分割した複数の断片で構成されている。所定の単位は、少なくとも1個の単語や単語n-gram、少なくとも1個の文等のテキストを構成する要素のことである。言い換えれば、断片は、少なくとも1個の単語や単語n-gram、少なくとも1個の文等のテキストを構成する要素である。単語n-gramの例として、n=1の場合の単語n-gramである単語unigram、n=2の場合の単語n-gramである単語bigram、n=3の場合の単語n-gramである単語trigramを挙げることができる。 The input text is composed of a plurality of fragments divided in predetermined units. The predetermined unit is an element constituting text such as at least one word, word n-gram, at least one sentence or the like. In other words, a fragment is an element that constitutes text such as at least one word, word n-gram, at least one sentence, and the like. As an example of word n-gram, it is word unigram which is word n-gram in case of n = 1, word n-gram which is word n-gram in case of n = 2, word n-gram in case of n = 3 The word trigram can be mentioned.
段落は少なくとも1個の文で構成されるため、少なくとも1個の文を断片とする場合は、テキストの各段落を断片とする場合を含む。 Since a paragraph is composed of at least one sentence, when at least one sentence is a fragment, the case where each paragraph of text is a fragment is included.
例えば、断片難易度推定部31の中の特徴量抽出部111は、各断片の特徴量を抽出し、断片難易度推定部31は抽出された各断片の特徴量からその断片の難易度クラスを推定する。例えば、推定した各断片の特徴量に対応する難易度クラスを各断片の難易度クラスとする。断片の特徴量は、断片の難易度に関するものであればどのような特徴量であってもよい。例えば、断片が少なくとも1個の文である場合には、断片の特徴量を、その断片を構成する平均語数、その断片を構成する文節数、その断片における漢字の割合、その断片におけるカタカナの割合、その断片におけるひらがなの割合、その断片における漢字とカタカナの割合、その断片における能動態又は受動態の割合、その断片におけるその断片における構文木の深さの何れかとすることができる。
For example, the feature quantity extraction unit 111 in the fragment difficulty
その断片における漢字の割合は、例えば(その断片の中の漢字の文字数)/(その断片の文字数)である。 The ratio of kanji in the fragment is, for example, (number of kanji characters in the fragment) / (number of characters of the fragment).
その断片におけるカタカナの割合は、例えば(その断片の中のカタカナの文字数)/(その断片の文字数)である。 The ratio of katakana in the fragment is, for example, (number of katakana characters in the fragment) / (number of characters of the fragment).
その断片におけるひらがなの割合は、例えば(その断片の中のカタカナの文字数)/(その断片の文字数)である。 The percentage of Hiragana in the fragment is, for example, (number of katakana characters in the fragment) / (number of characters of the fragment).
その断片における漢字とカタカナの割合は、例えば(その断片の中の漢字とカタカナの文字数)/(その断片の文字数)である。 The ratio of kanji and katakana in the fragment is, for example, (number of kanji and katakana characters in the fragment) / (number of characters of the fragment).
その断片における能動態又は受動態の割合は、例えば、(その断片における能動態又は受動態の出現回数)/(その断片における動詞の出現回数)である。 The ratio of active or passive in the fragment is, for example, (number of appearances of active or passive in the fragment) / (number of appearances of verb in the fragment).
なお、断片が単語n-gramである場合には、断片難易度推定部31は、記憶部71に予め記憶されている、各断片とその各断片の難易度クラスとの対応付けの情報を参照して、各断片の難易度クラスを求めてもよい。例えば、ある断片が初めて出現した難易度クラス、言い換えればその断片が出現する最も低い難易度クラスを、その断片の難易度として記憶部71に記憶させておく。ある断片が初めて出現した難易度クラスである初出難易度クラスの例を図4に示す。断片難易度推定部31は、各断片に対応する難易度クラスを記憶部71から読み込むことにより、その各断片の難易度クラスを得ることができる。
When the fragment is a word n-gram, the fragment difficulty
あるいは、例えば、ある断片が頻出する難易度クラス、言い換えればその断片がもっとよよく出現する難易度クラスを、その断片の難易度として記憶部71に記憶させておいてもよい。
Alternatively, for example, a difficulty class in which a certain fragment frequently appears, in other words, a difficulty class in which the fragment appears better, may be stored in the
<全体難易度推定部32>
全体難易度推定部32には、テキスト及び前処理の結果が入力される。
<Overall difficulty
Text and the result of preprocessing are input to the overall difficulty
全体難易度推定部32は、入力されたテキスト全体の難易度クラスを推定する(ステップS32)。記載の簡略化のために、テキスト全体の難易度クラスのことを、単に「テキストの難易度クラス」とも呼ぶ。
The overall difficulty
断片難易度推定部31において、各断片の特徴量が抽出されている場合には、全体難易度推定部3は、抽出された各断片の特徴量を用いて、入力されたテキストの難易度クラスを推定する。例えば、全体難易度推定部3は、入力されたテキストに含まれる各断片の特徴量の平均値を計算して入力されたテキストの難易度クラスとしてもよい。また、例えば、特徴量として文の長さの平均値が計算されている場合には、文の長さの平均値を閾値判定することで難易度クラスを求めてもよい。これにより、長い文が多いテキストは、難易度が高いという傾向を反映した難易度クラス設定が可能となる。
When the feature amount of each fragment is extracted in the fragment difficulty
また、全体断片難易度推定部32の中の特徴量抽出部321が、テキストの特徴量を求め、全体難易度推定部32は求まった特徴量をテキストの難易度クラスとしてもよい。テキストの特徴量は、テキストの難易度に関するものであればどのような特徴量であってもよい。例えば、テキストの特徴量を、そのテキストにおける漢字の割合、そのテキストにおけるカタカナの割合、そのテキストにおけるひらがなの割合、そのテキストにおける漢字とカタカナの割合、そのテキストにおける能動態又は受動態の割合等にすることができる。
Further, the
そのテキストにおける漢字の割合は、例えば(そのテキストの中の漢字の文字数)/(そのテキストの文字数)である。 The ratio of kanji in the text is, for example, (number of kanji characters in the text) / (number of characters of the text).
そのテキストおけるカタカナの割合は、例えば(そのテキストの中のカタカナの文字数)/(そのテキスト文字数)である。 The proportion of katakana in the text is, for example, (the number of katakana characters in the text) / (the number of text characters).
そのテキストにおけるひらがなの割合は、例えば(そのテキストの中のカタカナの文字数)/(その断片の文字数)である。 The proportion of hiragana characters in the text is, for example, (number of katakana characters in the text) / (number of characters of the fragment).
そのテキストにおける漢字とカタカナの割合は、例えば(そのテキストの中の漢字とカタカナの文字数)/(その断片の文字数)である。 The ratio of kanji and katakana in the text is, for example, (number of kanji and katakana characters in the text) / (number of letters of the fragment).
そのテキストにおける能動態又は受動態の割合は、例えば、(そのテキストにおける能動態又は受動態の出現回数)/(そのテキストにおける動詞の出現回数)である。 The ratio of active or passive in the text is, for example, (number of appearances of active or passive in the text) / (number of appearance of verbs in the text).
<外れ値箇所抽出部4>
外れ値箇所抽出部4には、断片難易度推定部31で推定された各断片の難易度クラスと、全体難易度推定部32で推定されたテキストの難易度クラスが入力される。
<Outlier
The outlier
外れ値箇所抽出部4は、断片難易度推定部31で推定された各断片の難易度クラスと全体難易度推定部32で推定されたテキストの難易度クラスとの組である難易度の組を用いて、全体難易度推定部32で推定されたテキストの難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する(ステップS4)。抽出された外れ値箇所は、代替表現提示部5及び代替表現置換部6に出力される。
The outlier
なお、各断片の難易度クラスとテキストの難易度クラスとの組である難易度とは、必ずしも組にする必要はない。以下では、組にして比較する例で説明するが、テキストの難易度クラスから離れた難易度を有する、テキストの断片を抽出するために、各断片の難易度クラスとテキストの難易度クラスとの差異を比較できれば、比較方法は問わない。 Note that the degree of difficulty, which is a combination of the difficulty level class of each fragment and the text difficulty level class, does not necessarily have to be a pair. In the following, we will explain an example of comparing in pairs, but with the difficulty class of each fragment and the text difficulty class in order to extract fragments of the text, which have difficulty different from that of the text difficulty class As long as the differences can be compared, the comparison method does not matter.
例えば、外れ値箇所抽出部4は、難易度推定部3で推定されたテキストの難易度クラスから、所定の閾値以上に外れる箇所を抽出する。すなわち、外れ値箇所抽出部4は、各断片の難易度クラスと、推定されたテキストの難易度クラスとの差の絶対値が、所定の閾値(例えば1)以上又はより大である場合に、外れ値箇所抽出部4はその各断片を外れ値箇所として抽出する。
For example, the outlier
例えば、推定されたテキストの難易度クラスが9だった場合、例文中の「契機」は、後述する図8で示す様に、難易度クラス11以上で出現しやすい語であり、「契機」の難易度クラスは11となる。所定の閾値が1である場合、両難易度クラスの差の絶対値である2は、この所定の閾値である1以上又はより大である。このため、「契機」が外れ値箇所として抽出される。
For example, when the difficulty level class of the estimated text is 9, "Occurrence" in the example sentences is a word that is likely to appear on
外れ値箇所抽出部4は、親密度等の難易度クラス以外の指標を用いて外れ値箇所の抽出を行ってもよい。断片が単語であるとして、単語である断片の親密度は、その断片がどの程度なじみがあると感じられるかを表した指標である(例えば、参考文献1参照。)。
The outlier
〔参考文献1〕天野成昭,外1名,「基本語データベース: 語義別単語親密度」,学習研究社,2008 [Reference 1] Amano Nadaaki, 1 other person, "Basic word database: Word familiarity according to meaning", Learning research company, 2008
各断片に対応する親密度が予め定められて、記憶部72に記憶されているとする。各難易度クラスに対応する親密度が、記憶部72に記憶されているとする。図5に各断片に対応する親密度の例を示す。また、図6に各難易度クラスに対応する親密度の例を示す。図5の例では、各難易度クラスに対応する親密度は、区間となっている。このように、各全体難易度に対応する親密度は、区間となっていてもよい。また、図6の例では、12個の難易度クラスのそれぞれに対応する親密度を区間で示している。なお、難易度クラス5よりも低い全体難易度では、いずれも大人にとってはとても親密度の高い語になる。このため、難易度クラス5よりも低い全体難易度に、同じ親密度を対応させてもよい。
It is assumed that the degree of intimacy corresponding to each fragment is predetermined and stored in the
各断片の親密度は、例えば参考文献1等の既存のデータベースに基づいて定めることができる。親密度は、例えば7段階で定めることができる。例えば、親密度1だと知っている人が非常に少ない、親密度5以上なら95%以上の大人が知っていることを表す。入力されるテキスト対象が、幼児対象のものであれば、幼児の語彙獲得月齢を用いて、親密度を定めてもよい。
The closeness degree of each fragment can be determined, for example, based on an existing database such as
外れ値箇所抽出部4は、親密度を用いて外れ値箇所の抽出を行う場合には、各断片に対応する親密度と、全体難易度推定部32で推定されたテキストの難易度クラスとに対応する親密度を記憶部7から読み込む。
When the outlier
外れ値箇所抽出部4は、例えば、各断片の親密度が、全体難易度推定部32で推定された難易度クラスに対応する親密度よりも低い場合には、その各断片を外れ値箇所とする。
For example, when the closeness degree of each fragment is lower than the closeness degree corresponding to the difficulty class estimated by the overall difficulty
このように、外れ値箇所抽出部4は、各断片の親密度と全体難易度推定部32で推定されたテキストの難易度クラスに対応する親密度との比較に基づいて、外れ値箇所を抽出してもよい。
Thus, the outlier
また、外れ値箇所抽出部4は、難易度の組と親密度の組の両方を使って、外れ値箇所の抽出をしてもよい。外れ値箇所抽出部4は、例えば、各断片の難易度クラスと、推定されたテキストの難易度クラスとの差の絶対値が、所定の閾値(例えば1)以上又はより大である場合であって、かつ、その各断片の親密度が、全体難易度推定部32で推定された難易度クラスに対応する親密度よりも低い場合には、その各断片を外れ値箇所とする。
Also, the outlier
また、このように、外れ値箇所抽出部4は、親密度の組と、難易度の組との少なくとも一方を用いて、外れ値箇所を抽出してもよい。
Also, as described above, the outlier
なお、外れ値箇所抽出部4は、各断片の難易度クラス及び各断片の親密度の少なくとも一方を用いて外れ値箇所を抽出してもよい。例えば、外れ値箇所抽出部4は、各断片の難易度クラスが所定の閾値以上であり、かつ、その各断片の親密度が所定の以下の場合に、その各断片を外れ値箇所とする。これにより、出現頻度が極端に低い語や、偏りのある語についても、外れ値箇所の抽出処理を行うことができる。
The outlier
図7に、各難易度クラスにおける平均語数の例を示す。入力されたテキストの難易度クラスは3であり、ある一文である断片の語数は15であるとすると、この一文である断片の語数約15は、テキストの難易度クラス3における平均語数約11を大きく上回っている。このため、この一文である断片を外れ値箇所とすることが考えられる。
FIG. 7 shows an example of the average number of words in each difficulty level class. Assuming that the difficulty level class of the input text is 3 and the number of words of a fragment which is one sentence is 15, the number of words of the fragment which is one sentence is approximately 15 and the average number of words in the
<代替表現提示部5>
代替表現提示部5には、外れ値箇所が入力される。
<Alternative
Outlier points are input to the alternative
代替表現提示部5は、外れ値箇所抽出部4で抽出された外れ値箇所の断片と同様の意味を有する断片であって、外れ値箇所抽出部4で抽出された外れ値箇所の断片の難易度クラスよりも全体難易度推定部3で推定された全体難易度に近い難易度の断片である代替表現をユーザに提示する(ステップS5)。この提示は、例えば、CRT、液晶ディスプレイ等の表示装置を介して行われる。なお、代替表現提示部5は、外れ値箇所を更にユーザに提示してもよい。
The alternative
例えば、外れ値箇所抽出部4において「契機」という単語が難易度クラスが高すぎるため外れ値箇所として抽出された場合には、代替表現提示部5は、「契機」よりも難易度クラスの低い「きっかけ」という単語を置き換える候補として提示することが考えられる。
For example, when the word “Origin” is extracted as an outlier part because the difficulty level class is too high in the outlier
各断片に対応する代替表現は対応する難易度クラスと共に、代替表現記憶部8に予め記憶されているとする。代替表現は、同義語辞書や、大量のコーパスから類似する語や表現を収集したALAGIN 言語資源・音声資源サイト(https://alaginrc.nict.go.jp/)等の既存のデータベースを用いて作成することができる。代替表現提示部5は、入力された外れ値箇所をキーとして代替表現記憶部8を参照することにより、適切な代替表現を読み込む。
It is assumed that the alternative expression corresponding to each fragment is stored in advance in the alternative
代替表現提示部5は、外れ値箇所を提示した代替表現に置換する修正を行うかどうかの提案をユーザに行ってもよい。ユーザは、キーボード、マウス、タッチパネル等の入力装置を用いて、その提案を受け入れる旨の入力を行うと、その旨を表す修正要求信号が代替表現提示部5から代替表現置換部6に出力される。
The alternative
置き換える候補として提示する候補は、1つであっても複数であってもよい。複数の場合、代替表現提示部5は、外れ値箇所を提示した代替表現のいずれに置換する修正を行うか、あるいは、いずれにも修正を行わないか、複数の提案をユーザに行ってもよい。ユーザは、キーボード、マウス、タッチパネル等の入力装置を用いて、どの候補を受け入れる旨を入力するか、修正を行わない旨の入力を行うと、その旨を表す修正要求信号が代替表現提示部5から代替表現置換部6に出力される。
The candidate to be presented as a candidate for replacement may be one or more. In the case of multiple, the alternative
<代替表現置換部6>
代替表現置換部6には、外れ値箇所が入力される。また、代替表現置換部6には、修正要求信号が入力される。
<Alternative
The outlier location is input to the alternative
代替表現置換部6は、外れ値箇所抽出部4で抽出された外れ値箇所の断片と同様の意味を有する断片であって、外れ値箇所抽出部4で抽出された外れ値箇所の断片の難易度クラスよりも全体難易度推定部3で推定された難易度クラスに近い難易度クラスの断片である代替表現により入力されたテキストの中の外れ値箇所抽出部4で抽出された外れ値箇所の断片を置換したテキストを出力する(ステップS6)。
The alternative
また、修正要求信号を代替表現提示部5から受信した場合には、代替表現置換部6は、外れ値箇所を代替表現提示部5で提示した代替表現に置換する修正を行い、修正後テキストを出力する。
Also, when the correction request signal is received from the alternative
各断片に対応する代替表現は対応する難易度クラスと共に、代替表現記憶部8に予め記憶されているとする。代替表現は、同義語辞書や、大量のコーパスから類似する語や表現を収集したALAGIN 言語資源・音声資源サイト(https://alaginrc.nict.go.jp/)等の既存のデータベースを用いて作成することができる。代替表現置換部6は、入力された外れ値箇所をキーとして代替表現記憶部8を参照することにより、適切な代替表現を読み込み、置換処理を行う。
It is assumed that the alternative expression corresponding to each fragment is stored in advance in the alternative
代替表現提示をせず、最も近いものに自動で置き換えて、修正後のテキストを出力する構成でもよい。その場合には、代替表現提示部5は不要である。
It may be configured to output a corrected text by automatically replacing with the closest one without presenting alternative expressions. In that case, the alternative
[第二実施形態]
第二実施形態の外れ値箇所抽出装置及び方法は、全体難易度推定部32で推定されたテキストの難易度クラスからの外れ値箇所ではなく、所定の難易度クラスからの外れ値箇所を抽出する装置及び方法である。以下、第一実施形態と異なる部分のみを説明する。第一実施形態と同様の部分については説明を省略する。
Second Embodiment
The outlier location extracting apparatus and method according to the second embodiment extract outlier locations from a predetermined difficulty class, not outlier locations from the difficulty class of the text estimated by the overall
所定の難易度クラスは、ユーザにより適宜決定される。 The predetermined difficulty level class is appropriately determined by the user.
第二実施形態の外れ値箇所抽出装置は、第一実施形態の外れ値箇所抽出装置と異なり、図2に示すように、テキストの難易度クラスを推定する全体難易度推定部32を備えていない。すなわち、第二実施形態の外れ値箇所抽出方法は、ステップS32の処理を行わない。
Unlike the outlier location extracting device according to the first embodiment, the outlier location extracting device according to the second embodiment does not include the overall
第二実施形態の外れ値箇所抽出部4、代替表現提示部5及び代替表現置換部6は、全体難易度推定部32で推定されたテキストの難易度クラスに代えて、所定の難易度クラスに基づいて、第一実施形態と同様の処理を行う。
The outlier
すなわち、第二実施形態の外れ値箇所抽出部4は、断片難易度推定部31で推定された各断片の難易度クラスと所定の難易度クラスとの組である難易度の組を用いて、所定の難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する。言い換えれば、第二実施形態の外れ値箇所抽出部4は、断片難易度推定部31で推定された各断片の難易度クラスと所定の難易度クラスとの比較に基づいて、所定の難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する。
That is, the outlier
第二実施形態の代替表現提示部5は、外れ値箇所抽出部4で抽出された外れ値箇所の断片と同様の意味を有する断片であって、外れ値箇所抽出部4で抽出された外れ値箇所の断片の難易度クラスよりも所定の難易度クラスに近い難易度の断片である代替表現をユーザに提示する(ステップS5)。
The alternative
第二実施形態の代替表現置換部6は、外れ値箇所抽出部4で抽出された外れ値箇所の断片と同様の意味を有する断片であって、外れ値箇所抽出部4で抽出された外れ値箇所の断片の難易度クラスよりも所定の全体難易度に近い難易度クラスの断片である代替表現により入力されたテキストの中の外れ値箇所抽出部4で抽出された外れ値箇所の断片を置換したテキストを出力する(ステップS6)。
The alternative
また、各断片の親密度及び所定の難易度クラスに対応する親密度が予め定められているとして、第二実施形態の外れ値箇所抽出部4は、各断片の親密度と所定の難易度クラスに対応する親密度との比較に基づいて、外れ値箇所を抽出してもよい。
Also, assuming that the intimacy degree of each fragment and the intimacy degree corresponding to the predetermined difficulty level class are predetermined, the outlier
このように、全体難易度推定部32で推定された難易度クラスの代わりにユーザが予め指定した所定の難易度クラスを用いてもよい。例えば、ユーザが小学校3年生程度の難易度を設定したい場合、小学校3年生程度の難易度を表すクラスを所定の難易度クラスとする。
Thus, instead of the difficulty level class estimated by the overall difficulty
例えば、小学校3年生程度の難易度を設定したいのに、テキスト全体が小学校3年生程度の難易度よりも難しいかどうかを調べたい場合には、全体難易度推定部32による全体の難易度の推定を行うが、その必要がない場合には、単に小学校3年生程度の難易度クラスから遠い箇所を外れ値箇所とすればよいため、全体難易度推定部32による全体の難易度の推定は行わなくてよい。
For example, when it is desired to set whether the entire text is more difficult than the third grade elementary level, although the third degree primary grade is desired to be set, the overall degree of difficulty is estimated by the overall
[第三実施形態]
第三実施形態の外れ値箇所抽出装置及び方法は、単語n-gramの出現頻度を用いて、断片及び/又はテキストの難易度クラスを推定する装置及び方法である。以下、第一実施形態と異なる部分のみを説明する。第一実施形態と同様の部分については説明を省略する。
Third Embodiment
The outlier location extracting apparatus and method according to the third embodiment is an apparatus and method for estimating the difficulty level class of fragments and / or texts using the frequency of occurrence of word n-gram. Hereinafter, only differences from the first embodiment will be described. The description of the same parts as in the first embodiment will be omitted.
<断片難易度推定部31>
断片難易度推定部31は、入力されたテキストに含まれる各断片の難易度クラスを推定する。
<Shard difficulty
The fragment difficulty
例えば、断片が少なくとも1個の文である場合(具体的には、断片が段落である等の場合)には、断片難易度推定部31は、各単語n-gramの出現頻度を用いて、各断片の難易度クラスを推定する。
For example, if the fragment is at least one sentence (specifically, if the fragment is a paragraph, etc.), the fragment difficulty
断片難易度推定部31は、各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを各断片の難易度クラスとする。
The fragment difficulty
各断片Sが難易度クラスiに属する尤度L(i|S)は、例えば以下の式(3')及び式(4')により定義される。 The likelihood L (i | S) that each fragment S belongs to the difficulty level class i is defined by, for example, the following equations (3 ′) and (4 ′).
ここで、tf・idf(Wj)は単語n-gram Wjの重みであり、f(Wj,S)は各断片における各単語n-gram Wjの出現頻度であり、ΣLf(WL,S)は上記各断片に含まれる単語n-gramの数であり、Dは所定の学習用テキストの数であり(すなわち、各難易度クラスの学習用テキストの集合Diの要素の数|Di|の和Σi=1 N|Di|であり)、dfiは単語n-gram Wjの出現する学習用テキストの数であり、Pi(Wj)は難易度クラスiにおける単語n-gram Wjの生起確率Pi(Wj)である。 Here, tf · idf (W j ) is a weight of word n-gram W j , f (W j , S) is an appearance frequency of each word n-gram W j in each fragment, and Σ L f ( W L , S) is the number of words n-grams contained in each of the above fragments, and D is the number of predetermined texts for learning (ie, the elements of the set D i of texts for learning of each difficulty level number | D i | of the sum Σ i = 1 N | D i | a is), df i is the number of learning for the text that appears in the word n-gram W j, P i (W j) the degree of difficulty class The occurrence probability P i (W j ) of the word n-gram W j at i .
難易度クラスiにおける単語n-gram Wjの生起確率Pi(Wj)は例えば以下の式(1)により定義される。ここで、iは、事前に設定された難易度クラスの種類を表す値(i=1,…,N)である。jは、1以上の自然数である。 The occurrence probability P i (W j ) of the word n-gram W j in the difficulty level class i is defined, for example, by the following equation (1). Here, i is a value (i = 1,..., N) representing the type of the difficulty level set in advance. j is a natural number of 1 or more.
ここで、Nは、難易度クラスの個数であり、所定の正の整数である。f(wj,Di)は、Diにおける断片wjの出現頻度である。 Here, N is the number of difficulty classes and is a predetermined positive integer. f (w j , D i ) is the frequency of occurrence of fragment w j in D i .
各単語n-gramの特徴量としてPi(wj)が予め計算され記憶部71に予め記憶される。また、式(3')及び式(4')の計算で必要なD, dfi等の他のパラメータも記憶部71に記憶されている。断片難易度推定部31は、記憶部71からこれらの値を読み込み式(3')及び式(4')の計算を行う。
P i (w j ) is calculated in advance as a feature amount of each word n-gram, and stored in the
外れ値箇所抽出装置は、Pi(wj)を事前に計算するための事前計算部9を備えていてもよい。事前計算部9は、Pi(wj)=0となる場合に上記式(3)及び式(3')により定義される尤度が計算できなくなることを避けるため、全てのPi(wj)が0でなくなるまで、以下の式(2)を適用することにより、Pi(wj)を補正してもよい。
The outlier location extraction device may include a
また、Pi(wj)が0でない場合でも、特徴量抽出部2は式(2)によって得られる値を利用してもよい。例えば式(2)によって得られる値が式(1)で得られている値より大きい場合にも、特徴量抽出部2は式(2)によって得られる値を利用してもよい。
In addition, even when P i (w j ) is not 0, the feature
なお、0の場合にのみ両隣の値の和の1/2とする式(2)では不具合が生じる場合がある。 In addition, a fault may arise in Formula (2) made into 1/2 of the sum of the value of both sides only in the case of 0.
例えば、難易度クラスdの補正前のPk(wj)は0であるため、式(2)により補正をすると、難易度クラスdの補正後のPk(wj)=(0.6+0.6)/2=0.3となる。この場合、補正前後でbとdの大小関係が逆転してしまう。すなわち、補正前では難易度クラスbのPb(wj)=0.1 > 難易度クラスdのPd(wj)=0であったにも関わらず、補正後では難易度クラスbのPb(wj)=0.1 < 難易度クラスdのPd(wj)=0.3となり、補正の前後でbとdでPi(wj)の大小関係が逆転している。そこで、0に近い値を有し、自身より大きな値の隣に存在する場合には0でなくても補正してもよい。具体的には、上記の場合、bについても上記式(2)により補正してもよい。 For example, since P k (w j ) before the correction of the difficulty class d is 0, P k (w j ) after the correction of the difficulty class d = (0.6 + 0.6) when corrected by the equation (2). ) /2=0.3. In this case, the magnitude relationship between b and d is reversed before and after correction. That is, although P b (w j ) = 0.1 in the difficulty class b before correction, P d (w j ) = 0 in the difficulty class d, P b in the difficulty class b after correction (w j ) = 0.1 <P d (w j ) = 0.3 of the difficulty class d, and before and after the correction, the magnitude relationship of P i (w j ) is reversed between b and d. Therefore, if it has a value close to 0 and exists next to a value larger than itself, it may be corrected even if it is not 0. Specifically, in the above case, b may be corrected by the above equation (2).
断片が1個の単語で構成されているとした場合、すなわち単語uni-gramの場合、難易度クラスiにおける断片wjの生起確率Pi(wj)は、「きっかけ」「契機」「親子」等の各単語の各難易度クラスにおける生起確率である。 Assuming that the fragment is composed of one word, that is, in the case of a word uni-gram, the occurrence probability P i (w j ) of the fragment w j in the difficulty class i is “trigger” “trigger” “parent-child Etc. is an occurrence probability in each difficulty level class of each word.
図8に、「きっかけ」「契機」「親子」という単語のそれぞれの各難易度クラスにおける生起確率の例を示す。また、図9に、「おおかみ」「オオカミ」「狼」という単語のそれぞれの各難易度クラスにおける生起確率の例を示す。図8及び図9において、横軸は難易度クラスを表し、縦軸は生起確率を意味する。図8及び図9では、難易度クラスは1から12までの12種類存在する。この例では、難易度クラスの値が大きいほど難易度が高いことを意味する。この12個の難易度クラスは、それぞれ小学校1年生から高校3年生に対応している。すなわち、難易度クラス1が小学校1年生に、難易度クラス2が小学校2年生に、・・・、難易度クラス12が高校3年生に対応している。
FIG. 8 shows an example of the occurrence probability in each difficulty level class of the words "trigger", "trigger" and "parent-child". Further, FIG. 9 shows an example of the occurrence probability in each difficulty level class of each of the words "Ookami", "Ookami", and "Mio". In FIGS. 8 and 9, the horizontal axis represents the difficulty level, and the vertical axis represents the probability of occurrence. In FIG. 8 and FIG. 9, there are 12 types of difficulty levels from 1 to 12. In this example, the larger the difficulty class value, the higher the difficulty. These twelve difficulty classes correspond to first graders to third graders in elementary school, respectively. That is, the
図8から、「契機」という単語は、9から12という高い難易度クラスでのみ生起確率が高いことがわかる。また、図9から、「おおかみ」という単語は低い難易度クラスで生起確率が高く、「オオカミ」という単語は中程度の難易度クラスで生起確率が高く、「狼」という単語は高い難易度クラスで生起確率が高いことがわかる。 It can be seen from FIG. 8 that the word “Origin” has a high probability of occurrence only in the high difficulty level class of 9 to 12. Also, from FIG. 9, the word “okami” has a high probability of occurrence in the low difficulty class, the word “wolf” has a high probability of occurrence in the medium difficulty class, and the word “狼” has a high difficulty class It can be seen that the occurrence probability is high.
断片が2個の単語で構成されている場合、すなわち単語bigramの場合、難易度クラスiにおける単語n-gram Wjの生起確率Pi(Wj)は、「親子の」等の2個の単語の各難易度クラスにおける生起確率となる。この例のように、断片が2個以上の単語である場合の生起確率を計算することにより、単語より長い複合表現や、言い回し等の各難易度クラスにおける生起確率を計算することができる。 When the fragment is composed of two words, that is, in the case of the word bigram, the occurrence probability P i (W j ) of the word n-gram W j in the difficulty class i is two such as “parent-child” It is the occurrence probability in each difficulty level class of the word. As in this example, by calculating the occurrence probability when the fragment is two or more words, it is possible to calculate the occurrence probability in each difficulty level class such as a complex expression longer than a word or a wording.
これらの生起確率を用いて、より長い単位のn-gramで構成される断片やテキストについても、各難易度クラスに対する尤度を計算することができる。 These occurrence probabilities can be used to calculate the likelihood for each difficulty level even for fragments or texts composed of longer units of n-grams.
なお、断片難易度推定部31は、第一実施形態で説明した処理と同様の処理により、各断片の難易度クラスを推定してもよい。例えば、断片が単語n-gramである場合には、断片難易度推定部31は、記憶部71に予め記憶されている、各断片とその各断片の難易度クラスとの対応付けの情報を参照して、各断片の難易度クラスを求めてもよい。
The fragment difficulty
<全体難易度推定部32>
全体難易度推定部32は、各単語n-gramの出現頻度を用いて、入力されたテキストの難易度クラスを推定する(ステップS32)。推定されたテキストの難易度クラスは、外れ値箇所抽出部4に出力される。
<Overall difficulty
The overall difficulty
例えば、全体難易度推定部32は、入力されたテキストに含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、入力されたテキストが各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを入力されたテキストの難易度クラスとする。
For example, the overall difficulty
入力されたテキストTが難易度クラスiに属する尤度L(i|T)は、例えば以下の式(3)及び式(4)により定義される。 The likelihood L (i | T) that the input text T belongs to the difficulty level class i is defined by, for example, the following equations (3) and (4).
ここで、tf・idf(Wj)は単語n-gram Wjの重みであり、f(Wj,T)はTにおける各単語n-gram Wjの出現頻度であり、ΣLf(WL,T)は上記テキストに含まれる単語n-gramの数であり、Dは所定の学習用テキストの数であり、dfiは単語n-gram Wjの出現する上記学習用テキストの数であり、Pi(Wj)は難易度クラスiにおける単語n-gram Wjの生起確率Pi(Wj)である。 Here, tf · idf (W j ) is a weight of the word n-gram W j , f (W j , T) is an appearance frequency of each word n-gram W j in T, and Σ L f (W L, T) is the number of words n-gram contained in the text, D is the number of predetermined training text, df i is the number of the training text that appears in the word n-gram W j P i (W j ) is an occurrence probability P i (W j ) of the word n-gram W j in the difficulty class i.
各単語n-gramの特徴量としてPi(Wj)が予め計算され記憶部71に予め記憶される。また、式(3)及び式(4)の計算で必要なD, dfi等の他のパラメータも記憶部71に記憶されている。全体難易度推定部3は、記憶部71からこれらの値を読み込み式(3) 及び式(4)の計算を行う。
P i (W j ) is calculated in advance as a feature amount of each word n-gram and stored in advance in the
Pi(Wj)の定義及び事前計算については、上記と同様であるため、ここでは重複説明を省略する。 The definition and pre-calculation of P i (W j ) are the same as described above, and thus redundant description will be omitted here.
なお、全体難易度推定部32は、第一実施形態で説明した処理と同様の処理によりテキストの難易度クラスを推定してもよい。例えば、全体断片難易度推定部32の中の特徴量抽出部321が、テキストの特徴量を求め、全体難易度推定部32は求まった特徴量をテキストの難易度クラスとしてもよい。
Note that the overall difficulty
なお、全体難易度推定部32は、各単語n-gramの出現頻度を用いて入力されたテキストの難易度クラスを推定した結果である単語n-gram に基づく各難易度クラスに対する尤度と、第一実施形態で説明した処理と同様の処理により得たテキストの平均文長や漢字の割合、受動態や能動態の割合などをすべて特徴量として利用し、学習器によって最終的な難易度クラスを推定してもよい。この時、学習器としては、SVM-RANK などの既知の学習器を利用することができる。また、これらの特徴量を用いて難易度クラスを推定するためのモデルは、予め学習データから構築して記憶させておく。
The overall difficulty
[第四実施形態]
第四実施形態の外れ値箇所抽出装置及び方法は、第四実施形態の外れ値箇所抽出装置及び方法とは異なり、全体難易度推定部32で推定されたテキストの難易度クラスからの外れ値箇所ではなく、所定の難易度クラスからの外れ値箇所を抽出する装置及び方法である。以下、第三実施形態と異なる部分のみを説明する。第三実施形態と同様の部分については説明を省略する。
Fourth Embodiment
The outlier location extracting apparatus and method according to the fourth embodiment are different from the outlier location extracting apparatus and method according to the fourth embodiment, and the outlier location from the difficulty level class of the text estimated by the overall difficulty
所定の難易度クラスは、ユーザにより適宜決定される。 The predetermined difficulty level class is appropriately determined by the user.
第四実施形態の外れ値箇所抽出装置は、第三実施形態の外れ値箇所抽出装置と異なり、図2に示すように、テキストの難易度クラスを推定する全体難易度推定部32を備えていない。すなわち、第四実施形態の外れ値箇所抽出方法は、ステップS32の処理を行わない。
Unlike the outlier location extracting device according to the fourth embodiment, the outlier location extracting device according to the fourth embodiment does not include the overall
第四実施形態の外れ値箇所抽出部4、代替表現提示部5及び代替表現置換部6は、全体難易度推定部32で推定されたテキストの難易度クラスに代えて、所定の難易度クラスに基づいて、第三実施形態と同様の処理を行う。
The outlier
すなわち、第四実施形態の外れ値箇所抽出部4は、断片難易度推定部31で推定された各断片の難易度クラスと所定の難易度クラスとの組である難易度の組を用いて、所定の難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する。言い換えれば、第四実施形態の外れ値箇所抽出部4は、断片難易度推定部31で推定された各断片の難易度クラスと所定の難易度クラスとの比較に基づいて、所定の難易度クラスから離れた難易度を有する、テキストの断片である外れ値箇所を抽出する。
That is, the outlier
第四実施形態の代替表現提示部5は、外れ値箇所抽出部4で抽出された外れ値箇所の断片と同様の意味を有する断片であって、外れ値箇所抽出部4で抽出された外れ値箇所の断片の難易度クラスよりも所定の難易度クラスに近い難易度の断片である代替表現をユーザに提示する(ステップS5)。
The alternative
第四実施形態の代替表現置換部6は、外れ値箇所抽出部4で抽出された外れ値箇所の断片と同様の意味を有する断片であって、外れ値箇所抽出部4で抽出された外れ値箇所の断片の難易度クラスよりも所定の難易度クラスに近い難易度クラスの断片である代替表現により入力されたテキストの中の外れ値箇所抽出部4で抽出された外れ値箇所の断片を置換したテキストを出力する(ステップS6)。
The alternative
また、各断片の親密度及び所定の難易度クラスに対応する親密度が予め定められているとして、第四実施形態の外れ値箇所抽出部4は、各断片の親密度と所定の難易度クラスに対応する親密度との比較に基づいて、外れ値箇所を抽出してもよい。
Further, assuming that the intimacy degree of each fragment and the intimacy degree corresponding to the predetermined difficulty level class are determined in advance, the outlier
このように、全体難易度推定部32で推定された難易度クラスの代わりにユーザが予め指定した所定の難易度クラスを用いてもよい。例えば、ユーザが小学校3年生程度の難易度を設定したい場合、小学校3年生程度の難易度を表すクラスを所定の難易度クラスとする。
Thus, instead of the difficulty level class estimated by the overall difficulty
例えば、小学校3年生程度の難易度を設定したいのに、テキスト全体が小学校3年生程度の難易度よりも難しいかどうかを調べたい場合には、全体難易度推定部32による全体の難易度の推定を行うが、その必要がない場合には、単に小学校3年生程度の難易度クラスから遠い箇所を外れ値箇所とすればよいため、全体難易度推定部32による全体の難易度の推定は行わなくてよい。
For example, when it is desired to set whether the entire text is more difficult than the third grade elementary level, although the third degree primary grade is desired to be set, the overall degree of difficulty is estimated by the overall
[プログラム及び記録媒体]
外れ値箇所抽出装置における各処理をコンピュータによって実現する場合、外れ値箇所抽出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各処理がコンピュータ上で実現される。
[Program and Recording Medium]
When each process in the outlier location extraction device is realized by a computer, the processing content of the function that the outlier location extraction device should have is described by a program. And each process is implement | achieved on a computer by running this program by computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing content can be recorded in a computer readable recording medium. As the computer readable recording medium, any medium such as a magnetic recording device, an optical disc, a magneto-optical recording medium, a semiconductor memory, etc. may be used.
また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 Further, each processing means may be configured by executing a predetermined program on a computer, or at least a part of the processing content may be realized as hardware.
[変形例]
上記の外れ値抽出装置及び方法は、外れ値箇所を抽出する代わりに、上記と同様の処理により、外れ値箇所であると判定をするものであってもよい。また、外れ値抽出装置及び方法は、外れ値箇所であると判定した上で、その判定された外れ値箇所を抽出するものであってもよい。
[Modification]
The above outlier extraction apparatus and method may be configured to determine that the outlier location is the same as the above processing, instead of extracting the outlier location. Further, the outlier extraction apparatus and method may be configured to extract the determined outlier location after determining that it is an outlier location.
上記の外れ値抽出装置は、入力されたテキストに含まれ、テキストを所定の単位で分割した断片の少なくとも1つについて難易度を推定する断片難易度推定部31と、少なくとも1つの断片の中で所定の基準以上に難易度が外れている断片を、テキストの外れ値箇所であると判定する及び/又はテキストの外れ値箇所として抽出する外れ値箇所抽出部4と、を備えている外れ値抽出装置の一例であると考えることができる。
The outlier extraction device described above includes a fragment difficulty
外れ値箇所抽出部31は、少なくとも1つの断片の中で所定の基準以上に難易度が外れている断片を、テキストの外れ値箇所であると判定する及び/又はテキストの外れ値箇所として抽出することができれば上記以外の処理により外れ値箇所の判定及び/又は抽出を行ってもよい。
The outlier
例えば、外れ値箇所抽出部31は、統計的に各断片の難易度の分布を描いたとき、難易度がその分布の中で所定の位置よりも裾の方に行ってしまっていたらその難易度に対応する断片を外れ値箇所とする、というような統計的な所定の基準に基づいて、外れ値箇所の判定及び/又は抽出を行ってもよい。
For example, when the outlier
上記の断片の難易度クラスは、断片の難易度の一例である。断片の難易度は、離散的な値を取るものであってもよいし、連続的な値を取るものであってもよい。 The above-mentioned difficulty class of fragments is an example of the difficulty of fragments. The difficulty levels of fragments may be discrete values or continuous values.
図7及び図8の例では、難易度クラスの種類の個数は12あり、12個の難易度クラスは小学校1年生から高校3年生に対応していたが、これは一例である。Nを所定の正の整数として、難易度クラスの種類の個数はN個であってもよい。また、N個の難易度クラスは、年齢や学年以外の指標に対応させてもよい。例えば、難易度クラスを、「一般」「専門1(新聞)」「専門2(特許)」「専門3(教科書)」等の専門分野に対応させてもよい。これにより、外れ値箇所抽出装置及び方法を、ある専門分野でのマニュアル作成時に利用することができる。 In the example of FIG. 7 and FIG. 8, the number of types of the difficulty level class is 12, and the 12 difficulty levels correspond to the first grader to the third grade of elementary school, but this is an example. The number of types of difficulty classes may be N, where N is a predetermined positive integer. Also, N difficulty classes may correspond to indicators other than age and grade. For example, the difficulty level classes may correspond to special fields such as “general”, “specialty 1 (newspaper)”, “specialty 2 (patent)”, and “specialty 3 (textbook)”. This allows the outlier location extraction apparatus and method to be used when creating a manual in a particular area of expertise.
また、外れ値箇所抽出装置に、代替表現提示部5は備えられていなくてもよい。
Further, the alternative
外れ値箇所として、テキストから単語や段落を抽出するだけでなく、外れ値箇所としてテキストからページを抽出してもよい。この場合、断片は、ページとなる。また、外れ値箇所として、複数のテキストから、難易度クラスの異なるテキストを抽出してもよい。この場合、複数のテキストの難易度クラスと、各断片である各テキストの難易度クラスとが推定され、複数のテキストの難易度クラスから離れた難易度クラスのテキストが外れ値箇所として抽出される。このように、「入力されたテキスト」及び「断片」の定義を適宜変えることにより、外れ値箇所抽出装置及び方法を様々な用途に拡張してもよい。 As outlier portions, not only words or paragraphs may be extracted from text, but pages may be extracted from text as outlier portions. In this case, the fragment is a page. Also, texts of different difficulty classes may be extracted from a plurality of texts as outlier locations. In this case, difficulty levels of multiple texts and difficulty levels of each text that is each fragment are estimated, and texts of difficulty levels separated from multiple text difficulty classes are extracted as outlier points . Thus, the outlier location extraction apparatus and method may be extended to various applications by changing the definitions of “entered text” and “fragment” as appropriate.
上記説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。 The processes described above are not only executed chronologically according to the order of description, but may also be executed in parallel or individually depending on the processing capability of the apparatus executing the process or the necessity.
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。 It goes without saying that other modifications can be made as appropriate without departing from the spirit of the present invention.
1 前処理部
2 特徴量抽出部
31 断片難易度推定部
32 全体難易度推定部
4 外れ値箇所抽出部
5 代替表現提示部
6 代替表現置換部
71 記憶部
72 記憶部
8 代替表現記憶部
1
Claims (10)
上記テキストの難易度クラスを推定する全体難易度推定部と、
上記推定された上記各断片の難易度クラスと上記推定されたテキストの難易度クラスとの比較に基づいて、上記推定されたテキストの難易度クラスから離れた難易度を有する、上記テキストの断片である外れ値箇所を抽出する外れ値箇所抽出部と、
を含み、
上記断片難易度推定部は、上記各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、上記各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを上記推定された各断片の難易度クラスとし、
上記全体難易度推定部は、上記テキストに含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、上記テキストが各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを上記推定されたテキストの難易度クラスとする、
外れ値箇所抽出装置。 A fragment difficulty level estimation unit for estimating the difficulty level class of each fragment obtained by dividing the text into predetermined units, which is included in the input text;
An overall difficulty estimation unit that estimates the difficulty level class of the above text,
A fragment of the text having a degree of difficulty separate from the estimated difficulty level of the text based on a comparison of the estimated difficulty level of each fragment and the estimated difficulty level of the text An outlier location extraction unit for extracting a certain outlier location;
Only including,
The fragment difficulty level estimation unit determines each difficulty level of each fragment based on the appearance frequency of each word n-gram included in each fragment and the occurrence probability of each word previously obtained for each difficulty level class. The likelihood belonging to the class is estimated, and the highest likelihood difficulty class is taken as the difficulty class of each fragment estimated above,
The overall difficulty level estimation unit determines whether the text is in each difficulty level class based on the appearance frequency of each word n-gram included in the text and the occurrence probability of each word previously determined for each difficulty level class. Estimate the likelihood of belonging, and let the difficulty class with the highest likelihood be the difficulty class of the above estimated text,
Outlier location extractor.
上記推定された上記各断片の難易度クラスと所定の難易度クラスとの比較に基づいて、上記所定の難易度クラスから離れた難易度を有する、上記テキストの断片である外れ値箇所を抽出する外れ値箇所抽出部と、
を含み、
上記断片難易度推定部は、上記各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、上記各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを上記推定された各断片の難易度クラスとする、
外れ値箇所抽出装置。 A fragment difficulty level estimation unit for estimating the difficulty level class of each fragment obtained by dividing the text into predetermined units, which is included in the input text;
An outlier portion which is a fragment of the text having a degree of difficulty separated from the predetermined degree of difficulty is extracted based on a comparison between the estimated degree of difficulty of each fragment and a predetermined degree of difficulty. Outlier location extraction unit,
Only including,
The fragment difficulty level estimation unit determines each difficulty level of each fragment based on the appearance frequency of each word n-gram included in each fragment and the occurrence probability of each word previously obtained for each difficulty level class. The likelihood belonging to the class is estimated, and the highest likelihood difficulty class is taken as the difficulty class of each fragment estimated above,
Outlier location extractor.
Sを上記断片とし、f(Wj,S)を上記各断片における各単語n-gram Wjの出現頻度とし、ΣLf(WL,S)を上記各断片に含まれる単語n-gramの数とし、Dを所定の学習用テキストの数とし、dfiを単語n-gram Wjの出現する上記学習用テキストの数とし、Pi(Wj)を難易度クラスiにおける単語n-gram Wjの生起確率Pi(Wj)として、上記各断片が難易度クラスiに属する尤度L(i|S)は以下の式により定義される、
Let S be the fragment, f (W j , S) be the appearance frequency of each word n-gram W j in each fragment, and L L f (W L , S) be the word n-gram contained in each fragment Let D be the number of given training texts, d f i be the number of the above training texts in which word n-gram W j appears, and P i (W j ) be the word n- in the difficulty class i As the occurrence probability P i (W j ) of gram W j, the likelihood L (i | S) that each of the above fragments belongs to the difficulty level class i is defined by the following equation
上記断片は単語であるとして、
単語の親密度を、その単語がどの程度なじみがあると感じられるかを表した指標とし、上記各断片の親密度及び上記推定されたテキストの難易度クラス又は上記所定の難易度クラスに対応する親密度が予め定められているとして、
上記外れ値箇所抽出部は、上記各断片の親密度と上記推定されたテキストの難易度クラスおよび/又は上記所定の難易度クラスに対応する親密度との比較に基づいて、上記外れ値箇所を抽出する、
外れ値箇所抽出装置。 In the outlier location extraction device according to any one of claims 1 to 3 ,
Assuming that the above fragment is a word,
The intimacy degree of a word is used as an index indicating how familiar the word is felt, and corresponds to the intimacy degree of each fragment and the difficulty level of the estimated text or the predetermined difficulty level. Assuming that closeness is predetermined,
The outlier location extraction unit is configured to compare the outlier location based on a comparison between the intimacy degree of each fragment and the intimacy degree corresponding to the estimated difficulty level of the text and / or the predetermined difficulty level class. Extract,
Outlier location extractor.
上記断片は少なくとも1個の文であり、断片の特徴量はその断片を構成する平均語数であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片を構成する文節数であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片における漢字の割合であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片におけるカタカナの割合であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片におけるひらがなの割合であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片における漢字とカタカナの割合であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片における能動態又は受動態の割合であるか、
上記断片は少なくとも1個の文であり、断片の特徴量はその断片における構文木の深さであるか、
の何れかである外れ値箇所抽出装置。 In the outlier location extraction device according to any one of claims 1 to 4 ,
The fragment is at least one sentence, and the feature quantity of the fragment is the average number of words constituting the fragment, or
The above fragment is at least one sentence, and the feature quantity of the fragment is the number of clauses constituting the fragment, or
The fragment is at least one sentence, and the feature quantity of the fragment is the ratio of kanji in the fragment,
The fragment is at least one sentence, and the feature quantity of the fragment is the proportion of katakana in the fragment, or
The fragment is at least one sentence, and the feature quantity of the fragment is the percentage of hiragana in the fragment,
The above fragment is at least one sentence, and the feature quantity of the fragment is the ratio of kanji and katakana in the fragment,
The fragment is at least one sentence, and the feature quantity of the fragment is the rate of activity or passiveness of the fragment,
The above fragment is at least one sentence, and the feature quantity of the fragment is the depth of the syntax tree in the fragment, or
An outlier location extractor that is any of the following.
上記抽出された外れ値箇所の断片と同様の意味を有する断片であって、上記抽出された外れ値箇所の断片の難易度よりも上記推定されたテキストの難易度クラス又は上記所定の難易度クラスに近い難易度の断片である代替表現をユーザに提示する代替表現提示部、
を更に含む外れ値箇所抽出装置。 In the outlier location extraction device according to any one of claims 1 to 5 ,
It is a fragment having the same meaning as the extracted fragment of the outlier part, which is the difficulty class of the above-mentioned estimated text or the above predetermined difficulty class than the difficulty of the fragment of the extracted outlier part An alternative presentation presenting unit that presents to the user an alternative presentation that is a fragment of a degree of difficulty close to
An outlier location extractor further comprising
上記抽出された外れ値箇所の断片と同様の意味を有する断片であって、上記抽出された外れ値箇所の断片の難易度よりも上記推定されたテキストの難易度クラス又は上記所定の難易度クラスに近い難易度の断片である代替表現により上記テキストの中の上記抽出された外れ値箇所の断片を置換したテキストを出力する代替表現置換提示部、
を更に含む外れ値箇所抽出装置。 In the outlier location extraction device according to any one of claims 1 to 5 ,
It is a fragment having the same meaning as the extracted fragment of the outlier part, which is the difficulty class of the above-mentioned estimated text or the above predetermined difficulty class than the difficulty of the fragment of the extracted outlier part An alternative expression substitution presentation unit which outputs a text obtained by replacing the extracted fragment of the outlier location in the text by an alternative expression that is a fragment having a degree of difficulty near,
An outlier location extractor further comprising
全体難易度推定部が、上記テキストの難易度クラスを推定する全体難易度推定ステップと、 An overall difficulty estimation step of estimating the difficulty level of the above text by the overall difficulty estimation unit;
外れ値箇所抽出部が、上記推定された上記各断片の難易度クラスと上記推定されたテキストの難易度クラスとの比較に基づいて、上記推定されたテキストの難易度クラスから離れた難易度を有する、上記テキストの断片である外れ値箇所を抽出する外れ値箇所抽出ステップと、 The outlier location extraction unit determines the degree of difficulty away from the estimated difficulty class of the text based on the comparison of the estimated difficulty class of each fragment with the estimated difficulty class of the text. An outlier location extracting step of extracting an outlier location which is a fragment of the text,
を含み、 Including
上記断片難易度推定ステップは、上記各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、上記各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを上記推定された各断片の難易度クラスとし、 In the fragment difficulty level estimation step, each fragment has each difficulty level based on the appearance frequency of each word n-gram included in each fragment and the occurrence probability of each word previously determined for each difficulty level class The likelihood belonging to the class is estimated, and the highest likelihood difficulty class is taken as the difficulty class of each fragment estimated above,
上記全体難易度推定ステップは、上記テキストに含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、上記テキストが各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを上記推定されたテキストの難易度クラスとする、 In the overall difficulty level estimation step, the text is divided into each difficulty level class based on the appearance frequency of each word n-gram included in the text and the occurrence probability of each word previously determined for each difficulty level class. Estimate the likelihood of belonging, and let the difficulty class with the highest likelihood be the difficulty class of the above estimated text,
外れ値箇所抽出方法。 Outlier location extraction method.
外れ値箇所抽出部が、上記推定された上記各断片の難易度クラスと所定の難易度クラスとの比較に基づいて、上記所定の難易度クラスから離れた難易度を有する、上記テキストの断片である外れ値箇所を抽出する外れ値箇所抽出ステップと、 The text fragment of the above, wherein the outlier location extraction unit has a difficulty level away from the predetermined difficulty level class based on the comparison between the estimated difficulty level class of each fragment and the predetermined difficulty level class An outlier location extracting step for extracting a certain outlier location;
を含み、 Including
上記断片難易度推定ステップは、上記各断片に含まれる各単語n-gramの出現頻度と、難易度クラスごとに予め求められた各単語の生起確率とに基づいて、上記各断片が各難易度クラスに属する尤度を推定し、最も尤度の高い難易度クラスを上記推定された各断片の難易度クラスとする、 In the fragment difficulty level estimation step, each fragment has each difficulty level based on the appearance frequency of each word n-gram included in each fragment and the occurrence probability of each word previously determined for each difficulty level class The likelihood belonging to the class is estimated, and the highest likelihood difficulty class is taken as the difficulty class of each fragment estimated above,
外れ値箇所抽出方法。 Outlier location extraction method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016035300A JP6502279B2 (en) | 2016-02-26 | 2016-02-26 | Outlier location extraction device, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016035300A JP6502279B2 (en) | 2016-02-26 | 2016-02-26 | Outlier location extraction device, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017151849A JP2017151849A (en) | 2017-08-31 |
JP6502279B2 true JP6502279B2 (en) | 2019-04-17 |
Family
ID=59739873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016035300A Active JP6502279B2 (en) | 2016-02-26 | 2016-02-26 | Outlier location extraction device, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6502279B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7106999B2 (en) * | 2018-06-06 | 2022-07-27 | 日本電信電話株式会社 | Difficulty Estimation Device, Difficulty Estimation Model Learning Device, Method, and Program |
FR3102240B1 (en) * | 2019-10-18 | 2021-10-01 | Safran Electronics & Defense | Mechanically compensated frequency anisotropy sensor |
JPWO2023032100A1 (en) * | 2021-09-01 | 2023-03-09 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6438876A (en) * | 1987-08-05 | 1989-02-09 | Fuji Xerox Co Ltd | Language data base having speech level |
JP5322047B2 (en) * | 2007-06-27 | 2013-10-23 | 国立大学法人長岡技術科学大学 | Text readability evaluation system |
JP2009140074A (en) * | 2007-12-04 | 2009-06-25 | Nippon Telegr & Teleph Corp <Ntt> | Term difficulty level diagnostic device and term difficulty level diagnostic program |
JP2011013811A (en) * | 2009-06-30 | 2011-01-20 | Konan Gakuen | Device, system and method for word level decision, control program, and recording medium |
JP6417649B2 (en) * | 2013-08-22 | 2018-11-07 | 株式会社リコー | Text processing device, text display system, program |
-
2016
- 2016-02-26 JP JP2016035300A patent/JP6502279B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017151849A (en) | 2017-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Chinese spelling error detection and correction based on language model, pronunciation, and shape | |
US9959776B1 (en) | System and method for automated scoring of texual responses to picture-based items | |
US10095692B2 (en) | Template bootstrapping for domain-adaptable natural language generation | |
US8577898B2 (en) | System and method for rating a written document | |
CN110427618B (en) | Adversarial sample generation method, medium, apparatus and computing device | |
US10452785B2 (en) | Translation assistance system, translation assistance method and translation assistance program | |
Wanner | On the relevance of syntactic and discourse features for author profiling and identification | |
Chanda et al. | Unraveling the English-Bengali code-mixing phenomenon | |
Mawardi et al. | Spelling correction for text documents in Bahasa Indonesia using finite state automata and Levinshtein distance method | |
JP6502279B2 (en) | Outlier location extraction device, method and program | |
JP2019003552A (en) | Processing method, processing device, and processing program | |
CN104536979A (en) | Generation method and device of topic model and acquisition method and device of topic distribution | |
Bach et al. | Exploiting discourse information to identify paraphrases | |
CN107870900B (en) | Method, apparatus and recording medium for providing translated text | |
Alotaiby et al. | Arabic vs. English: Comparative statistical study | |
Sharma et al. | Word prediction system for text entry in Hindi | |
Rustamovna | Understanding the levenshtein distance equation for beginners | |
Vakare et al. | Sentence semantic similarity using dependency parsing | |
Riggs et al. | A computer-administered C-test in Spanish | |
Zaghouani et al. | SAHSOH@ QALB-2015 Shared Task: A rule-based correction method of common Arabic native and non-native speakers’ errors | |
Birkenes | North Frisian dialects: A quantitative investigation using a parallel corpus of translations. | |
Kocher et al. | Author clustering using spatium | |
CN112417849A (en) | English mail text data processing method, device, equipment and storage medium | |
Renner et al. | Maximizing ANLP evaluation: Harmonizing flawed input | |
Udagedara et al. | Language model-based spell-checker for sri lankan names and addresses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6502279 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |