JP2020190970A - 文書処理装置およびその方法、プログラム - Google Patents
文書処理装置およびその方法、プログラム Download PDFInfo
- Publication number
- JP2020190970A JP2020190970A JP2019096575A JP2019096575A JP2020190970A JP 2020190970 A JP2020190970 A JP 2020190970A JP 2019096575 A JP2019096575 A JP 2019096575A JP 2019096575 A JP2019096575 A JP 2019096575A JP 2020190970 A JP2020190970 A JP 2020190970A
- Authority
- JP
- Japan
- Prior art keywords
- word
- input
- unit
- words
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010606 normalization Methods 0.000 description 88
- 238000000034 method Methods 0.000 description 62
- 238000004458 analytical method Methods 0.000 description 58
- 230000008569 process Effects 0.000 description 53
- 238000012545 processing Methods 0.000 description 50
- 230000000877 morphologic effect Effects 0.000 description 38
- 230000002452 interceptive effect Effects 0.000 description 23
- 239000013598 vector Substances 0.000 description 21
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
前記検索部は、前記正規化処理部によって単語の正規化が行われた前記入力質問文と前記想定質問文との類似判定を行う、文書処理装置として構成される。
本発明はまた、文書処理方法および文書処理プログラムとして構成される。
実施例1は、ユーザにより入力される入力質問文と検索対象の想定質問文について、同義語と表記ゆれを一意な表記に正規化し、省略されている単語を補完した上で検索を行う対話型検索装置の例について説明するものである。
対話型検索システムは、対話型検索装置100と、端末19を含んで構成される。端末19は、ネットワークに接続可能な、例えばPC(パーソナルコンピュータ)、スマートフォン、タブレット等の、ユーザが操作する情報処理装置である。端末19は、ネットワークを介して対話型検索装置100と接続し、対話型検索装置100に質問文のテキストを送信し、対話型検索装置100からの応答を受信する。なお、図1には1台の端末19が示されているが、対話型検索装置100には複数の端末19が接続され得る。
対話型検索装置100は、入力部202、検索部203、出力部203、想定質問記憶部205、登録部206、テキスト解析部207、正規化処理部208、正規化DB登録部209、形態素解析辞書210、属性語テーブル211、同義語テーブル212、属性語候補テーブル216、関連語DB213、形態素Nグラム214、単語埋め込みベクトル215を有して構成される。これらの主な構成部位は、対話型検索プログラムがCPU102で実行されることで実現される。また、上記のテーブルやDB(データベース)は、メモリ103または記憶装置104内に形成される。以下、各部位について詳細に説明する。
なお、端末19で専用のアプリケーションを使用し、ユーザインタフェース部201がそのアプリケーションに対してテキストのやりとりをするよう構成しても良い。
正規化DB登録処理のフローを図3に示す。正規化DB登録処理では、学習コーパス(学習テキスト)内に所定の回数以上出現する名詞と未知語について、その単語の同義語と属性語を推定して、それぞれ属性語テーブル211と同義語テーブル212に登録する。正規化DB登録処理は、ユーザによって想定質問集の一括登録が行われる時に、登録部206を介して実行される。正規化DB登録部209は、登録部206から形態素解析処理済みの想定質問集のテキストが入力されると、そのテキストから単語埋め込みベクトル215を生成する。なお、想定質問記憶部205に単語埋め込みベクトルは、word2vec等、学習コーパス内での単語の相対的な意味に基づいて単語をベクトル化する技術である。単語埋め込みベクトルでは、ベクトル間のコサイン類似度によって単語間の意味の近さが表される。正規化DB登録部209は、単語埋め込みベクトルと併せて、形態素Nグラムの生成も行う。
テキスト解析部207は、入力質問文と想定質問文に対し、正規化処理部208を介して、形態素解析結果の単語列の正規化処理を行う。正規化処理は、正規化処理部208が、正規化DB登録部209が作成した属性語テーブル211と同義語テーブル212を使用して、同義語・表記ゆれを一意な表記に正規化し、属性語テーブル211を用いて省略されている単語を単語列に挿入する処理を行う。
図10に、想定質問を登録する処理のフローチャートを示す。想定質問の登録では、事前に関連語DB213の登録を行う。すなわち、入力部202は、入力される校正済み業務文書を読み込み、テキスト解析部207に出力する(S1001)。そして、テキスト解析部207から形態素解析結果の単語列を受けとる。なお、このとき、正規化処理部208による正規化処理は行わない。形態素解析結果の単語列は、登録部206を介して正規化DB登録部209に入力され、正規化DB登録部209は、それを関連語DB213に登録する(S1002)。
図11に、検索処理のフローチャートを示す。検索処理は、ユーザが端末19から入力した入力質問文に対して検索を行ない、回答文を出力するまでの動作を含む。
まず、入力部202が、端末19から入力された質問文(入力質問文)を受け付けて(S1101)、その受け付けた入力質問文をテキスト解析部207に転送する。次に、テキスト解析部207は、入力質問文のテキストの形態素解析を行って、正規化処理部208に転送する。正規化処理部208は正規化処理を実行して、その結果を、テキスト解析部207を介して入力部202に返却する(S1102)。
端末10の表示画面は、検索欄1401と、ユーザが質問文を入力する入力欄1405と、検索ボタン1406と、同義語テーブル編集ボタン1407および属性語テーブル編集ボタン1408を有する。検索欄1401には、入力欄1405に入力された質問文の正規化結果1402と、検索の結果得られた回答文1403の表示が含まれる。検索欄1401の表示1402,1403は、入力欄1405の質問文について検索ボタン1406が押下された時に表示される。1404は、対話履歴(検索履歴)を表示するためのスクロールバーである。
19 端末
201 ユーザインタフェース部
202 入力部
203 検索部
204 出力部
205 想定質問記憶部
206 登録部
207 テキスト解析部
208 正規化処理部
209 正規化DB登録部
210 形態素解析辞書
211 属性語テーブル
212 同義語テーブル
213 関連語DB
214 形態素Nグラム
215 単語埋め込みベクトル
216 属性語候補テーブル
Claims (15)
- 入力される入力質問文を受付ける入力部と、
前記入力部で受付ける文章の形態素解析を行うテキスト解析部と、
想定質問文と回答文を対応付けて蓄積する想定質問記憶部と、
前記想定質問記憶部から前記入力質問文に類似する前記想定質問文を検索して、前記想定質問文に対応する回答文を得る検索部と、
前記検索部により得られる回答文を出力する出力部と、
前記テキスト解析部によって単語列に変換された前記入力質問文と前記想定質問文について、単語ごとの正規化を行う正規化処理部と、を有し、
前記検索部は、前記正規化処理部によって単語の正規化が行われた前記入力質問文と前記想定質問文との類似判定を行う、
ことを特徴とする文書処理装置。 - 前記正規化部は、任意の第1の単語と第2の単語について、対象文書群において該第1の単語と該第2の単語の周辺に出現する単語の一致数が所定値以上であり、かつ、対象文書群の単語を網羅する関連語情報に該第2の単語が含まれていない場合、該第1の単語を含む文章に対して、該第1の単語を該第2の単語に置換する、
請求項1に記載の文書処理装置。 - 前記正規化部は、任意の第1の単語について、検索対象文書群において所定の長さの単語列における前記第1の単語との共起確率が所定値以上である第2の単語と第3の単語が存在する場合、該第2の単語または該第3の単語を含む単語列に対して該第1の単語を挿入する、
請求項1に記載の文書処理装置。 - 前記正規化部は、任意の第1の単語について、検索対象文書群において所定の長さの単語列における前記第1の単語との共起確率が所定値以上である第2の単語と第3の単語が存在する場合、該第1の単語と該第2の単語を含み、該第1の単語と該第2の単語の間の単語の数が所定数以下の文章と、該第1の単語と該第3の単語を含み、該第1の単語と該第3の単語の間の単語の数が所定数以下の文章に対して、該第1の単語を削除する、
請求項1に記載の文書処理装置。 - 学習コーパス内に所定の回数以上出現する名詞と未知語の単語について、該単語の同義語と属性語を生成する正規化DB登録部と、
前記正規化DB登録部により生成された属性語を登録する属性語テーブルと、
前記正規化DB登録部により生成された同義語を登録する同義語テーブルと、
を有する請求項1に記載の文書処理装置。 - 前記正規化部は、
前記入力部が受け付ける前記入力質問文に含まれる普通名詞と未知語の単語について、前記同義語テーブルを検索して、検索の結果、前記同義語テーブルに対象語が登録されている場合、該対象語と対になっている正規化語を取得して、対象の前記単語を正規化語に置き換える、
を有する請求項5に記載の文書処理装置。 - 前記正規化部は、
前記入力部が受け付ける前記入力質問文に含まれる普通名詞と未知語の単語について、前記属性語テーブルを検索して、前記単語について一致する対象語がある場合、該対象語に対応する属性語を取得して、該属性語が入力される単語列に存在していない場合、取得した前記属性語を前記単語列に挿入する、
を有する請求項5に記載の文書処理装置。 - 前記検索部は、前記正規化処理部によって、前記入力質問文に含まれる前記単語が正規化語に置き換えられた前記入力質問文と前記想定質問文との類似判定を行う、
または、前記属性語が前記単語列に挿入された前記入力質問文と前記想定質問文との類似判定を行う、
を有する請求項6または7に記載の文書処理装置。 - 前記正規化DB登録部は、前記学習コーパスから単語埋め込みベクトルと形態素Nグラムを生成した後、形態素Nグラムの1グラムを参照して、出現頻度が所定の回数以上で品詞が、普通名詞、固有名詞、未知語である単語を抽出し、該単語に対してコサイン類似度が所定の値以上の単語を対象語とし、Nグラムに前記対象語に対応する着目語が存在しない場合、前記対象語は該着目語の同義語・表記ゆれ、または関連語と判定する、
請求項6または7に記載の文書処理装置。 - コンピュータを用いて文書処理を行う文書処理方法であって、
入力される入力質問文を受付ける入力ステップと、
前記入力ステップで受付ける文章の形態素解析を行うテキスト解析ステップと、
想定質問文と回答文を対応付けて蓄積する想定質問記憶部から前記入力質問文に類似する前記想定質問文を検索して、前記想定質問文に対応する回答文を得る検索ステップと、
前記検索ステップにより得られる回答文を出力する出力ステップと、
前記テキスト解析ステップによって単語列に変換された前記入力質問文と前記想定質問文について、単語ごとの正規化を行う正規化処理ステップと、を有し、
前記検索ステップは、前記正規化処理ステップによって単語の正規化が行われた前記入力質問文と前記想定質問文との類似判定を行う、
ことを特徴とする文書処理方法。 - 学習コーパス内に所定の回数以上出現する名詞と未知語の単語について、該単語の同義語を生成する正規化DB登録ステップと、
前記正規化DB登録ステップにより生成された同義語を同義語テーブルに登録するステップと、を有し、
前記正規化ステップは、
前記入力ステップで受け付ける前記入力質問文に含まれる普通名詞と未知語の単語について、前記同義語テーブルを検索して、検索の結果、前記同義語テーブルに対象語が登録されている場合、該対象語と対になっている正規化語を取得して、対象の前記単語を正規化語に置き換える、請求項10に記載の文書処理方法。 - 学習コーパス内に所定の回数以上出現する名詞と未知語の単語について、該単語の属性語を生成する正規化DB登録ステップと、
前記正規化DB登録ステップにより生成された属性語を属性語テーブルに登録するステップと、を有し、
前記正規化ステップは、
前記入力ステップで受け付ける前記入力質問文に含まれる普通名詞と未知語の単語について、前記属性語テーブルを検索して、前記単語について一致する対象語がある場合、該対象語に対応する属性語を取得して、該属性語が入力される単語列に存在していない場合、取得した前記属性語を前記単語列に挿入する、請求項10に記載の文書処理方法。 - 前記コンピュータにネットワークを介して接続される端末に、
前記入力質問文の入力欄と、検索ボタンと、該入力欄に入力された前記入力質問文の正規化結果と、検索の結果得られた前記回答文と、を含む画面を表示する
請求項10に記載の文書処理方法。 - 前記同義語テーブルによる単語の置換、または前記属性語テーブルによる単語の補完を行った場合、前記コンピュータにネットワークを介して接続される端末に、正規化なしで再検索するかを問い合わせる画面を表示する
請求項11または12に記載の文書処理方法。 - コンピュータで実行される文書処理プログラムであって、該コンピュータは、
入力される入力質問文を受付ける入力ステップと、
前記入力ステップで受付ける文章の形態素解析を行うテキスト解析ステップと、
想定質問文と回答文を対応付けて蓄積する想定質問記憶部から前記入力質問文に類似する前記想定質問文を検索して、前記想定質問文に対応する回答文を得る検索ステップと、
前記検索ステップにより得られる回答文を出力する出力ステップと、
前記テキスト解析ステップによって単語列に変換された前記入力質問文と前記想定質問文について、単語ごとの正規化を行う正規化処理ステップと、
前記検索ステップは、前記正規化処理ステップによって単語の正規化が行われた前記入力質問文と前記想定質問文との類似判定を行う、
を実行することを特徴とする文書処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019096575A JP2020190970A (ja) | 2019-05-23 | 2019-05-23 | 文書処理装置およびその方法、プログラム |
US16/871,272 US11537795B2 (en) | 2019-05-23 | 2020-05-11 | Document processing device, document processing method, and document processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019096575A JP2020190970A (ja) | 2019-05-23 | 2019-05-23 | 文書処理装置およびその方法、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020190970A true JP2020190970A (ja) | 2020-11-26 |
Family
ID=73453807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019096575A Pending JP2020190970A (ja) | 2019-05-23 | 2019-05-23 | 文書処理装置およびその方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11537795B2 (ja) |
JP (1) | JP2020190970A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7137028B1 (ja) | 2022-02-25 | 2022-09-13 | 株式会社Jsol | 質問文生成装置、質問文生成方法、質問文生成プログラム |
WO2024189827A1 (ja) * | 2023-03-15 | 2024-09-19 | 日本電気株式会社 | 質問推定システム、質問推定方法および記録媒体 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11538465B1 (en) | 2019-11-08 | 2022-12-27 | Suki AI, Inc. | Systems and methods to facilitate intent determination of a command by grouping terms based on context |
US11217227B1 (en) | 2019-11-08 | 2022-01-04 | Suki AI, Inc. | Systems and methods for generating disambiguated terms in automatically generated transcriptions including instructions within a particular knowledge domain |
US11829400B2 (en) * | 2021-05-05 | 2023-11-28 | International Business Machines Corporation | Text standardization and redundancy removal |
US20230316298A1 (en) * | 2022-04-04 | 2023-10-05 | Microsoft Technology Licensing, Llc | Method and system of intelligently managing customer support requests |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001034614A (ja) * | 1999-07-16 | 2001-02-09 | Fujitsu Ltd | 自然言語型検索支援装置及び方法 |
JP2001117919A (ja) * | 1999-10-21 | 2001-04-27 | Sharp Corp | 自然言語文自動前編集装置及び方法並びにこれに利用される記憶媒体 |
JP2002073661A (ja) * | 2000-08-31 | 2002-03-12 | Toshiba Corp | 知的情報管理システム及び知的情報登録方法 |
JP2003058539A (ja) * | 2001-08-13 | 2003-02-28 | Logo Vista Corp | 事例翻訳におけるシソーラス辞書作成装置 |
JP2006031194A (ja) * | 2004-07-13 | 2006-02-02 | Internatl Business Mach Corp <Ibm> | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
US20070022109A1 (en) * | 2005-07-25 | 2007-01-25 | Tomasz Imielinski | Systems and methods for answering user questions |
JP2011248409A (ja) * | 2010-05-21 | 2011-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 重要語抽出装置とその方法とプログラム |
JP2012008948A (ja) * | 2010-06-28 | 2012-01-12 | Sharp Corp | 類似性導出装置および類似性導出プログラム |
JP2013156815A (ja) * | 2012-01-30 | 2013-08-15 | Nec Corp | ドキュメント整合性評価システム、ドキュメント整合性評価方法、およびプログラム |
WO2014033799A1 (ja) * | 2012-08-27 | 2014-03-06 | 株式会社日立製作所 | 単語意味関係抽出装置 |
US20170323204A1 (en) * | 2016-05-03 | 2017-11-09 | International Business Machines Corporation | Text Simplification for a Question and Answer System |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9645993B2 (en) * | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
JP5711674B2 (ja) | 2012-01-12 | 2015-05-07 | Kddi株式会社 | 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法 |
US10572595B2 (en) * | 2017-04-13 | 2020-02-25 | Baidu Usa Llc | Global normalized reader systems and methods |
US12001465B2 (en) * | 2018-04-27 | 2024-06-04 | Nippon Telegraph And Telephone Corporation | Response selecting apparatus, response selecting method, and response selecting program |
US10861022B2 (en) * | 2019-03-25 | 2020-12-08 | Fmr Llc | Computer systems and methods to discover questions and answers from conversations |
US11036803B2 (en) * | 2019-04-10 | 2021-06-15 | International Business Machines Corporation | Rapid generation of equivalent terms for domain adaptation in a question-answering system |
-
2019
- 2019-05-23 JP JP2019096575A patent/JP2020190970A/ja active Pending
-
2020
- 2020-05-11 US US16/871,272 patent/US11537795B2/en active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001034614A (ja) * | 1999-07-16 | 2001-02-09 | Fujitsu Ltd | 自然言語型検索支援装置及び方法 |
JP2001117919A (ja) * | 1999-10-21 | 2001-04-27 | Sharp Corp | 自然言語文自動前編集装置及び方法並びにこれに利用される記憶媒体 |
JP2002073661A (ja) * | 2000-08-31 | 2002-03-12 | Toshiba Corp | 知的情報管理システム及び知的情報登録方法 |
JP2003058539A (ja) * | 2001-08-13 | 2003-02-28 | Logo Vista Corp | 事例翻訳におけるシソーラス辞書作成装置 |
JP2006031194A (ja) * | 2004-07-13 | 2006-02-02 | Internatl Business Mach Corp <Ibm> | 検索システム、検索方法、報告システム、報告方法、及びプログラム |
US20070022109A1 (en) * | 2005-07-25 | 2007-01-25 | Tomasz Imielinski | Systems and methods for answering user questions |
JP2011248409A (ja) * | 2010-05-21 | 2011-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 重要語抽出装置とその方法とプログラム |
JP2012008948A (ja) * | 2010-06-28 | 2012-01-12 | Sharp Corp | 類似性導出装置および類似性導出プログラム |
JP2013156815A (ja) * | 2012-01-30 | 2013-08-15 | Nec Corp | ドキュメント整合性評価システム、ドキュメント整合性評価方法、およびプログラム |
WO2014033799A1 (ja) * | 2012-08-27 | 2014-03-06 | 株式会社日立製作所 | 単語意味関係抽出装置 |
US20170323204A1 (en) * | 2016-05-03 | 2017-11-09 | International Business Machines Corporation | Text Simplification for a Question and Answer System |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7137028B1 (ja) | 2022-02-25 | 2022-09-13 | 株式会社Jsol | 質問文生成装置、質問文生成方法、質問文生成プログラム |
JP2023124315A (ja) * | 2022-02-25 | 2023-09-06 | 株式会社Jsol | 質問文生成装置、質問文生成方法、質問文生成プログラム |
WO2024189827A1 (ja) * | 2023-03-15 | 2024-09-19 | 日本電気株式会社 | 質問推定システム、質問推定方法および記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US11537795B2 (en) | 2022-12-27 |
US20200372215A1 (en) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107209759B (zh) | 注解辅助装置及记录介质 | |
US6269189B1 (en) | Finding selected character strings in text and providing information relating to the selected character strings | |
JP2020190970A (ja) | 文書処理装置およびその方法、プログラム | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
US9208140B2 (en) | Rule based apparatus for modifying word annotations | |
WO2005059771A1 (ja) | 対訳判断装置、方法及びプログラム | |
US8655641B2 (en) | Machine translation apparatus and non-transitory computer readable medium | |
US7483828B2 (en) | Multilingual database creation system and method | |
US11386269B2 (en) | Fault-tolerant information extraction | |
US20030083860A1 (en) | Content conversion method and apparatus | |
Aliero et al. | Systematic review on text normalization techniques and its approach to non-standard words | |
Wong et al. | iSentenizer‐μ: Multilingual Sentence Boundary Detection Model | |
US20100094615A1 (en) | Document translation apparatus and method | |
Huo et al. | ARCLIN: automated API mention resolution for unformatted texts | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
US8041556B2 (en) | Chinese to english translation tool | |
JP3326646B2 (ja) | 機械翻訳システム用辞書・ルール学習装置 | |
JP3825645B2 (ja) | 表現変換方法及び表現変換装置 | |
CN115034209A (zh) | 文本分析方法、装置、电子设备以及存储介质 | |
US11017172B2 (en) | Proposition identification in natural language and usage thereof for search and retrieval | |
US20030093261A1 (en) | Multilingual database creation system and method | |
JP3737817B2 (ja) | 表現変換方法及び表現変換装置 | |
JP4940606B2 (ja) | 翻訳システム、翻訳装置、翻訳方法及びプログラム | |
Dawit | Context Based Afaan Oromo Language Spell Checker For Handheld Device | |
JP3949874B2 (ja) | 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231018 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240116 |