JP3983265B1 - 辞書作成支援システム、方法及びプログラム - Google Patents
辞書作成支援システム、方法及びプログラム Download PDFInfo
- Publication number
- JP3983265B1 JP3983265B1 JP2006262699A JP2006262699A JP3983265B1 JP 3983265 B1 JP3983265 B1 JP 3983265B1 JP 2006262699 A JP2006262699 A JP 2006262699A JP 2006262699 A JP2006262699 A JP 2006262699A JP 3983265 B1 JP3983265 B1 JP 3983265B1
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- candidate word
- storage database
- history
- history storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 30
- 238000011156 evaluation Methods 0.000 claims description 46
- 238000000605 extraction Methods 0.000 claims description 28
- 239000000284 extract Substances 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 description 18
- 238000013519 translation Methods 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 210000004102 animal cell Anatomy 0.000 description 5
- 238000004321 preservation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明の辞書作成支援システムは、辞書登録候補語の情報を辞書作成支援履歴と共に格納する履歴保存データベースを有する。また、テキストデータ列を取り込む入力手段と、入力されたテキストデータ列を解析して、所定の候補化条件を満たす辞書登録候補語を抽出し、履歴保存データベースにおける辞書登録候補語の情報を更新する候補語抽出・更新手段と、履歴保存データベースに記述されている辞書登録候補語のうち、辞書作成支援履歴についての条件も含め、所定の提示条件に合致したものを提示する候補語提示手段と、提示された辞書登録候補語に対する辞書登録の有無を取り込む登録指示取込手段と、候補語提示手段又は登録指示取込手段の処理に応じ、履歴保存データベースに記述されている辞書作成支援履歴を更新する履歴更新手段とを備える。
【選択図】 図1
Description
以下、本発明による辞書作成支援システム、方法及びプログラムを、機械翻訳に用いる対訳辞書を作成する場合に適用した一実施形態を、図面を参照しながら説明する。
図1は、この実施形態の辞書作成支援システムの機能的構成を示すブロック図である。この実施形態の辞書作成支援システムは、パソコンなどの情報処理装置(1台に限定されず、複数台で分散処理し得るようにしたものであっても良い)上に、実施形態の辞書作成支援プログラム(固定データを含む)をインストールすることにより、構築されるものであるが、機能的には図1で表すことができる。
次に、以上のような機能的構成を有する実施形態の辞書作成支援システム100の動作(実施形態の辞書作成支援方法)を、図面を参照しながら説明する。
上記実施形態によれば、複数の入力文(テキストデータ列)に対する辞書登録作業を繰返し行う場合において、過去の登録作業の結果を履歴として参照するようにしたので、前回までの辞書作成処理において、登録不要と判断された用語や、既に登録された用語は、以降の辞書作成処理で候補語として提示されることがなくなり、重複した作業が排除され、作業効率を高めることができる。
上記実施形態では、履歴保存データベースの履歴情報に「辞書登録あり」や「表示済み」と記入された辞書登録候補語は、ユーザに提示しないようにしたものを示したが、提示条件は、上記実施形態のものに限定されない。例えば、「辞書登録あり」や「表示済み」のような履歴情報と共に辞書登録候補語を表示させるようにしても良く、また、「辞書登録あり」の場合に、既に登録された辞書内容を表示させるようにしても良い。
2…処理装置、21…用語抽出部、22…情報更新部、23…辞書作成部、
3…記憶装置、31…履歴保存データベース、32…辞書、
100…辞書作成支援システム。
Claims (5)
- 辞書登録候補語の情報を辞書作成支援履歴と共に格納する履歴保存データベースと、
テキストデータ列を取り込む入力手段と、
入力されたテキストデータ列を解析して、所定の候補化条件を満たす辞書登録候補語を抽出し、上記履歴保存データベースにおける辞書登録候補語の情報を更新する候補語抽出・更新手段と、
上記履歴保存データベースに記述されている辞書登録候補語のうち、辞書作成支援履歴についての条件も含め、所定の提示条件に合致したものを提示する候補語提示手段と、
提示された辞書登録候補語に対する辞書登録の有無を取り込む登録指示取込手段と、
上記候補語提示手段又は上記登録指示取込手段の少なくとも一方の処理に応じ、上記履歴保存データベースに記述されている辞書作成支援履歴を更新する履歴更新手段とを備え、
上記履歴保存データベースにおける辞書登録候補語の情報は、辞書登録候補語の見出しと、その辞書登録候補語の頻度又は頻度に対して演算した統計量でなる評価値とを含み、
上記候補語抽出・更新手段は、テキストデータ列が入力される毎に、抽出された辞書登録候補語が、上記履歴保存データベースに既登録の場合には、格納している評価値を、今までの評価値と新たな抽出時の評価値とから計算される値に更新させるものであり、
上記候補語提示手段は、上記履歴保存データベースにおける評価値が所定の閾値以上であることを1つの提示条件としている
ことを特徴とする辞書作成支援システム。 - 上記履歴更新手段は、上記候補語提示手段による提示がなされたか否かを辞書作成支援履歴に記述させるものであり、
上記候補語提示手段は、過去に提示がなされた辞書登録候補語を再度提示させないものである
ことを特徴とする請求項1に記載の辞書作成支援システム。 - 上記履歴更新手段は、上記登録指示取込手段が取り込んだ辞書登録の有無を辞書作成支援履歴に記述させるものであり、
上記候補語提示手段は、辞書に登録された辞書登録候補語を再度提示させないものである
ことを特徴とする請求項1又は2に記載の辞書作成支援システム。 - 履歴保存データベース、入力手段、候補語抽出・更新手段、候補語提示手段、登録指示取込手段及び履歴更新手段を備え、
上記履歴保存データベースは、辞書登録候補語の見出しと、その辞書登録候補語の頻度又は頻度に対して演算した統計量でなる評価値とを含む辞書登録候補語の情報を辞書作成支援履歴と共に格納しているものであり、
上記入力手段は、テキストデータ列を取り込み、
上記候補語抽出・更新手段は、入力されたテキストデータ列を解析して、所定の候補化条件を満たす辞書登録候補語を抽出し、抽出した辞書登録候補語が、上記履歴保存データベースに既登録の場合には、格納している評価値を、今までの評価値と新たな抽出時の評価値とから計算される値に更新するように上記履歴保存データベースにおける辞書登録候補語の情報を更新すると共に、抽出した辞書登録候補語が、上記履歴保存データベースに未登録の場合には、抽出した辞書登録候補語の情報を追加するように、上記履歴保存データベースにおける辞書登録候補語の情報を更新し、
上記候補語提示手段は、上記履歴保存データベースに記述されている辞書登録候補語のうち、辞書作成支援履歴についての条件も含むと共に、上記履歴保存データベースにおける評価値が所定の閾値以上であることを1つの提示条件として含む所定の提示条件に合致したものを提示し、
上記登録指示取込手段は、提示された辞書登録候補語に対する辞書登録の有無を取り込み、
上記履歴更新手段は、上記候補語提示手段又は上記登録指示取込手段の少なくとも一方の処理に応じ、上記履歴保存データベースに記述されている辞書作成支援履歴を更新する
ことを特徴とする辞書作成支援方法。 - コンピュータを、
辞書登録候補語の見出しと、その辞書登録候補語の頻度又は頻度に対して演算した統計量でなる評価値とを含む辞書登録候補語の情報を辞書作成支援履歴と共に格納する履歴保存データベースと、
テキストデータ列を取り込む入力手段と、
入力されたテキストデータ列を解析して、所定の候補化条件を満たす辞書登録候補語を抽出し、抽出した辞書登録候補語が、上記履歴保存データベースに既登録の場合には、格納している評価値を、今までの評価値と新たな抽出時の評価値とから計算される値に更新するように上記履歴保存データベースにおける辞書登録候補語の情報を更新すると共に、抽出した辞書登録候補語が、上記履歴保存データベースに未登録の場合には、抽出した辞書登録候補語の情報を追加するように、上記履歴保存データベースにおける辞書登録候補語の情報を更新する候補語抽出・更新手段と、
上記履歴保存データベースに記述されている辞書登録候補語のうち、辞書作成支援履歴についての条件も含むと共に、上記履歴保存データベースにおける評価値が所定の閾値以上であることを1つの提示条件として含む所定の提示条件に合致したものを提示する候補語提示手段と、
提示された辞書登録候補語に対する辞書登録の有無を取り込む登録指示取込手段と、
上記候補語提示手段又は上記登録指示取込手段の少なくとも一方の処理に応じ、上記履歴保存データベースに記述されている辞書作成支援履歴を更新する履歴更新手段
として機能させることを特徴とする辞書作成支援プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006262699A JP3983265B1 (ja) | 2006-09-27 | 2006-09-27 | 辞書作成支援システム、方法及びプログラム |
US11/819,547 US20080077397A1 (en) | 2006-09-27 | 2007-06-28 | Dictionary creation support system, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006262699A JP3983265B1 (ja) | 2006-09-27 | 2006-09-27 | 辞書作成支援システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP3983265B1 true JP3983265B1 (ja) | 2007-09-26 |
JP2008083952A JP2008083952A (ja) | 2008-04-10 |
Family
ID=38595950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006262699A Active JP3983265B1 (ja) | 2006-09-27 | 2006-09-27 | 辞書作成支援システム、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20080077397A1 (ja) |
JP (1) | JP3983265B1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7917355B2 (en) * | 2007-08-23 | 2011-03-29 | Google Inc. | Word detection |
JP5340584B2 (ja) | 2007-11-28 | 2013-11-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 電子メッセージの読解を支援する装置及び方法 |
JP5090490B2 (ja) * | 2010-03-23 | 2012-12-05 | ヤフー株式会社 | 代表表記抽出装置、方法及びプログラム |
JP5155351B2 (ja) * | 2010-03-23 | 2013-03-06 | ヤフー株式会社 | 地図データ処理装置及び方法 |
CN102411563B (zh) * | 2010-09-26 | 2015-06-17 | 阿里巴巴集团控股有限公司 | 一种识别目标词的方法、装置及系统 |
KR20120046627A (ko) * | 2010-11-02 | 2012-05-10 | 삼성전자주식회사 | 화자 적응 방법 및 장치 |
EP2635965A4 (en) * | 2010-11-05 | 2016-08-10 | Rakuten Inc | KEYWORK EXTRACTION SYSTEMS AND METHODS |
US9235565B2 (en) * | 2012-02-14 | 2016-01-12 | Facebook, Inc. | Blending customized user dictionaries |
WO2015030461A1 (en) | 2013-08-26 | 2015-03-05 | Samsung Electronics Co., Ltd. | User device and method for creating handwriting content |
US20150088493A1 (en) * | 2013-09-20 | 2015-03-26 | Amazon Technologies, Inc. | Providing descriptive information associated with objects |
JP2016177348A (ja) * | 2015-03-18 | 2016-10-06 | 株式会社東芝 | 更新支援装置、方法およびプログラム |
CN113590766B (zh) * | 2021-09-28 | 2021-12-17 | 中国电子科技集团公司第二十八研究所 | 一种基于多模态数据融合的航班推出状态监视方法 |
US11636180B2 (en) | 2021-09-28 | 2023-04-25 | The 28Th Research Institute Of China Electronics Technology Group Corporation | Flight pushback state monitoring method based on multi-modal data fusion |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3531468B2 (ja) * | 1998-03-30 | 2004-05-31 | 株式会社日立製作所 | 文書処理装置及び方法 |
US20040205671A1 (en) * | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
US7254773B2 (en) * | 2000-12-29 | 2007-08-07 | International Business Machines Corporation | Automated spell analysis |
KR100682897B1 (ko) * | 2004-11-09 | 2007-02-15 | 삼성전자주식회사 | 사전 업데이트 방법 및 그 장치 |
US7490033B2 (en) * | 2005-01-13 | 2009-02-10 | International Business Machines Corporation | System for compiling word usage frequencies |
-
2006
- 2006-09-27 JP JP2006262699A patent/JP3983265B1/ja active Active
-
2007
- 2007-06-28 US US11/819,547 patent/US20080077397A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2008083952A (ja) | 2008-04-10 |
US20080077397A1 (en) | 2008-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3983265B1 (ja) | 辞書作成支援システム、方法及びプログラム | |
JP5362095B2 (ja) | インプットメソッドエディタ | |
US20200372088A1 (en) | Recommending web api's and associated endpoints | |
US6876963B1 (en) | Machine translation method and apparatus capable of automatically switching dictionaries | |
JP2003223437A (ja) | 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム | |
JP2005128873A (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
JP2008287406A (ja) | 情報処理装置および情報処理方法、プログラム、並びに、記録媒体 | |
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
JP2005135113A (ja) | 電子機器装置、関連語抽出方法及びプログラム | |
JPH09198395A (ja) | 文書検索装置 | |
JP2008052548A (ja) | 検索プログラム、情報検索装置及び情報検索方法 | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
JP2013134753A (ja) | 誤り文修正装置、誤り文修正方法およびプログラム | |
JP2005122665A (ja) | 電子機器装置、関連語データベースの更新方法、プログラム | |
JP5380989B2 (ja) | 辞書機能を備えた電子装置およびプログラム | |
JP5326781B2 (ja) | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム | |
JP2004046775A (ja) | 固有表現抽出装置及び方法並びに固有表現抽出プログラム | |
JP4015661B2 (ja) | 固有表現抽出装置、方法、プログラム及びそれを記録した記録媒体 | |
JP4431759B2 (ja) | 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム | |
CN112732885A (zh) | 用于问答系统的答案扩展方法、装置及电子设备 | |
JP7131518B2 (ja) | 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム | |
JP5212725B2 (ja) | 電子書籍作成支援装置 | |
JP4980604B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体 | |
JP5262190B2 (ja) | 入力補完装置、及び入力補完プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070703 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100713 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3983265 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110713 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120713 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130713 Year of fee payment: 6 |