JP2007094775A - 意味解析装置、意味解析方法および意味解析プログラム - Google Patents
意味解析装置、意味解析方法および意味解析プログラム Download PDFInfo
- Publication number
- JP2007094775A JP2007094775A JP2005283477A JP2005283477A JP2007094775A JP 2007094775 A JP2007094775 A JP 2007094775A JP 2005283477 A JP2005283477 A JP 2005283477A JP 2005283477 A JP2005283477 A JP 2005283477A JP 2007094775 A JP2007094775 A JP 2007094775A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- data
- unit
- semantic analysis
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得手段100と、データ形式に基づいて、データから項目値を抽出する項目値抽出手段102と、項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスとを対応付けて保持するコンセプト保持手段110と、項目値抽出手段102によって抽出された項目値の文字列と少なくとも一部一致するインスタンスに対応付けられているコンセプトを項目名に対するコンセプトとして特定するコンセプト特定手段104と、コンセプトと項目名とを対応付ける対応付手段106とを備えた。
【選択図】 図1
Description
<Wine Color>Style<Wine Color>:White Wine
と記述される。そして、このデータが外部に出力される。
コンセプト対応テーブル112中のコンセプト「Wine Color」が特定される。 さらに、このコンセプト「Wine Color」に対応付けられているインスタンスから、項目名「Style」に対する項目値「White Wine」を検索する。そして、「White Wine」が含まれていないので、コンセプト「Wine Color」に対する新たなインスタンスとして「White Wine」を登録する。
20 ページ
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 データ取得部
102 項目値抽出部
104 コンセプト特定部
106 コンセプト対応付部
110 オントロジーDB
112 コンセプト対応テーブル
114 概念化テーブル
120 コンセプト抽出部
122 インスタンス追加部
Claims (17)
- 項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得手段と、
前記データ取得手段が取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出手段と、
前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスとを対応付けて保持するコンセプト保持手段と、
前記コンセプト保持手段において、前記項目値抽出手段によって抽出された前記項目値の文字列と少なくとも一部一致するインスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定手段と、
前記コンセプト特定手段により特定された前記コンセプトと、前記項目名とを対応付ける対応付手段と
を備えたことを特徴とする意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトに対応付けられている前記インスタンスと、前記項目値抽出手段によって抽出された前記項目値とを比較し、前記項目値と同一のインスタンスを特定することを特徴とする請求項1に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の上位下位関係を示す前記属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて上位から下位の順を前記比較順番として決定することを特徴とする請求項2に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の全体と当該全体に対する一部との関係を示す全体部分関係を示す前記属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて、全体から部分の順を前記比較順番として決定することを特徴とする請求項2に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の抽象具体化関係を示す前記属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて、抽象から具体化の順を前記比較順番として決定することを特徴とする請求項2に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の上位下位関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記項目値と同一のインスタンスに対応付けられている前記コンセプトが複数存在し、複数のコンセプトが前記上位下位関係にある場合に、下位のコンセプトを特定することを特徴とする請求項1に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の全体と当該全体に対する一部との関係を示す全体部分関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記項目値と同一のインスタンスに対応付けられている前記コンセプトが複数存在し、複数のコンセプトが前記全体部分関係にある場合に、部分のコンセプトを特定することを特徴とする請求項1に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の抽象具体化関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記項目値と同一のインスタンスに対応付けられている前記コンセプトが複数存在し、複数のコンセプトが前記抽象具体化関係にある場合に、具体化されたコンセプトを特定することを特徴とする請求項1に記載の意味解析装置。 - 前記データ取得手段が取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索手段と、
前記コンセプト保持手段において、前記コンセプト検索手段により検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索手段と、
前記インスタンス検索手段が前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索手段により検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加手段と
をさらに備えたことを特徴とする請求項1から8のいずれか一項に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記データ取得手段が取得した前記データから、当該データに対するコンセプトを示す情報を抽出するコンセプト抽出手段と、
前記コンセプト抽出手段が前記データに対する前記コンセプトを抽出した場合に、前記コンセプト保持手段において、前記コンセプト抽出手段が抽出した前記コンセプトに対応付けられている前記属性において、当該コンセプトに関係付けられている前記コンセプトを検索対象として特定する検索対象特定手段と
をさらに備え、
前記コンセプト特定手段は、前記検索対象特定手段により前記検索対象として特定された前記コンセプトの中から、前記項目名に対する前記コンセプトを特定することを特徴とする請求項1から9のいずれか一項に記載の意味解析装置。 - 前記コンセプト抽出手段は、前記データ取得手段が取得した前記データの前記メタデータから前記コンセプトを抽出することを特徴とする請求項10に記載の意味解析装置。
- 前記コンセプト抽出手段は、前記データ取得手段が取得した前記データにURL(Uniform Resource Locator)が含まれている場合に、当該URLから前記コンセプトを抽出することを特徴とする請求項10に記載の意味解析装置。
- 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記データ取得手段が取得すべき前記データを識別するデータ識別情報と、当該データの前記コンセプトとを対応付けて保持する取得データコンセプト保持手段と、
前記取得データコンセプト保持手段において前記データ取得手段が取得した前記データの前記データ識別情報に対応付けられている前記コンセプトを特定し、特定した前記コンセプトの前記属性において、当該コンセプトに関係付けられている前記コンセプトを検索対象として特定する検索対象特定手段と
をさらに備え、
前記コンセプト特定手段は、前記検索対象特定手段により前記検索対象として特定された前記コンセプトの中から、前記項目名に対する前記コンセプトを特定することを特徴とする請求項1から12のいずれか一項に記載の意味解析装置。 - 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
前記コンセプト特定手段は、前記データに含まれる他の項目名に対するコンセプトを既に特定している場合に、既に特定した前記コンセプトの前記属性において、当該コンセプトに関係付けられている前記コンセプトを検索対象として特定する検索対象特定手段をさらに備え、
前記コンセプト特定手段は、前記検索対象特定手段により前記検索対象として特定された前記コンセプトの中から、前記項目名に対する前記コンセプトを特定することを特徴とする請求項1から13のいずれか一項に記載の意味解析装置。 - 前記検索対象特定手段は、さらに前記コンセプト特定手段が既に特定した前記コンセプト以外の前記コンセプトを前記検索対象として特定することを特徴とする請求項14に記載の意味解析装置。
- 項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得ステップと、
前記データ取得ステップにおいて取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出ステップと、
前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスとを対応付けて保持するコンセプト保持手段において、前記項目値抽出手段によって抽出された前記項目値の文字列と少なくとも一部一致するインスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定ステップと、
前記コンセプト特定ステップにおいて特定された前記コンセプトと、前記項目名とを対応付ける対応付ステップと
を有することを特徴とする意味解析方法。 - 意味解析処理をコンピュータに実行させる意味解析プログラムであって、
項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得ステップと、
前記データ取得ステップにおいて取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出ステップと、
前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスとを対応付けて保持するコンセプト保持手段において、前記項目値抽出手段によって抽出された前記項目値の文字列と少なくとも一部一致するインスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定ステップと、
前記コンセプト特定ステップにおいて特定された前記コンセプトと、前記項目名とを対応付ける対応付ステップと
を有することを特徴とする意味解析プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005283477A JP4427500B2 (ja) | 2005-09-29 | 2005-09-29 | 意味解析装置、意味解析方法および意味解析プログラム |
US11/362,224 US7953592B2 (en) | 2005-09-29 | 2006-02-27 | Semantic analysis apparatus, semantic analysis method and semantic analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005283477A JP4427500B2 (ja) | 2005-09-29 | 2005-09-29 | 意味解析装置、意味解析方法および意味解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007094775A true JP2007094775A (ja) | 2007-04-12 |
JP4427500B2 JP4427500B2 (ja) | 2010-03-10 |
Family
ID=37895360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005283477A Expired - Fee Related JP4427500B2 (ja) | 2005-09-29 | 2005-09-29 | 意味解析装置、意味解析方法および意味解析プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7953592B2 (ja) |
JP (1) | JP4427500B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081537A (ja) * | 2009-10-06 | 2011-04-21 | Psc:Kk | データ受渡方法及び汎用データ取得方法 |
WO2018163241A1 (ja) * | 2017-03-06 | 2018-09-13 | 三菱電機株式会社 | オントロジー構築支援装置 |
WO2019171490A1 (ja) * | 2018-03-07 | 2019-09-12 | 日本電気株式会社 | ナレッジ拡充システム、方法およびプログラム |
JP2020027649A (ja) * | 2018-08-15 | 2020-02-20 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8495004B2 (en) * | 2006-03-27 | 2013-07-23 | International Business Machines Corporation | Determining and storing at least one results set in a global ontology database for future use by an entity that subscribes to the global ontology database |
JP2008084193A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム |
JP4451435B2 (ja) * | 2006-12-06 | 2010-04-14 | 本田技研工業株式会社 | 言語理解装置、言語理解方法、及び、コンピュータプログラム |
CN100592293C (zh) * | 2007-04-28 | 2010-02-24 | 李树德 | 基于智能本体的知识搜索引擎及其实现方法 |
JP2009080624A (ja) * | 2007-09-26 | 2009-04-16 | Toshiba Corp | 情報表示装置、方法及びプログラム |
KR101308048B1 (ko) * | 2007-10-10 | 2013-09-12 | 삼성전자주식회사 | 반도체 메모리 장치 |
US9245243B2 (en) * | 2009-04-14 | 2016-01-26 | Ureveal, Inc. | Concept-based analysis of structured and unstructured data using concept inheritance |
MY168837A (en) * | 2009-05-25 | 2018-12-04 | Mimos Berhad | A method and system for extendable semantic query interpretation |
US9208223B1 (en) * | 2010-08-17 | 2015-12-08 | Semantifi, Inc. | Method and apparatus for indexing and querying knowledge models |
WO2012094592A1 (en) * | 2011-01-07 | 2012-07-12 | Rengaswamy Mohan | Concepts and link discovery system |
US9092516B2 (en) | 2011-06-20 | 2015-07-28 | Primal Fusion Inc. | Identifying information of interest based on user preferences |
US11294977B2 (en) | 2011-06-20 | 2022-04-05 | Primal Fusion Inc. | Techniques for presenting content to a user based on the user's preferences |
US9799328B2 (en) * | 2012-08-03 | 2017-10-24 | Veveo, Inc. | Method for using pauses detected in speech input to assist in interpreting the input during conversational interaction for information retrieval |
US9582572B2 (en) * | 2012-12-19 | 2017-02-28 | Intel Corporation | Personalized search library based on continual concept correlation |
US20150178372A1 (en) * | 2013-12-19 | 2015-06-25 | OpenGov, Inc. | Creating an ontology across multiple semantically-related data sets |
JP7350674B2 (ja) * | 2020-02-26 | 2023-09-26 | 株式会社東芝 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6061675A (en) | 1995-05-31 | 2000-05-09 | Oracle Corporation | Methods and apparatus for classifying terminology utilizing a knowledge catalog |
JP2001325284A (ja) | 2000-05-12 | 2001-11-22 | Nippon Telegr & Teleph Corp <Ntt> | 表構造領域からの情報抽出方法および装置と情報抽出プログラムを記録した記録媒体 |
US7027974B1 (en) * | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US7043492B1 (en) * | 2001-07-05 | 2006-05-09 | Requisite Technology, Inc. | Automated classification of items using classification mappings |
EP1485871A2 (en) | 2002-02-27 | 2004-12-15 | Michael Rik Frans Brands | A data integration and knowledge management solution |
US7493253B1 (en) * | 2002-07-12 | 2009-02-17 | Language And Computing, Inc. | Conceptual world representation natural language understanding system and method |
JP2005182280A (ja) * | 2003-12-17 | 2005-07-07 | Ibm Japan Ltd | 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム |
-
2005
- 2005-09-29 JP JP2005283477A patent/JP4427500B2/ja not_active Expired - Fee Related
-
2006
- 2006-02-27 US US11/362,224 patent/US7953592B2/en not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011081537A (ja) * | 2009-10-06 | 2011-04-21 | Psc:Kk | データ受渡方法及び汎用データ取得方法 |
WO2018163241A1 (ja) * | 2017-03-06 | 2018-09-13 | 三菱電機株式会社 | オントロジー構築支援装置 |
JPWO2018163241A1 (ja) * | 2017-03-06 | 2019-11-07 | 三菱電機株式会社 | オントロジー構築支援装置 |
WO2019171490A1 (ja) * | 2018-03-07 | 2019-09-12 | 日本電気株式会社 | ナレッジ拡充システム、方法およびプログラム |
JPWO2019171490A1 (ja) * | 2018-03-07 | 2021-02-12 | 日本電気株式会社 | ナレッジ拡充システム、方法およびプログラム |
JP7014288B2 (ja) | 2018-03-07 | 2022-02-01 | 日本電気株式会社 | ナレッジ拡充システム、方法およびプログラム |
US11874873B2 (en) | 2018-03-07 | 2024-01-16 | Nec Corporation | Knowledge expansion system, method, and program |
JP2020027649A (ja) * | 2018-08-15 | 2020-02-20 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 |
US11321421B2 (en) | 2018-08-15 | 2022-05-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus and device for generating entity relationship data, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
US7953592B2 (en) | 2011-05-31 |
JP4427500B2 (ja) | 2010-03-10 |
US20070073680A1 (en) | 2007-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4427500B2 (ja) | 意味解析装置、意味解析方法および意味解析プログラム | |
CN112749284B (zh) | 知识图谱构建方法、装置、设备及存储介质 | |
US11651014B2 (en) | Source code retrieval | |
US20190155898A1 (en) | Method and device for extracting entity relation based on deep learning, and server | |
TW202020691A (zh) | 特徵詞的確定方法、裝置和伺服器 | |
CN113051285A (zh) | Sql语句的转换方法、系统、设备及存储介质 | |
CN109344355B (zh) | 针对网页变化的自动回归检测与块匹配自适应方法和装置 | |
WO2022100376A1 (zh) | 文本段落结构还原方法、装置、设备及计算机存储介质 | |
CN104133870B (zh) | 一种网页相似度计算方法及装置 | |
CN110096599B (zh) | 知识图谱的生成方法及装置 | |
CN112818200A (zh) | 基于静态网站的数据爬取及事件分析方法及系统 | |
US20110270862A1 (en) | Information processing apparatus and information processing method | |
CN109753646B (zh) | 一种文章属性识别方法以及电子设备 | |
CN110263121A (zh) | 表格数据处理方法、装置、电子装置及计算机可读存储介质 | |
CN113220854A (zh) | 机器阅读理解的智能对话方法及装置 | |
KR101802051B1 (ko) | 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템 | |
CN106897287B (zh) | 网页发布时间抽取方法和用于网页发布时间抽取的装置 | |
CN106326314B (zh) | 网页信息抽取方法及装置 | |
CN112230895A (zh) | 一种el表达式解析方法、装置、设备及存储介质 | |
JP6327799B2 (ja) | 自然言語推論システム、自然言語推論方法及びプログラム | |
CN110309258B (zh) | 一种输入检查方法、服务器和计算机可读存储介质 | |
JP2016051367A (ja) | データ解析装置、データ解析方法、および、プログラム。 | |
CN113297349A (zh) | 一种基于知识图谱的ros软件包推荐方法及系统 | |
CN115879452A (zh) | 新词发现方法、装置、设备及计算机可读存储介质 | |
CN109657115B (zh) | 爬取数据自修复方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091117 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091214 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4427500 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131218 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |