JP2021064143A - 文作成装置、文作成方法および文作成プログラム - Google Patents
文作成装置、文作成方法および文作成プログラム Download PDFInfo
- Publication number
- JP2021064143A JP2021064143A JP2019188191A JP2019188191A JP2021064143A JP 2021064143 A JP2021064143 A JP 2021064143A JP 2019188191 A JP2019188191 A JP 2019188191A JP 2019188191 A JP2019188191 A JP 2019188191A JP 2021064143 A JP2021064143 A JP 2021064143A
- Authority
- JP
- Japan
- Prior art keywords
- document
- related document
- sentence
- section
- sections
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
図1は、文作成システム1による処理の一例を説明するための模式図である。
図2は、文作成システム1の概略構成の一例を示す図である。
図3は、サーバ3の概略構成の一例を示す図である。
図面を参照して、本実施形態に係る文作成装置100について説明する。文作成装置100は、専門書類の入力を受け付けて、この専門書類に解説を加える変換処理を行う注釈付与装置である。ここで解説を加えるとは、専門書類の文中に含まれる参照文言に対して、その参照先の文書がある文へのリンクを貼ったり、専門書類に含まれる専門用語等の解説をする文書データを付与したり、その専門用語を解説する他の文書へのリンクを貼ったりすることをいう。
以下に、図8を参照して、本発明に係る文作成方法について説明する。
[文作成プログラム]
上記実施形態には示していないが、上記文作成装置が作成したデータを用いて実現される機能として、関連文献を逆引きする機能を含んでよい。閲覧中の文献の全体或いは特定箇所が別の文献により参照されている場合、その閲覧中の文献の全体或いは特定箇所を参照している文献があることがある。従来であれば、閲覧中の文献を参照している他の文献を発見することは不可能であった。なぜなら、この世に存在するすべての書籍は、その箇所を参照している可能性があるため、ある文献へ言及している他の文献を網羅的に探し出すためには、世の中の全文献を確認する必要があり、このことは現実的な時間制約上、実行不可能であるためである。本実施形態に係る発明においては、上述の意味的構造化により、すべての文献のセクション間の明示的参照関係が抽出されているため、ある文献を参照している他の文書が「この文書を参照している文書」としてプロダクト画面上に表示され、それらの文書の当該箇所に移動することができる。具体的には、上記実施形態に示した手法により参照先の文献も同様に構造化してセクションに分割するとともに各セクションに対するタグ付けを実行し、参照先の関連するセクションに対してリンクを貼る。これによって、関連文献の中の関連する部分を参照することができ、従来は不可能だったある文書を参照している他の文書を発見することと、被参照先の本の中から当該資料への言及を含むセクションへと移動することが可能になる。例えば、閲覧していた「大阪地方裁判所…」という判決を参照している文書が表示されているとすると、例えば、図7に示すようなUIにおいて「被リンク検索」というボタンを設けて、当該ボタンを押すことにより「この文書を参照している文書」というポップアップが表示され、その中の1冊を選択すると、当該判例が参照されている箇所に移動することが出来る。
2 コンピュータ
3 サーバ
4 端末装置
5 ネットワーク
100 文作成装置
10 受付部
20 分割部
30 キーワードタグ生成部
40 制御部
50 判定部
51 検出部
52 同定部
60 特定部
70 リンク生成部
80 リンク出力部
90 関連文書取得部
110 関連文書出力部
Claims (21)
- 文書の入力を受け付ける受付部と、
前記文書を複数のセクションに分割する分割部と、
前記分割部が分割した前記複数のセクションごとにキーワードタグを生成するキーワードタグ生成部と、
前記複数のセクション中に参照を示唆する文言が含まれるか否かを判定する判定部と、
前記参照を示唆する文言が含まれる場合に、参照先のセクションを特定する特定部とを備える
文作成装置。 - 前記特定部が特定した前記参照先のセクションに前記文書からのリンクを生成するリンク生成部と、
前記特定部が特定した前記参照先へのリンクを出力し、当該リンクを選択することにより前記参照先への移動を可能にするリンク出力部と、
をさらに備える
請求項1に記載の文作成装置。 - 前記判定部は、パターンマッチ、条件付き確率場等の系列ラベリング問題を解くための手法及びニューラルネットワークのうち少なくともいずれか1つを用いて前記参照を示唆する文言を検出し、前記リンクのそれぞれについて前記参照先のセクションを同定することを特徴とする請求項2に記載の文作成装置。
- 前記文書に類似し、前記参照を示唆する文言の内容を示す参照先のデータである関連文書を示す情報を取得する関連文書取得部と、
前記関連文書を出力する関連文書出力部と、
をさらに備える請求項1〜3のいずれか1項に記載の文作成装置。 - 前記関連文書取得部は、前記セクション及び前記参照先のセクションから、前記関連文書を取得することを特徴とする請求項4に記載の文作成装置。
- 前記関連文書取得部は、前記文書とは異なる他の文書から、前記関連文書を取得することを特徴とする請求項4に記載の文作成装置。
- 前記関連文書取得部は、グラフ理論を用いて関連性を推論するネットワーク構造化、及び埋め込みに基づく低次元ユークリッド空間上での類似度計算のいずれかにより、前記関連文書を取得することを特徴とする請求項4〜6に記載の文作成装置。
- 文書の入力を受け付ける受付ステップと、
前記文書を複数のセクションに分割する分割ステップと、
前記分割ステップが分割した前記複数のセクションごとにキーワードタグを生成するキーワードタグ生成ステップと、
前記複数のセクション中に参照を示唆する文言が含まれるか否かを判定する判定ステップと、
前記参照を示唆する文言が含まれる場合に、参照先のセクションを特定する特定ステップとを備える
文作成方法。 - 前記特定ステップが特定した前記参照先のセクションに前記文書からのリンクを生成する生成ステップと、
前記特定ステップが特定した前記参照先へのリンクを出力する出力ステップと、
をさらに備える
請求項8に記載の文作成方法。 - 前記判定ステップは、パターンマッチ、条件付き確率場等の系列ラベリング問題を解くための手法及びニューラルネットワークのうち少なくともいずれか1つを用いて前記参照を示唆する文言を検出し、前記リンクのそれぞれについて前記参照先のセクションを同定することを特徴とする請求項9に記載の文作成方法。
- 前記文書に類似し、前記参照を示唆する文言の内容を示す参照先のデータである関連文書を示す情報を取得する関連文書取得ステップと、
前記関連文書を出力する関連文書出力ステップと、
をさらに備える請求項8〜10のいずれか1項に記載の文作成方法。 - 前記関連文書取得ステップは、前記セクション及び前記参照先のセクションから、前記関連文書を取得することを特徴とする請求項11に記載の文作成方法。
- 前記関連文書取得ステップは、前記文書とは異なる他の文書から、前記関連文書を取得することを特徴とする請求項11に記載の文作成方法。
- 前記関連文書取得ステップは、グラフ理論を用いて関連性を推論するネットワーク構造化、及び埋め込みに基づく低次元ユークリッド空間上での類似度計算のいずれかにより、前記関連文書を取得することを特徴とする請求項11〜13に記載の文作成方法。
- コンピュータに、
文書の入力を受け付ける受付機能と、
前記文書を複数のセクションに分割する分割機能と、
前記分割機能が分割した前記複数のセクションごとにキーワードタグを生成するキーワードタグ生成機能と、
前記セクション中に参照を示唆する文言が含まれるか否かを判定する判定機能と、
参照を示唆する文言が含まれる場合に、参照先のセクションを特定する特定機能と
を実現させることを特徴とする文作成プログラム。 - 前記コンピュータに、
前記特定機能が特定した前記参照先のセクションに前記文書からのリンクを生成するリンク生成機能と、
前記特定機能が特定した前記参照先へのリンクを出力するリンク出力機能と、
をさらに実現させる
ことを特徴とする請求項15に記載の文作成プログラム。 - 前記判定機能は、パターンマッチ、条件付き確率場等の系列ラベリング問題を解くための手法及びニューラルネットワークのうち少なくともいずれか1つを用いて前記参照を示唆する文言を検出し、前記リンクのそれぞれについて前記参照先のセクションを同定することを特徴とする請求項16に記載の文作成プログラム。
- 前記コンピュータに、
前記文書に類似し、前記参照を示唆する文言の内容を示す参照先のデータである関連文書を示す情報を取得する関連文書取得機能と、
前記関連文書を出力する関連文書出力機能と、
をさらに実現させる請求項15〜17のいずれか1項に記載の文作成プログラム。 - 前記関連文書取得機能は、前記セクション及び前記参照先のセクションから、前記関連文書を取得することを特徴とすることを特徴とする請求項18に記載の文作成プログラム。
- 前記関連文書取得機能は、前記文書とは異なる他の文書から、前記関連文書を取得することを特徴とする請求項18に記載の文作成プログラム。
- 前記関連文書取得機能は、グラフ理論を用いて関連性を推論するネットワーク構造化、及び埋め込みに基づく低次元ユークリッド空間上での類似度計算のいずれかにより、前記関連文書を取得することを特徴とする請求項18〜20に記載の文作成プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019188191A JP2021064143A (ja) | 2019-10-11 | 2019-10-11 | 文作成装置、文作成方法および文作成プログラム |
JP2024062838A JP2024091709A (ja) | 2019-10-11 | 2024-04-09 | 文作成装置、文作成方法および文作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019188191A JP2021064143A (ja) | 2019-10-11 | 2019-10-11 | 文作成装置、文作成方法および文作成プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024062838A Division JP2024091709A (ja) | 2019-10-11 | 2024-04-09 | 文作成装置、文作成方法および文作成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021064143A true JP2021064143A (ja) | 2021-04-22 |
Family
ID=75486303
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019188191A Pending JP2021064143A (ja) | 2019-10-11 | 2019-10-11 | 文作成装置、文作成方法および文作成プログラム |
JP2024062838A Pending JP2024091709A (ja) | 2019-10-11 | 2024-04-09 | 文作成装置、文作成方法および文作成プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024062838A Pending JP2024091709A (ja) | 2019-10-11 | 2024-04-09 | 文作成装置、文作成方法および文作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP2021064143A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115618852A (zh) * | 2022-11-22 | 2023-01-17 | 山东天成书业有限公司 | 一种文本数字化自动校对系统 |
EP4276676A1 (en) | 2022-05-09 | 2023-11-15 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, program, and storage medium for extracting a named entity from a document |
WO2024262026A1 (ja) * | 2023-06-23 | 2024-12-26 | 日本電信電話株式会社 | 教師データ生成装置、教師データ生成方法、および教師データ生成プログラム |
JP7606937B2 (ja) | 2021-07-05 | 2024-12-26 | 株式会社日立製作所 | チェックリスト消化支援装置及びチェックリスト消化支援方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6295542B1 (en) * | 1998-10-02 | 2001-09-25 | National Power Plc | Method and apparatus for cross-referencing text |
JP2002032367A (ja) * | 2000-07-14 | 2002-01-31 | Jisedai Joho Hoso System Kenkyusho:Kk | 文章解釈を支援するための情報付加方法及び文章提示装置 |
JP2003178055A (ja) * | 2001-12-11 | 2003-06-27 | Hitachi Ltd | 文書データの関連性抽出装置及び抽出プログラム |
JP2004086845A (ja) * | 2002-06-27 | 2004-03-18 | Oki Electric Ind Co Ltd | 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体 |
US20050050444A1 (en) * | 2003-09-03 | 2005-03-03 | Vasey Philip E. | Cross-reference generation |
JP2006195667A (ja) * | 2005-01-12 | 2006-07-27 | Toshiba Corp | 構造化文書検索装置、構造化文書検索方法、及び構造化文書検索プログラム |
JP2008204274A (ja) * | 2007-02-21 | 2008-09-04 | Nomura Research Institute Ltd | 会話解析装置および会話解析プログラム |
JP2008310570A (ja) * | 2007-06-14 | 2008-12-25 | Hitachi Ltd | 電文解析方法、電文解析装置、及び電文解析プログラム |
JP2009181166A (ja) * | 2008-01-29 | 2009-08-13 | Toshiba Corp | 文書処理装置、方法及びプログラム |
JP2012059227A (ja) * | 2010-09-13 | 2012-03-22 | Ricoh Co Ltd | 文書分割装置、文書処理システム、プログラム |
US9411804B1 (en) * | 2013-07-17 | 2016-08-09 | Yseop Sa | Techniques for automatic generation of natural language text |
JP2017033361A (ja) * | 2015-08-04 | 2017-02-09 | コニカミノルタ株式会社 | 文書関連付け装置、文書関連付けシステム、プログラム |
JP6469919B1 (ja) * | 2018-05-09 | 2019-02-13 | 株式会社Legalscape | 判決文データベースの作成方法、判決文データベースの検索方法、文作成方法、判決文データベースの作成装置、判決文データベースの検索装置、文作成装置、判決文データベースの作成プログラム、判決文データベースの検索プログラム、および文作成プログラム |
-
2019
- 2019-10-11 JP JP2019188191A patent/JP2021064143A/ja active Pending
-
2024
- 2024-04-09 JP JP2024062838A patent/JP2024091709A/ja active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6295542B1 (en) * | 1998-10-02 | 2001-09-25 | National Power Plc | Method and apparatus for cross-referencing text |
JP2002032367A (ja) * | 2000-07-14 | 2002-01-31 | Jisedai Joho Hoso System Kenkyusho:Kk | 文章解釈を支援するための情報付加方法及び文章提示装置 |
JP2003178055A (ja) * | 2001-12-11 | 2003-06-27 | Hitachi Ltd | 文書データの関連性抽出装置及び抽出プログラム |
JP2004086845A (ja) * | 2002-06-27 | 2004-03-18 | Oki Electric Ind Co Ltd | 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体 |
US20050050444A1 (en) * | 2003-09-03 | 2005-03-03 | Vasey Philip E. | Cross-reference generation |
JP2006195667A (ja) * | 2005-01-12 | 2006-07-27 | Toshiba Corp | 構造化文書検索装置、構造化文書検索方法、及び構造化文書検索プログラム |
JP2008204274A (ja) * | 2007-02-21 | 2008-09-04 | Nomura Research Institute Ltd | 会話解析装置および会話解析プログラム |
JP2008310570A (ja) * | 2007-06-14 | 2008-12-25 | Hitachi Ltd | 電文解析方法、電文解析装置、及び電文解析プログラム |
JP2009181166A (ja) * | 2008-01-29 | 2009-08-13 | Toshiba Corp | 文書処理装置、方法及びプログラム |
JP2012059227A (ja) * | 2010-09-13 | 2012-03-22 | Ricoh Co Ltd | 文書分割装置、文書処理システム、プログラム |
US9411804B1 (en) * | 2013-07-17 | 2016-08-09 | Yseop Sa | Techniques for automatic generation of natural language text |
JP2017033361A (ja) * | 2015-08-04 | 2017-02-09 | コニカミノルタ株式会社 | 文書関連付け装置、文書関連付けシステム、プログラム |
JP6469919B1 (ja) * | 2018-05-09 | 2019-02-13 | 株式会社Legalscape | 判決文データベースの作成方法、判決文データベースの検索方法、文作成方法、判決文データベースの作成装置、判決文データベースの検索装置、文作成装置、判決文データベースの作成プログラム、判決文データベースの検索プログラム、および文作成プログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7606937B2 (ja) | 2021-07-05 | 2024-12-26 | 株式会社日立製作所 | チェックリスト消化支援装置及びチェックリスト消化支援方法 |
EP4276676A1 (en) | 2022-05-09 | 2023-11-15 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, program, and storage medium for extracting a named entity from a document |
CN115618852A (zh) * | 2022-11-22 | 2023-01-17 | 山东天成书业有限公司 | 一种文本数字化自动校对系统 |
WO2024262026A1 (ja) * | 2023-06-23 | 2024-12-26 | 日本電信電話株式会社 | 教師データ生成装置、教師データ生成方法、および教師データ生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2024091709A (ja) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shelar et al. | Named entity recognition approaches and their comparison for custom ner model | |
Strötgen et al. | Multilingual and cross-domain temporal tagging | |
US10146751B1 (en) | Methods for information extraction, search, and structured representation of text data | |
US9659084B1 (en) | System, methods, and user interface for presenting information from unstructured data | |
Khusro et al. | On methods and tools of table detection, extraction and annotation in PDF documents | |
JP6014725B2 (ja) | 単文/複文構造の自然言語クエリに対する検索および情報提供方法並びにシステム | |
Croce et al. | Neural learning for question answering in italian | |
JP2021064143A (ja) | 文作成装置、文作成方法および文作成プログラム | |
Wang et al. | Mining key information of web pages: A method and its application | |
Spitz et al. | EVELIN: Exploration of event and entity links in implicit networks | |
Uçar et al. | A novel algorithm for extracting the user reviews from web pages | |
Dinov et al. | Natural language processing/text mining | |
Nanni et al. | Semi-supervised textual analysis and historical research helping each other: Some thoughts and observations | |
Fabo et al. | Mapping the Bentham corpus: concept-based navigation | |
Wanjari et al. | Automatic news extraction system for Indian online news papers | |
Modi et al. | Multimodal web content mining to filter non-learning sites using NLP | |
Musabeyezu | Comparative study of annotation tools and techniques | |
Batista-Navarro et al. | A text mining-based framework for constructing an RDF-compliant biodiversity knowledge repository | |
Ananiadou et al. | Supporting the education evidence portal via text mining | |
Maree | Multimedia context interpretation: a semantics-based cooperative indexing approach | |
KR101072147B1 (ko) | 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템 | |
Banerjee et al. | Trainable framework for information extraction, structuring and summarization of unstructured data, using modified NER | |
Ellouze et al. | CITOM: An incremental construction of multilingual topic maps | |
Mgarbi et al. | Building a recommendation system based on the job offers extracted from the web and the skills of job seekers | |
Audeh et al. | Comparative study of unsupervised keyword extraction methods for job recommendation in an industrial environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220826 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231012 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240109 |