WO2011033653A1

WO2011033653A1 - 用語統一支援装置

Info

Publication number: WO2011033653A1
Application number: PCT/JP2009/066379
Authority: WO
Inventors: 康隆大嶽
Original assignee: 株式会社東芝
Priority date: 2009-09-18
Filing date: 2009-09-18
Publication date: 2011-03-24

Abstract

　用語統一支援装置は、推奨語を含むアトリビュートと、該アトリビュートで定義されるプロパティとによって定義されるデータであって、プロパティ毎の辞書データを取得し、データ項目を行列形式で表す仕様データとデータ項目を補足する説明を表す補足記述とを含む技術文書と、補足記述で用いられる用語から第１用語との入力を受け付ける。そして、用語統一支援装置は、仕様データから第１用語が用いられて補足されている第１データ項目を抽出し、辞書データを用いて第１データ項目に相当する第１プロパティを推定し、辞書データを用いて第１プロパティと関係を有するプロパティの中から、第１用語に対応する第２プロパティを推定し、辞書データを用いて、第２プロパティが所有する推奨語と第１用語とを照合する。

Description

用語統一支援装置

　本発明は、用語統一支援装置に関する。

　従来、製品を製造したり販売したりするサプライヤ企業と、その製品を利用するユーザ企業との間で交換される技術文書には、製品カタログ、スペックシート、納入仕様書などがある。これらの技術文書において製品の仕様を表す仕様データはしばしば行列形式の表として表現される。その表中の１行（又は１列）は１つのデータ項目に相当するが、それが何を意味するのかを「項目名」「記号」「単位」などの各要素を詳細項目として用い説明した上で、「値」を記載するといった形式をとることが普通である。また、表中のデータ項目には「補足記述」が付与されることがある。例えば、データ項目がある電流値を示す場合、その測定条件として「注１）ジャンクション温度が150℃を超えることのない放熱条件でご使用下さい」といったようなものが補足記述である。

　一方、最近では、サプライヤ企業と、ユーザ企業とが一丸となり製品分類毎に標準的なデータ項目を定めた「辞書」を開発しており、データ項目の標準化や統一化もはかられるようになってきている。辞書の形式の１つとして、ＩＳＯ１３５８４（通称、ＰＬＩＢ：Ｐａｒｔｓ　Ｌｉｂｒａｒｙ）がある。ＰＬＩＢは、各製品の仕様データを表現するためのデータ項目を定める「プロパティ」と製品分類を定める「クラス」とを定義するための構造及びその辞書に従って具体的な製品仕様を記述した「コンテンツ」を交換するための構造を定めた国際規格である。ＩＳＯ１３５８４－４２では、データ項目が何を意味するかを説明する詳細項目に相当する「アトリビュート」を標準化している。また、ＰＬＩＢに従ったコンテンツを管理するデータベースは、階層型データベースの１つととらえることができる。

　しかしながら、現在流通する技術文書においては、「項目名」「記号」「単位」や「補足記述」中で用いられる用語が、サプライヤ毎に微妙に異なる表現となっていることが依然として多い。このため、色々なサプライヤから受けた技術文書を利用する側のユーザ企業では一貫性がとれないなどの問題が発生している。技術文書で用いられる用語について、ＰＬＩＢなどに従った標準的な辞書（標準辞書という）で定義された用語へ統一することが急務となっており、標準辞書で定義された用語にあわない語の検出やその修正が求められている。

　現在は、技術文書の作成者が文書上の語をキーワードとして辞書を類似検索することで、それが正しい語彙であるか否かを人手により検出することが行われている。しかし、標準辞書の構造を熟知していない作成者も多く、本当に推奨語が使えているのか判断しにくいケースが多かった。

　近年では、ＰＬＩＢ辞書の類似検索システムがいくつか提案されている。製品仕様文書は主に、「表データ」とそれに対する「補足記述」とから構成されるが、補足記述中の用語を標準辞書で定義された推奨語へ統一させるために、例えば、以下の２つの方法を適用することが考えられる。１つは、文章を構文解析して単語間の関係を抽出し、”語関係用語統一チェックルール”と照らし合わせて、不統一な用語を検出する方法である（特許文献１参照）。また１つは、用語の使用頻度に基づいて、最も一般的に使用される用語に置換する方法である（特許文献２参照）。

特開平５－２９８３０１号公報特開２００８－２９３２００号公報

　しかし、特許文献１の方法では、用語統一の精度が、単語間の関係の抽出精度とチェックルールの品質とに左右されてしまう恐れがある。また特許文献２の方法では、”語関係用語統一チェックルール”の品質には左右されないものの、長文以外での利用が困難である。また、いずれの方法も製品の仕様文書がもつコンテキスト（文脈、前後関係、背景等）を生かすことができない恐れがあった。

　本発明は、上記に鑑みてなされたものであって、仕様データに対する補足記述で用いられる用語を標準辞書で定義された推奨語へ統一することを支援可能な用語統一支援装置を提供することを目的とする。

　本発明は、用語統一支援装置であって、推奨語を含むアトリビュートと、該アトリビュートで定義されるプロパティとによって定義されるデータであって、前記プロパティ毎の辞書データを取得する取得部と、データ項目を行列形式で表す仕様データと前記データ項目を補足する説明を表す補足記述とを含む技術文書の入力を受け付ける第１受付部と、前記補足記述で用いられる用語から第１用語の入力を受け付ける第２受付部と、前記仕様データから前記第１用語が用いられて補足されている第１データ項目を抽出する抽出部と、前記辞書データを用いて前記第１データ項目に相当する第１プロパティを推定する第１推定部と、前記辞書データを用いて前記第１プロパティと関係を有するプロパティの中から、前記第１用語に対応する第２プロパティを推定する第２推定部と、前記辞書データを用いて、前記第２プロパティが所有する前記推奨語と前記第１用語とを照合する照合部とを備えることを特徴とする。

　本発明によれば、仕様データに対する補足記述で用いられる用語を標準辞書で定義された推奨語へ統一することが支援可能になる。

用語統一支援装置のハードウェア構成を例示する図。用語統一支援装置の機能的構成を例示する図。辞書ＤＢのデータ構造を例示する図。プロパティ毎の辞書データを例示する図。インデックステーブルを例示する図。技術文書を例示する図。インデックスを登録する処理の手順を示すフローチャート。用語統一支援処理の手順を示すフローチャート。補足対象プロパティを推定する処理の手順を示すフローチャート。仕様データにおける列と、アトリビュートとの対応関係を示す図。対象用語プロパティを推定する処理の手順を示すフローチャート。ステップＳ４２の処理の手順を示すフローチャート。訂正候補の表示例を示す図。補足記述漏れの表示例を示す図。訂正候補の表示例を示す図。

　以下に添付図面を参照して、この発明にかかる用語統一支援装置の一実施の形態を詳細に説明する。

　まず、用語統一支援装置のハードウェア構成について図１を用いて説明する。用語統一支援装置１０は、装置全体を制御するＣＰＵ（Central　Processing　Unit）等の制御部１０１と、各種データや各種プログラムを記憶するＲＯＭ（Read　Only　Memory）１０４やＲＡＭ（Random　Access　Memory）１０５等の主記憶部と、各種データや各種プログラムを記憶するＨＤＤ（Hard　Disk　Drive）やＣＤ（Compact　Disk）ドライブ装置等の補助記憶部１０７と、これらを接続するバス１０８とを備えており、通常のコンピュータを利用したハードウェア構成となっている。また、用語統一支援装置１０には、情報を表示する表示部１０３と、ユーザの指示入力を受け付けるキーボードやマウス等の操作部１０２と、外部装置の通信を制御する通信Ｉ／Ｆ（interface）とが有線又は無線により各々接続される。本実施の形態においては、用語統一支援装置１０は、少なくとも１つの要素を含むデータ項目毎に行列形式で表す仕様データとデータ項目を補足する説明を表す補足記述とを含む技術文書の編集を行う文書編集装置と通信Ｉ／Ｆを介して接続される。

　次に、このようなハードウェア構成において、用語統一支援装置１０の制御部１０１がＲＯＭ１０４や補助記憶部１０７に記憶された各種プログラムを実行することにより実現される各種機能について具体的に説明する。図２は、用語統一支援装置１０の機能的構成を例示する図である。用語統一支援装置１０は、文書受付部２１と、対象用語受付部２２と、補足対象抽出部２３と、分類受付部２４と、補足対象プロパティ推定部２５と、対象用語プロパティ推定部２６と、語彙照合部２７と、照合結果出力部２８と、補足記述漏れ出力部２９と、辞書記憶部３０とを有する。これらのうち、文書受付部２１と、対象用語受付部２２と、補足対象抽出部２３と、分類受付部２４と、補足対象プロパティ推定部２５と、対象用語プロパティ推定部２６と、語彙照合部２７と、照合結果出力部２８と、補足記述漏れ出力部２９とは、制御部１０１のプログラム実行時にＲＡＭ１０５などの主記憶部上に生成されるものである。辞書記憶部３０は、例えば補助記憶部１０７に記憶されるものである。

　辞書記憶部３０は、辞書ＤＢと、インデックステーブルとを有する。辞書ＤＢは辞書データを記憶する。辞書データは、製品の分類と階層を示すクラスと、クラスを特徴付けるプロパティによって定義される。またプロパティは少なくとも1つのアトリビュートによって定義される。製品とは、ユーザのニーズや欲求を満たすために、市場へと提供されるものであり、有形のものだけでなく、サービス、経験、イベント、人、場所、資産、組織、情報、アイデアなどが製品に含まれる。図３は、辞書ＤＢのデータ構造を例示する図である。同図では、辞書ＤＢは、分類（クラス）を中心とした階層構造を有していることが示されている。同図に示される階層構造においては、「COMPONENT」という分類をルートクラスとし、その子クラスとして「半導体」と「一般電子部品」とが存在し、さらに「半導体」にその子クラスとして「汎用ロジックIC」と「トランジスタ」とが存在する。即ち、「半導体」は「汎用ロジックIC」「トランジスタ」という２つの分類に細分化され、「トランジスタ」はさらに「MOSFET」と「IGBT」という２つの分類に細分化されることが示されている。階層構造は何層であっても構わない。尚、（）内に書かれた記号（この例ではCn、nは数字）は、辞書記憶部３０内で唯一につけられたクラスを表すコードであり、ＰＬＩＢ規格では「クラスＢＳＵコード」と呼ぶ識別子に相当する。

　図３に示されるように、階層構造を定義するクラスには、それぞれ固有のプロパティ（図３中、点線で囲まれた部分）が定義される。各クラスにおいては、当該クラスの上位クラスで定義されたプロパティを継承する。例えば、クラス「MOSFET」が持つプロパティは、当該クラスで定義されたプロパティ（「P3」「P4」「P5」「P6」）と、その上位クラス「トランジスタ」で定義されたプロパティ（この例では簡略化したために無い）と、クラス「半導体」で定義されたプロパティ（この例では簡略化したために無い）と、クラス「COMPONENT」で定義されたプロパティ（「P0」）ということになる。尚、クラスの場合と同様にプロパティにおいても辞書ＤＢ内で唯一につけられたプロパティを表すコード（「プロパティＢＳＵコード」又は単に「ＢＳＵ」）が付与される。以降では、上述したクラスを表すコード及びプロパティを表すコードを共にＢＳＵコードとして取り扱う。

　図４は、プロパティ毎の辞書データを例示する図である。１番上の行を除く各行がプロパティ毎の各辞書データに対応したレコードである。各辞書データは、各プロパティを識別するためのＢＳＵコードと、当該プロパティが定義されたクラス（定義クラスという）を識別するためのＢＳＵコードと、プロパティの性質を定義するアトリビュートとを含む。アトリビュートとしては、同図に示されるように、例えば、「定義クラス」「ＢＳＵ」「推奨名」「被依存プロパティ」「シノニム」「シンボル」「単位」「定義」とがある。「被依存プロパティ」とは、プロパティ間の依存関係を示すものであり、そのプロパティの値が依存する側のプロパティの値によって影響を受けるプロパティであることを示す。例えば、P4の被依存プロパティとしてP3を定めているが、これは「P3：DCドレイン電流」は「P4：チャネル温度」に依存して定まる値であることを示している。プロパティP3とプロパティP6に関しても同様の依存関係があることを示している。尚、本実施の形態では利用しないがプロパティの「データ型」や、プロパティ自体の定義の出典を示す「出典」といったアトリビュートもＰＬＩＢでは存在する。以上のようにクラスの親子構造、プロパティとそのアトリビュートの種類、プロパティ間の依存関係、データ型の種類など辞書の構造を定めたデータモデルの１つとして、前述した製品部品ライブラリの交換フォーマットの国際標準であるＩＳＯ１３５８４／Ｐａｒｔｓ　Ｌｉｂｒａｒｙ（ＰＬＩＢ）がある。尚、本実施の形態においては、辞書がＰＬＩＢモデルに従った場合の適用例を用い説明するが、ＰＬＩＢ以外のデータベースへ適用しても良い。

　インデックステーブルは、各プロパティやクラスの単語要素毎にインデックスを記憶する。図５は、インデックステーブルを例示する図である。同図に示されるように、インデックステーブルは、各プロパティについて単語要素毎にインデックスとして、「クラス／プロパティ区分(C/P)」「ＢＳＵコード」「単語要素」「アトリビュートの種類」「重み」を記憶する。「クラス／プロパティ区分(C/P)」とは、クラス又はプロパティかを区別するためのものである。「単語要素」とは、例えば「推奨名」「定義」「シノニム」などの特定のアトリビュートの値として表される文字列が単語毎に分解されたものである。「重み」とは、アトリビュートの種類に応じて付けられる。このインデックスは、後述する補足対象プロパティ推定部２５が行うプロパティの推定に用いられる。なお、この例ではプロパティのみをインデックステーブルへの登録するものとして説明する。

　図２の説明に戻る。文書受付部２１は、文書編集装置１１から送信された技術文書（対象文書という）の入力を受け付ける。図６は、技術文書を例示する図である。同図に示されるように、技術文書には、「項目名」「記号」「定格」「単位」などの要素を含む複数のデータ項目毎に行列形式で表された仕様データと、「注１」や「注２」としてデータ項目を補足する説明を表す補足記述とが含まれている。仕様データのうち、一番上の行は、見出しである。補足記述における「注１」は、仕様データのデータ項目のうち、「DCドレイン電流」にリンクが付けられているため、このデータ項目に対する説明の補足である。補足記述における「注２」は、仕様データのデータ項目のうち、「許容損失」にリンクが付けられているため、このデータ項目に対する説明の補足である。このように、技術文書においては、補足記述と仕様データにおけるデータ項目とが関連付けされている。

　対象用語受付部２２は、対象文書に含まれる補足記述で用いられる用語であって、文書編集装置１１においてユーザにより指定されて送信され且つ照合の対象である用語（対象用語という）の入力を受け付ける。分類受付部２４は、文書編集装置１１においてユーザにより指定されて送信された、対象文書に関する製品のクラスの入力を受け付ける。補足対象抽出部２３は、文書受付部２１が入力を受け付けた技術文書に含まれる仕様データのうち、補足記述において、対象用語受付部２２が入力を受け付けた対象用語が用いられて説明の補足がされている対象のデータ項目（補足対象項目という）を抽出する。具体的には、補足対象抽出部２３は、補足記述において当該対象用語が用いられている説明と関連付けられているデータ項目を抽出する。

　補足対象プロパティ推定部２５は、補足対象抽出部２３が抽出した補足対象項目と、分類受付部２４が入力を受け付けたクラスと、辞書記憶部３０の有する辞書ＤＢに記憶された辞書データとを用いて、当該補足対象項目が辞書ＤＢにおいてどの辞書データに相当するか、即ち、当該補足対象項目が辞書ＤＢにおいてどのプロパティに相当するかを推定する。対象用語プロパティ推定部２６は、補足対象プロパティ推定部２５が推定したプロパティ（補足対象プロパティという）と、分類受付部２４が入力を受け付けたクラスとを用いて、対象用語受付部２２が入力を受け付けた対象用語に対するプロパティ（対象用語プロパティという）を推定する。

　具体的には、補足対象プロパティは、対象用語プロパティに関連するプロパティであると考えられるため、補足対象プロパティ推定部２５は、補足対象プロパティとＰＬＩＢ構造上関連を持つプロパティに絞って対象用語プロパティを検索する。当該対象用語プロパティの検索の方法には以下の２種類の方法がある。
[方法１]補足対象プロパティが他のプロパティと依存関係を有さない場合
１）補足対象プロパティが属するクラスを特定
２）１）で特定したクラス及び当該クラスと上下関係を有するクラス、即ち、１）で特定したクラス、当該クラスの下位の全てのクラス及び当該クラスの上位の全てのクラスのいずれかに属するプロパティの集合を検索対象Ｑと定める
３）検索対象Ｑのうち「対象用語」をキーワードとしてプロパティ毎の辞書データの類似検索をインデックステーブルを用いて行なう
[方法２]補足対象プロパティが他のプロパティと依存関係を有する場合
１）補足対象プロパティと依存関係を有するプロパティ、即ち、補足対象プロパティが「被依存プロパティ」として定められているプロパティ及び補足対象プロパティの集合を検索対象Ｒと定める
２）検索対象Ｒのうち「対象用語」をキーワードとしてプロパティ毎の辞書データの類似検索をインデックステーブルを用いて行なう
補足対象プロパティ推定部２５は、以上のいずれかの方法によって実行した類似検索の結果得られたプロパティをランキング付きで出力する。このランキングが上位である程、対象用語プロパティである度合が高いプロパティとして推定される。

　語彙照合部２７は、対象用語プロパティ推定部２６が推定した対象用語プロパティに含まれる推奨語と、対象用語受付部２２が入力を受け付けた対象用語とを照合する。照合結果出力部２８は、語彙照合部２７の照合の結果を文書編集装置１１に送信する。具体的には、語彙照合部２７の照合の結果、推奨語と、対象用語とが一致しない場合、照合結果出力部２８は、当該推奨語を当該対象用語の訂正候補として示す第１照合結果を文書編集装置１１に送信する。補足記述漏れ出力部２９は、補足対象プロパティ推定部２５が推定した補足対象プロパティが他のプロパティと依存関係を有する場合、即ち、当該補足対象プロパティが辞書データにおいて他のプロパティの「被依存プロパティ」として定められている場合、当該他のプロパティのうち、補足対象項目に対する補足記述においてその名称に関するアトリビュート（「推奨名」「短縮名称」「シノニム」「定義」など）の全部又は一部が用いられていないプロパティ（補足漏れプロパティという）を検索し、検索の結果に応じて、補足漏れプロパティの推奨語を補足記述漏れとして示す第２照合結果を文書編集装置１１に送信する。

　次に、本実施の形態にかかる用語統一支援装置１０の行う処理の手順について説明する。まず、各プロパティの単語要素毎のインデックスをインデックステーブルへ登録する処理の手順について図７を用いて説明する。まず、用語統一支援装置１０は、図３に例示される各辞書データをdicElem(i,j)として主記憶部に記憶する（ステップＳ１）。但し、iは一番上の行を除く各行に対応する辞書データのレコードを表し、jは各列に対応するアトリビュートを表している。用語統一支援装置１０は、dicElem(i,j)の全ての辞書データの名称に関するアトリビュート（ここでは「推奨名(j=3)」「シノニム(j=5)」とする）の全てに対して（ステップＳ２～Ｓ３）、アトリビュートの値として表される文字列dic(i,j)を各々単語解析する（ステップＳ４）。例えば、図４においてiが「1」であり、jが「3」（推奨名）については、その文字列は「ジャンクション温度」である。この場合、単語解析により「ジャンクション」と「温度」とに分解される。そして、用語統一支援装置１０は、このように分解した全ての単語要素に対して、アトリビュートの種類に応じた重み付けを行い、この重みの値（w(j)）を、プロパティ毎及び単語要素毎に「クラス・プロパティ分類」「ＢＳＵコード」「単語要素」「アトリビュートの種類」と共にインデックスとしてインデックステーブルへ登録する（ステップＳ５）。本実施の形態では、重みとして、アトリビュートの種類毎に以下の値を用いるものとする。
「推奨名」：1.0
「シノニム」：0.8
その他のアトリビュート：0

　この処理の結果、図４に例示される各プロパティについては、図５に例示される各インデックスが単語要素毎にインデックステーブルに登録される。但し、同図に示されるように、重みが「0」となる単語要素については登録されない。このようにインデックスが登録されたインデックステーブルは、以下で説明する用語統一支援処理で用いられる。

　次に、用語統一支援処理の手順について図８を用いて説明する。尚、辞書記憶部３０の有する辞書ＤＢのデータ構造は、図３～４に例示した通りであるとする。文書編集装置１１においてユーザが、技術文書（対象文書）を指定し、当該対象文書に含まれる補足記述に含まれる用語のうち、照合の対象となる用語（対象用語）を指定し、クラスを指定すると、指定された対象文書、対象用語及びクラスを含むデータを文書編集装置１１は用語統一支援装置１０に送信する。ここでは、例えば、図５に例示された技術文書が指定され、「ジャンクション温度」が対象用語として指定され、「トランジスタ」がクラスとして指定されるとする。尚、クラスの指定は、例えば、ＢＳＵコードによって行っても良いし、クラスの名称によって行っても良い。

　用語統一支援装置１０は、文書編集装置１１から送信された当該データを受信すると、文書受付部２１の機能により、対象文書の入力を受け付け、対象用語受付部２２の機能により、対象用語の入力を受け付け、分類受付部２４の機能により、クラスの入力を受け付ける（ステップＳ２０）。次いで、用語統一支援装置１０は、補足対象抽出部２３の機能により、ステップＳ２０で入力が受け付けられた対象文書に含まれる仕様データのうち、ステップＳ２０で入力が受け付けられた対象用語が用いられて説明の補足がされている対象のデータ項目（補足対象項目）を抽出する（ステップＳ２１）。ここでは、「ジャンクション温度」が用いられて説明が補足されている「注１」と関連付けられているデータ項目は、「DCドレイン電流」であるから、これが補足対象項目となる。即ち、図６に例示された技術文書に含まれる仕様データのうち３行目が補足対象項目として抽出される。そして、用語統一支援装置１０は、補足対象プロパティ推定部２５の機能により、ステップＳ２で抽出された補足対象項目と、ステップＳ１で入力が受け付けられたクラスと、辞書記憶部３０の有する辞書ＤＢに記憶された辞書データとを用いて、補足対象項目が辞書ＤＢにおいてどの辞書データに相当するか、即ち、当該補足対象項目が辞書ＤＢにおいてどのプロパティに相当するかを推定する（ステップＳ２２）。

　ここで、ステップＳ２２で補足対象項目に相当するプロパティ（補足対象プロパティ）を推定する処理の詳細な手順を図９を用いて説明する。この処理は、アトリビュートを推定する第１処理と、類似するプロパティ（類似プロパティという）を検索する第２処理とに大別される。第１処理においては、仕様データにおける列と、辞書ＤＢにおけるプロパティに含まれるアトリビュートとの対応関係が、図１０に例示されるように、編集者により以下の通り予め指定されているものとする。
一列目：アトリビュート「推奨名」
二列目：アトリビュート「シンボル」
三列目：該当なし
四列目：アトリビュート「単位」

　そして、第２処理で、用語統一支援装置１０は、以下のようにして、補足対象項目が辞書ＤＢにおけるどのプロパティに相当するかを推定する。まず、用語統一支援装置１０は、辞書ＤＢにおいて比較対象のプロパティを選択する（ステップＳ３０）。次いで、用語統一支援装置１０は、以下のルールを適用して、補足対象項目に属する各列のうち、アトリビュートが推定された列毎に点数を類似度として計算する（ステップＳ３１）。
(a)辞書データにおける当該アトリビュートに文字列が完全一致する場合：5点
(b)辞書データにおける当該アトリビュートに文字列が部分一致する場合：1点
(c)「名称」（「推奨名」「シノニム」）に関しては区別しない

　全ての列について類似度の計算が終了すると（ステップＳ３２：ＹＥＳ）、用語統一支援装置１０は、合計の点数が最も高いプロパティを選択して、これを類似プロパティとして決定する（ステップＳ３３）。この類似プロパティが、即ち、補足対象項目に相当するプロパティ（補足対象プロパティ）として推定される。

　具体的には、図４に例示されたプロパティ毎の辞書データに対して、補足対象項目である「DCドレイン電流」についての類似度の計算結果は以下の通りである。
類似度（P3）=5+5+5=15　　＃推奨名、シンボル、単位が完全一致
類似度（P6）=1+0+0=1　　＃推奨名が部分一致
プロパティ「P3」,「P6」以外のプロパティに対しては、類似度は全て0となる。
従って、補足対象プロパティは、クラス「MOSFET」で定義された「P3：DCドレイン電流」であると推定される。

　図８の説明に戻る。ステップＳ２２の後、用語統一支援装置１０は、対象用語プロパティ推定部２６の機能により、ステップＳ２２で推定された補足対象プロパティと、ステップＳ２０で入力が受け付けられたクラスとを用いて、ステップＳ２０で入力が受け付けられた対象用語に対するプロパティ（対象用語プロパティ）を推定する(ステップＳ２３)。

　ここで、ステップＳ２３で対象用語プロパティを推定する処理の詳細な手順を図１１を用いて説明する。まず、用語統一支援装置１０は、辞書ＤＢに記憶された各辞書データにおける「被依存プロパティ」を参照して、ステップＳ２２で推定した補足対象プロパティが他のプロパティと依存関係を有するか否かを判断する（ステップＳ４０）。即ち、用語統一支援装置１０は、補足対象プロパティが「被依存プロパティ」として定められているプロパティが辞書データとして辞書ＤＢに記憶されているか否かを判断する。当該判断結果が肯定的である場合（ステップＳ４０：ＹＥＳ）、用語統一支援装置１０は、上述の[方法２]により処理を行なうべく、まず、補足対象プロパティ及び補足対象プロパティと依存関係を有するプロパティの集合を検索対象Ｒと定める（ステップＳ４１）。

　補足対象プロパティである「P3：DCドレイン電流」については、図４の例では、該当のプロパティは「P4」,「P6」となる。従って、ここでは、用語統一支援装置１０は、ステップＳ２２で推定した補足対象プロパティが他のプロパティと依存関係を有するため、補足対象プロパティ「P3」と当該補足対象プロパティと依存関係を有するプロパティ「P4」,「P6」との集合（「P3」，「P4」,「P6」）を検索対象Ｒと定める。

　次いで、用語統一支援装置１０は、ステップＳ２０で入力が受け付けられた対象用語をキーワードとして、検索対象Ｒに含まれるプロパティの類似検索をインデックステーブルを用いて行なうことにより、対象用語に対するプロパティを推定する（ステップＳ４２）。ここで、ステップＳ４２の処理の詳細な手順について図１２を用いて説明する。用語統一支援装置１０は、対象用語を単語解析し（ステップＳ５０）、この結果得られた単語要素を含むインデックスを、検索対象Ｒに含まれるプロパティについてインデックステーブルにおいて検索する（ステップＳ５１）。具体的には、対象用語「ジャンクション温度」については、「ジャンクション」と「温度」との各単語要素に分解される。図５に例示されるインデックステーブルでは、これらの各単語要素を含むインデックスＩＤＸ３～ＩＤＸ５が検索の結果得られる。そして、用語統一支援装置１０は、検索の結果得られたインデックスをプロパティ毎にグルーピングし、重みの総和（得点）を計算する（ステップＳ５２）。インデックスＩＤＸ３～ＩＤＸ５については、プロパティ「P4」にグルーピングされる。プロパティPnの得点をPoint(Pn)とすると、プロパティ「P4」ついての計算結果は以下の通りとなる。
Point(P4)=1.0+0.8+0.8=2.6

　次いで、用語統一支援装置１０は、プロパティ毎の計算結果を値の高い順にランキングして、各プロパティをランキング付きで出力する（ステップＳ５３）。このランキングが上位である程、対象用語プロパティである度合が高いプロパティとして推定される。上述の例では、プロパティ「P4」が一位として出力され、これが対象用語プロパティとして推定される。尚、ここでの留意点は、図４に例示された辞書データのプロパティ「P1」については、推奨名「ジャンクション温度」がアトリビュートとして含まれているにもかかわらず、これは対象外となる点にある。プロパティ「P1」はクラス「汎用ロジックIC」に属するものである。一方、「ジャンクション温度」が用いられて説明の補足がされている補足対象項目「DCドレイン電流」に相当するプロパティは「P3」であり、これの属するクラスは、「MOFSET」である。このため、これと同じクラスに属するプロパティ「P4」が対象用語プロパティとして推定され、プロパティ「P1」が対象外となることで、対象用語プロパティが正しく推定されている。

　図１１の説明に戻る。ステップＳ４０で、ステップＳ２２で推定した補足対象プロパティが他のプロパティと依存関係を有さない場合（ステップＳ４０：ＮＯ）、用語統一支援装置１０は、上述の[方法１]により処理を行なうべく、補足対象プロパティが属するクラスを特定する（ステップＳ４３）。そして、用語統一支援装置１０は、ステップＳ４３で特定したクラス、当該クラスの下位の全てのクラス及び当該クラスの上位の全てのクラスのいずれかに属するプロパティの集合を検索対象Ｑと定める（ステップＳ４４）。次いで、用語統一支援装置１０は、ステップＳ２０で入力が受け付けられた対象用語をキーワードとして、検索対象Ｑに含まれるプロパティの類似検索をインデックステーブルを用いて行なうことにより、対象用語プロパティを推定する（ステップＳ４５）。ステップＳ４５の処理の詳細な手順については、ステップＳ４２と略同様であり、図１２を用いて説明したものと略同様であるため、その説明を省略する。

　図８の説明に戻る。ステップＳ２３の後、用語統一支援装置１０は、語彙照合部２７の機能により、ステップＳ２３で推定された対象用語プロパティに含まれる推奨語と、ステップＳ１で入力が受け付けられた対象用語とを照合する（ステップＳ２４）。これらが一致しない場合（ステップＳ２５：ＮＯ）、用語統一支援装置１０は、照合結果出力部２８の機能により、当該推奨語を当該対象用語の訂正候補として示す第１照合結果を文書編集装置１１に送信する（ステップＳ２６）。上述の例で、対象用語プロパティ「P4」については、図４に例示される辞書データでは、推奨語は「チャネル温度」である。これは対象用語「ジャンクション温度」とは一致しない。このため、この「チャネル温度」が訂正候補として示す第１照合結果が文書編集装置１１に送信される。そして、文書編集装置１１は、当該第１照合結果を受信すると、当該第１照合結果を用いて、図１３に例示されるように、「チャネル温度」を「ジャンクション温度」の訂正候補として表示装置に表示させる。

　また、用語統一支援装置１０は、ステップＳ２２で推定された補足対象プロパティが他のプロパティと依存関係を有する場合、補足記述漏れ出力部２９の機能により、当該他のプロパティのうち、補足対象項目に対する補足記述においてその名称に関するアトリビュート（「推奨名」「シノニム」「定義」など）の全部又は一部が用いられていないプロパティ（補足漏れプロパティ）を検索する。検索の結果、補足漏れプロパティがあった場合（ステップＳ２７：ＹＥＳ）、用語統一支援装置１０は、当該補足漏れプロパティの推奨語を補足記述漏れとして示す第２照合結果を文書編集装置１１に送信する（ステップＳ２８）。上述の例では、補足対象プロパティ「P3」については、プロパティ「P4」,「P6」の「被依存プロパティ」として定められている。このため、補足対象プロパティ「P3」は、プロパティ「P4」,「P6」と依存関係を有する。一方、図６に例示された対象文書では、プロパティ「P6」については、推奨語などの名称に関するアトリビュートの値である文字列は補足記述における「注１」に含まれていない。このため、用語統一支援装置１０は、プロパティ「P6」の推奨語を「注１」における補足記述漏れとして示す第２照合結果を文書編集装置１１に送信する。文書編集装置１１は、当該第２照合結果を受信するとこれを用いて、図１４に例示されるように、「注１」において「P6:ゲート漏れ電流」について補足記述漏れの可能性を指摘するメッセージを表示装置に表示させる。なお、被補足対象に表記上の揺らぎがあってもよい。例えば、ドレーン電流とドレイン電流などである。

　以上のように、製品の仕様を表す技術文書において、仕様データに対する補足記述に含まれる用語（対象用語）が説明の補足をしている対象のデータ項目（補足対象項目）に相当するプロパティを推定し、これを用いて、対象用語に対応するプロパティ（対象用語プロパティ）を推定して、対象用語の訂正候補を提示する。このため、技術文書の仕様データの補足記述において用いられる用語について、標準辞書に合わせた用語に修正することを支援することができ、標準辞書で定義したプロパティの推奨語への統一を支援することができる。また、補足記述における記述漏れをチェックして、記述漏れの可能性のあるプロパティを提示することができる。従って、技術文書を利用するユーザ企業とそれを提供するサプライ企業との間の意味解釈の齟齬をなくすことができ、技術文書の品質を向上させることができる。

[変形例]
　なお、本発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。また、以下に例示するような種々の変形が可能である。

　上述した実施の形態において、用語統一支援装置１０で実行される各種プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また当該各種プログラムを、インストール可能な形式又は実行可能な形式のファイルでＣＤ－ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ－Ｒ、ＤＶＤ（Digital　Versatile　Disk）等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供するように構成しても良い。

　上述した各実施の形態において、用語統一支援装置１０は、辞書ＤＢを有するように構成したが、これに限らず、他の情報処理装置が辞書ＤＢを有するように構成し、用語統一支援装置１０は、当該他の情報処理装置を介して辞書ＤＢにアクセスして該当の辞書データを取得するようにしても良い。

　また、上述した各実施の形態において、辞書ＤＢはＰＬＩＢに従った場合の適用例を示したが、これに限らず、ＰＬＩＢ以外のデータベースへ適用するようにしても良い。

　上述した各実施の形態において、アトリビュートに対応する方向は列方向であるとし、プロパティに対応する方向は行方向であるとしたが、これらは逆であっても良い。

　また、上述した各実施の形態において、用語統一支援装置１０は、分類受付部２４の機能により、指定されたクラスの入力を受け付け、当該クラスに属するプロパティに限定して、補足対象プロパティを推定した。しかし、クラスが指定されなくても良く、この場合、辞書ＤＢに記憶されている辞書データの全てを処理対象として補足対象プロパティを推定するようにしても良い。

　上述した実施の形態において、用語統一支援装置１０は、対象用語プロパティ推定部２６の機能により、対象用語に対するプロパティを推定する際に、補足対象プロパティが他のプロパティと依存関係を有するか否かによって、[方法１]及び[方法２]に分けて処理を行った。しかし、補足対象プロパティが他のプロパティと依存関係を有するか否かを考慮せずに、[方法１]によってのみ処理を行うようにしても良い。この場合、図１１では、用語統一支援装置１０は、ステップＳ４０～４１の処理を行なわず、ステップＳ４３～Ｓ４５の処理を行う。ステップＳ４３では、補足対象プロパティである「P3：DCドレイン電流」については、図４の例では、ステップＳ４３では、クラスは「MOFSET」と特定される。ステップＳ４４では、該当のプロパティは「P1」,「P3」，「P4」,「P5」,「P6」となり、検索対象Ｑは、プロパティ「P1」,「P3」，「P4」,「P5」,「P6」の集合として定められる。ステップＳ４５では、図１２のステップＳ５０の後、ステップＳ５１では、図５に例示されるインデックステーブルにおいて、「ジャンクション」と「温度」との各単語要素を含むインデックスＩＤＸ１～ＩＤＸ５が、検索の結果得られる。ステップＳ５２では、インデックスＩＤＸ１～ＩＤＸ５については、プロパティ「P1」,「P4」に各々グルーピングされる。プロパティPnの得点をPoint(Pn)とすると、各プロパティ「P1」,「P4」ついての計算結果は以下の通りとなる。
Point(P1)=1.0+1.0=2.0
Point(P4)=1.0+0.8+0.8=2.6

　従って、ステップＳ５３では、プロパティ「P4」が一位、プロパティ「P1」が二位として出力され、これらが対象用語プロパティの候補として推定される。図８のステップＳ２４では、ステップＳ２３（図１２のステップＳ５３）で推定された各対象用語プロパティの候補に含まれる各推奨語と、ステップＳ１で入力が受け付けられた対象用語とが各々照合され、これらが一致しない場合、ステップＳ２６では、各推奨語を当該対象用語の訂正候補として示す第１照合結果が文書編集装置１１に送信される。ここでは、第１照合結果には、ランキングされた複数の順位のプロパティについて対象用語と一致しなかった推奨語が訂正候補として示されえる。文書編集装置１１は、当該第１照合結果を受信すると、当該第１照合結果を用いて、図１５に例示されるように、ランキングの順に、訂正候補１として、プロパティ「P4」について「チャネル温度」と、訂正候補２としてプロパティ「P1」について「ジャンクション温度」を表示装置に表示させる。尚、この例では、ランキングは二位までであるため、訂正候補は、２つであるが、ランキングのうち何位までを訂正候補とするかは、限定されない。例えば、ステップＳ５２で計算する得点の閾値を予め定めておき、当該閾値以下の得点のプロパティの推奨語については、対象用語と一致しない場合であっても、訂正候補としないようにしても良い。

１０　用語統一支援装置
１１　文書編集装置
２１　文書受付部
２２　対象用語受付部
２３　補足対象抽出部
２４　分類受付部
２５　補足対象プロパティ推定部
２６　対象用語プロパティ推定部
２７　語彙照合部
２８　照合結果出力部
２９　補足記述漏れ出力部
３０　辞書記憶部
１０１　制御部
１０２　操作部
１０３　表示部
１０４　ＲＯＭ
１０５　ＲＡＭ
１０７　補助記憶部
１０８　バス

Claims

　推奨語を含むアトリビュートと、該アトリビュートで定義されるプロパティとによって定義されるデータであって、前記プロパティ毎の辞書データを取得する取得部と、
　データ項目を行列形式で表す仕様データと前記データ項目を補足する説明を表す補足記述とを含む技術文書の入力を受け付ける第１受付部と、
　前記補足記述で用いられる用語から第１用語の入力を受け付ける第２受付部と、
　前記仕様データから前記第１用語が用いられて補足されている第１データ項目を抽出する抽出部と、
　前記辞書データを用いて前記第１データ項目に相当する第１プロパティを推定する第１推定部と、
　前記辞書データを用いて前記第１プロパティと関係を有するプロパティの中から、前記第１用語に対応する第２プロパティを推定する第２推定部と、
　前記辞書データを用いて、前記第２プロパティが所有する前記推奨語と前記第１用語とを照合する照合部とを備える
ことを特徴とする用語統一支援装置。
　前記辞書データは、前記プロパティ間の依存関係を含み、
　前記第２推定部は、前記辞書データを用いて、前記第１プロパティと依存関係を有するプロパティの中から、前記第２プロパティを推定する
ことを特徴とする請求項１に記載の用語統一支援装置。
　前記照合の結果、前記推奨語と、前記第１用語とが一致しない場合、当該推奨語を示す第１照合結果を出力する第１出力部を更に備える
ことを特徴とする請求項２に記載の用語統一支援装置。
　前記プロパティは、前記推奨語に関する前記アトリビュートによって少なくとも記述され、
　前記辞書データを用いて、前記第１プロパティと依存関係を有するプロパティのうち、前記補足記述で前記名称に関するアトリビュートが用いられていない第３プロパティの前記推奨語を示す第２照合結果を出力する第２出力部を更に備える
ことを特徴とする請求項３に記載の用語統一支援装置。
　前記辞書データは、分類を示すクラス毎に前記プロパティが定義されており、
　前記技術文書に関する第１クラスの入力を受け付ける第３受付部とを更に備え、
　前記第１推定部は、前記辞書データを用いて、前記第１クラスに属するプロパティの中から、前記第１プロパティを推定する
ことを特徴とする請求項４に記載の用語統一支援装置。
　前記第２推定部は、前記第１プロパティが他のプロパティと依存関係を有さない場合、前記辞書データを用いて、前記第１クラス及び当該第１クラスと上下関係にあるクラスのいずれかに属する前記プロパティの中から、前記第２プロパティを推定する
ことを特徴とする請求項５に記載の用語統一支援装置。