JP5837447B2 - Metadata candidate generation device and metadata candidate generation method - Google Patents
Metadata candidate generation device and metadata candidate generation method Download PDFInfo
- Publication number
- JP5837447B2 JP5837447B2 JP2012060997A JP2012060997A JP5837447B2 JP 5837447 B2 JP5837447 B2 JP 5837447B2 JP 2012060997 A JP2012060997 A JP 2012060997A JP 2012060997 A JP2012060997 A JP 2012060997A JP 5837447 B2 JP5837447 B2 JP 5837447B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- time
- data
- text
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 15
- 230000002123 temporal effect Effects 0.000 claims description 38
- 238000000605 extraction Methods 0.000 claims description 25
- 239000000284 extract Substances 0.000 claims description 11
- 238000013500 data storage Methods 0.000 description 21
- 238000010295 mobile communication Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 235000021168 barbecue Nutrition 0.000 description 2
- 241000824268 Kuma Species 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ユーザによって記憶された記憶データに付加するメタデータの候補を生成するメタデータ候補生成装置及びメタデータ候補生成方法に関するものである。 The present invention relates to a metadata candidate generation device and a metadata candidate generation method for generating metadata candidates to be added to stored data stored by a user.
従来から、ユーザによってデジタルカメラ等を利用して記録された画像データに対するメタデータを自動生成する技術が知られている。これにより、メタデータに含まれるキーワードによって画像データを検索することが可能になる。 Conventionally, a technique for automatically generating metadata for image data recorded by a user using a digital camera or the like is known. As a result, it is possible to search for image data using a keyword included in the metadata.
例えば、下記特許文献1には、画像データの撮像日時および撮像位置を含む撮像情報を受信し、その撮像情報に基づいて、画像データに対するメタデータの生成時に用いる初期キーワードを生成するメタデータ生成装置が開示されている。このような機能によれば、撮像日時に対応するスケジュールデータにより初期キーワードが抽出され、撮像位置に対応する位置情報より初期キーワードが抽出される。 For example, in Patent Document 1 below, a metadata generation device that receives imaging information including an imaging date and time and an imaging position of image data, and generates an initial keyword used when generating metadata for the image data based on the imaging information. Is disclosed. According to such a function, the initial keyword is extracted from the schedule data corresponding to the imaging date and time, and the initial keyword is extracted from the position information corresponding to the imaging position.
しかしながら、上述した従来のメタデータ生成装置では、撮像情報に対応する初期キーワードが抽出され、その初期キーワードの出現頻度の高い文書データから中間キーワード及び最終キーワードが抽出されるため、必ずしも撮像データの検索に適したキーワードが選択されない場合がある。その結果、撮像データの検索が効率的に実施できない傾向にあった。 However, in the conventional metadata generation apparatus described above, an initial keyword corresponding to imaging information is extracted, and an intermediate keyword and a final keyword are extracted from document data in which the initial keyword appears frequently. In some cases, a keyword suitable for is not selected. As a result, there is a tendency that retrieval of imaging data cannot be performed efficiently.
そこで、本発明は、かかる課題に鑑みて為されたものであり、ユーザが作成したテキスト情報の中から、記憶データの検索に適したメタデータを効率的に抽出することが可能なメタデータ候補生成装置及びメタデータ候補生成方法を提供することを目的とする。 Therefore, the present invention has been made in view of such problems, and is a metadata candidate that can efficiently extract metadata suitable for retrieval of stored data from text information created by a user. It is an object to provide a generation device and a metadata candidate generation method.
上記課題を解決するため、本発明のメタデータ候補生成装置は、ユーザによって記憶された記憶データに対して付与されたデータ生成時刻に関する生成時刻情報を取得する第1の付与情報取得手段と、ユーザによって作成された複数のテキスト情報に対して付与された時刻に関する時刻情報を取得する第2の付与情報取得手段と、生成時刻情報の示す時刻に対して一定の時間範囲内の時刻を示す時刻情報が付与されたテキスト情報を、複数のテキスト情報のうちから特定し、当該テキスト情報を取得する時間的類似情報取得手段と、時間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、複数の重要語を記憶データに付加するメタデータの候補として出力する重要語抽出手段と、を備える。 In order to solve the above-described problem, the metadata candidate generation device of the present invention includes a first assignment information acquisition unit that acquires generation time information related to a data generation time assigned to storage data stored by a user, and a user Time information indicating a time within a certain time range with respect to the time indicated by the generation time information, and second addition information acquisition means for acquiring time information relating to the time given to the plurality of text information created by Is specified from among the plurality of text information, and the importance is given from the temporal similarity information acquisition means for acquiring the text information and the text information acquired by the temporal similarity information acquisition means. A plurality of important words extracted and output as candidate metadata for adding the plurality of important words to the stored data.
或いは、本発明のメタデータ候補生成方法は、第1の付与情報取得手段が、ユーザによって記憶された記憶データに対して付与されたデータ生成時刻に関する生成時刻情報を取得する第1の付与情報取得ステップと、第2の付与情報取得手段が、ユーザによって作成された複数のテキスト情報に対して付与された時刻に関する時刻情報を取得する第2の付与情報取得ステップと、時間的類似情報取得手段が、生成時刻情報の示す時刻に対して一定の時間範囲内の時刻を示す時刻情報が付与されたテキスト情報を、複数のテキスト情報のうちから特定し、当該テキスト情報を取得する時間的類似情報取得ステップと、重要語抽出手段が、時間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、複数の重要語を記憶データに付加するメタデータの候補として出力する重要語抽出ステップと、を備える。 Alternatively, in the metadata candidate generation method of the present invention, the first assignment information acquisition unit acquires the generation time information related to the data generation time assigned to the storage data stored by the user. A second grant information acquisition step in which the second grant information acquisition means acquires time information relating to the time given to the plurality of text information created by the user; and a temporal similarity information acquisition means. The time-similar information acquisition for identifying text information to which time information indicating a time within a certain time range is given from the time indicated by the generation time information from among a plurality of text information and acquiring the text information A step and an important word extracting means extract a plurality of important words given importance from the text information acquired by the temporal similarity information acquiring means; Comprising the important word extracting step of outputting as the candidate of the metadata to be added to the number of key words in the stored data, the.
このようなメタデータ候補生成装置、或いはメタデータ候補生成方法によれば、記憶データに対して付与された生成時刻情報が取得されるとともに、複数のテキスト情報に対して付与された時刻情報が取得される。さらに、生成時刻情報の示す時刻に対して一定の時間範囲の時刻情報が付与されたテキスト情報が取得され、これらのテキスト情報から重要度付けされた複数の重要語がメタデータの候補として出力される。これにより、記憶データの生成時刻に近い時刻に関連するテキスト情報が広く取得されて、そのテキスト情報の中から重要な語が出力されるので、記憶データ用の検索キーワードとしての候補を効率よく抽出して、その候補の中から記憶データにメタデータとして付加させることができる。 According to such a metadata candidate generation device or metadata candidate generation method, generation time information given to storage data is acquired, and time information given to a plurality of text information is acquired. Is done. Further, text information to which time information in a certain time range is given with respect to the time indicated by the generation time information is acquired, and a plurality of important words assigned importance from these text information are output as metadata candidates. The As a result, text information related to the time close to the generation time of the stored data is widely acquired, and important words are output from the text information. Therefore, candidates as search keywords for stored data are efficiently extracted. Then, the candidate can be added as metadata to the stored data.
第1の付与情報取得手段は、記憶データに対して付与されたデータ生成位置に関する生成位置情報を更に取得し、第2の付与情報取得手段は、テキスト情報に付与された位置に関する位置情報を更に取得し、生成位置情報の示す位置に対して空間的に関連の有る位置を示す位置情報が付与されたテキスト情報を、複数のテキスト情報のうちから特定し、当該テキスト情報を取得する空間的類似情報取得手段を備え、重要語抽出手段は、時間的類似情報取得手段及び空間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、複数の重要語を記憶データに付加するメタデータの候補として出力することが好ましい。 The first assignment information acquisition means further acquires the generation position information related to the data generation position assigned to the stored data, and the second assignment information acquisition means further acquires the position information related to the position assigned to the text information. Spatial similarity that acquires and identifies text information to which position information indicating a position spatially related to the position indicated by the generated position information is assigned from among a plurality of text information, and acquires the text information The information acquisition means includes an important word extraction means for extracting a plurality of important words with importance from the text information acquired by the temporal similarity information acquisition means and the spatial similarity information acquisition means, and a plurality of important words Are preferably output as metadata candidates to be added to the stored data.
かかる構成を採れば、記憶データに対して付与された生成位置情報が取得されるとともに、複数のテキスト情報に対して付与された位置情報が取得される。さらに、生成位置情報の示す位置に対して空間的に関連の有る位置情報が付与されたテキスト情報が取得され、これらのテキスト情報から重要度付けされた複数の重要語がメタデータの候補として出力される。これにより、記憶データの生成位置に近い位置に関連するテキスト情報が広く取得されて、そのテキスト情報の中から重要な語が出力されるので、記憶データ用の検索キーワードとしての候補をさらに一層効率よく抽出して、その候補の中から記憶データにメタデータとして付加させることができる。 With such a configuration, the generation position information given to the stored data is acquired, and the position information given to the plurality of text information is acquired. Furthermore, text information to which position information that is spatially related to the position indicated by the generated position information is obtained is acquired, and a plurality of important words that are assigned importance from these text information are output as metadata candidates. Is done. As a result, text information related to a position close to the generation position of the stored data is widely acquired, and important words are output from the text information, so that candidates as search keywords for the stored data can be made even more efficient. It can be extracted well and added as metadata to the stored data from the candidates.
また、重要語抽出手段は、テキスト情報における複数の単語の出現頻度に基づいて、複数の重要語の重要度を決定する、ことが好ましい。こうすれば、記憶データの検索キーワードにより適した重要語を記憶データに付加させることができる。 Moreover, it is preferable that an important word extraction means determines the importance of several important words based on the appearance frequency of several words in text information. In this way, an important word that is more suitable for a search keyword of stored data can be added to the stored data.
また、重要語抽出手段は、複数の単語の出現頻度、複数の単語の抽出元であるテキスト情報に付与された時刻情報の生成時刻情報に対する時間的一致度を基に、重要度を決定する、ことも好ましい。かかる構成を採れば、重要語に対して、その出現頻度に記憶データに対する時間的一致度を加味して重要度を決定するので、複数のテキスト情報の中から検索キーワードに適した重要語をより効率的に抽出することができる。 Further, the important word extracting means determines the importance based on the appearance frequency of the plurality of words and the temporal coincidence with respect to the generation time information of the time information given to the text information from which the plurality of words are extracted. It is also preferable. By adopting such a configuration, since the importance level is determined by adding the temporal frequency of the stored word to the appearance frequency of the important word, more important words suitable for the search keyword are selected from a plurality of text information. It can be extracted efficiently.
また、重要語抽出手段は、複数の単語の出現頻度、複数の単語の抽出元であるテキスト情報に付与された時刻情報の生成時刻情報に対する時間的一致度、及び当該テキスト情報に付与された位置情報の生成位置情報に対する空間的一致度を基に、重要度を決定する、ことも好ましい。かかる構成を採れば、重要語に対して、その出現頻度に記憶データに対する時間的及び空間的一致度を加味して重要度を決定するので、複数のテキスト情報の中から検索キーワードに適した重要語をより効率的に抽出することができる。 In addition, the important word extracting means includes a frequency of appearance of a plurality of words, a degree of temporal coincidence with generation time information of time information given to text information from which a plurality of words are extracted, and a position given to the text information It is also preferable to determine the importance based on the spatial coincidence with the information generation position information. By adopting such a configuration, the importance is determined by adding the temporal frequency and the spatial coincidence with the stored data to the appearance frequency of the important word, so that the importance suitable for the search keyword from a plurality of text information. Words can be extracted more efficiently.
さらに、重要語抽出手段は、複数の単語に関して、出現頻度及び時間的一致度を重み付け加算することにより、重要度を計算する、ことも好ましい。この場合、テキスト情報における出現頻度と記憶データに対する時間的一致度との間で重み付けを加えながら重要語の重要度を決定するので、検索キーワードにより一層適した重要語を選択することができる。 Furthermore, it is also preferable that the important word extracting unit calculates the importance by weighting and adding the appearance frequency and the temporal coincidence with respect to a plurality of words. In this case, since the importance of the important word is determined while weighting between the appearance frequency in the text information and the temporal coincidence with the stored data, it is possible to select an important word more suitable for the search keyword.
さらに、重要語抽出手段は、複数の単語に関して、出現頻度、時間的一致度、及び空間的一致度を重み付け加算することにより、重要度を計算する、ことも好ましい。この場合、テキスト情報における出現頻度と記憶データに対する時間的及び空間的一致度との間で重み付けを加えながら重要語の重要度を決定するので、検索キーワードにより一層適した重要語を選択することができる。 Furthermore, it is preferable that the important word extracting unit calculates the importance by weighting and adding the appearance frequency, the temporal coincidence, and the spatial coincidence for a plurality of words. In this case, since the importance of the important word is determined while weighting between the appearance frequency in the text information and the temporal and spatial coincidence with the stored data, it is possible to select a more suitable important word for the search keyword. it can.
またさらに、互いに一定の時間範囲内にある生成時刻情報を有する複数の記憶データを特定する記憶データ特定手段をさらに備え、重要語抽出手段は、当該複数の記憶データのうちの1つに対して抽出した複数の重要語を、当該複数の記憶データに対して付加するメタデータの候補として出力する、ことも好ましい。こうすれば、時間的に関連性の高い記憶データに対して、まとめて重要語を出力することができ、データ処理効率が格段に向上する。 The storage device further includes storage data specifying means for specifying a plurality of storage data having generation time information within a certain time range, and the keyword extraction means is provided for one of the plurality of storage data. It is also preferable to output the plurality of extracted important words as metadata candidates to be added to the plurality of stored data. In this way, it is possible to output important words collectively with respect to stored data that are highly related in time, and the data processing efficiency is greatly improved.
さらにまた、互いに空間的に関連がある生成位置情報を有する複数の記憶データを特定する記憶データ特定手段をさらに備え、重要語抽出手段は、当該複数の記憶データのうちの1つに対して抽出した複数の重要語を、当該複数の記憶データに対して付加するメタデータの候補として出力する、ことも好ましい。この場合も、空間的に関連性の高い記憶データに対して、まとめて重要語を出力することができ、データ処理効率が格段に向上する。 Furthermore, it further comprises storage data specifying means for specifying a plurality of storage data having generation position information spatially related to each other, and the important word extraction means extracts one of the plurality of storage data. It is also preferable to output the plurality of important words as metadata candidates to be added to the plurality of stored data. Also in this case, important words can be output collectively for stored data that are spatially related, and the data processing efficiency is greatly improved.
本発明によれば、ユーザが作成したテキスト情報の中から、記憶データの検索に適したメタデータを効率的に抽出することができる。 According to the present invention, metadata suitable for retrieval of stored data can be efficiently extracted from text information created by a user.
以下、図面とともに本発明によるメタデータ候補生成装置及びメタデータ候補生成方法の好適な実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。 Hereinafter, preferred embodiments of a metadata candidate generation apparatus and a metadata candidate generation method according to the present invention will be described in detail with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.
図1は、本発明の好適な一実施形態にかかるメタデータ候補生成用サーバ装置1の概略構成図である。図1に示すメタデータ候補生成用サーバ装置1は、ユーザにより移動通信端末2を利用して記憶された写真データ、音楽データ、文書データ等の記憶データを格納及び管理するサーバ装置である。このメタデータ候補生成用サーバ装置1は、1台のサーバ装置で構成されていてもよいし、複数のサーバ装置が連携して動作するサーバシステムであってもよい。このメタデータ候補生成用サーバ装置1は、移動体通信方式を採用した移動体通信ネットワークや有線通信ネットワーク等によって構成される通信ネットワークNWを介して、移動通信端末2と相互にデータ通信を行うことが可能とされている。移動通信端末2は、携帯電話端末、スマートフォン、PDA等に代表される端末装置である。 FIG. 1 is a schematic configuration diagram of a metadata candidate generation server device 1 according to a preferred embodiment of the present invention. A metadata candidate generation server apparatus 1 shown in FIG. 1 is a server apparatus that stores and manages storage data such as photo data, music data, and document data stored by a user using a mobile communication terminal 2. The metadata candidate generation server device 1 may be configured by a single server device or a server system in which a plurality of server devices operate in cooperation. The metadata candidate generation server device 1 performs data communication with the mobile communication terminal 2 via a communication network NW configured by a mobile communication network, a wired communication network, or the like adopting a mobile communication method. Is possible. The mobile communication terminal 2 is a terminal device represented by a mobile phone terminal, a smartphone, a PDA, or the like.
図2は、図1のメタデータ候補生成用サーバ装置1を構成する計算機のハードウェア構成を示すブロック図である。メタデータ候補生成用サーバ装置1を構成する計算機100は、物理的には、CPU31と、主記憶装置であるRAM32及びROM33と、ハードディスク装置等の補助記憶装置36と、入力デバイスである入力キー、タッチパネル、マウス等の入力装置35と、ディスプレイ、スピーカ等の出力装置37と、他の端末装置やサーバ装置との間での通信ネットワークNWを介したデータの送受信を司る通信モジュール34とを含む情報処理装置として構成されている。メタデータ候補生成用サーバ装置1によって実現される機能は、図2に示すCPU31、RAM32等のハードウェア上に所定のプログラムを読み込ませることにより、CPU31の制御のもとで通信モジュール34、入力装置35、出力装置37を動作させるとともに、RAM32や補助記憶装置36におけるデータの読み出し及び書き込みを行うことで実現される。
FIG. 2 is a block diagram showing a hardware configuration of a computer constituting the metadata candidate generation server device 1 of FIG. The
図1に戻って、メタデータ候補生成用サーバ装置1は、機能的な構成要素として、記憶データ格納部11と、テキストデータ格納部12と、生成時刻情報取得部(第1の付与情報取得手段)13と、生成位置情報取得部(第1の付与情報取得手段)14と、時刻情報取得部(第2の付与情報取得手段)15と、位置情報取得部(第2の付与情報取得手段)17と、時間的類似情報取得部(時間的類似情報取得手段)16と、空間的類似情報取得部(空間的類似情報取得手段)18と、形態素解析部(重要語抽出手段)19と、重要語抽出部(重要語抽出手段)20と、重要語格納部21と、類似データ特定部(記憶データ特定手段)22と、候補データ出力部(重要語抽出手段)23とを備えている。
Returning to FIG. 1, the metadata candidate generation server device 1 includes a storage
まず、メタデータ候補生成用サーバ装置1の各構成要素の機能について詳細に説明する。 First, the function of each component of the metadata candidate generation server device 1 will be described in detail.
記憶データ格納部11は、ユーザによって移動通信端末2を利用して生成あるいは取得された複数の記憶データを記憶する。この複数の記憶データのそれぞれには、データがユーザによって記憶された時刻に関する生成時刻情報と、データ記憶時の移動通信端末2の位置を示す生成位置情報とが付与されている。これらの生成時刻情報及び生成位置情報は、写真データにおけるEXIF(Exchangeable Image File Format)のように記憶データにメタデータとして含まれていてもよいし、記憶データのファイル名に含まれていてもよい。また、生成時刻情報は、ユーザが移動通信端末2を利用して記憶データを生成した時刻を示すものであってもよく、メタデータ候補生成用サーバ装置1に記憶データが記憶された時刻を示すものであってもよい。同様に、生成位置情報は、ユーザが移動通信端末2を利用して記憶データを生成した時の位置を示すものであってもよく、メタデータ候補生成用サーバ装置1に記憶データが記憶された時の位置を示すものであってもよい。
The storage
テキストデータ格納部12は、ユーザによって移動通信端末2を利用して作成された複数のテキストデータ(テキスト情報)を記憶する。テキストデータとしては、ユーザの行動予定及び行動履歴を示すスケジュールデータや、ユーザが通信ネットワークNWに接続されたSNS(Social Networking Service)等の各種サービスを提供するコンピュータ上に投稿した日記データ、メモデータ等のテキストデータ、ユーザが通信ネットワークNWに向けて送信したメールデータ等が挙げられる。このテキストデータには、そのデータに関連する時刻に関する時刻情報と、データに関連する位置を示す位置情報とが付与されている。例えば、スケジュールデータには、そのデータに含まれるスケジュールに対応する日時及び場所が含まれ、行事データには、クリスマスや誕生日などの行事に対応する日時が含まれ、日記データには、日記に対応する日時及び場所が含まれ、メールデータには、メール送信時の日時及び場所が含まれ、ニュースデータには、ニュースに対応する日時及び場所が含まれている。これらの時刻情報及び位置情報は、テキストデータに直接含まれていてもよいし、テキストデータにメタデータとして付加されていてもよい。
The text
生成時刻情報取得部13は、記憶データ格納部11に格納されたメタデータ候補の出力処理対象の記憶データから、生成時刻情報を読み出して取得する。また、生成位置情報取得部14は、記憶データ格納部11に格納された処理対象の記憶データから、生成位置情報を読み出して取得する。そして、生成時刻情報取得部13は、取得した生成時刻情報を時間的類似情報取得部16に引き渡し、生成位置情報取得部14は、取得した生成時刻情報を空間的類似情報取得部18に引き渡す。
The generation time
時刻情報取得部15は、テキストデータ格納部12に格納された複数のテキストデータから、時刻情報を読み出して取得し、位置情報取得部17は、テキストデータ格納部12に格納された複数のテキストデータから、位置情報を読み出して取得する。そして、時刻情報取得部15は、取得した時刻情報を時間的類似情報取得部16に引き渡し、位置情報取得部17は、取得した生成時刻情報を空間的類似情報取得部18に引き渡す。
The time
図3には、テキストデータ格納部12に格納されたデータの構成の一例を示している。同図に示すように、1つのテキストデータには、そのデータを識別するID情報“カレンダ_001”と、データ内容“家族旅行@北海道”と、時刻情報“日時:2012/1/30”と、位置情報“北海道札幌市…”とが含まれ、他のテキストデータには、そのデータを識別するID情報“日記_001”と、データ内容“夏休みに家族で北海道へ。…”と、時刻情報“日時:2012/1/30”とが含まれている。時刻情報取得部15は、このような複数のテキストデータから、IDと時刻情報との組み合わせ、詳細には、ID情報“カレンダ_001”と時刻情報“日時:2012/1/30”との組み合わせ、及びID情報“日記_001”と時刻情報“日時:2012/1/30”との組み合わせを取得する。また、位置情報取得部17は、このような複数のテキストデータから、IDと位置情報との組み合わせ、詳細には、ID情報“カレンダ_001”と位置情報“北海道札幌市…”との組み合わせを取得する。なお、テキストデータに含まれる位置情報としては、緯度経度を示す情報であってもよい。
FIG. 3 shows an example of the configuration of data stored in the text
時間的類似情報取得部16は、処理対象の記憶データに付与されていた生成時刻情報の示す時刻に対して、一定の時間範囲内の時刻を示す時刻情報が付与されたテキストデータを、テキストデータ格納部12に格納されていたテキストデータの中から特定する。すなわち、時刻情報取得部15によって取得されたID情報及び時刻情報の組み合わせから、生成時刻情報の示す時刻から予め定められた時間内の時刻情報を含む組み合わせを抽出し、抽出した組み合わせに含まれるID情報を基にテキストデータを特定する。例えば、図3に示すテキストデータの例の場合、処理対象の記憶データに付与されていた生成時刻情報の示す時刻“2012/1/30 01:00:00”から1日以内の時刻の範囲“2012/1/29 01:00:00”〜“2012/1/31 01:00:00”を算出し、その時刻の範囲にある時刻情報““2012/1/30”を抽出し、その時刻情報に対応するID情報“カレンダ_001”,“日記_001”を特定する。そして、時間的類似情報取得部16は、特定したID情報に対応するテキストデータをテキストデータ格納部12から取得して、形態素解析部19に引き渡す。
The temporal similarity
空間的類似情報取得部18は、処理対象の記憶データに付与されていた生成位置情報の示す時刻に対して、空間的に関連の高い位置を示す位置情報が付与されたテキストデータを、テキストデータ格納部12に格納されていたテキストデータの中から特定する。すなわち、位置情報取得部17によって取得されたID情報及び位置情報の組み合わせから、生成位置情報の示す位置から予め定められた距離範囲内の位置情報を含む組み合わせを抽出し、抽出した組み合わせに含まれるID情報を基にテキストデータを特定する。例えば、図3に示すテキストデータの例の場合、処理対象の記憶データに付与されていた生成位置情報の示す位置“緯度X度、経度Y度”からZkmの距離範囲内の位置を示す位置情報“北海道札幌市…”を関連の高い位置情報として抽出し、その位置情報に対応するID情報“カレンダ_001”を特定する。このとき、空間的類似情報取得部18は、地名で示される位置情報を緯度経度に変換して比較してもよいし、緯度経度で示される位置情報を地名に変換して比較してもよい。また、空間的類似情報取得部18は、2つの位置情報の示す位置間の距離を判断することにより位置情報を抽出してもよいし、2つの位置情報の示す地名の一部が一致するか否かで位置情報を抽出してもよい。そして、空間的類似情報取得部18は、特定したID情報に対応するテキストデータをテキストデータ格納部12から取得して、形態素解析部19に引き渡す。
The spatial similarity
形態素解析部19は、時間的類似情報取得部16及び空間的類似情報取得部18から渡されたテキストデータに対して形態素解析を施し、それらのテキストデータを単語に分割し、分割した全ての単語を重要語抽出部20に引き渡す。なお、形態素解析部19は、分割した単語の品詞を判別し、名詞や動詞等の特定の品詞に判定された単語のみを抽出して重要語抽出部20に引き渡すことが好適である。また、分割した単語の品詞を判別し、助詞や助動詞等の特定の品詞に判定された単語を除いて抽出することも好適である。例えば、形態素解析部19は、テキストデータ“家族旅行@北海道”から、単語“家族旅行”、“北海道”を抽出する。
The
重要語抽出部20は、形態素解析部19によって抽出された各単語の重要度を、各単語の出現頻度、生成時刻情報に対する時間的一致度、及び生成位置情報に対する空間的一致度を基に決定する。すなわち、重要語抽出部20は、該当単語が抽出されたテキストデータ中の出現頻度からTF(Term Frequency)値tfを算出し、テキストデータ格納部12に格納されている全てのテキストデータ数、及び該当単語を含むテキストデータ数からIDF(Inverse Document Frequency)値idfを算出し、それらの値を乗じて得られたTF−IDF値tfidfを重要度パラメータSTF−IDFとして計算する(下記式参照。)。
上記式中、ni,jは、テキストデータjにおける出現回数、|D|は総テキストデータ数、
は、単語iを含むテキストデータ数を示す。
また、重要語抽出部20は、該当単語の抽出元のテキストデータに付与された時刻情報の示す時刻と、処理対象の記憶データに付与された生成時刻情報の示す時刻との間の時間差を、各単語の記憶データに対する時間的近接度を示す重要度パラメータSTIMEとして決定する。また、重要語抽出部20は、該当単語の抽出元のテキストデータに付与された位置情報の示す位置と、処理対象の記憶データに付与された生成位置情報の示す位置との間の距離を、各単語の記憶データに対する空間的近接度を示す重要度パラメータSSPACEとして決定する。さらに、重要語抽出部20は、計算した3つの重要度パラメータSTF−IDF,STIME,SSPACEを、下記式;
重要度パラメータS=αS’ TF−IDF+βS’ TIME+γS’ SPACE
を用いて重み付け加算をすることにより、各単語の記憶データに対する重要度を示す重要度パラメータSを計算して各単語に付加する。ここで、α+β+γ=1であり、S’ TF−IDFは、全ての単語の値のうちの上位N値の総和でSTF−IDFを正規化した値である。また、S’ TIME,S’ SPACEは、それぞれ、下記式;
S’ TIME=(ΣSTIME−STIME)/ΣSTIME,
S’ SPACE=(ΣSSPACE−SSPACE)/ΣSSPACE
によってSTIME,SSPACEを正規化した値である(ΣSTIME,ΣSTIMEは、全ての単語の値の総和を示し、n個のSTIMEの総和ΣSTIME=0の場合には、S’ TIME=1/nとし、n個のSSPACEの総和ΣSSPACE=0の場合には、S’ SPACE=1/nとする)。そして、重要語抽出部20は、重要度パラメータSを付加した各単語を、メタデータ候補の出力処理対象の記憶データ毎に重要語格納部21に格納する。
The important
In the above formula, n i, j is the number of appearances in text data j, | D | is the total number of text data,
Indicates the number of text data including the word i.
In addition, the important
Importance parameter S = αS ′ TF−IDF + βS ′ TIME + γS ′ SPACE
Is added to each word by calculating the importance parameter S indicating the importance of each word with respect to the stored data. Here, α + β + γ = 1, and S ′ TF-IDF is a value obtained by normalizing S TF-IDF with the sum of the upper N values of all word values. Also, S 'TIME, S' SPACE, respectively, the following formulas;
S ′ TIME = (ΣS TIME −S TIME ) / ΣS TIME ,
S ′ SPACE = (ΣS SPACE −S SPACE ) / ΣS SPACE
By a S TIME, the value obtained by normalizing the S SPACE (ΣS TIME, ΣS TIME represents the sum of all the words of the value, if the sum [sigma] s TIME = 0 of n S TIME is S 'TIME = a 1 / n, in the case of the sum [sigma] s SPACE = 0 of n S SPACE is a S 'SPACE = 1 / n) . Then, the important
類似データ特定部22は、メタデータ候補の出力処理対象の記憶データに類似する記憶データを、記憶データ格納部11を参照することにより特定する。具体的には、処理対象の記憶データに付与された生成時刻情報の示す時刻から一定時間範囲内の時刻を示す生成時刻情報が付与された複数の記憶データを分類する。例えば、処理対象の記憶データに生成時刻情報“2012/1/30 01:00:00”が付与された場合には、その時刻に対して前後1時間の範囲“2012/1/30 00:00:00”〜“2012/1/30 02:00:00”にある生成時刻情報が付与された記憶データを特定する。また、類似データ特定部22は、処理対象の記憶データに付与された生成位置情報の示す位置から空間的に関連の高い位置を示す生成位置情報が付与された複数の記憶データを特定して分類する。例えば、処理対象の記憶データに生成位置情報“緯度X度、経度Y度”が付与されていた場合には、その位置に対して10kmの範囲にある生成位置情報が付与された記憶データや、生成位置情報から特定される地名が重複する位置が付与された記憶データを特定する。なお、類似データ特定部22は、互いに類似する記憶データを、自己組織化やK−means法等のクラスタリングの手法を用いて生成時刻の偏りや生成位置の偏りを特定することで、分類してもよい。そして、類似データ特定部22は、処理対象の記憶データに類似する複数の記憶データを特定する情報を候補データ出力部23に出力する。
The similar
候補データ出力部23は、移動通信端末2からの送信要求に応じて、重要語格納部21から重要度順に複数の単語を読み出して、処理対象の記憶データに対して付加するメタデータの候補として出力する。このとき、候補データ出力部23は、処理対象の1つの記憶データに対して出力される複数の単語を、類似データ特定部22によって当該記憶データに類似するとして分類された複数の記憶データに対するメタデータの候補としても、同時に出力する。さらに、候補データ出力部23は、メタデータ候補のなかからメタデータに反映する単語を選択する入力を移動通信端末2から受け付けた場合に、その単語をメタデータに反映するように、記憶データ格納部11内の該当記憶データを更新する。ここで、候補データ出力部23は、処理対象の記憶データに対してメタデータの候補を出力する際には、メタデータ候補の抽出元のテキストデータの種別毎に(例えば、スケジュールデータ、日記データ、及びメールデータ毎に)、メタデータ候補を順位づけして出力してもよいし、全ての種別のテキストデータから抽出されて順位づけされた候補をまとめて出力してもよい。
In response to a transmission request from the mobile communication terminal 2, the candidate
以下、図4を参照して、メタデータ候補生成用サーバ装置1の動作について説明するとともに、併せてメタデータ候補生成用サーバ装置1におけるメタデータ候補生成方法について詳述する。同図は、メタデータ候補生成用サーバ装置1によるメタデータ候補生成時の動作を示すフローチャートである。 Hereinafter, the operation of the metadata candidate generation server device 1 will be described with reference to FIG. 4, and the metadata candidate generation method in the metadata candidate generation server device 1 will be described in detail. FIG. 3 is a flowchart showing an operation at the time of metadata candidate generation by the metadata candidate generation server apparatus 1.
まず、移動通信端末2のユーザからメタデータ候補の出力処理対象を選択する入力が受け付けられる(ステップS101)。そうすると、生成時刻情報取得部13によって、処理対象の記憶データに付与された生成時刻情報が記憶データ格納部11から読み出されると同時に、時刻情報取得部15によって、テキストデータ格納部12から複数のテキストデータに付与された時刻情報が読み出される(ステップS102)。そして、時間的類似情報取得部16によって、生成時刻情報の示す時刻に対して一定の時間範囲内の時刻情報が付与された複数のテキストデータが特定され、それらのテキストデータがテキストデータ格納部12から取得される(ステップS103)。さらに、生成位置情報取得部14によって、処理対象の記憶データに付与された生成位置情報が記憶データ格納部11から読み出されると同時に、位置情報取得部17によって、テキストデータ格納部12から複数のテキストデータに付与された位置情報が読み出される(ステップS104)。そして、空間的類似情報取得部18によって、生成位置情報の示す位置に対して空間的に関連の高い位置情報が付与された複数のテキストデータが特定され、それらのテキストデータがテキストデータ格納部12から取得される(ステップS105)。
First, an input for selecting a metadata candidate output processing target is received from the user of the mobile communication terminal 2 (step S101). Then, the generation time information given to the storage data to be processed is read from the storage
その後、形態素解析部19により、複数のテキストデータが単語に分割される(ステップS106)。次に、重要語抽出部20により、分割された複数の単語を対象に重要度パラメータSが計算され、その重要度パラメータSを基に順位付けがなされた複数の単語が、処理対象の記憶データ毎に重要語格納部21に格納される(ステップS107)。さらに、類似データ特定部22により、空間的或いは時間的に互いに類似する複数の記憶データが分類される(ステップS108)。最後に、移動通信端末2からの送信要求に応じて、処理対象の記憶データ、及びその記憶データに類似すると分類された記憶データに関して、メタデータの候補としての単語が順位付けされて出力される(ステップS109)。
Thereafter, the
図5には、メタデータ候補生成用サーバ装置1からのメタデータ候補の出力に応じて、移動通信端末2において表示された出力画面D1の一例を示している。同図に示すように、処理対象の記憶データである写真データG1と、写真データG1に対して時間的或いは空間的に類似する写真データG2,G3,G4とに対するメタデータ候補の単語として、“北海道”、“家族旅行”、“夏休み”、“バーベキュー”、“キャンプファイヤ”、“熊の置物”が表示され、それらの候補の中から、ユーザにより、“北海道”、“家族旅行”、“夏休み”、“バーベキュー”、“キャンプファイヤ”が、メタデータとして反映する単語として選択されている。 FIG. 5 shows an example of the output screen D 1 displayed on the mobile communication terminal 2 in response to the output of metadata candidates from the metadata candidate generation server device 1. As shown in the figure, a photograph data G 1 is a storage data to be processed, photograph data G 2 similar temporally or spatially with respect to picture data G 1, G 3, the metadata candidates for the G 4 The words “Hokkaido”, “Family trip”, “Summer vacation”, “Barbecue”, “Campfire”, “Kuma no figurine” are displayed, and the user selects “Hokkaido”, “ "Family trip", "Summer vacation", "Barbecue", "Campfire" are selected as words to be reflected as metadata.
以上説明したメタデータ候補生成用サーバ装置1、及びメタデータ候補生成用サーバ装置1におけるメタデータ候補生成方法によれば、記憶データに対して付与された生成時刻情報と生成位置情報とが取得されるとともに、複数のテキストデータに対して付与された時刻情報と位置情報とが取得される。さらに、生成時刻情報の示す時刻に対して一定の時間範囲の時刻情報が付与されたテキストデータが取得されるとともに、生成位置情報の示す位置に対して空間的に関連の有る位置情報が付与されたテキストデータが取得され、これらのテキスト情報から重要度付けされた複数の重要語がメタデータの候補として出力される。これにより、記憶データの生成時刻及び生成位置に近い時刻及び位置に関連するテキスト情報が広く取得されて、そのテキスト情報の中から重要な語が出力されるので、記憶データ用の検索キーワードとしての候補を、効率よく抽出して、その候補の中から記憶データにメタデータとして付加させることができる。 According to the metadata candidate generation server device 1 and the metadata candidate generation method in the metadata candidate generation server device 1 described above, the generation time information and the generation position information given to the storage data are acquired. At the same time, time information and position information given to the plurality of text data are acquired. Further, text data to which time information in a certain time range is assigned to the time indicated by the generation time information is acquired, and position information that is spatially related to the position indicated by the generation position information is assigned. Text data is acquired, and a plurality of important words given importance from these text information are output as metadata candidates. As a result, text information related to the time and position close to the generation time and generation position of the stored data is widely acquired, and important words are output from the text information. Candidates can be efficiently extracted and added to the stored data as metadata from the candidates.
また、テキストデータにおける複数の単語の出現頻度に基づいて、複数の単語の重要度が決定されるので、記憶データの検索キーワードにより適した重要語を記憶データに付加させることができる。さらに、重要語に対して、その出現頻度に記憶データに対する時間的及び空間的一致度を加味して重要度を決定するので、複数のテキスト情報の中から検索キーワードに適した重要語をより効率的に抽出することができる。 In addition, since the importance of the plurality of words is determined based on the appearance frequency of the plurality of words in the text data, it is possible to add an important word more suitable for the search keyword of the storage data to the storage data. Furthermore, since the importance is determined by adding the temporal and spatial coincidence to the stored data to the occurrence frequency of the important word, the important word suitable for the search keyword is more efficiently selected from a plurality of text information. Can be extracted.
また、互いに一定の時間範囲内にある生成時刻情報を有する複数の記憶データに対して、まとめてメタデータ候補を出力することができ、データ処理効率が格段に向上する。さらに、互いに空間的に関連がある生成位置情報を有する複数の記憶データに対して、まとめてメタデータ候補を出力することができ、データ処理効率がさらに向上する。 In addition, metadata candidates can be output collectively for a plurality of stored data having generation time information within a certain time range, and the data processing efficiency is remarkably improved. Furthermore, metadata candidates can be output collectively for a plurality of stored data having generated position information that is spatially related to each other, further improving data processing efficiency.
なお、本発明は、上述した実施形態に限定されるものではない。 In addition, this invention is not limited to embodiment mentioned above.
例えば、図1に示したような各構成要素は、ユーザが使用する端末装置に一部又は全てが具備されていてもよい。例えば、図6に示すように、全ての構成要素が、記憶データにメタデータを付加しようとするユーザが使用する移動通信端末101内に備えられていてもよい。
For example, some or all of the components shown in FIG. 1 may be included in the terminal device used by the user. For example, as shown in FIG. 6, all the components may be provided in the
1…メタデータ候補生成用サーバ装置、101,2…移動通信端末、13…生成時刻情報取得部(第1の付与情報取得手段)、14…生成位置情報取得部(第1の付与情報取得手段)、15…時刻情報取得部(第2の付与情報取得手段)、16…時間的類似情報取得部(時間的類似情報取得手段)、17…位置情報取得部(第2の付与情報取得手段)、18…空間的類似情報取得部(空間的類似情報取得手段)、19…形態素解析部(重要語抽出手段)、20…重要語抽出部(重要語抽出手段)、22…類似データ特定部(記憶データ特定手段)、23…候補データ出力部(重要語抽出手段)。 DESCRIPTION OF SYMBOLS 1 ... Metadata candidate production | generation server apparatus, 101,2 ... Mobile communication terminal, 13 ... Generation | occurrence | production time information acquisition part (1st provision information acquisition means), 14 ... Generation | occurrence | production position information acquisition part (1st provision information acquisition means) ), 15... Time information acquisition unit (second attached information acquisition unit), 16... Temporal similarity information acquisition unit (temporal similarity information acquisition unit), 17... Position information acquisition unit (second addition information acquisition unit) 18 ... Spatial similarity information acquisition unit (spatial similarity information acquisition unit), 19 ... Morphological analysis unit (important word extraction unit), 20 ... Important word extraction unit (important word extraction unit), 22 ... Similar data specifying unit ( Storage data specifying means), 23... Candidate data output section (important word extracting means).
Claims (6)
ユーザによって作成された複数のテキスト情報に対して付与された時刻に関する時刻情報を取得する第2の付与情報取得手段と、
前記生成時刻情報の示す時刻に対して一定の時間範囲内の時刻を示す時刻情報が付与されたテキスト情報を、前記複数のテキスト情報のうちから特定し、当該テキスト情報を取得する時間的類似情報取得手段と、
前記時間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、前記複数の重要語を前記記憶データに付加するメタデータの候補として出力する重要語抽出手段と、
を備え、
前記重要語抽出手段は、
前記テキスト情報における複数の単語の出現頻度、及び前記複数の単語の抽出元であるテキスト情報に付与された前記時刻情報の前記生成時刻情報に対する時間的一致度に基づいて、前記出現頻度及び前記時間的一致度を重み付け加算することにより、前記複数の重要語の前記重要度を計算し決定する、
ことを特徴とするメタデータ候補生成装置。 First grant information acquisition means for acquiring generation time information related to data generation time assigned to stored data stored by a user;
A second assignment information acquisition means for acquiring time information related to the time assigned to the plurality of text information created by the user;
Time-similar information for identifying text information to which time information indicating a time within a certain time range with respect to the time indicated by the generation time information is specified from among the plurality of text information and acquiring the text information Acquisition means;
Important word extraction that extracts a plurality of important words given importance from the text information acquired by the temporal similarity information acquisition means, and outputs the plurality of important words as metadata candidates to be added to the stored data Means,
Equipped with a,
The important word extraction means includes
The appearance frequency and the time based on the appearance frequency of the plurality of words in the text information and the degree of temporal coincidence with the generation time information of the time information given to the text information from which the plurality of words are extracted Calculating and determining the importance of the plurality of important words by weighted addition of the degree of matching
A metadata candidate generation device characterized by that.
ユーザによって作成された複数のテキスト情報に対して付与された時刻に関する時刻情報と、前記テキスト情報に付与された位置に関する位置情報とを取得する第2の付与情報取得手段と、 Second grant information acquisition means for acquiring time information related to a time given to a plurality of text information created by a user and position information related to a location given to the text information;
前記生成時刻情報の示す時刻に対して一定の時間範囲内の時刻を示す時刻情報が付与されたテキスト情報を、前記複数のテキスト情報のうちから特定し、当該テキスト情報を取得する時間的類似情報取得手段と、 Time-similar information for identifying text information to which time information indicating a time within a certain time range with respect to the time indicated by the generation time information is specified from among the plurality of text information and acquiring the text information Acquisition means;
前記生成位置情報の示す位置に対して空間的に関連の有る位置を示す位置情報が付与されたテキスト情報を、前記複数のテキスト情報のうちから特定し、当該テキスト情報を取得する空間的類似情報取得手段と、 Spatial similarity information for specifying text information to which position information indicating a position spatially related to the position indicated by the generated position information is assigned from among the plurality of text information and acquiring the text information Acquisition means;
前記時間的類似情報取得手段及び前記空間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、前記複数の重要語を前記記憶データに付加するメタデータの候補として出力する重要語抽出手段と、 Metadata that extracts a plurality of important words given importance from the text information acquired by the temporal similarity information acquisition means and the spatial similarity information acquisition means, and adds the plurality of important words to the stored data Keyword extraction means to output as a candidate for
を備え、With
前記重要語抽出手段は、 The important word extraction means includes
前記テキスト情報における複数の単語の出現頻度、前記複数の単語の抽出元であるテキスト情報に付与された前記時刻情報の前記生成時刻情報に対する時間的一致度、及び当該テキスト情報に付与された前記位置情報の前記生成位置情報に対する空間的一致度に基づいて、前記複数の単語に関して前記出現頻度、前記時間的一致度、及び前記空間的一致度を重み付け加算することにより、前記複数の重要語の重要度を計算し決定する、Frequency of appearance of a plurality of words in the text information, degree of temporal coincidence of the time information given to the text information from which the plurality of words are extracted to the generation time information, and the position given to the text information The weight of the appearance frequency, the temporal coincidence, and the spatial coincidence of the plurality of words based on the spatial coincidence with respect to the generation position information of information, thereby calculating the importance of the plurality of important words. Calculate and determine the degree,
ことを特徴とするメタデータ候補生成装置。A metadata candidate generation device characterized by that.
前記重要語抽出手段は、当該複数の記憶データのうちの1つに対して抽出した前記複数の重要語を、当該複数の記憶データに対して付加するメタデータの候補として出力する、
ことを特徴とする請求項1又は2に記載のメタデータ候補生成装置。 Further comprising storage data specifying means for specifying a plurality of the storage data having generation time information within a certain time range from each other;
The important word extracting means outputs the plurality of important words extracted for one of the plurality of stored data as metadata candidates to be added to the plurality of stored data.
The metadata candidate generation device according to claim 1 or 2 , characterized in that
前記重要語抽出手段は、当該複数の記憶データのうちの1つに対して抽出した前記複数の重要語を、当該複数の記憶データに対して付加するメタデータの候補として出力する、
ことを特徴とする請求項1〜3のいずれか1項に記載のメタデータ候補生成装置。 A storage data specifying means for specifying a plurality of the storage data having generated position information spatially related to each other;
The important word extracting means outputs the plurality of important words extracted for one of the plurality of stored data as metadata candidates to be added to the plurality of stored data.
The metadata candidate generation device according to any one of claims 1 to 3 .
第2の付与情報取得手段が、ユーザによって作成された複数のテキスト情報に対して付与された時刻に関する時刻情報を取得する第2の付与情報取得ステップと、
時間的類似情報取得手段が、前記生成時刻情報の示す時刻に対して一定の時間範囲内の時刻を示す時刻情報が付与されたテキスト情報を、前記複数のテキスト情報のうちから特定し、当該テキスト情報を取得する時間的類似情報取得ステップと、
重要語抽出手段が、前記時間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、前記複数の重要語を前記記憶データに付加するメタデータの候補として出力する重要語抽出ステップと、
を備え、
前記重要語抽出ステップでは、
前記テキスト情報における複数の単語の出現頻度、及び前記複数の単語の抽出元であるテキスト情報に付与された前記時刻情報の前記生成時刻情報に対する時間的一致度に基づいて、前記出現頻度及び前記時間的一致度を重み付け加算することにより、前記複数の重要語の前記重要度を計算し決定する、
ることを特徴とするメタデータ候補生成方法。 A first grant information acquisition step in which a first grant information acquisition means acquires generation time information related to a data generation time given to storage data stored by a user;
A second grant information acquisition step in which the second grant information acquisition means acquires time information related to the time given to the plurality of text information created by the user;
The temporal similarity information acquisition unit specifies text information to which time information indicating a time within a certain time range is given with respect to the time indicated by the generation time information from among the plurality of text information, and the text A temporally similar information acquisition step for acquiring information;
A candidate for metadata in which the important word extracting means extracts a plurality of important words given importance from the text information acquired by the temporal similarity information acquiring means, and adds the plurality of important words to the stored data Key word extraction step to output as
Equipped with a,
In the important word extraction step,
The appearance frequency and the time based on the appearance frequency of the plurality of words in the text information and the degree of temporal coincidence with the generation time information of the time information given to the text information from which the plurality of words are extracted Calculating and determining the importance of the plurality of important words by weighted addition of the degree of matching
A metadata candidate generation method characterized by:
第2の付与情報取得手段が、ユーザによって作成された複数のテキスト情報に対して付与された時刻に関する時刻情報と、前記テキスト情報に付与された位置に関する位置情報とを取得する第2の付与情報取得ステップと、 2nd grant information in which the 2nd grant information acquisition means acquires time information about time given to a plurality of text information created by a user, and position information about a position given to the text information An acquisition step;
時間的類似情報取得手段が、前記生成時刻情報の示す時刻に対して一定の時間範囲内の時刻を示す時刻情報が付与されたテキスト情報を、前記複数のテキスト情報のうちから特定し、当該テキスト情報を取得する時間的類似情報取得ステップと、 The temporal similarity information acquisition unit specifies text information to which time information indicating a time within a certain time range is given with respect to the time indicated by the generation time information from among the plurality of text information, and the text A temporally similar information acquisition step for acquiring information;
空間的類似情報取得手段が、前記生成位置情報の示す位置に対して空間的に関連の有る位置を示す位置情報が付与されたテキスト情報を、前記複数のテキスト情報のうちから特定し、当該テキスト情報を取得する空間的類似情報取得ステップと、 Spatial similarity information acquisition means specifies text information to which position information indicating a position spatially related to the position indicated by the generated position information is assigned from the plurality of text information, and the text A spatial similarity information acquisition step for acquiring information;
重要語抽出手段が、前記時間的類似情報取得手段及び前記空間的類似情報取得手段によって取得されたテキスト情報から、重要度付けをした複数の重要語を抽出し、前記複数の重要語を前記記憶データに付加するメタデータの候補として出力する重要語抽出ステップと、 An important word extracting means extracts a plurality of important words given importance from the text information acquired by the temporal similar information acquiring means and the spatial similar information acquiring means, and stores the plurality of important words in the memory A key word extraction step to output as metadata candidates to be added to the data;
を備え、With
前記重要語抽出ステップでは、 In the important word extraction step,
前記テキスト情報における複数の単語の出現頻度、前記複数の単語の抽出元であるテキスト情報に付与された前記時刻情報の前記生成時刻情報に対する時間的一致度、及び当該テキスト情報に付与された前記位置情報の前記生成位置情報に対する空間的一致度に基づいて、前記複数の単語に関して前記出現頻度、前記時間的一致度、及び前記空間的一致度を重み付け加算することにより、前記複数の重要語の重要度を計算し決定する、Frequency of appearance of a plurality of words in the text information, degree of temporal coincidence of the time information given to the text information from which the plurality of words are extracted to the generation time information, and the position given to the text information The weight of the appearance frequency, the temporal coincidence, and the spatial coincidence of the plurality of words based on the spatial coincidence with respect to the generation position information of information, thereby calculating the importance of the plurality of important words. Calculate and determine the degree,
ることを特徴とするメタデータ候補生成方法。A metadata candidate generation method characterized by:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012060997A JP5837447B2 (en) | 2012-03-16 | 2012-03-16 | Metadata candidate generation device and metadata candidate generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012060997A JP5837447B2 (en) | 2012-03-16 | 2012-03-16 | Metadata candidate generation device and metadata candidate generation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013196189A JP2013196189A (en) | 2013-09-30 |
JP5837447B2 true JP5837447B2 (en) | 2015-12-24 |
Family
ID=49395101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012060997A Expired - Fee Related JP5837447B2 (en) | 2012-03-16 | 2012-03-16 | Metadata candidate generation device and metadata candidate generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5837447B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6543933B2 (en) * | 2014-07-30 | 2019-07-17 | 株式会社バッファロー | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING SYSTEM, DISPLAY CONTROL METHOD IN INFORMATION PROCESSING DEVICE, AND PROGRAM |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006163877A (en) * | 2004-12-08 | 2006-06-22 | Seiko Epson Corp | Metadata generation device |
US8094974B2 (en) * | 2005-07-26 | 2012-01-10 | Panasonic Corporation | Picture data management apparatus and picture data management method |
JP4894253B2 (en) * | 2005-10-31 | 2012-03-14 | セイコーエプソン株式会社 | Metadata generating apparatus and metadata generating method |
JP2008003972A (en) * | 2006-06-26 | 2008-01-10 | Seiko Epson Corp | Metadata generating apparatus and metadata generating method |
US8635192B2 (en) * | 2008-02-28 | 2014-01-21 | Blackberry Limited | Method of automatically geotagging data |
JP2012027850A (en) * | 2010-07-27 | 2012-02-09 | Ntt Docomo Inc | Information processing device, information processing system, information processing method and program |
-
2012
- 2012-03-16 JP JP2012060997A patent/JP5837447B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013196189A (en) | 2013-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12002010B2 (en) | Event extraction systems and methods | |
JP4337064B2 (en) | Information processing apparatus, information processing method, and program | |
JP6759844B2 (en) | Systems, methods, programs and equipment that associate images with facilities | |
KR101384931B1 (en) | Method, apparatus or system for image processing | |
US9218568B2 (en) | Disambiguating data using contextual and historical information | |
US20090217199A1 (en) | Information Retrieving and Displaying Method and Computer-Readable Medium | |
CN105359087A (en) | Auto-calendaring | |
US20100293255A1 (en) | Open information transmitting method, open information transmitting system, central device and recording medium | |
KR100970335B1 (en) | How to update a keyword of interest to you and a system for performing that method | |
JP2006031379A (en) | Information presentation apparatus and information presentation method | |
US11651039B1 (en) | System, method, and user interface for a search engine based on multi-document summarization | |
JP6185379B2 (en) | RECOMMENDATION DEVICE AND RECOMMENDATION METHOD | |
JP2010079683A (en) | Program and advertisement distribution system | |
US20170124120A1 (en) | Information processing system, information processing method, and information processing program | |
KR101651963B1 (en) | Method of generating time and space associated data, time and space associated data generation server performing the same and storage medium storing the same | |
JP5837447B2 (en) | Metadata candidate generation device and metadata candidate generation method | |
JP5639549B2 (en) | Information retrieval apparatus, method, and program | |
JP2019128925A (en) | Event presentation system and event presentation device | |
US9092409B2 (en) | Smart scoring and filtering of user-annotated geocoded datasets | |
KR101132431B1 (en) | System and method for providing interest information | |
JP4894253B2 (en) | Metadata generating apparatus and metadata generating method | |
JP2019185620A (en) | Message processor and program | |
CN106663112A (en) | Presenting information cards for events associated with entities | |
JP5708868B1 (en) | Program, information processing apparatus and method | |
JP5449097B2 (en) | Event information presentation device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140811 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5837447 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |