JP5155351B2 - 地図データ処理装置及び方法 - Google Patents
地図データ処理装置及び方法 Download PDFInfo
- Publication number
- JP5155351B2 JP5155351B2 JP2010065376A JP2010065376A JP5155351B2 JP 5155351 B2 JP5155351 B2 JP 5155351B2 JP 2010065376 A JP2010065376 A JP 2010065376A JP 2010065376 A JP2010065376 A JP 2010065376A JP 5155351 B2 JP5155351 B2 JP 5155351B2
- Authority
- JP
- Japan
- Prior art keywords
- facility
- map data
- polygon
- token
- poi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Instructional Devices (AREA)
Description
上記の課題に対し、本発明の目的は、与えられた文字列群から適切な代表表記を抽出する技術を提供することである。
上記の課題に対し、本発明の目的は、地図データベースにおいて複合施設を構成している施設の範囲を容易に特定することである。
第1実施形態は、図1(構成図)に示す代表表記抽出装置(以下「本装置」と呼ぶ)1に関する。本装置1は、一般的なコンピュータの構成として少なくとも、CPUなどの演算制御部5と、外部記憶装置(HDD等)や主メモリ等の記憶装置6と、図示しない通信ネットワークとの通信手段7(LANアダプタなど)と、を有する。そして、本装置1では、記憶装置6に予め記憶(インストール)した図示しない所定のコンピュータ・プログラムが演算制御部5を制御することで、図1に示す各手段などの要素(11,12,14など)を実現する。
上記のように構成した本装置1を用いて、ポータルECサイトの管理者が、図2に例示したように店舗により異なった商品名が付けられているある特定の同一商品について、その商品を扱う複数の店舗を横断的に紹介する企画コーナーを設けるために代表表記を得る場合の処理例を以下に示す。この場合、管理者が、適宜なユーザインタフェース画面などで、図2に示した5つの文字列を対象として選択する場合、文字列指定手段12がそのような操作を受け付け、選択された各文字列を分割手段14に与える。ここで選択された複数の文字列を「文字列群」とも呼ぶこととする。
すなわち、まず、分割手段14が、与えられた複数の文字列を、それぞれトークンに分割する(ステップS14)。「トークン」は、文字列を所定のある基準で分割した一単位の意である。文字列をトークンに分割する手法としては、字種などの文字グループごとに分割したり、形態素で分割するなど、自由に選択してよい。
地球防衛軍モビルスーツAB100
地球防衛軍モビルスーツ「AB100」
地球防衛軍AB100
防衛軍AB100モビルスーツ
防衛軍AB100
であるものとし、これらをもとの文字列(文字列群)のように呼ぶこととする。また、記号の鉤括弧「」も文字列を構成するものとし、文字列中の記号を説明するため示すときは二重鉤括弧で『「』や『」』のように示すものとする。
地球防衛軍/モビルスーツ/AB/100
地球防衛軍/モビルスーツ/「/AB/100/」
地球防衛軍/AB/100
防衛軍/AB/100/モビルスーツ
防衛軍/AB/100
地球/防衛軍/モビルスーツ/AB/100
地球/防衛軍/モビルスーツ/「/AB/100/」
地球/防衛軍/AB/100
防衛軍/AB/100/モビルスーツ
防衛軍/AB/100
となる。
続いて、カウント手段15が、一以上の前記トークンが直接連なって前記文字列の全部又は一部を構成する全てのトークン列(もとの文字列中でも直接連なっていたものに限る)について、前記複数の文字列の中で当該トークン列が含まれる文字列数をカウントする(ステップS15)。これは、いわゆる「N−gram」を、その適用単位をトークンとして適用するものである。
『防衛軍』
『AB』
『100』
『防衛軍/AB』
『AB/100』
『防衛軍/AB/100』
という6種のトークン列が生成される。なお、もとの文字列中で直接連ならない『防衛軍/100』(間に有った中間のトークン『AB』を抜いている)のようなトークン列は、この例では作成しない。
さらに、トークン選択手段16が、カウントされた前記文字列数が所定の閾値以上又はその閾値より大きいトークン列であって、前記トークン列の中で他のさらに長いトークン列中に含まれるトークン列を除いたトークン列(以下「最長トークン列」と呼ぶ)を選択し、他は足切りする(ステップS16)。例えば、上の例では、もとの文字列群のうち5割以上に出現した最長トークン列が、
地球/防衛軍 (3)
防衛軍 (5)
地球 (3)
防衛軍/AB/100 (3)
AB/100 (5)
モビルスーツ (3)
となる(括弧内はそのトークン列を含む文字列数)。
地球/防衛軍 (3)
× 防衛軍 (5)
× 地球 (3)
防衛軍/AB/100 (3)
× AB/100 (5)
モビルスーツ (3)
残る最長トークン列は、
地球/防衛軍 (3)
防衛軍/AB/100 (3)
モビルスーツ (3)
となり、これらが現在残っているトークン列である。
また、重複削除手段17が、選択されたトークン列であってこの時点で上記のように残っている最長トークン列のうち、最長トークン列間で相互に重複するものを削除する(ステップS17)。例えば上記の
地球/防衛軍
防衛軍/AB/100
モビルスーツ
から、重複している『防衛軍』を削除して独立したトークンとして切り出すと、
地球
防衛軍
AB/100
モビルスーツ
となり、これらが現在選択されているトークン列である。
ついで、並べ替え手段18が、与えられた文字列群のうち、現在選択されているトークン列を最も多く含む文字列を基準文字列として選択し、その基準文字列における各トークンの順序に合わせて、前記選択されたトークン列を並べ替える(ステップS18)。ここで、現在選択されているトークン列を「最も多く含む」文字列を選択する基準としては、現在選択されているトークン列を、単に最も数多く含む文字列を基準文字列としてもよいが、他の基準でもよい。例えば、ここでは、現在選択されているトークン列を含み、含んでいるそれぞれのトークン列を含む文字列の文字列数(3、5など)の合計が最大となる文字列を、トークン列を「最も多く含む」文字列とし、基準文字列として選択するものとする。
地球 (3)
防衛軍 (5)
AB/100 (5)
モビルスーツ (3)
をもとに、与えられた文字列ごとに、その文字列が含んでいるトークン列を含む文字列数の合計を計算すると、
地球/防衛軍/モビルスーツ/AB/100 : 3+5+3+5=16
地球/防衛軍/モビルスーツ/「/AB100/」 : 3+5+3+5=16
地球/防衛軍/AB/100 : 3+5+5=13
防衛軍/AB/100/モビルスーツ : 5+5+3=13
防衛軍/AB/100 : 5+5=10
となる。
『地球 防衛軍 モビルスーツ AB 100』
となる。最後に、この並べ替えたトークン列を、結果出力手段19が抽出結果として
『地球防衛軍モビルスーツAB100』
のように出力する(ステップS19)。
以上のように、第1実施形態では、同じ商品などに対応するものとして与えられた文字列群を、字種などで分割したトークンから、所定数の文字列に含まれる最長のトークンの列を選択することにより、文字列群中で最も共通的に用いられる最大公約数的文字列が得られるので、その文字列群を言い表す適切な代表表記を抽出することができる。
第1実施形態に示した代表表記抽出装置を応用して、POIの名称から施設名称候補を得る例を第2実施形態として示す。図4に示すように、第2実施形態の代表表記抽出装置2は、地図データの処理に関し後述する作用効果を実現・実行する各手段21〜24並びに26を有し(図4左側)、そのうち候補抽出手段24の具体的構成内容として、第1実施形態に準じた構成(図4右側の一点鎖線内。符号14〜19)を設けたものである。
『ペストリー○○ネリオタワー越谷店』
『○○銀行ネリオタワー越谷支店』
『寿司○○・ネリオタワー越谷店』
『○○ショップ越谷ネリオタワー店』
であれば、名称後方の「店」「支店」は定型的表現として無視したうえ、第1実施形態と同様にトークンを用いた処理の結果、施設名称候補は『ネリオタワー越谷』となる。
上記第2実施形態では、第1実施形態に準じた代表表記抽出装置により、単一施設の名称をPOIの名称から抽出した例を示した。これに対し、第3実施形態は、ビルなどの要素を複数含む複合施設(大規模商業施設など)の名称をPOIの名称から抽出する地図データ処理装置3(図6)を示すものである。この第3実施形態において施設の名称を抽出する技術は、第1及び第2実施形態で示したような代表表記抽出装置には限られない。
POI1:『○○銀行アモルタウン支店』
POI2:『アモルタウンクリニック』
POI3:『アモルタウン内郵便局』
東棟
POI4:『洋菓子○○アモルタウン店』
POI5:『○○ショップアモルタウン店』
POI6:『和食○○亭アモルタウン店』
西棟
POI7:『てんぷら○○』
POI8:『スーパー○○アモルタウン店』
POI9:『アモルタウン○○催事場』
他の一棟
POI10:『○○ファクトリー東町ビル店』
POI11:『美容室○○東町ビル店』
POI12:『○○チケット東町ビル支店』
第4実施形態は、第3実施形態に準じた地図データ処理装置における施設名称候補の抽出に、第1実施形態における代表表記抽出装置(図1)に準じた構成を適用する例である。すなわち、図13に示すように、この第4実施形態における地図データ処理装置4は、第3実施形態(図6)に準じた構成であるが、候補抽出手段44の具体的構成としては、代表表記抽出装置41として、次のような作用効果を実現・実行する各手段を設けたものである。なお、地図データ処理装置4と代表表記抽出装置41は一体の装置として実現してもよく、また、各処理の詳細や語義は、第3実施形態までに説明してきた内容に準じる。
なお、上記各実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、手段などの各要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路など他の情報処理機構で実現してもよい。また、各構成図、データの図、フローチャートの図などは例示に過ぎず、各要素の有無、その順序や具体的内容などは適宜変更可能である。
3,4 地図データ処理装置
5 演算制御部
6 記憶装置
7 通信手段
11 文字列記憶手段
12 文字列指定手段
14 分割手段
15 カウント手段
16 トークン選択手段
17 重複削除手段
18 並べ替え手段
19 結果出力手段
21,31 地図データ記憶手段
22,32 ポリゴン選択手段
23,33 POI選択手段
24,34,44 候補抽出手段
35 関連付け手段
26,36,46 地図データ更新手段
Claims (6)
- 複数のPOIが関連付けられた施設ポリゴンを含む地図データを記憶している地図データ記憶手段と、
前記地図データ記憶手段から、互いに近傍に位置する複数の施設ポリゴンを選択するポリゴン選択手段と、
選択された前記施設ポリゴンに関連する複数のPOIを前記地図データ記憶手段から選択するPOI選択手段と、
前記施設ポリゴンに関連するものとして選択された前記複数のPOIの名称の中に複数含まれる部分名称を前記施設ポリゴンごとの施設名称候補として抽出する候補抽出手段と、
抽出された前記施設名称候補の共通性に基づいて、選択されている複数の施設ポリゴンの全部又は一部を相互に関連付けする関連付け手段と、
を有することを特徴とする地図データ処理装置。 - 前記関連付け手段による前記関連付けの根拠となった前記共通性にかかる前記施設名称候補を、前記関連付けされた複数の施設ポリゴンに対応する名称として、前記地図データ記憶手段に記憶されている前記地図データを更新する地図データ更新手段を有することを特徴とする請求項1記載の地図データ処理装置。
- 与えられた複数の文字列を、それぞれトークンに分割する分割手段と、
一以上の前記トークンが直接連なって前記文字列の全部又は一部を構成する全てのトークン列について、前記複数の文字列の中で当該トークン列が含まれる文字列数をカウントするカウント手段と、
カウントされた前記文字列数が所定の閾値以上又はより大きいトークン列であって、前記トークン列の中で他のさらに長いトークン列中に含まれるトークン列を除いたトークン列を選択するトークン選択手段と、
選択されたトークン列を抽出結果として出力する結果出力手段と、
を有することを特徴とする請求項1記載の地図データ処理装置。 - 前記関連付けされた前記各施設ポリゴンに関連する複数のPOIの名称に基づいて前記結果出力手段により抽出結果として出力された前記トークン列、を前記関連付けされた複数の施設ポリゴンに対応する名称として、前記地図データ記憶手段に記憶されている前記地図データを更新する地図データ更新手段を有することを特徴とする請求項3記載の地図データ処理装置。
- 複数のPOIが関連付けられた施設ポリゴンを含む地図データを記憶している地図データ記憶手段から、互いに近傍に位置する複数の施設ポリゴンを選択するポリゴン選択ステップと、
選択された前記施設ポリゴンに関連する複数のPOIを前記地図データ記憶手段から選択するPOI選択ステップと、
前記施設ポリゴンに関連するものとして選択された前記複数のPOIの名称の中に複数含まれる部分名称を前記施設ポリゴンごとの施設名称候補として抽出する候補抽出ステップと、
抽出された前記施設名称候補の共通性に基づいて、選択されている複数の施設ポリゴンの全部又は一部を相互に関連付けする関連付けステップと、
をコンピュータが実行することを特徴とする地図データ生成方法。 - コンピュータを制御するコンピュータ・プログラムであって、
複数のPOIが関連付けられた施設ポリゴンを含む地図データを記憶している地図データ記憶手段から、互いに近傍に位置する複数の施設ポリゴンを選択するポリゴン選択ステップと、
選択された前記施設ポリゴンに関連する複数のPOIを前記地図データ記憶手段から選択するPOI選択ステップと、
前記施設ポリゴンに関連するものとして選択された前記複数のPOIの名称の中に複数含まれる部分名称を前記施設ポリゴンごとの施設名称候補として抽出する候補抽出ステップと、
抽出された前記施設名称候補の共通性に基づいて、選択されている複数の施設ポリゴンの全部又は一部を相互に関連付けする関連付けステップと、
をコンピュータに実行させることを特徴とする地図データ生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010065376A JP5155351B2 (ja) | 2010-03-23 | 2010-03-23 | 地図データ処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010065376A JP5155351B2 (ja) | 2010-03-23 | 2010-03-23 | 地図データ処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011198163A JP2011198163A (ja) | 2011-10-06 |
JP5155351B2 true JP5155351B2 (ja) | 2013-03-06 |
Family
ID=44876251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010065376A Active JP5155351B2 (ja) | 2010-03-23 | 2010-03-23 | 地図データ処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5155351B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7254070B2 (ja) * | 2018-04-18 | 2023-04-07 | 株式会社Nttドコモ | 訪問先推定装置および訪問先推定方法 |
KR102156671B1 (ko) * | 2020-01-13 | 2020-09-16 | 주식회사 호갱노노 | 건물의 외벽선을 이용한 구역 형성 방법 및 장치 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3303881B2 (ja) * | 2001-03-08 | 2002-07-22 | 株式会社日立製作所 | 文書検索方法および装置 |
JP4711577B2 (ja) * | 2001-09-28 | 2011-06-29 | 株式会社パスコ | 地図情報表示プログラム |
JP4274913B2 (ja) * | 2003-11-27 | 2009-06-10 | アルパイン株式会社 | 目的地検索装置 |
US7831382B2 (en) * | 2006-02-01 | 2010-11-09 | TeleAtlas B.V. | Method for differentiating duplicate or similarly named disjoint localities within a state or other principal geographic unit of interest |
JP3983265B1 (ja) * | 2006-09-27 | 2007-09-26 | 沖電気工業株式会社 | 辞書作成支援システム、方法及びプログラム |
JP4974746B2 (ja) * | 2007-04-19 | 2012-07-11 | アルパイン株式会社 | ナビゲーション装置 |
JP5526396B2 (ja) * | 2008-03-11 | 2014-06-18 | クラリオン株式会社 | 情報検索装置、情報検索システム及び情報検索方法 |
JP5113108B2 (ja) * | 2008-06-18 | 2013-01-09 | ヤフー株式会社 | 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム |
JP4919234B2 (ja) * | 2008-08-07 | 2012-04-18 | ヤフー株式会社 | 建物データの名寄せ方法 |
-
2010
- 2010-03-23 JP JP2010065376A patent/JP5155351B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011198163A (ja) | 2011-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
CN105930469A (zh) | 基于Hadoop的个性化旅游推荐系统及方法 | |
US20150066909A1 (en) | Cooking recipe information providing device, cooking recipe information providing method, program, and information storage medium | |
US20110082803A1 (en) | Business flow retrieval system, business flow retrieval method and business flow retrieval program | |
WO2019123703A1 (ja) | データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム | |
JP3777087B2 (ja) | デ―タ表示システム、データ表示方法、コンピュータシステムおよび記録媒体 | |
CN106407377A (zh) | 基于人工智能的搜索方法和装置 | |
JP2019153271A5 (ja) | ||
US7739291B2 (en) | Methods and systems for displaying matching business objects | |
CN105283843A (zh) | 可嵌入的媒体内容搜索微件 | |
JP5345582B2 (ja) | シソーラス構築システム、シソーラス構築方法およびシソーラス構築プログラム | |
JP2005242904A (ja) | 文書群分析装置、文書群分析方法、文書群分析システム、プログラムおよび記録媒体 | |
JP5155351B2 (ja) | 地図データ処理装置及び方法 | |
JP5090490B2 (ja) | 代表表記抽出装置、方法及びプログラム | |
JP4675986B2 (ja) | 情報共有装置及び情報共有プログラム | |
KR101723310B1 (ko) | 특허공보를 기반으로한 대리인 검색 서비스 제공 시스템 및 방법 | |
JP7188461B2 (ja) | セキュリティ情報分析装置、システム、方法およびプログラム | |
JP6852002B2 (ja) | データ検索方法、データ検索装置及びプログラム | |
KR20190000061A (ko) | 키워드 속성을 기준으로 관련 있는 키워드를 제공하는 방법 및 시스템 | |
JP2021033695A (ja) | 計算機システム及び業務の支援方法 | |
JP5874997B2 (ja) | 検索システム、検索方法及びプログラム | |
KR20200008830A (ko) | 요리 레시피 시각화를 위한 레시피 트리 구축 시스템 및 이를 이용한 레시피 트리 구축 방법 | |
JP5792871B1 (ja) | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム | |
KR102528401B1 (ko) | 대화형 형태소 분석을 제공하기 위한 시스템 | |
JP6739361B2 (ja) | 情報提供装置、情報提供方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5155351 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |