JP6393411B2 - データ分析支援システム及びデータ分析支援方法 - Google Patents
データ分析支援システム及びデータ分析支援方法 Download PDFInfo
- Publication number
- JP6393411B2 JP6393411B2 JP2017513867A JP2017513867A JP6393411B2 JP 6393411 B2 JP6393411 B2 JP 6393411B2 JP 2017513867 A JP2017513867 A JP 2017513867A JP 2017513867 A JP2017513867 A JP 2017513867A JP 6393411 B2 JP6393411 B2 JP 6393411B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- explanation
- value
- values
- data analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 57
- 238000007405 data analysis Methods 0.000 title claims description 34
- 238000012545 processing Methods 0.000 claims description 134
- 238000003860 storage Methods 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000002776 aggregation Effects 0.000 description 7
- 238000004220 aggregation Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000012821 model calculation Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (12)
- 処理装置と、前記処理装置に接続される記憶装置と、を有するデータ分析支援システムであって、
前記記憶装置は、
主キーの値と目的指標の値とを対応付ける目的指標情報と、
前記主キーと共通する値と複数の項目の説明指標の値の組とを対応付ける説明指標情報と、を保持し、
前記処理装置は、
前記説明指標の一つ以上の項目を選択し、
前記選択された一つ以上の項目の説明指標の値をクラスタリングし、
クラスタリングによって得られた各クラスタの各項目の説明指標の値の範囲を特定し、特定された値の範囲を出力し、
前記説明指標の各組について、前記選択された一つ以上の項目の説明指標の値が前記特定された説明指標の値の範囲内であるという条件を満たすか否かを判定し、前記主キーの値ごとに、前記条件を満たす前記説明指標の組の数を集計し、集計された前記説明指標の組の数を特徴量として出力することを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記処理装置は、前記各主キーの値に対応する前記特徴量と、前記各主キーの値に対応する前記目的指標の値との相関に基づいて、前記目的指標を説明するモデルを生成することを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記記憶装置は、前記説明指標情報に含まれる説明指標の各項目のデータ型を示す情報を保持し、
前記処理装置は、文字列型の項目及び文字列型以外のデータ型の項目を含む、前記説明指標の複数の項目が選択された場合、前記文字列型以外のデータ型の項目の説明指標の値をクラスタリングすることによって、前記選択された一つ以上の項目の説明指標の値をクラスタリングすることを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記処理装置は、前記選択された一つ以上の項目の説明指標の値と、前記選択された一つ以上の項目の説明指標の値に対応する前記主キーの値に対応する前記目的指標の値と、を含む値の組をクラスタリングすることを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記処理装置は、
所定の大きさの複数のグリッドに分割された空間に、前記選択された一つ以上の項目の説明指標の値の各組をプロットし、プロットされた前記値の組の密度が所定の閾値を超える複数のグリッドが隣接する場合、それらを一つのクラスタに含めるように、前記選択された一つ以上の項目の説明指標の値をクラスタリングし、
前記空間における前記各クラスタに含まれる複数のグリッドの範囲を前記各クラスタの各項目の説明指標の値の範囲として特定することを特徴とするデータ分析支援システム。 - 請求項5に記載のデータ分析支援システムであって、
前記処理装置は、前記各クラスタを、前記プロットされた値の組の密度が前記所定の閾値を超えないグリッドを含まない長方形、直方体又は超直方体の複数のクラスタに分割することを特徴とするデータ分析支援システム。 - 処理装置と、前記処理装置に接続される記憶装置と、を有する計算機システムが実行するデータ分析支援方法であって、
前記記憶装置は、
主キーの値と目的指標の値とを対応付ける目的指標情報と、
前記主キーと共通する値と複数の項目の説明指標の値の組とを対応付ける説明指標情報と、を保持し、
前記データ分析支援方法は、
前記処理装置が、前記説明指標の一つ以上の項目を選択する第1手順と、
前記処理装置が、前記選択された一つ以上の項目の説明指標の値をクラスタリングする第2手順と、
前記処理装置が、クラスタリングによって得られた各クラスタの各項目の説明指標の値の範囲を特定し、特定された値の範囲を出力する第3手順と、
前記処理装置が、前記説明指標の各組について、前記選択された一つ以上の項目の説明指標の値が前記特定された説明指標の値の範囲内であるという条件を満たすか否かを判定し、前記主キーの値ごとに、前記条件を満たす前記説明指標の組の数を集計し、集計された前記説明指標の組の数を特徴量として出力する第4手順と、を含むことを特徴とするデータ分析支援方法。 - 請求項7に記載のデータ分析支援方法であって、
前記処理装置が、前記各主キーの値に対応する前記特徴量と、前記各主キーの値に対応する前記目的指標の値との相関に基づいて、前記目的指標を説明するモデルを生成する第5手順をさらに含むことを特徴とするデータ分析支援方法。 - 請求項7に記載のデータ分析支援方法であって、
前記記憶装置は、前記説明指標情報に含まれる説明指標の各項目のデータ型を示す情報を保持し、
前記第2手順において、前記処理装置は、文字列型の項目及び文字列型以外のデータ型の項目を含む、前記説明指標の複数の項目が選択された場合、前記文字列型以外のデータ型の項目の説明指標の値をクラスタリングすることによって、前記選択された一つ以上の項目の説明指標の値をクラスタリングすることを特徴とするデータ分析支援方法。 - 請求項7に記載のデータ分析支援方法であって、
前記第2手順において、前記処理装置は、前記選択された一つ以上の項目の説明指標の値と、前記選択された一つ以上の項目の説明指標の値に対応する前記主キーの値に対応する前記目的指標の値と、を含む値の組をクラスタリングすることを特徴とするデータ分析支援方法。 - 請求項7に記載のデータ分析支援方法であって、
前記第2手順において、前記処理装置は、所定の大きさの複数のグリッドに分割された空間に、前記選択された一つ以上の項目の説明指標の値の各組をプロットし、プロットされた前記値の組の密度が所定の閾値を超える複数のグリッドが隣接する場合、それらを一つのクラスタに含めるように、前記選択された一つ以上の項目の説明指標の値をクラスタリングし、
前記第3手順において、前記処理装置は、前記空間における前記各クラスタに含まれる複数のグリッドの範囲を前記各クラスタの各項目の説明指標の値の範囲として特定することを特徴とするデータ分析支援方法。 - 請求項11に記載のデータ分析支援方法であって、
前記第2手順において、前記処理装置は、前記各クラスタを、前記プロットされた値の組の密度が前記所定の閾値を超えないグリッドを含まない長方形、直方体又は超直方体の複数のクラスタに分割することを特徴とするデータ分析支援方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/062115 WO2016170600A1 (ja) | 2015-04-21 | 2015-04-21 | データ分析支援システム及びデータ分析支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016170600A1 JPWO2016170600A1 (ja) | 2017-06-08 |
JP6393411B2 true JP6393411B2 (ja) | 2018-09-19 |
Family
ID=57143180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513867A Active JP6393411B2 (ja) | 2015-04-21 | 2015-04-21 | データ分析支援システム及びデータ分析支援方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10509808B2 (ja) |
JP (1) | JP6393411B2 (ja) |
WO (1) | WO2016170600A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11267065B2 (en) | 2019-02-18 | 2022-03-08 | Lincoln Global, Inc. | Systems and methods providing pattern recognition and data analysis in welding and cutting |
US20220222686A1 (en) * | 2019-05-21 | 2022-07-14 | Nippon Telegraph And Telephone Corporation | Analysis apparatus, analysis system, analysis method and program |
CN112214531B (zh) * | 2020-10-12 | 2021-11-05 | 海南大学 | 跨数据、信息、知识多模态的特征挖掘方法及组件 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3054708B1 (ja) | 1999-02-23 | 2000-06-19 | 工業技術院長 | ストレス計測装置 |
JP2002278762A (ja) * | 2001-03-19 | 2002-09-27 | Nippon Steel Corp | データクラスタリング方法 |
JP3995099B2 (ja) * | 2004-07-27 | 2007-10-24 | 国立医薬品食品衛生研究所長 | 高次元データを塊に分割する装置 |
JP2008117016A (ja) * | 2006-10-31 | 2008-05-22 | Toshiba Corp | 文書データ処理装置 |
JP6066086B2 (ja) * | 2011-02-28 | 2017-01-25 | 日本電気株式会社 | データ判別装置、方法及びプログラム |
JP5117589B2 (ja) * | 2011-03-22 | 2013-01-16 | 株式会社東芝 | 文書分析装置およびプログラム |
EP2975525B1 (en) * | 2013-03-13 | 2018-10-10 | Nec Corporation | System analysis device, and system analysis method |
JP6101607B2 (ja) * | 2013-09-17 | 2017-03-22 | 株式会社日立製作所 | データ分析支援システム |
WO2015049797A1 (ja) | 2013-10-04 | 2015-04-09 | 株式会社日立製作所 | データ管理方法、データ管理装置及び記憶媒体 |
US20150339782A1 (en) * | 2014-05-26 | 2015-11-26 | Tata Consultancy Services Limited | System and method for classifying a plurality of customer accounts |
-
2015
- 2015-04-21 WO PCT/JP2015/062115 patent/WO2016170600A1/ja active Application Filing
- 2015-04-21 US US15/534,576 patent/US10509808B2/en active Active
- 2015-04-21 JP JP2017513867A patent/JP6393411B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20180260470A1 (en) | 2018-09-13 |
US10509808B2 (en) | 2019-12-17 |
JPWO2016170600A1 (ja) | 2017-06-08 |
WO2016170600A1 (ja) | 2016-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI718643B (zh) | 異常群體識別方法及裝置 | |
CN103514243B (zh) | 时空数据管理系统和时空数据管理方法 | |
KR101696338B1 (ko) | 컬럼-인덱스 데이터 포맷을 이용하여 빅데이터를 효율적으로 처리 및 분석하는 시스템 및 방법 | |
JP2017512338A (ja) | 第一クラスデータベース要素としての半構造データの実装 | |
CN111782686A (zh) | 用户数据的查询方法、装置、电子设备及存储介质 | |
JP2015026188A (ja) | データベース分析装置及び方法 | |
US10579616B2 (en) | Data search system, data search method, and program product | |
US11620406B2 (en) | Information processing device, information processing method, and recording medium | |
Bang et al. | HPC workload characterization using feature selection and clustering | |
JPWO2013105505A1 (ja) | インデックス走査装置及びインデックス走査方法 | |
JP6393411B2 (ja) | データ分析支援システム及びデータ分析支援方法 | |
JP6242540B1 (ja) | データ変換システム及びデータ変換方法 | |
JP2019204246A (ja) | 学習データ作成方法及び学習データ作成装置 | |
US9201888B2 (en) | File management apparatus, file management method, and file management system | |
CN110874366A (zh) | 数据处理、查询方法和装置 | |
Dai et al. | Research on personalized behaviors recommendation system based on cloud computing | |
JP2021056570A (ja) | データベースの分割システム、データベースの分割方法、及びデータベースの分割プログラム | |
US20220360458A1 (en) | Control method, information processing apparatus, and non-transitory computer-readable storage medium for storing control program | |
JP7418781B2 (ja) | 企業類似度算出サーバ及び企業類似度算出方法 | |
JP2015064856A (ja) | データ分析プログラム、データ分析方法及びデータ分析装置 | |
US11126604B2 (en) | Aggregation apparatus, aggregation method, and storage medium | |
Maingi | A Survey on the Clustering Algorithms in Sales Data Mining | |
JP6320891B2 (ja) | 問題構造抽出装置および問題構造抽出方法 | |
JPWO2014168199A1 (ja) | 論理演算方法および情報処理装置 | |
JP2020038610A (ja) | 検索処理プログラム、検索処理方法及び情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180821 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180824 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6393411 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |