KR101153966B1 - 고차원 데이터의 색인/검색 시스템 및 그 방법 - Google Patents
고차원 데이터의 색인/검색 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR101153966B1 KR101153966B1 KR1020080131384A KR20080131384A KR101153966B1 KR 101153966 B1 KR101153966 B1 KR 101153966B1 KR 1020080131384 A KR1020080131384 A KR 1020080131384A KR 20080131384 A KR20080131384 A KR 20080131384A KR 101153966 B1 KR101153966 B1 KR 101153966B1
- Authority
- KR
- South Korea
- Prior art keywords
- hashing
- signature
- module
- feature data
- cell
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 238000003780 insertion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 13
- 238000010845 search algorithm Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 101100328519 Caenorhabditis elegans cnt-2 gene Proteins 0.000 description 1
- 101100328536 Mus musculus Cntd1 gene Proteins 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
- 멀티미디어 객체로부터 추출된 고차원의 특징 데이터를 색인하고, 저장하여, 상기 저장된 고차원 데이터의 검색을 수행하는 검색시스템에 있어서,상기 특징 데이터로부터 추출된 하나의 특징 벡터가 속하는 셀을 구하고, 상기 셀을 표시하기 위한 시그니처를 생성하되, 상기 시그니처를 차원 단위로 여러 개로 나누어, 이를 다수의 인덱스에 저장하는 해싱 구조를 구축하고, 이 해싱 구조를 구축하는 과정에서 상기 특징 데이터를 삽입하고자 하는 셀 뿐만 아니라 인접한 이웃 셀에 중복 삽입하는 해싱 연산모듈; 및상기 구축된 해싱 구조를 기반으로, 상기 특징 데이터의 삽입 및 검색을 수행하는 알고리즘이 저장된 저장부를 포함하는 고차원 데이터의 색인/검색 시스템.
- 제 1 항에 있어서, 상기 해싱 연산모듈은,상기 특징 데이터의 클러스터링을 위해 공간을 상기 차원 단위로 일정 구간으로 나누고, 각 일정 구간에 상기 시그니처를 부여하는 시그니처 변환모듈;상기 시그니처 변환모듈에서 부여된 시그니처 간의 거리를 보존할 수 있도록 재변환하고, 재변환된 시그니처에서 '1'의 비트 수를 기반으로 상기 재변환된 시그니처를 상기 해싱 구조에 맵핑(Mapping)하여, 1차 해싱 구조를 구축하는 1차 해싱함수 모듈;검색의 정확도의 향상을 위해 상기 특징 데이터를 삽입하고자 하는 셀 뿐만 아니라 인접한 이웃 셀에 중복 저장하는 이웃 셀 계산 모듈; 및상기 구축된 1차 해싱 구조의 버킷 개수를 B개의 버킷에 압축저장하여, 상기 1차 해싱 구조를 2차 해싱 구조에 맵핑하는 2차 해싱 함수모듈을 포함하는 것인 고차원 데이터의 색인/검색 시스템.
- 제2항에 있어서, 상기 시그니처 변환모듈은 상기 특징 데이터를 상기 일정 구간별로 나누고, 이를 기반으로 비트열을 생성하는 것인 고차원 데이터의 색인/검색 시스템.
- 멀티미디어 객체로부터 추출된 고차원의 특징 데이터를 색인 및 검색을 실행하기 위해, 해싱 연산모듈과 저장부가 탑재된 컴퓨팅 장치를 이용하여, 상기 고차원의 특징 데이터를 색인 및 검색하는 방법에 있어서,상기 해싱 연산모듈이 상기 특징 데이터로부터 추출된 하나의 특징 벡터가 속하는 셀을 구하고, 상기 셀을 표시하기 위한 시그니처를 생성하되, 상기 시그니처를 차원 단위로 여러 개로 나누어, 이를 다수의 인덱스에 저장하고, 상기 특징 데이터를 삽입하고자 하는 셀 뿐만 아니라 인접한 이웃 셀에 중복 삽입하는 단계;상기 해싱 연산모듈이 각 인덱스에 검색된 후보 셋(집합)을 합병 및 정렬하여 해싱 구조를 구축하는 단계; 및상기 저장부가 상기 특징 데이터의 삽입 및 검색을 수행하기 위해 상기 구축된 해싱 구조를 저장하는 단계를 포함하는 고차원 데이터의 색인/검색 방법.
- 제7항에 있어서, 시그니처 변환모듈, 1차 해싱함수 모듈, 이웃 셀 계산 모듈 및 2차 해싱 함수모듈로 구성된 상기 해싱 연산모듈에 의해 상기 다수의 인덱스를 저장하는 단계는,상기 시그니처 변환모듈이 상기 특징 데이터의 클러스터링을 위해 공간을 일정 구간으로 나누고, 각 구간에 시그니처를 부여하는 단계;상기 1차 해싱함수 모듈이 상기 부여된 시그니처를 거리 간의 거리를 보존할 수 있도록 재변환하고, 재변환된 시그니처에서 '1'의 비트 수를 기반으로 상기 재변환된 시그니처를 1차 해싱구조에 사상하는 단계;상기 이웃 셀 계산 모듈이 검색의 정확도의 향상을 위해 상기 특징 데이터를 삽입하고자 하는 셀 뿐만 아니라 인접한 이웃 셀에 중복 저장하는 단계; 및상기 2차 해싱 함수 모듈이 상기 1차 해싱 구조의 버킷 개수를 B개의 버킷에 압축저장하여, 상기 1차 해싱 구조를 2차 해싱 구조에 맵핑하는 단계를 포함하는 고차원 데이터의 색인/검색 방법.
- 제7항에 있어서, 시그니처 변환모듈, 1차 해싱함수 모듈, 이웃 셀 계산 모듈 및 2차 해싱 함수모듈로 구성된 상기 해싱 연산모듈에 의한 상기 특징 데이터의 삽입 단계를 더 포함하고,상기 특징 데이터의 삽입 단계는,상기 시그니처 변환모듈에 의해 상기 특징 데이터가 비트열로 변환되고, 상기 변환된 비트열이 차원을 기반으로 인덱스의 개수만큼 분할되는 단계;상기 이웃 셀 계산 모듈에 의해 중복 삽입할 셀이 결정되는 단계;상기 1차 해싱함수 모듈에 의해 1차 해싱이 수행되고, 아울러 인덱스에 할당되는 비트 수를 기반으로 난수가 생성되는 단계;상기 2차 해싱함수 모듈에 의해 2차 해싱이 수행되고, 버킷을 탐색하고, 탐색된 버킷에 최종적으로 데이터가 저장되는 단계;비트열을 차원을 기반으로 인덱스의 개수만큼 분할한 모든 비트열의 부분에 대해 상기 단계들이 수행되면, 모든 단계가 종료되는 단계를 포함하는 것인 고차원 데이터의 색인/검색 방법.
- 제7항에 있어서, 시그니처 변환모듈, 1차 해싱함수 모듈, 이웃 셀 계산 모듈 및 2차 해싱 함수모듈로 구성된 상기 해싱 연산모듈에 의한 상기 특징 데이터의 검색 단계를 더 포함하고,상기 특징 데이터의 검색 단계는,상기 시그니처 변환모듈에 의해 상기 특징 데이터가 비트열로 변환되고, 변환된 비트열이 인덱스 개수만큼 차원이 분할되는 단계;상기 1차 해싱함수 모듈에 의해 1차 해싱 주소값이 계산되는 단계;상기 2차 해싱함수 모듈에 의해 2차 해싱 주소값이 계산되는 단계;상기 저장부가 계산된 주소값을 통하여 해당 버킷에 저장되어 있는 데이터가 검색되고, 후보 셋이 저장되는 단계; 및비트열을 차원을 기반으로 분할한 모든 비트열의 부분에 대해 상기 단계들을 수행한 후에, 획득된 후보셋이 병합 및 정렬되고, k개의 특징 데이터가 반환됨으로써, 최종적인 결과가 상기 컴퓨팅 장치를 통해 사용자에게 전송되는 단계를 포함하는 것인 고차원 데이터의 색인/검색 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080131384A KR101153966B1 (ko) | 2008-12-22 | 2008-12-22 | 고차원 데이터의 색인/검색 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080131384A KR101153966B1 (ko) | 2008-12-22 | 2008-12-22 | 고차원 데이터의 색인/검색 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100072855A KR20100072855A (ko) | 2010-07-01 |
KR101153966B1 true KR101153966B1 (ko) | 2012-06-08 |
Family
ID=42635943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080131384A KR101153966B1 (ko) | 2008-12-22 | 2008-12-22 | 고차원 데이터의 색인/검색 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101153966B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101986129B1 (ko) | 2019-04-17 | 2019-06-05 | 영남대학교 산학협력단 | 데이터 정렬 방법과 장치 및 이를 수행하기 위한 컴퓨팅 장치 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816110B (zh) * | 2019-01-24 | 2024-07-26 | 上海嘉楠捷思信息技术有限公司 | Scrypt算法工作量证明方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172384A (ja) | 2005-12-22 | 2007-07-05 | Matsushita Electric Ind Co Ltd | 画像検索装置および画像検索方法 |
-
2008
- 2008-12-22 KR KR1020080131384A patent/KR101153966B1/ko not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172384A (ja) | 2005-12-22 | 2007-07-05 | Matsushita Electric Ind Co Ltd | 画像検索装置および画像検索方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101986129B1 (ko) | 2019-04-17 | 2019-06-05 | 영남대학교 산학협력단 | 데이터 정렬 방법과 장치 및 이를 수행하기 위한 컴퓨팅 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20100072855A (ko) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100903961B1 (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
US8171029B2 (en) | Automatic generation of ontologies using word affinities | |
CN107391554B (zh) | 高效分布式局部敏感哈希方法 | |
KR101266358B1 (ko) | 다중 길이 시그니처 파일 기반 분산 색인 시스템 및 방법 | |
CN102521386B (zh) | 基于集群存储的空间元数据分组方法 | |
Yagoubi et al. | Dpisax: Massively distributed partitioned isax | |
US20100106713A1 (en) | Method for performing efficient similarity search | |
CN103345496B (zh) | 多媒体信息检索方法和系统 | |
CN113434736A (zh) | 一种面向遥感大数据的多维混合索引方法及系统 | |
US9619501B2 (en) | Index scan device and index scan method | |
Hetland et al. | Ptolemaic access methods: Challenging the reign of the metric space model | |
KR101467707B1 (ko) | 지식 베이스의 개체 매칭 방법 및 이를 위한 장치 | |
CN104933143A (zh) | 获取推荐对象的方法及装置 | |
Mohamed et al. | Quantized ranking for permutation-based indexing | |
KR101153966B1 (ko) | 고차원 데이터의 색인/검색 시스템 및 그 방법 | |
Ihm et al. | Approximate convex skyline: a partitioned layer-based index for efficient processing top-k queries | |
TWI770477B (zh) | 資訊處理裝置、儲存媒體、程式產品及資訊處理方法 | |
CN113254720A (zh) | 一种基于新型存储器的存储内哈希排序构建方法 | |
Hong et al. | Attribute clustering in high dimensional feature spaces | |
CN105740371A (zh) | 一种基于密度的增量聚类数据挖掘方法及系统 | |
Bai et al. | Subspace global skyline query processing | |
Waters et al. | Isosurface extraction using fixed-sized buckets | |
CN114579573B (zh) | 信息检索方法、装置、电子设备以及存储介质 | |
Fang et al. | Locality-Sensitive Hashing Scheme Based on Heap Sort of Hash Bucket | |
Mohamed | Scalable approximate k-NN in multidimensional big data. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20081222 |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20090303 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20081222 Comment text: Patent Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20110309 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20120510 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120531 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20120531 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20160409 |