KR101525584B1 - 바이오 데이터 검증 방법 및 이를 위한 장치 - Google Patents
바이오 데이터 검증 방법 및 이를 위한 장치 Download PDFInfo
- Publication number
- KR101525584B1 KR101525584B1 KR1020120139109A KR20120139109A KR101525584B1 KR 101525584 B1 KR101525584 B1 KR 101525584B1 KR 1020120139109 A KR1020120139109 A KR 1020120139109A KR 20120139109 A KR20120139109 A KR 20120139109A KR 101525584 B1 KR101525584 B1 KR 101525584B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- sequence
- row
- bio
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/50—Compression of genetic data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Genetics & Genomics (AREA)
- Software Systems (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 1은 본 발명의 일 실시예에 따른, 바이오 데이터 검증 시스템의 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른, 데이터 검증 장치의 구성을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른, 압축 해제된 바이오 데이터의 기록 내용을 발췌한 도면이다.
도 4는 본 발명의 일 실시예에 따른, 바이오 데이터 검증 장치에서 클라이언트 단말로부터 수신한 바이오 데이터를 검증하는 방법을 설명하는 흐름도이다.
행 | 정보 |
첫 번째 행 | 시퀀스 ID |
두 번째 행 | 염기서열 정보 |
세 번째 행 | 옵션 |
네 번째 행 | 염기서열에 대한 품질 점수 |
210 : 인증부 220 : 데이터 처리부
230 : 저장부 240 : 데이터 검증부
250 : 오류율 확인부 300 : 스토리지 시스템
400 : 네트워크
Claims (16)
- 데이터 검증 장치에서 클라이언트 단말로부터 수신한 바이오 데이터의 오류를 검증하는 바이오 데이터 검증 방법에 있어서,
상기 클라이언트 단말로부터 바이오 데이터의 업로드를 요청받아 스토리지 시스템에 상기 바이오 데이터를 저장하는 단계;
상기 바이오 데이터에서 각 시퀀스를 추출하고, 각각의 시퀀스가 유효한 데이터인지 여부를 검증하는 단계;
상기 검증 결과 오류가 발생한 시퀀스가 발견되면, 시퀀스의 오류율을 산출하는 단계; 및
상기 산출한 오류율이 임계값을 초과하는지 여부를 확인하여 초과하면, 상기 바이오 데이터의 업로드를 중단하는 단계;를 포함하는 바이오 데이터 검증 방법. - 제 1 항에 있어서,
상기 검증하는 단계는,
상기 시퀀스의 첫 행이 문자 '@'로 시작되는지 여부를 검증하는 단계; 및
상기 시퀀스의 두 번째 행에 기 설정된 유효 문자가 기록되었는지 여부를 검증하는 단계;를 포함하고,
상기 시퀀스의 첫 행이 문자 '@'로 시작되고 두 번째 행에 기 설정된 유효 문자가 기록된 것으로 검증되면, 상기 시퀀스를 유효한 데이터로 판별하는 것을 특징으로 하는 바이오 데이터 검증 방법. - 제 1 항에 있어서,
상기 검증하는 단계는,
상기 시퀀스의 첫 행이 문자 '@'로 시작되는지 여부를 검증하는 단계;
상기 시퀀스의 두 번째 행에 기 설정된 유효 문자가 기록되었는지 여부를 검증하는 단계;
상기 시퀀스의 세 번째 행에 문자 '+'가 기록되었는지 여부를 검증하는 단계;
상기 시퀀스의 네 번째 행에 사전에 설정된 아스키 범위에 속하는 문자가 기록되어 있는지 여부를 검증하는 단계; 및
상기 시퀀스의 두 번째 행과 네 번째 행의 문자 개수가 동일한지 여부를 검증하는 단계;를 포함하고,
상기 시퀀스의 첫 행이 문자 '@'로 시작되고 두 번째 행에 기 설정된 유효 문자가 기록된 것으로 검증되며, 세 번째 행에 문자 '+'가 기록되고 네 번째 행에 사전에 설정된 아스키 범위에 속하는 문자가 기록된 것으로 검증되면, 상기 시퀀스를 유효한 데이터로 판별하는 것을 특징으로 하는 바이오 데이터 검증 방법. - 제 2 항에 있어서,
상기 기 설정된 유효 문자가 기록되었는지 여부를 검증하는 단계는,
상기 시퀀스의 두 번째 행에 'A', 'T', 'G', 'C', 'N' 중 어느 하나가 기록되어 있는지 여부를 검증하는 것인 바이오 데이터 검증 방법. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 검증하는 단계는,
특정 시퀀스에 오류가 발생한 것으로 확인되면, 이 시퀀스의 식별정보를 오류 목록에 기록하고, 상기 오류 목록을 상기 스토리지 시스템에 저장하는 것을 특징으로 하는 바이오 데이터 검증 방법. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 중단하는 단계 이후에,
상기 클라이언트 단말로 상기 바이오 데이터의 오류 발생을 통보하는 단계; 및
상기 스토리지 시스템에 저장한 상기 바이오 데이터를 삭제하는 단계;를 더 포함하는 것을 특징으로 하는 바이오 데이터 검증 방법. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 검증하는 단계는,
업로드 진행중인 상기 바이오 데이터를 실시간으로 압축 해제하고, 상기 압축 해제한 바이오 데이터에서 시퀀스를 추출하는 것을 특징으로 하는 바이오 데이터 검증 방법. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 산출하는 단계는,
상기 바이오 데이터의 전체 용량을 확인하고 이 전체 용량을 토대로 상기 바이오 데이터 전체에 기록된 시퀀스의 총 개수를 추정하고, 오류 발생한 시퀀스의 개수와 상기 추정한 시퀀스의 총 개수를 토대로 상기 시퀀스의 오류율을 산출하는 것을 특징으로 하는 바이오 데이터 검증 방법. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 바이오 데이터는 FASTQ 포맷인 것인 특징으로 하는 바이오 데이터 검증 방법. - 클라이언트 단말로부터 바이오 데이터의 업로드를 요청받아 스토리지 시스템에 상기 바이오 데이터를 저장하는 데이터 처리부;
상기 바이오 데이터에서 각 시퀀스를 추출하고, 각각의 시퀀스가 유효한 데이터인지 여부를 검증하는 데이터 검증부; 및
상기 데이터 검증부에서 오류로서 판별한 시퀀스의 개수에 근거하여 시퀀스의 오류율을 산출하고, 상기 산출한 오류율이 임계값을 초과하는지 여부에 따라 상기 바이오 데이터의 업로드를 선택적으로 중단하는 오류율 확인부;를 포함하는 데이터 검증 장치. - 제 10 항에 있어서,
상기 데이터 검증부는,
상기 시퀀스의 첫 행이 문자 '@'로 시작되는지 여부를 1차 검증하고, 상기 시퀀스의 두 번째 행에 기 설정된 유효 문자가 기록되었는지 여부를 2차 검증하여, 상기 시퀀스의 첫 행이 문자 '@'로 시작되고 두 번째 행에 상기 유효 문자가 기록된 것으로 검증되면, 상기 시퀀스를 유효한 데이터로 판별하는 것을 특징으로 하는 데이터 검증 장치. - 제 10 항에 있어서,
상기 데이터 검증부는,
상기 시퀀스의 첫 행이 문자 '@'로 시작되는지 여부를 1차 검증하고, 상기 시퀀스의 두 번째 행에 기 설정된 유효 문자가 기록되었는지 여부를 2차 검증하고,상기 시퀀스의 세 번째 행에 문자 '+'가 기록되었는지 여부를 3차 검증하고, 상기 시퀀스의 네 번째 행에 사전에 설정된 아스키 범위에 속하는 문자가 기록되어 있는지 여부를 4차 검증하고, 상기 시퀀스의 두 번째 행과 네 번째 행의 문자 개수가 동일한지 여부를 5차 검증한 후, 상기 시퀀스의 첫 행이 문자 '@'로 시작되고, 두 번째 행에 기 설정된 유효 문자가 기록되며, 세 번째 행에 문자 '+'가 기록되고, 네 번째 행에 사전에 설정된 아스키 범위에 속하는 문자가 기록되며, 상기 시퀀스의 두 번째 행과 네 번째 행의 문자 개수가 동일한 것으로 검증되면, 상기 시퀀스를 유효한 데이터로 판별하는 것을 특징으로 하는 데이터 검증 장치. - 제 10 항에 있어서,
상기 데이터 검증부는,
상기 시퀀스의 두 번째 행에 'A', 'T', 'G', 'C', 'N' 중 적어도 어느 하나가 포함되면, 상기 시퀀스의 두 번째 행에 상기 유효 문자가 기록된 것으로 검증하는 데이터 검증 장치. - 제 10 항 내지 제 13 항 중 어느 한 항에 있어서,
상기 데이터 검증부는,
특정 시퀀스에 오류가 발생한 것으로 판별되면, 이 시퀀스의 식별정보를 오류 목록에 기록하고, 상기 오류 목록을 상기 스토리지 시스템에 저장하는 것을 특징으로 하는 데이터 검증 장치. - 제 10 항 내지 제 13 항 중 어느 한 항에 있어서,
상기 오류율 확인부는,
상기 산출한 오류율이 임계값을 초과하면, 상기 클라이언트 단말로 상기 바이오 데이터의 오류 발생을 통보하고, 상기 스토리지 시스템에 저장한 상기 바이오 데이터를 삭제하는 것을 특징으로 하는 데이터 검증 장치. - 제 10 항 내지 제 13 항 중 어느 한 항에 있어서,
상기 데이터 처리부는,
업로드 진행중인 상기 바이오 데이터를 실시간으로 압축 해제하고,
상기 데이터 검증부는,
상기 압축 해제한 바이오 데이터에서 시퀀스를 추출하는 것을 특징으로 하는 데이터 검증 장치.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120139109A KR101525584B1 (ko) | 2012-12-03 | 2012-12-03 | 바이오 데이터 검증 방법 및 이를 위한 장치 |
US14/649,546 US10528531B2 (en) | 2012-12-03 | 2013-07-18 | Method for verifying biodata, and apparatus therefor |
PCT/KR2013/006451 WO2014088179A1 (ko) | 2012-12-03 | 2013-07-18 | 바이오 데이터 검증 방법 및 이를 위한 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120139109A KR101525584B1 (ko) | 2012-12-03 | 2012-12-03 | 바이오 데이터 검증 방법 및 이를 위한 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140071124A KR20140071124A (ko) | 2014-06-11 |
KR101525584B1 true KR101525584B1 (ko) | 2015-06-03 |
Family
ID=50883579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120139109A Expired - Fee Related KR101525584B1 (ko) | 2012-12-03 | 2012-12-03 | 바이오 데이터 검증 방법 및 이를 위한 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10528531B2 (ko) |
KR (1) | KR101525584B1 (ko) |
WO (1) | WO2014088179A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230188344A1 (en) * | 2021-12-10 | 2023-06-15 | Bank Of America Corporation | Automatically Re-Routing Multi-Cloud Holochain Data Ingestion Based on Network Architecture Availability to Internet of Things (IoT) Devices |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008020312A (ja) * | 2006-07-12 | 2008-01-31 | Olympus Corp | 検査結果出力方法 |
JP2011247907A (ja) * | 2011-09-13 | 2011-12-08 | Panasonic Corp | バイオセンサ、バイオセンサ用測定装置及び基質の定量方法 |
US20120135409A1 (en) * | 2008-11-07 | 2012-05-31 | Sequenta, Inc. | Methods of monitoring conditions by sequence analysis |
KR20120079320A (ko) * | 2011-01-04 | 2012-07-12 | 삼성전자주식회사 | 프로브맵을 이용하여 유전자 서열을 복원하는 방법 및 장치 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030000452A (ko) | 2001-06-25 | 2003-01-06 | 주식회사데이콤 | 인터넷 서비스에 있어서 대용량 데이터 처리의 대행 방법 |
KR100696708B1 (ko) | 2006-02-21 | 2007-03-20 | 재단법인서울대학교산학협력재단 | 의료기관간 의료정보 온라인 전송 시스템 |
JP5658501B2 (ja) | 2010-07-27 | 2015-01-28 | シスメックス株式会社 | 検体分析システム、検体分析装置、管理装置、及び検体分析装置の管理方法 |
KR101188886B1 (ko) | 2010-10-22 | 2012-10-09 | 삼성에스디에스 주식회사 | 유전 정보 관리 시스템 및 방법 |
-
2012
- 2012-12-03 KR KR1020120139109A patent/KR101525584B1/ko not_active Expired - Fee Related
-
2013
- 2013-07-18 WO PCT/KR2013/006451 patent/WO2014088179A1/ko active Application Filing
- 2013-07-18 US US14/649,546 patent/US10528531B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008020312A (ja) * | 2006-07-12 | 2008-01-31 | Olympus Corp | 検査結果出力方法 |
US20120135409A1 (en) * | 2008-11-07 | 2012-05-31 | Sequenta, Inc. | Methods of monitoring conditions by sequence analysis |
KR20120079320A (ko) * | 2011-01-04 | 2012-07-12 | 삼성전자주식회사 | 프로브맵을 이용하여 유전자 서열을 복원하는 방법 및 장치 |
JP2011247907A (ja) * | 2011-09-13 | 2011-12-08 | Panasonic Corp | バイオセンサ、バイオセンサ用測定装置及び基質の定量方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20140071124A (ko) | 2014-06-11 |
US10528531B2 (en) | 2020-01-07 |
US20170147614A1 (en) | 2017-05-25 |
WO2014088179A1 (ko) | 2014-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080148375A1 (en) | Authentication system, authentication device, and authentication method | |
US20130262873A1 (en) | Method and system for authenticating remote users | |
JP5970328B2 (ja) | 生体認証サーバおよび生体認証の運用管理方法 | |
KR20170003366A (ko) | 성문 기반 통신 방법, 장치, 및 시스템 | |
CN110691085A (zh) | 登录方法、装置、密码管理系统及计算机可读介质 | |
CN106130739A (zh) | 应用程序登录处理方法及装置 | |
CN102739667A (zh) | 基于验证提示信息的验证方法、装置、系统及服务器 | |
CN109409079A (zh) | 弱口令核查方法及装置 | |
CN106330983A (zh) | 身份认证方法、用户客户端及系统 | |
CN103581109B (zh) | 声纹登录购物系统和方法 | |
JP2019504545A (ja) | 携帯電話番号を変更するためのサービス要求を認識する方法及び装置 | |
KR101525584B1 (ko) | 바이오 데이터 검증 방법 및 이를 위한 장치 | |
CN109246066B (zh) | 身份识别方法、云服务器及身份识别系统 | |
CN110336791B (zh) | 一种断点数据传输方法、装置、设备及计算机存储介质 | |
EP3002692A1 (en) | Evaluation processing method and device for voice service | |
CN104601532B (zh) | 一种登录账户的方法及装置 | |
CN113436002B (zh) | 数据处理方法、装置及系统 | |
CN112148920B (zh) | 数据管理方法 | |
CN105827578A (zh) | 一种击键特征数据的处理方法及装置 | |
CN103581110A (zh) | 面部识别登录购物系统和方法 | |
CN115114613B (zh) | 采用asic和gpu异构类型资源进行口令破解的系统 | |
CN105282007B (zh) | 一种加入社交群组的方法、服务器及其系统 | |
CN110751033A (zh) | 离线登录方法及相关产品 | |
EP2639724A2 (en) | System and method for processing genome sequence in consideration of seed length | |
CN115510416A (zh) | 一种移动终端id的映射表的更新方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
PR1002 | Payment of registration fee |
Fee payment year number: 1 St.27 status event code: A-2-2-U10-U11-oth-PR1002 |
|
PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
FPAY | Annual fee payment |
Payment date: 20180503 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Fee payment year number: 4 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
FPAY | Annual fee payment |
Payment date: 20190502 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Fee payment year number: 5 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
PR1001 | Payment of annual fee |
Fee payment year number: 6 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
PC1903 | Unpaid annual fee |
Not in force date: 20210529 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE St.27 status event code: A-4-4-U10-U13-oth-PC1903 |
|
PC1903 | Unpaid annual fee |
Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20210529 St.27 status event code: N-4-6-H10-H13-oth-PC1903 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |