KR100911830B1 - 화자 기록 장치 및 방법 - Google Patents
화자 기록 장치 및 방법 Download PDFInfo
- Publication number
- KR100911830B1 KR100911830B1 KR1020070089141A KR20070089141A KR100911830B1 KR 100911830 B1 KR100911830 B1 KR 100911830B1 KR 1020070089141 A KR1020070089141 A KR 1020070089141A KR 20070089141 A KR20070089141 A KR 20070089141A KR 100911830 B1 KR100911830 B1 KR 100911830B1
- Authority
- KR
- South Korea
- Prior art keywords
- speaker
- recording
- voice
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
Claims (17)
- 화자 식별의 대상자들 또는 다자의 발언에 의해 입력되는 음성을 샘플링하는 음성 샘플링부와,상기 화자 등록을 위해 상기 음성 샘플링부에 의해 샘플링된 음성 데이터를 상기 화자 식별의 대상자들에 대한 정보와 함께 등록하는 화자 등록부와,상기 화자 식별을 위해 상기 음성 샘플링부에 의해 샘플링된 음성 데이터와 상기 화자 등록부에 의해 기 등록된 음성 관련 데이터들과의 비교를 통해 화자를 식별하는 화자 식별부와,상기 화자 식별부에 의한 화자 식별 결과에 의거하여 상기 다자의 발언에 대해 발언 구간별로 해당 화자 식별 정보를 기록하는 화자 기록부를 포함하며,상기 화자 식별부는 상기 샘플링된 음성 데이터로부터 식별한 화자가 상기 화자 등록부에 의해 사전 등록된 화자가 아니라면 임시로 아이디를 발급하고 이후의 동일 화자에 의한 발언은 이전에 발급된 임시아이디를 사용하는화자 기록 장치.
- 제 1 항에 있어서,상기 화자 기록 장치는,상기 화자 식별을 위해 상기 음성 샘플링부에 입력되는 음성을 녹취한 녹취 음성 데이터를 재생하면서 상기 화자 식별 정보를 표시하는 기록 재생부를 더 포함하는 화자 기록 장치.
- 제 1 항에 있어서,상기 화자 등록부는, 상기 화자 등록을 위해 상기 음성 샘플링부에 의해 샘플링된 음성 데이터를 화자 특성 데이터로 변환한 후에 등록하며,상기 화자 식별부는, 상기 화자 식별을 위해 상기 음성 샘플링부에 의해 샘플링된 음성 데이터를 화자 특성 데이터로 변환한 후에 상기 화자 등록부에 의해 기 등록된 화자 특성 데이터들과의 유사도 비교를 통해 상기 대상자들에 대한 정보 중에서 특정 화자 특성 데이터에 대응하는 정보에 의거하여 화자를 식별하는화자 기록 장치.
- 제 2 항에 있어서,상기 화자 기록부는, 상기 화자 식별을 위해 상기 음성 샘플링부에 입력되는 음성과의 동기화를 위해 상기 화자 식별부에 의해 식별된 화자의 정보에 시간 정보를 포함시켜서 상기 화자 식별 정보를 기록하는화자 기록 장치.
- 제 4 항에 있어서,상기 기록 재생부는, 상기 녹취 음성 데이터를 재생하면서 상기 화자 식별 정보의 시간 정보를 활용하여 상기 화자 식별부에 의해 식별된 화자의 정보를 표시하는화자 기록 장치.
- 제 1 항에 있어서,상기 화자 기록부는, 상기 화자 식별 정보를 화자 정보 파일의 형태로 저장하는화자 기록 장치.
- 제 6 항에 있어서,상기 화자 기록부는, 상기 음성 구간별로 시작 시점에 상기 화자 식별 정보를 기록하여 상기 화자 정보 파일을 생성하는화자 기록 장치.
- (a) 화자 식별의 대상자들에 의해 입력되는 음성을 샘플링하여 샘플링된 음성 데이터를 상기 화자 식별의 대상자들에 대한 정보와 함께 등록하는 단계와,(b) 다자의 발언에 의해 입력되는 음성을 샘플링하여 샘플링된 음성 데이터와 상기 (a) 단계에서 기 등록된 음성 관련 데이터들과의 비교를 통해 화자를 식별하는 단계와,(c) 상기 (b) 단계에서 상기 화자를 식별한 결과에 의거하여 상기 다자의 발언에 대해 발언 구간별로 화자 식별 정보를 기록하는 단계를 포함하며,상기 (b) 단계는, 상기 비교를 통해 식별한 화자가 상기 (a) 단계에서 사전 등록된 화자가 아니라면 임시로 아이디를 발급하고 이후의 동일 화자에 의한 발언은 이전에 발급된 임시아이디를 사용하는화자 기록 방법.
- 제 8 항에 있어서,상기 화자 기록 방법은,(d) 상기 (b) 단계에서 입력되는 음성을 녹취한 녹취 음성 데이터를 재생하면서 상기 (c) 단계에서 기록한 상기 화자 식별 정보를 표시하는 단계를 더 포함하는 화자 기록 방법.
- 제 8 항에 있어서,상기 (a) 단계는, 상기 (a) 단계에 의해 샘플링된 음성 데이터를 화자 특성 데이터로 변환한 후에 등록하며,상기 (b) 단계는, 상기 (b) 단계에 의해 샘플링된 음성 데이터를 화자 특성 데이터로 변환한 후에 상기 (a) 단계에서 기 등록된 화자 특성 데이터들과의 유사도 비교를 통해 상기 대상자들에 대한 정보 중에서 특정 화자 특성 데이터에 대응하는 정보에 의거하여 화자를 식별하는화자 기록 방법.
- 제 9 항에 있어서,상기 (d) 단계는, 상기 화자 식별을 위해 입력되는 음성과의 동기화를 위해 상기 (c) 단계에 의해 식별된 화자의 정보에 시간 정보를 포함시켜서 상기 화자 식별 정보를 기록하는화자 기록 방법.
- 제 11 항에 있어서,상기 (d) 단계는, 상기 녹취 음성 데이터를 재생하면서 상기 화자 식별 정보의 시간 정보를 활용하여 상기 (c) 단계에 의해 식별된 화자의 정보를 표시하는화자 기록 방법.
- 삭제
- 제 8 항 또는 제 9 항에 있어서,상기 (c) 단계는, 현재 음성 구간에 실제로는 음성이 없고 이전 음성 구간에서 화자 식별이 진행되었을 경우에 상기 현재 음성 구간의 시작 시점을 이전까지 진행되었던 화자의 발언 종료점으로 설정하는화자 기록 방법.
- 제 8 항 또는 제 9 항에 있어서,상기 (c) 단계는, 현재 음성 구간의 화자와 이전 음성 구간의 화자가 다르다면 상기 현재 음성 구간의 시작 시점을 상기 이전 음성 구간의 화자에 의한 발언 종료점으로 설정하는화자 기록 방법.
- 제 9 항에 있어서,상기 (d) 단계는, (d1) 상기 녹취 음성 데이터와 상기 (c) 단계에서 기록한 상기 화자 식별 정보를 읽어들이는 단계와,(d2) 상기 (d1) 단계에서 읽어들인 상기 녹취 음성 데이터를 재생하면서 경과 시간을 계측하는 단계와,(d3) 상기 (d2) 단계에서 계측한 경과 시간과 상기 화자 식별 정보 내 구간별 화자 기록 데이터상의 시작 및 종료 시점과 비교하여 해당 시간에 발언을 한 화자의 정보를 획득하는 단계와,(d4) 상기 (d3) 단계에 의해 획득한 화자의 정보가 포함된 상기 화자 식별 정보를 표시하는 단계를 포함하는 화자 기록 방법.
- 제 16 항에 있어서,상기 (d4) 단계는, 상기 화자 식별 정보 중에서 이름이나 아이디를 먼저 표시하여 해당 발언자가 누구인지 표시하고, 별도의 사용자 인터페이스를 통해 추가 정보가 요구될 때에 사전에 등록된 상세 신상 정보를 제공하는화자 기록 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070089141A KR100911830B1 (ko) | 2007-09-03 | 2007-09-03 | 화자 기록 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070089141A KR100911830B1 (ko) | 2007-09-03 | 2007-09-03 | 화자 기록 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090023978A KR20090023978A (ko) | 2009-03-06 |
KR100911830B1 true KR100911830B1 (ko) | 2009-08-13 |
Family
ID=40693120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070089141A Expired - Fee Related KR100911830B1 (ko) | 2007-09-03 | 2007-09-03 | 화자 기록 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100911830B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102246900B1 (ko) | 2014-07-29 | 2021-04-30 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003177776A (ja) | 2001-12-12 | 2003-06-27 | Seiko Instruments Inc | 議事録記録システム |
JP2004287201A (ja) * | 2003-03-24 | 2004-10-14 | Seiko Epson Corp | 議事録作成装置及び方法、ならびに、コンピュータプログラム |
JP2005080110A (ja) | 2003-09-02 | 2005-03-24 | Yamaha Corp | 音声会議システム、音声会議端末装置およびプログラム |
JP2007187880A (ja) * | 2006-01-13 | 2007-07-26 | Nec Corp | モデリング装置、モデリング方法、プログラム |
-
2007
- 2007-09-03 KR KR1020070089141A patent/KR100911830B1/ko not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003177776A (ja) | 2001-12-12 | 2003-06-27 | Seiko Instruments Inc | 議事録記録システム |
JP2004287201A (ja) * | 2003-03-24 | 2004-10-14 | Seiko Epson Corp | 議事録作成装置及び方法、ならびに、コンピュータプログラム |
JP2005080110A (ja) | 2003-09-02 | 2005-03-24 | Yamaha Corp | 音声会議システム、音声会議端末装置およびプログラム |
JP2007187880A (ja) * | 2006-01-13 | 2007-07-26 | Nec Corp | モデリング装置、モデリング方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20090023978A (ko) | 2009-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108346034B (zh) | 一种会议智能管理方法及系统 | |
US6282510B1 (en) | Audio and video transcription system for manipulating real-time testimony | |
CN106782545B (zh) | 一种将音视频数据转化成文字记录的系统和方法 | |
US7848493B2 (en) | System and method for capturing media | |
US20070286573A1 (en) | Audio And Video Transcription System For Manipulating Real-Time Testimony | |
CN108305632B (zh) | 一种会议的语音摘要形成方法及系统 | |
US9064160B2 (en) | Meeting room participant recogniser | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
US8385588B2 (en) | Recording audio metadata for stored images | |
EP2343668B1 (en) | A method and system of processing annotated multimedia documents using granular and hierarchical permissions | |
US9438993B2 (en) | Methods and devices to generate multiple-channel audio recordings | |
TWI536365B (zh) | 聲紋辨識 | |
US9037461B2 (en) | Methods and systems for dictation and transcription | |
CN106024009A (zh) | 音频处理方法及装置 | |
KR20070118038A (ko) | 정보처리 장치 및 정보처리 방법과 컴퓨터·프로그램 | |
WO2016119370A1 (zh) | 一种实现录音的方法、装置和移动终端 | |
WO2016197708A1 (zh) | 一种录音方法及终端 | |
JP2006085440A (ja) | 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム | |
JP2008032825A (ja) | 発言者表示システム、発言者表示方法および発言者表示プログラム | |
CN109065038A (zh) | 一种执法仪的语音控制方法及系统 | |
CN110460798B (zh) | 视频访谈服务处理方法、装置、终端与存储介质 | |
WO2023160288A1 (zh) | 会议纪要生成方法、装置、电子设备和可读存储介质 | |
KR100911830B1 (ko) | 화자 기록 장치 및 방법 | |
JP2005109928A (ja) | 電子会議システム及び電子会議管理方法 | |
CN112017655A (zh) | 一种智能语音收录回放方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
FPAY | Annual fee payment |
Payment date: 20120730 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
L13-X000 | Limitation or reissue of ip right requested |
St.27 status event code: A-2-3-L10-L13-lim-X000 |
|
U15-X000 | Partial renewal or maintenance fee paid modifying the ip right scope |
St.27 status event code: A-4-4-U10-U15-oth-X000 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20130806 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20130806 |
|
PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |