KR101597286B1 - 아바타 영상 메시지를 생성하는 장치 및 방법 - Google Patents
아바타 영상 메시지를 생성하는 장치 및 방법 Download PDFInfo
- Publication number
- KR101597286B1 KR101597286B1 KR1020090039786A KR20090039786A KR101597286B1 KR 101597286 B1 KR101597286 B1 KR 101597286B1 KR 1020090039786 A KR1020090039786 A KR 1020090039786A KR 20090039786 A KR20090039786 A KR 20090039786A KR 101597286 B1 KR101597286 B1 KR 101597286B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- voice
- information
- editable
- editing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/18—Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
Claims (18)
- 사용자 음성을 수신하는 오디오 입력부;사용자 입력을 수신하는 사용자 입력부;표시 정보를 출력하는 표시부; 및상기 사용자 음성에 대한 음성 인식을 수행하여 편집 정보를 생성하고, 상기 편집 정보를 이용하여 상기 음성을 편집하고, 상기 편집된 음성에 따른 아바타 애니메이션을 생성하고, 상기 편집된 음성과 상기 아바타 애니메이션을 이용하여 아바타 영상 메시지를 생성하는 제어부;를 포함하며,상기 편집 정보는 상기 음성으로부터 변환된 단어열 및 상기 단어열에 포함된 단어 각각에 대응하는 음성 구간에 대한 싱크 정보를 포함하고,상기 제어부는 상기 단어열에 포함된 적어도 2개의 단어에 대하여 연음으로 인식되는 정도를 나타내는 연음 스코어 및 비연음으로 인식되는 정도를 나타내는 비연음 스코어를 계산하고, 상기 연음 스코어로부터 상기 비연음 스코어를 차감한 차이값이 임계값 이하인 경우 상기 적어도 2개의 단어가 비연음으로 발성된 것으로 결정하고, 상기 비연음으로 발성된 것으로 결정된 적어도 2개의 단어 사이의 경계로 상기 편집 가능한 위치를 결정하는 아바타 영상 메시지 생성 장치.
- 삭제
- 제1항에 있어서,상기 제어부는 상기 단어열에서 편집 가능한 위치를 결정하여 상기 편집 가능한 위치를 나타내는 정보를 상기 표시부로 출력하는 아바타 영상 메시지 생성 장치.
- 제3항에 있어서,상기 편집 가능한 위치를 나타내는 정보는 상기 단어열을 편집 가능한 단위로 구분하여 표시하기 위한 시각적 표시 정보를 포함하는 아바타 영상 메시지 생성 장치.
- 제4항에 있어서,상기 제어부는 상기 시각적 표시 정보로서 상기 단어열에서 편집 가능한 단위로 움직이는 커서가 제공되도록 상기 표시부를 제어하는 아바타 영상 메시지 생성 장치.
- 제3항에 있어서,상기 제어부는 상기 사용자 입력 신호에 따라 상기 편집 가능한 위치에서 상기 단어열을 편집하는 아바타 영상 메시지 생성 장치.
- 제3항에 있어서,상기 제어부는 상기 편집 가능한 위치를 상기 단어열에 포함된 단어들에 대응하는 음성 구간 사이의 경계들 중 에너지가 소정 임계값 이하인 위치로 결정하는 아바타 영상 메시지 생성 장치.
- 삭제
- 제1항에 있어서,상기 제어부는 음성에 대응하는 단어열에 포함된 적어도 하나의 단어를 삭제하는 동작, 상기 단어열에 포함된 적어도 하나의 단어를 새로운 단어로 수정하는 동작 및 상기 단어열에 새로운 단어를 삽입하는 동작 중 적어도 하나의 동작을 이용하여 음성을 편집하는 아바타 영상 메시지 생성 장치.
- 제1항에 있어서,상기 제어부는 음성에 대응하는 단어열에 포함된 적어도 하나의 단어를 수정하거나, 상기 단어열에 새로운 단어를 삽입하기 위하여 새로운 음성이 입력되는 경우, 상기 새로운 음성에 포함된 묵음 부분을 단축하는 묵음 길이 보정부를 포함하는 아바타 영상 메시지 생성 장치.
- 입력되는 음성에 대한 음성 인식을 수행하는 단계;음성 인식 수행에 따라 편집 정보를 생성하는 단계;상기 편집 정보를 이용하여 상기 음성을 편집하는 단계;상기 편집된 음성에 따른 아바타 애니메이션을 생성하는 단계; 및상기 편집된 음성과 상기 아바타 애니메이션을 이용하여 아바타 영상 메시지를 생성하는 단계를 포함하며,상기 편집 정보는 상기 음성으로부터 변환된 단어열 및 상기 단어열에 포함된 단어 각각에 대응하는 음성 구간에 대한 싱크 정보를 포함하고,상기 편집 가능한 위치는 상기 단어열에 포함된 적어도 2개의 단어가 발음될 때 연음으로 인식되는 정도를 나타내는 연음 스코어로부터 비연음으로 인식되는 정도를 나타내는 비연음 스코어를 차감한 차이값이 임계값 이하인 경우, 상기 적어도 2개의 단어의 경계의 위치로 결정되는 아바타 영상 메시지 생성 방법.
- 삭제
- 제11항에 있어서,상기 음성을 편집하는 단계는,상기 단어열에서 편집 가능한 위치를 결정하여 상기 편집 가능한 위치를 나타내는 정보를 표시하는 단계; 및사용자 입력 신호에 따라 선택된 편집 가능한 위치에서 상기 단어열을 편집하는 단계를 포함하는 아바타 영상 메시지 생성 방법.
- 제13항에 있어서,상기 편집 가능한 위치를 나타내는 정보는 상기 단어열을 편집 가능한 단위 로 구분하여 표시하기 위한 시각적 표시 정보를 포함하는 아바타 영상 메시지 생성 방법.
- 제13항에 있어서,상기 편집 가능한 위치는 상기 단어열에 포함된 단어들에 대응하는 음성 구간 사이의 경계들 중 에너지가 소정 임계값 이하인 위치로 결정되는 아바타 영상 메시지 생성 방법.
- 삭제
- 제11항에 있어서,상기 음성을 편집하는 단계에서,상기 음성에 대응하는 단어열에 포함된 적어도 하나의 단어를 삭제하는 동작, 상기 단어열에 포함된 적어도 하나의 단어를 새로운 단어로 수정하는 동작, 및 상기 단어열에 새로운 단어를 삽입하는 동작 중 적어도 하나의 동작이 수행되는 아바타 영상 메시지 생성 방법.
- 제11항에 있어서,상기 음성을 편집하는 단계에서, 상기 음성에 대응하는 단어열에 포함된 적어도 하나의 단어를 수정하거나 상기 단어열에 새로운 단어를 삽입하기 위하여 새로운 음성이 입력되는 경우, 상기 새로운 음성에 포함된 묵음 부분을 단축하는 아바타 영상 메시지 생성 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090039786A KR101597286B1 (ko) | 2009-05-07 | 2009-05-07 | 아바타 영상 메시지를 생성하는 장치 및 방법 |
US12/754,303 US8566101B2 (en) | 2009-05-07 | 2010-04-05 | Apparatus and method for generating avatar based video message |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090039786A KR101597286B1 (ko) | 2009-05-07 | 2009-05-07 | 아바타 영상 메시지를 생성하는 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100120917A KR20100120917A (ko) | 2010-11-17 |
KR101597286B1 true KR101597286B1 (ko) | 2016-02-25 |
Family
ID=43062884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090039786A Expired - Fee Related KR101597286B1 (ko) | 2009-05-07 | 2009-05-07 | 아바타 영상 메시지를 생성하는 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8566101B2 (ko) |
KR (1) | KR101597286B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022149661A1 (ko) * | 2021-01-06 | 2022-07-14 | 주식회사 헤이스타즈 | 인물 사진으로부터 생성된 아바타를 이용한 어학 콘텐츠 제공 방법 및 장치 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2050086A2 (en) * | 2006-07-12 | 2009-04-22 | Medical Cyberworlds, Inc. | Computerized medical training system |
KR101234653B1 (ko) | 2010-11-30 | 2013-02-19 | 기아자동차주식회사 | 가변 밸브 리프트 장치 |
KR101246287B1 (ko) * | 2011-03-28 | 2013-03-21 | (주)클루소프트 | 음가의 강세를 이용한 발음기관 애니메이션 생성 장치 및 방법 |
WO2013152453A1 (en) * | 2012-04-09 | 2013-10-17 | Intel Corporation | Communication using interactive avatars |
US10250537B2 (en) | 2014-02-12 | 2019-04-02 | Mark H. Young | Methods and apparatuses for animated messaging between messaging participants represented by avatar |
US11527265B2 (en) * | 2018-11-02 | 2022-12-13 | BriefCam Ltd. | Method and system for automatic object-aware video or audio redaction |
GB2606131A (en) * | 2021-03-12 | 2022-11-02 | Palringo Ltd | Communication platform |
GB2606713A (en) | 2021-05-13 | 2022-11-23 | Twyn Ltd | Video-based conversational interface |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297188A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5799276A (en) * | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
US7139767B1 (en) * | 1999-03-05 | 2006-11-21 | Canon Kabushiki Kaisha | Image processing apparatus and database |
US7110945B2 (en) * | 1999-07-16 | 2006-09-19 | Dreamations Llc | Interactive book |
JP3417355B2 (ja) | 1999-08-23 | 2003-06-16 | 日本電気株式会社 | 音声エディット装置及びプログラムを記録した機械読み取り可能な記録媒体 |
KR20010058733A (ko) | 1999-12-30 | 2001-07-06 | 서평원 | 이동통신 단말기의 메시지 송수신 방법 |
US7203648B1 (en) * | 2000-11-03 | 2007-04-10 | At&T Corp. | Method for sending multi-media messages with customized audio |
KR100369804B1 (ko) | 2001-02-14 | 2003-01-30 | 삼성전자 주식회사 | 휴대 전화 단말 시스템의 음성 인식 단문 메시지 전송장치 및 방법 |
KR20010035529A (ko) * | 2001-02-27 | 2001-05-07 | 이병관 | 음성 캐릭터 메시지 전송방법, 음성캐릭터 메시징 서비스시스템 |
KR20020003833A (ko) | 2001-08-22 | 2002-01-15 | 백종관 | 음성아바타를 이용한 이메일 또는 채팅 시스템에서음향효과가 가미된 음성메일 또는 음성채팅 방법 |
KR20030086756A (ko) | 2002-05-06 | 2003-11-12 | 인포뱅크 주식회사 | 음성 메시지 제공 방법 |
KR20040025029A (ko) | 2002-09-18 | 2004-03-24 | (주)아이엠에이테크놀로지 | 유무선통신단말기의 문자데이터 입력을 통한 영상데이터전송방법 |
KR20040051921A (ko) | 2002-12-13 | 2004-06-19 | 삼성전자주식회사 | 아바타 서비스를 제공하기 위한 이동통신 시스템 및 방법 |
KR20040076524A (ko) * | 2003-02-26 | 2004-09-01 | 주식회사 메세지 베이 아시아 | 애니메이션 캐릭터 제작 방법 및 애니메이션 캐릭터를이용한 인터넷 서비스 시스템 |
KR20040093510A (ko) | 2003-04-30 | 2004-11-06 | 주식회사 모보테크 | 단문 메시지를 이용한 음성 메시지 전송 방법 |
KR100573182B1 (ko) | 2003-05-30 | 2006-04-24 | 에스케이 텔레콤주식회사 | 전화 통화시 아바타 영상 서비스를 제공하는 방법 및 시스템 |
CN100353417C (zh) | 2003-09-23 | 2007-12-05 | 摩托罗拉公司 | 用于提供文本消息的方法和装置 |
KR100643415B1 (ko) | 2005-01-05 | 2006-11-10 | 엘지전자 주식회사 | 이동 단말기의 3차원 아바타 메신저 시스템 |
KR20060104324A (ko) * | 2005-03-30 | 2006-10-09 | 주식회사 케이티프리텔 | 캐릭터 합성 메시지 전송 방법 및 시스템 |
US20080151786A1 (en) * | 2006-12-21 | 2008-06-26 | Motorola, Inc. | Method and apparatus for hybrid audio-visual communication |
US9811935B2 (en) * | 2007-04-26 | 2017-11-07 | Ford Global Technologies, Llc | Emotive advisory system and method |
US8111281B2 (en) * | 2007-06-29 | 2012-02-07 | Sony Ericsson Mobile Communications Ab | Methods and terminals that control avatars during videoconferencing and other communications |
US7953255B2 (en) * | 2008-05-01 | 2011-05-31 | At&T Intellectual Property I, L.P. | Avatars in social interactive television |
US20100057455A1 (en) * | 2008-08-26 | 2010-03-04 | Ig-Jae Kim | Method and System for 3D Lip-Synch Generation with Data-Faithful Machine Learning |
US20100137030A1 (en) * | 2008-12-02 | 2010-06-03 | Motorola, Inc. | Filtering a list of audible items |
US20100153858A1 (en) * | 2008-12-11 | 2010-06-17 | Paul Gausman | Uniform virtual environments |
-
2009
- 2009-05-07 KR KR1020090039786A patent/KR101597286B1/ko not_active Expired - Fee Related
-
2010
- 2010-04-05 US US12/754,303 patent/US8566101B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297188A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022149661A1 (ko) * | 2021-01-06 | 2022-07-14 | 주식회사 헤이스타즈 | 인물 사진으로부터 생성된 아바타를 이용한 어학 콘텐츠 제공 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
US20100286987A1 (en) | 2010-11-11 |
US8566101B2 (en) | 2013-10-22 |
KR20100120917A (ko) | 2010-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101597286B1 (ko) | 아바타 영상 메시지를 생성하는 장치 및 방법 | |
US8793133B2 (en) | Systems and methods document narration | |
US20190196666A1 (en) | Systems and Methods Document Narration | |
US9478219B2 (en) | Audio synchronization for document narration with user-selected playback | |
US8954328B2 (en) | Systems and methods for document narration with multiple characters having multiple moods | |
US8594995B2 (en) | Multilingual asynchronous communications of speech messages recorded in digital media files | |
CN106486121B (zh) | 应用于智能机器人的语音优化方法及装置 | |
CN107077840B (zh) | 语音合成装置和方法 | |
JPH10153998A (ja) | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 | |
JP2002244688A (ja) | 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
EP3509062A1 (en) | Information processing device, information processing method, and program | |
KR20110131768A (ko) | 발음기관 애니메이션 생성 장치 및 방법 | |
JP2012181358A (ja) | テキスト表示時間決定装置、テキスト表示システム、方法およびプログラム | |
KR101089184B1 (ko) | 캐릭터의 발화와 감정표현 제공 시스템 및 방법 | |
CN117351929A (zh) | 翻译方法、装置、电子设备和存储介质 | |
CN115956269A (zh) | 语音转换装置、语音转换方法、程序及记录介质 | |
JP2011186143A (ja) | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
Adell et al. | Modelling filled pauses prosody to synthesise disfluent speech | |
EP0982684A1 (en) | Moving picture generating device and image control network learning device | |
JP4409279B2 (ja) | 音声合成装置及び音声合成プログラム | |
CN117372588A (zh) | 口型图像生成方法及装置 | |
CN110767204A (zh) | 声音处理方法、装置及存储介质 | |
CN116580696A (zh) | 基于情感识别的语音流合成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20090507 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20140502 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20090507 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150521 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20151125 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160218 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160218 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20191130 |