KR102116315B1 - 캐릭터의 음성과 모션 동기화 시스템 - Google Patents
캐릭터의 음성과 모션 동기화 시스템 Download PDFInfo
- Publication number
- KR102116315B1 KR102116315B1 KR1020180162733A KR20180162733A KR102116315B1 KR 102116315 B1 KR102116315 B1 KR 102116315B1 KR 1020180162733 A KR1020180162733 A KR 1020180162733A KR 20180162733 A KR20180162733 A KR 20180162733A KR 102116315 B1 KR102116315 B1 KR 102116315B1
- Authority
- KR
- South Korea
- Prior art keywords
- motion
- character
- voice
- information
- time information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 254
- 230000001360 synchronised effect Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 21
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/055—Time compression or expansion for synchronising with other signals, e.g. video signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/205—3D [Three Dimensional] animation driven by audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/80—2D [Two Dimensional] animation, e.g. using sprites
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
도 2는 또 다른 양상에 따라 캐릭터 애니메이션을 생성하는 합성부가 추가된 캐릭터의 음성과 모션 동기화 시스템을 도시한 블록도이다.
도 3은 일 실시예에 따른 캐릭터의 음성과 모션 동기화 시스템이 음성과 캐릭터 모션을 동기화하는 절차를 나타내는 절차도이다.
도 4는 또 다른 실시예에 따른 캐릭터의 음성과 모션 동기화 시스템의 절차로 동기화전 음성과 영상을 미리 생성하고, 동기화에 따라 생성된 음성과 영상을 변형하여 출력하는 절차를 나타내는 절차도이다.
110: 음성엔진부
120: 캐릭터 모션엔진부
130: 제어부
140: 음성출력부
150: 모션실행부
160: 합성부
Claims (8)
- 입력되는 발화 문장으로부터 음성의 재생 시간 정보를 생성하는 음성엔진부;
입력되는 발화 문장으로부터 발화 문장에 부합되는 캐릭터의 모션 정보와 모션의 실행 시간 정보를 생성하는 캐릭터 모션엔진부;
발화 문장과 발화 문장으로부터 각각 독립적으로 생성되는 음성의 재생 시간 정보 및 모션의 실행 시간 정보를 기초로 변형된 모션의 실행 시간 정보와 변형된 모션의 실행 시간 정보에 동기화되어 변형된 음성의 재생 시간 정보를 생성하는 제어부;
제어부가 제공하는 캐릭터의 모션 정보와 변형된 모션의 실행 시간 정보에 따라 캐릭터의 모션을 실행하는 영상을 생성하여 재생하는 모션실행부; 및
제어부가 제공하는 변형된 음성의 재생 시간 정보에 따라 음성을 생성하여 재생하는 음성출력부;
를 포함하는 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항에 있어서,
음성엔진부 및 캐릭터 모션엔진부에 발화 유형 정보가 더 입력되며,
발화 유형 정보는 발화 문장에서 강조할 영역과 강조의 정도를 나타내는 강조 정보와 음절의 강약 정보와 음절의 장단 정보 중 적어도 하나 이상을 포함하고,
음성엔진부는 발화 유형 정보를 이용하여 발화 문장으로부터 음성의 재생 시간 정보를 생성하고,
캐릭터 모션엔진부는 발화 유형 정보를 이용하여 발화 문장으로부터 발화 문장에 부합되는 캐릭터의 모션 정보와 모션의 실행 시간 정보를 생성하는 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항에 있어서,
캐릭터 모션엔진부가 발화 문장에 포함된 어절, 어절 사이의 공백 또는 단어 중 어느 하나에 부합되는 복수의 캐릭터 모션 정보와 각 모션의 실행 시간 정보를 생성하는 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항 또는 제 2 항에 있어서,
음성엔진부는 발화 문장에 대한 음성을 생성하여 전달하고,
음성출력부는 제어부가 제공하는 변형된 음성의 재생 시간 정보에 따라 음성엔진부가 생성한 음성을 변형하여 재생하는 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항 또는 제 2 항에 있어서,
캐릭터 모션엔진부는 생성된 캐릭터의 모션 정보와 변형된 모션의 실행 시간 정보에 따라 캐릭터의 모션을 실행하는 캐릭터 뼈대의 동작 정보를 생성하여 전달하고,
모션실행부는 제어부가 제공하는 캐릭터의 모션 정보와 변형된 모션의 실행 시간 정보에 따라 캐릭터 모션엔진부가 생성한 캐릭터 뼈대의 동작 정보를 변형하여 캐릭터의 모션을 실행하는 영상을 생성하는 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항에 있어서,
제어부가 음성의 재생 시간 정보를 변형하는 방법은 음절의 발음 시간을 변형하거나 음절 사이의 간격을 변형하는 방법인 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항에 있어서,
캐릭터 모션엔진부가 생성하는 모션의 실행 시간 정보는 모션에 대한 최소 실행 시간과 최대 실행 시간을 포함하고,
제어부가 모션의 실행 시간 정보를 변형하는 방법은 모션의 최소 실행 시간과 최대 실행 시간 범위에서 음성의 재생시간 정보에 따라 모션의 실행 시간을 결정하는 방법인 캐릭터의 음성과 모션 동기화 시스템.
- 제 1 항에 있어서,
모션실행부가 출력하는 영상과 음성출력부가 출력하는 음성을 합성하여 캐릭터 애니메이션을 생성하는 합성부;
를 더 포함하는 캐릭터의 음성과 모션 동기화 시스템.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180162733A KR102116315B1 (ko) | 2018-12-17 | 2018-12-17 | 캐릭터의 음성과 모션 동기화 시스템 |
US16/234,462 US20200193961A1 (en) | 2018-12-17 | 2018-12-27 | System for synchronizing speech and motion of character |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180162733A KR102116315B1 (ko) | 2018-12-17 | 2018-12-17 | 캐릭터의 음성과 모션 동기화 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102116315B1 true KR102116315B1 (ko) | 2020-05-28 |
Family
ID=70920111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180162733A Active KR102116315B1 (ko) | 2018-12-17 | 2018-12-17 | 캐릭터의 음성과 모션 동기화 시스템 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20200193961A1 (ko) |
KR (1) | KR102116315B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102254193B1 (ko) * | 2020-08-12 | 2021-06-02 | 주식회사 오텀리브스 | 3차원 캐릭터를 생성하는 캐릭터 생성 시스템 및 그 방법 |
WO2023096275A1 (ko) * | 2021-11-23 | 2023-06-01 | 네이버 주식회사 | 텍스트 기반 아바타 생성 방법 및 시스템 |
KR20230108599A (ko) * | 2022-01-11 | 2023-07-18 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111933110B (zh) * | 2020-08-12 | 2021-10-29 | 北京字节跳动网络技术有限公司 | 视频生成方法、生成模型训练方法、装置、介质及设备 |
WO2024053848A1 (en) * | 2022-09-06 | 2024-03-14 | Samsung Electronics Co., Ltd. | A method and a system for generating an imaginary avatar of an object |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5111409A (en) * | 1989-07-21 | 1992-05-05 | Elon Gasper | Authoring and use systems for sound synchronized animation |
KR100953979B1 (ko) * | 2009-02-10 | 2010-04-21 | 김재현 | 수화 학습 시스템 |
JP2015148932A (ja) * | 2014-02-06 | 2015-08-20 | Psソリューションズ株式会社 | 音声同期処理装置、音声同期処理プログラム、音声同期処理方法及び音声同期システム |
US20180336891A1 (en) * | 2015-10-29 | 2018-11-22 | Hitachi, Ltd. | Synchronization method for visual information and auditory information and information processing device |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6332123B1 (en) * | 1989-03-08 | 2001-12-18 | Kokusai Denshin Denwa Kabushiki Kaisha | Mouth shape synthesizing |
US5938447A (en) * | 1993-09-24 | 1999-08-17 | Readspeak, Inc. | Method and system for making an audio-visual work with a series of visual word symbols coordinated with oral word utterances and such audio-visual work |
US5983190A (en) * | 1997-05-19 | 1999-11-09 | Microsoft Corporation | Client server animation system for managing interactive user interface characters |
US6307576B1 (en) * | 1997-10-02 | 2001-10-23 | Maury Rosenfeld | Method for automatically animating lip synchronization and facial expression of animated characters |
US6636219B2 (en) * | 1998-02-26 | 2003-10-21 | Learn.Com, Inc. | System and method for automatic animation generation |
US6181351B1 (en) * | 1998-04-13 | 2001-01-30 | Microsoft Corporation | Synchronizing the moveable mouths of animated characters with recorded speech |
US6250928B1 (en) * | 1998-06-22 | 2001-06-26 | Massachusetts Institute Of Technology | Talking facial display method and apparatus |
US7630897B2 (en) * | 1999-09-07 | 2009-12-08 | At&T Intellectual Property Ii, L.P. | Coarticulation method for audio-visual text-to-speech synthesis |
GB0008537D0 (en) * | 2000-04-06 | 2000-05-24 | Ananova Ltd | Character animation |
AU2002232928A1 (en) * | 2000-11-03 | 2002-05-15 | Zoesis, Inc. | Interactive character system |
AU2002950502A0 (en) * | 2002-07-31 | 2002-09-12 | E-Clips Intelligent Agent Technologies Pty Ltd | Animated messaging |
US8224652B2 (en) * | 2008-09-26 | 2012-07-17 | Microsoft Corporation | Speech and text driven HMM-based body animation synthesis |
JP5178607B2 (ja) * | 2009-03-31 | 2013-04-10 | 株式会社バンダイナムコゲームス | プログラム、情報記憶媒体、口形状制御方法及び口形状制御装置 |
US9082400B2 (en) * | 2011-05-06 | 2015-07-14 | Seyyer, Inc. | Video generation based on text |
US10262644B2 (en) * | 2012-03-29 | 2019-04-16 | Smule, Inc. | Computationally-assisted musical sequencing and/or composition techniques for social music challenge or competition |
US9280844B2 (en) * | 2013-03-12 | 2016-03-08 | Comcast Cable Communications, Llc | Animation |
US10360716B1 (en) * | 2015-09-18 | 2019-07-23 | Amazon Technologies, Inc. | Enhanced avatar animation |
US11145100B2 (en) * | 2017-01-12 | 2021-10-12 | The Regents Of The University Of Colorado, A Body Corporate | Method and system for implementing three-dimensional facial modeling and visual speech synthesis |
US10467792B1 (en) * | 2017-08-24 | 2019-11-05 | Amazon Technologies, Inc. | Simulating communication expressions using virtual objects |
US10580046B2 (en) * | 2017-10-18 | 2020-03-03 | Criteo S.A. | Programmatic generation and optimization of animation for a computerized graphical advertisement display |
US10521946B1 (en) * | 2017-11-21 | 2019-12-31 | Amazon Technologies, Inc. | Processing speech to drive animations on avatars |
US10586369B1 (en) * | 2018-01-31 | 2020-03-10 | Amazon Technologies, Inc. | Using dialog and contextual data of a virtual reality environment to create metadata to drive avatar animation |
-
2018
- 2018-12-17 KR KR1020180162733A patent/KR102116315B1/ko active Active
- 2018-12-27 US US16/234,462 patent/US20200193961A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5111409A (en) * | 1989-07-21 | 1992-05-05 | Elon Gasper | Authoring and use systems for sound synchronized animation |
KR100953979B1 (ko) * | 2009-02-10 | 2010-04-21 | 김재현 | 수화 학습 시스템 |
JP2015148932A (ja) * | 2014-02-06 | 2015-08-20 | Psソリューションズ株式会社 | 音声同期処理装置、音声同期処理プログラム、音声同期処理方法及び音声同期システム |
US20180336891A1 (en) * | 2015-10-29 | 2018-11-22 | Hitachi, Ltd. | Synchronization method for visual information and auditory information and information processing device |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102254193B1 (ko) * | 2020-08-12 | 2021-06-02 | 주식회사 오텀리브스 | 3차원 캐릭터를 생성하는 캐릭터 생성 시스템 및 그 방법 |
WO2023096275A1 (ko) * | 2021-11-23 | 2023-06-01 | 네이버 주식회사 | 텍스트 기반 아바타 생성 방법 및 시스템 |
KR20230108599A (ko) * | 2022-01-11 | 2023-07-18 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
KR102643796B1 (ko) * | 2022-01-11 | 2024-03-06 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
US20200193961A1 (en) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102116315B1 (ko) | 캐릭터의 음성과 모션 동기화 시스템 | |
WO2022048403A1 (zh) | 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端 | |
KR102116309B1 (ko) | 가상 캐릭터와 텍스트의 동기화 애니메이션 출력 시스템 | |
US6813607B1 (en) | Translingual visual speech synthesis | |
CN113454708A (zh) | 语言学风格匹配代理 | |
KR102035596B1 (ko) | 인공지능 기반의 가상 캐릭터의 페이셜 애니메이션 자동 생성 시스템 및 방법 | |
KR102360839B1 (ko) | 머신 러닝 기반의 발화 동영상 생성 방법 및 장치 | |
US6661418B1 (en) | Character animation system | |
CN111276120A (zh) | 语音合成方法、装置和计算机可读存储介质 | |
JP2001209820A (ja) | 感情表出装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
JP2022518721A (ja) | 発話アニメーションのリアルタイム生成 | |
JP7227395B2 (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記憶媒体 | |
GB2516965A (en) | Synthetic audiovisual storyteller | |
KR102346755B1 (ko) | 음성 신호를 이용한 발화 동영상 생성 방법 및 장치 | |
JPH11339058A (ja) | 人物像対話装置及び人物像対話プログラムを記録した記録媒体 | |
KR20190114150A (ko) | 비디오 번역 및 립싱크 방법 및 시스템 | |
KR102489498B1 (ko) | 음성 합성 및 영상 합성 기술을 통해 고인을 모사하는 가상 인물과 커뮤니케이션을 수행하는 방법 및 시스템 | |
WO2021182199A1 (ja) | 情報処理方法、情報処理装置及び情報処理プログラム | |
KR101089184B1 (ko) | 캐릭터의 발화와 감정표현 제공 시스템 및 방법 | |
KR20220163623A (ko) | 머신 러닝 기반의 립싱크 영상 생성을 위한 학습 방법 및 이를 수행하기 위한 립싱크 영상 생성 장치 | |
KR102778688B1 (ko) | 사람 음성에 따른 실사인물의 발화 영상 합성 시스템 | |
KR102360840B1 (ko) | 텍스트를 이용한 발화 동영상 생성 방법 및 장치 | |
Karpov et al. | Multimodal synthesizer for Russian and Czech sign languages and audio-visual speech | |
JP5531654B2 (ja) | 制御情報生成装置および形状制御装置 | |
WO2024060873A1 (zh) | 动态影像的生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20181217 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190928 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200427 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200522 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200522 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230522 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240206 Start annual number: 5 End annual number: 5 |