JP5772739B2 - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP5772739B2 JP5772739B2 JP2012139455A JP2012139455A JP5772739B2 JP 5772739 B2 JP5772739 B2 JP 5772739B2 JP 2012139455 A JP2012139455 A JP 2012139455A JP 2012139455 A JP2012139455 A JP 2012139455A JP 5772739 B2 JP5772739 B2 JP 5772739B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- voice
- spectrum
- fundamental frequency
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Description
以上に例示した形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
Claims (6)
- 目標声質の音声を示す第1音声信号の基本周波数を、前記目標声質とは相違する初期声質の音声を示す第2音声信号の基本周波数に時間領域で調整する調整処理手段と、
前記調整処理手段による調整後の第1音声信号のスペクトルを調波成分毎に区分した各調波帯域成分を、前記調整処理手段による調整前の前記第1音声信号のスペクトルの第i次の調波成分の近傍に第i番目の調波帯域成分が位置するように、前記第2音声信号の基本周波数に対応する各調波周波数に配置するとともに、各調波帯域成分の包絡線および位相を前記第2音声信号のスペクトルの包絡線および位相に応じて調整したスペクトルを順次に生成する声質変換手段と
を具備する音声処理装置。 - 前記声質変換手段は、前記第2音声信号の基本周波数が前記第1音声信号の基本周波数を上回る場合、前記調整処理手段による調整後の第1音声信号のスペクトルの複数の調波帯域成分を間引いて前記各調波周波数に配置し、前記第2音声信号の基本周波数が前記第1音声信号の基本周波数を下回る場合、前記調整処理手段による調整後の第1音声信号のスペクトルの各調波帯域成分を反復して前記各調波周波数に配置する
請求項1の音声処理装置。 - 前記第1音声信号のスペクトルを生成する解析処理手段を具備し、
前記第2音声信号の基本周波数が前記第1音声信号の基本周波数を上回る場合、前記調整処理手段による時間領域での基本周波数の調整後に前記解析処理手段による前記第1音声信号のスペクトルの生成が実行される一方、前記第2音声信号の基本周波数が前記第1音声信号の基本周波数を下回る場合、前記解析処理手段による前記第1音声信号のスペクトルの生成後に基本周波数の調整が実行される
請求項1または請求項2の音声処理装置。 - 前記調整処理手段は、前記第1音声信号の基本周波数と前記第2音声信号の基本周波数とに応じた比率で前記第1音声信号を標本化することで基本周波数を調整する
請求項1から請求項3の何れかの音声処理装置。 - 特定の音素を前記目標声質で定常的に発声した音声を示す目標音声信号の各区間を時間軸上で相互に連結することで前記第1音声信号を生成する継続処理手段
を具備する請求項1から請求項4の何れかの音声処理装置。 - 前記第2音声信号のスペクトルと前記声質変換手段による処理後のスペクトルとを加重加算する混合処理手段
を具備する請求項1から請求項5の何れかの音声処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012139455A JP5772739B2 (ja) | 2012-06-21 | 2012-06-21 | 音声処理装置 |
US13/923,203 US9286906B2 (en) | 2012-06-21 | 2013-06-20 | Voice processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012139455A JP5772739B2 (ja) | 2012-06-21 | 2012-06-21 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014002338A JP2014002338A (ja) | 2014-01-09 |
JP5772739B2 true JP5772739B2 (ja) | 2015-09-02 |
Family
ID=49779002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012139455A Active JP5772739B2 (ja) | 2012-06-21 | 2012-06-21 | 音声処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9286906B2 (ja) |
JP (1) | JP5772739B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109192218A (zh) * | 2018-09-13 | 2019-01-11 | 广州酷狗计算机科技有限公司 | 音频处理的方法和装置 |
US11756558B2 (en) | 2019-02-20 | 2023-09-12 | Yamaha Corporation | Sound signal generation method, generative model training method, sound signal generation system, and recording medium |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6409417B2 (ja) * | 2014-08-29 | 2018-10-24 | ヤマハ株式会社 | 音響処理装置 |
JP6428256B2 (ja) * | 2014-12-25 | 2018-11-28 | ヤマハ株式会社 | 音声処理装置 |
JP6561499B2 (ja) * | 2015-03-05 | 2019-08-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
CN106887241A (zh) * | 2016-10-12 | 2017-06-23 | 阿里巴巴集团控股有限公司 | 一种语音信号检测方法与装置 |
JP6683103B2 (ja) * | 2016-11-07 | 2020-04-15 | ヤマハ株式会社 | 音声合成方法 |
JP6822075B2 (ja) * | 2016-11-07 | 2021-01-27 | ヤマハ株式会社 | 音声合成方法 |
JP6834370B2 (ja) * | 2016-11-07 | 2021-02-24 | ヤマハ株式会社 | 音声合成方法 |
WO2018084305A1 (ja) | 2016-11-07 | 2018-05-11 | ヤマハ株式会社 | 音声合成方法 |
US11233756B2 (en) * | 2017-04-07 | 2022-01-25 | Microsoft Technology Licensing, Llc | Voice forwarding in automated chatting |
JP6724932B2 (ja) | 2018-01-11 | 2020-07-15 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
JP7139628B2 (ja) * | 2018-03-09 | 2022-09-21 | ヤマハ株式会社 | 音処理方法および音処理装置 |
JP6992612B2 (ja) | 2018-03-09 | 2022-01-13 | ヤマハ株式会社 | 音声処理方法および音声処理装置 |
TWI658458B (zh) * | 2018-05-17 | 2019-05-01 | 張智星 | 歌聲分離效能提升之方法、非暫態電腦可讀取媒體及電腦程式產品 |
US20190362737A1 (en) * | 2018-05-25 | 2019-11-28 | i2x GmbH | Modifying voice data of a conversation to achieve a desired outcome |
CN109065068B (zh) * | 2018-08-17 | 2021-03-30 | 广州酷狗计算机科技有限公司 | 音频处理方法、装置及存储介质 |
JP2020194098A (ja) * | 2019-05-29 | 2020-12-03 | ヤマハ株式会社 | 推定モデル確立方法、推定モデル確立装置、プログラムおよび訓練データ準備方法 |
JP7326879B2 (ja) * | 2019-05-30 | 2023-08-16 | セイコーエプソン株式会社 | 半導体装置、電子機器及び移動体 |
US11094328B2 (en) * | 2019-09-27 | 2021-08-17 | Ncr Corporation | Conferencing audio manipulation for inclusion and accessibility |
CN113241082B (zh) * | 2021-04-22 | 2024-02-20 | 杭州网易智企科技有限公司 | 变声方法、装置、设备和介质 |
CN114360572A (zh) * | 2022-01-20 | 2022-04-15 | 百果园技术(新加坡)有限公司 | 语音去噪方法、装置、电子设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5567901A (en) * | 1995-01-18 | 1996-10-22 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US6336092B1 (en) * | 1997-04-28 | 2002-01-01 | Ivl Technologies Ltd | Targeted vocal transformation |
JP3706249B2 (ja) * | 1998-06-16 | 2005-10-12 | ヤマハ株式会社 | 音声変換装置、音声変換方法、および音声変換プログラムを記録した記録媒体 |
JP4245114B2 (ja) * | 2000-12-22 | 2009-03-25 | ローランド株式会社 | 音色制御装置 |
FR2868586A1 (fr) * | 2004-03-31 | 2005-10-07 | France Telecom | Procede et systeme ameliores de conversion d'un signal vocal |
JP4089665B2 (ja) * | 2004-08-25 | 2008-05-28 | ヤマハ株式会社 | ピッチ変換装置とプログラム |
JP4428435B2 (ja) * | 2007-10-15 | 2010-03-10 | ヤマハ株式会社 | ピッチ変換装置とプログラム |
-
2012
- 2012-06-21 JP JP2012139455A patent/JP5772739B2/ja active Active
-
2013
- 2013-06-20 US US13/923,203 patent/US9286906B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109192218A (zh) * | 2018-09-13 | 2019-01-11 | 广州酷狗计算机科技有限公司 | 音频处理的方法和装置 |
CN109192218B (zh) * | 2018-09-13 | 2021-05-07 | 广州酷狗计算机科技有限公司 | 音频处理的方法和装置 |
US11756558B2 (en) | 2019-02-20 | 2023-09-12 | Yamaha Corporation | Sound signal generation method, generative model training method, sound signal generation system, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
US20140006018A1 (en) | 2014-01-02 |
US9286906B2 (en) | 2016-03-15 |
JP2014002338A (ja) | 2014-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5772739B2 (ja) | 音声処理装置 | |
US8706496B2 (en) | Audio signal transforming by utilizing a computational cost function | |
CN111542875B (zh) | 声音合成方法、声音合成装置及存储介质 | |
JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
JP5961950B2 (ja) | 音声処理装置 | |
CN111418005B (zh) | 声音合成方法、声音合成装置及存储介质 | |
US20210375248A1 (en) | Sound signal synthesis method, generative model training method, sound signal synthesis system, and recording medium | |
US11289066B2 (en) | Voice synthesis apparatus and voice synthesis method utilizing diphones or triphones and machine learning | |
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
JP2016161919A (ja) | 音声合成装置 | |
WO2020095951A1 (ja) | 音響処理方法および音響処理システム | |
JP2006215204A (ja) | 音声合成装置およびプログラム | |
JP6977818B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
US20090222268A1 (en) | Speech synthesis system having artificial excitation signal | |
CN1647152A (zh) | 合成语音的方法 | |
US11756558B2 (en) | Sound signal generation method, generative model training method, sound signal generation system, and recording medium | |
JP2015118334A (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
JP2012063501A (ja) | 音声処理装置 | |
JP6056190B2 (ja) | 音声合成装置 | |
JP2005004105A (ja) | 信号生成装置及び信号生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140620 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141225 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150615 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5772739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |