TWI692719B - 音訊處理方法與音訊處理系統 - Google Patents
音訊處理方法與音訊處理系統 Download PDFInfo
- Publication number
- TWI692719B TWI692719B TW108109843A TW108109843A TWI692719B TW I692719 B TWI692719 B TW I692719B TW 108109843 A TW108109843 A TW 108109843A TW 108109843 A TW108109843 A TW 108109843A TW I692719 B TWI692719 B TW I692719B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- channel
- left channel
- translation
- weighted
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
本發明提供一種音訊處理方法與音訊處理系統。此音訊處理系統包含分類模組、轉換模組、平移模組、寬廣化模組及逆轉換模組。在此音訊處理方法中,首先提供聲音訊號。接著,提供多個類別。然後,根據這些類別來對聲音訊號進行分類步驟。接著,對聲音訊號進行轉換步驟,以將聲音訊號轉換至頻域。然後,對聲音訊號之振幅訊號進行平移步驟和加總步驟,以獲得加總振幅訊號。接著,對聲音訊號之相位訊號進行分離步驟和加總步驟,以獲得加總相位訊號。然後,對加總振幅訊號和加總相位訊號進行逆轉換步驟,以獲得對應至時域之一已優化聲音訊號。
Description
本發明是有關於一種音訊處理方法與音訊處理系統,且特別是有關於一種讓音效更寬廣與立體之音訊處理方法與音訊處理系統。
當人聽到由一音源產生的聲音信號時,此聲音信號通常會在兩個不同的時間到達人的左耳與右耳,且具有不同的音量大小。人的大腦解讀這些時間和音量大小的差異,而產生一聽覺場景(auditory scene)。立體聲(stereo)是一種聽覺場景的產生方法,其係透過多個獨立音效通道來提供聲音訊號至多個揚聲器,這些揚聲器以對稱的方式來排列,如此揚聲器可產生聽覺場景。一般而言,立體聲係透過雙聲道來實現。
本發明之一方面在於提供一種音訊處理方法與音訊處理系統,以優化立體聲的聽覺場景。
根據本發明之一些實施例,在上述的音訊處理
方法中,首先提供一輸入聲音訊號。接著,提供複數個類別。這些類別係一對一地對應至複數個處理參數組,每一處理參數組包含一平移角度曲線、一分離曲線以及一權重參數。然後,根據這些類別來對聲音訊號進行分類步驟,以獲得輸入聲音訊號所對應之輸入聲音類別,以及對應輸入聲音類別之平移角度曲線、分離曲線與權重參數,其中輸入聲音類別為上述類別之其中一者。接著,對輸入聲音訊號進行轉換步驟,以將輸入聲音訊號轉換至頻域,並獲得輸入聲音訊號所對應之振幅訊號和相位訊號。然後,根據輸入聲音訊號之輸入聲音類別以及輸入聲音類別所對應之平移角度曲線和權重參數,對輸入聲音訊號所對應之振幅訊號進行平移步驟,以獲得輸入聲音訊號之加權平移振幅訊號。接著,將加權平移振幅訊號加總,以獲得加總振幅訊號。然後,根據輸入聲音訊號之輸入聲音類別以及輸入聲音類別所對應之分離曲線和權重參數,對輸入聲音訊號所對應之相位訊號進行分離步驟,以獲得輸入聲音訊號之加權分離相位訊號。當加權平移振幅訊號之數量以及加權分離相位訊號之數量為一時,對加權平移振幅訊號和加權分離相位訊號進行逆轉換步驟,以獲得對應至時域之已優化聲音訊號。
根據本發明之一實施例,在上述之平移步驟中,首先根據輸入聲音類別所對應之平移角度曲線來計算一平移曲線。接著,將輸入聲音類別所對應之平移曲線乘以子聲音類別所對應之權重參數,以獲得輸入聲音訊號所對應之加權平移曲線。接著,將輸入聲音訊號所對應之振幅訊號乘
以相應之加權平移曲線,以獲得上述之加權平移振幅訊號。
根據本發明之一實施例,在上述之分離步驟中,首先將輸入聲音訊號所對應之相位訊號與相應之分離曲線相加,以獲得輸入聲音訊號所對應之一分離相位訊號。接著,將分離相位訊號與相應之權重參數相乘,以獲得上述之加權分離相位訊號。
根據本發明之一實施例,當加權平移振幅訊號之數量以及加權分離相位訊號之數量大於一時,將加權平移振幅訊號加總以獲得加總振幅訊號,以及將加權分離相位訊號加總以獲得一加總相位訊號;以及對加總振幅訊號和加總相位訊號進行逆轉換步驟,以獲得對應至時域之已優化聲音訊號。
根據本發明之一實施例,上述之轉換步驟為傅立葉轉換(Fourier Transform),上述之逆轉換步驟為逆傅立葉轉換(Inverse Fourier Transform)。
根據本發明之一些實施例,在上述的音訊處理方法中,首先提供輸入聲音訊號,其中此輸入聲音訊號包含左聲道輸入訊號和右聲道輸入訊號。接著,提供複數個類別。這些類別係一對一地對應至複數個處理參數組,每一處理參數組包含平移角度曲線、第一分離曲線、第二分離曲線以及一權重參數,其中第一分離曲線係對應至左聲道,第二分離曲線係對應右聲道。然後,根據這些類別來對左聲道輸入訊號進行第一分類步驟,以獲得左聲道輸入訊號所對應之一左聲道聲音類別,並根據左聲道聲音類別來獲得左聲道輸
入訊號所對應之左聲道平移角度曲線、左聲道分離曲線與左聲道權重參數。接著,根據上述之類別來對右聲道輸入訊號進行第二分類步驟,以獲得右聲道輸入訊號所對應之一右聲道聲音類別,並根據右聲道輸入訊號所對應之右聲道聲音類別來獲得右聲道平移角度曲線、右聲道分離曲線與右聲道權重參數。左聲道聲音類別為上述之類別之其中一者,右聲道聲音類別為上述之類別之其中一者。接著,進行左聲道音訊調整步驟。在左聲道音訊調整步驟中,首先進行第一轉換步驟,以將左聲道輸入訊號轉換至頻域,並獲得左聲道輸入訊號所對應之左聲道振幅訊號和左聲道相位訊號。然後,根據左聲道輸入訊號所對應之左聲道平移角度曲線和左聲道權重參數,對左聲道輸入訊號所對應之左聲道振幅訊號進行第一平移步驟,以獲得左聲道輸入訊號之左聲道加權平移振幅訊號。然後,根據左聲道輸入訊號所對應之左聲道分離曲線和左聲道權重參數,對左聲道輸入訊號所對應之左聲道相位訊號進行第一分離步驟,以獲得左聲道輸入訊號之左聲道加權分離相位訊號。然後,當左聲道加權平移振幅訊號之數量以及左聲道加權分離相位訊號之數量為一時,對左聲道加權平移振幅訊號和左聲道加權分離相位訊號進行第一逆轉換步驟,以獲得對應至時域之已優化左聲道聲音訊號。接著,進行右聲道音訊調整步驟。在右聲道音訊調整步驟中,首先進行第二轉換步驟,以將右聲道輸入訊號轉換至頻域,並獲得右聲道輸入訊號所對應之右聲道振幅訊號和右聲道相位訊號。然後,根據右聲道輸入訊號所對應之右聲道平移角度
曲線和右聲道權重參數,對右聲道輸入訊號所對應之右聲道振幅訊號進行第二平移步驟,以獲得右聲道輸入訊號之右聲道加權平移振幅訊號。然後,根據右聲道輸入訊號所對應之右聲道分離曲線和右聲道權重參數,對右聲道輸入訊號所對應之右聲道相位訊號進行一第二分離步驟,以獲右聲道輸入訊號之右聲道加權分離相位訊號。後,當右聲道加權平移振幅訊號之數量以及右聲道加權分離相位訊號之數量為一時,對右聲道加權平移振幅訊號和右聲道加權分離相位訊號進行第二逆轉換步驟,以獲得對應至時域之已優化右聲道聲音訊號。
根據本發明之一實施例,在上述之第一平移步驟中,首先根據左聲道平移角度曲線來計算一左聲道平移曲線。然後,將左聲道平移曲線乘以左聲道權重參數,以獲得左聲道輸入訊號所對應之左聲道加權平移曲線。接著,將左聲道振幅訊號乘以相應之左聲道加權平移曲線,以獲得上述之左聲道加權平移振幅訊號。
根據本發明之一實施例,在上述之第一分離步驟,首先將左聲道輸入訊號所對應之左聲道相位訊號與相應之左聲道分離曲線相加,以獲得左聲道輸入訊號所對應之一左聲道分離相位訊號。然後,將左聲道分離相位訊號與相應之左聲道權重參數相乘,以獲得左聲道加權分離相位訊號。
根據本發明之一實施例,在上述之第二平移步驟中,首先根據右聲道平移角度曲線來計算一右聲道平移曲線。接著,將右聲道平移曲線乘以右聲道權重參數,以獲得
右聲道輸入訊號所對應之一右聲道加權平移曲線。然後,將右聲道振幅訊號乘以相應之右聲道加權平移曲線,以獲得上述之右聲道加權平移振幅訊號。
根據本發明之一實施例,當右聲道聲音類別之數量為一時,在上述之第二分離步驟中,首先將右聲道輸入訊號所對應之右聲道相位訊號與相應之右聲道分離曲線相加,以獲得右聲道輸入訊號所對應之一右聲道分離相位訊號。接著,將右聲道分離相位訊號與相應之右聲道權重參數相乘,以獲得上述之右聲道加權分離相位訊號。
根據本發明之一實施例,當左聲道加權平移振幅訊號之數量以及左聲道加權分離相位訊號之數量大於一時,將左聲道加權平移振幅訊號加總,以獲得一左聲道加總振幅訊號,以及將左聲道加權分離相位訊號加總,以獲得一左聲道加總相位訊號;以及對左聲道加總振幅訊號和左聲道加總相位訊號進行第一逆轉換步驟,以獲得對應至時域之一已優化左聲道聲音訊號。
根據本發明之一實施例,當右聲道加權平移振幅訊號之數量以及右聲道加權分離相位訊號之數量大於一時,將右聲道加權平移振幅訊號加總,以獲得右聲道加總振幅訊號,以及將右聲道加權分離相位訊號加總,以獲得右聲道加總相位訊號;以及對右聲道加總振幅訊號和右聲道加總相位訊號進行第二逆轉換步驟,以獲得對應至時域之一已優化右聲道聲音訊號。
根據本發明之一實施例,上述之第一轉換步驟
和第二轉換步驟為傅立葉轉換,上述之第一逆轉換步驟和第二逆轉換步驟為逆傅立葉轉換。
根據本發明之一些實施例,上述之音訊處理系統包含分類模組、轉換模組、左聲道平移模組、右聲道平移模組、左聲道寬廣化模組、右聲道寬廣化模組以及逆轉換模組。分類模組係用以儲存複數個處理參數組。這些處理參數組係一對一地對應至複數個類別,每一處理參數組包含一平移角度曲線、對應至左聲道之一第一分離曲線、對應至右聲道之一第二分離曲線以及一權重參數。上述之分類模組更用以根據上述之類別來對左聲道輸入訊號和右聲道輸入訊號進行第一分類步驟和第二分類步驟,以獲得左聲道輸入訊號所對應之左聲道聲音類別、左聲道平移角度曲線、左聲道分離曲線與左聲道權重參數,以及獲得右聲道輸入訊號所對應之右聲道聲音類別、右聲道平移曲線、右聲道分離曲線與右聲道權重參數,其中左聲道聲音類別為上述之類別之其中一者,右聲道聲音類別為上述之類別之其中一者。轉換模組係用以對左聲道輸入訊號和右聲道輸入訊號進行轉換步驟,以將左聲道輸入訊號和右聲道輸入訊號轉換至頻域,並獲得左聲道輸入訊號所對應之一左聲道振幅訊號和一左聲道相位訊號,以及獲得右聲道輸入訊號所對應之一右聲道振幅訊號和一右聲道相位訊號。左聲道平移模組係用以根據左聲道輸入訊號所對應之左聲道平移角度曲線和左聲道權重參數,對左聲道輸入訊號所對應之左聲道振幅訊號進行一第一平移步驟,以獲得左聲道輸入訊號之左聲道加權平移振幅訊號。
右聲道平移模組係用以根據右聲道輸入訊號所對應之右聲道平移角度曲線和右聲道權重參數,對右聲道輸入訊號所對應之右聲道振幅訊號進行一第二平移步驟,以獲得右聲道輸入訊號之右聲道加權平移振幅訊號。左聲道寬廣化模組係用以根據左聲道輸入訊號所對應之左聲道分離曲線和左聲道權重參數,對左聲道輸入訊號所對應之左聲道相位訊號進行第一分離步驟,以獲得左聲道輸入訊號之左聲道加權分離相位訊號。右聲道寬廣化模組係用以根據右聲道輸入訊號所對應之右聲道分離曲線和右聲道權重參數,對右聲道輸入訊號所對應之右聲道相位訊號進行一第二分離步驟,以獲得右聲道輸入訊號之右聲道加權分離相位訊號。逆轉換模組係用以於左聲道加權平移振幅訊號之數量以及左聲道加權分離相位訊號之數量為一時,對左聲道加權平移振幅訊號和左聲道加權分離相位訊號進行第一逆轉換步驟,以獲得對應至時域之一已優化左聲道聲音訊號。逆轉換模組亦用以於右聲道加權平移振幅訊號之數量以及右聲道加權分離相位訊號之數量為一時,對右聲道加權平移振幅訊號和右聲道加權分離相位訊號進行第二逆轉換步驟,以獲得對應至時域之一已優化右聲道聲音訊號。
根據本發明之一實施例,在前述之第一平移步驟中,當左聲道聲音類別之數量為一時,左聲道平移模組更用以根據左聲道平移角度曲線來計算一左聲道平移曲線;將左聲道平移曲線乘以左聲道權重參數,以獲得左聲道輸入訊號所對應之左聲道加權平移曲線;以及將左聲道振幅訊號乘
以相應之左聲道加權平移曲線,以獲得上述之左聲道加權平移振幅訊號。
根據本發明之一實施例,在前述之第一分離步驟中,當左聲道聲音類別之數量為一時,左聲道寬廣化模組更用以將之左聲道相位訊號與左聲道分離曲線相加,以獲得左聲道輸入訊號所對應之一左聲道分離相位訊號;以及將左聲道分離相位訊號與左聲道權重參數相乘,以獲得上述之左聲道加權分離相位訊號。
根據本發明之一實施例,在前述之第二平移步驟中,當右聲道聲音類別之數量為一時,右聲道平移模組更用以根據右聲道平移角度曲線來計算一右聲道平移曲線;將之右聲道平移曲線乘以右聲道權重參數,以獲得右聲道輸入訊號所對應之一右聲道加權平移曲線;以及將右聲道振幅訊號乘以相應之右聲道加權平移曲線,以獲得上述之右聲道加權平移振幅訊號。
根據本發明之一實施例,在前述之第二分離步驟中,當右聲道聲音類別之數量為一時,右聲道寬廣化模組更用以將右聲道相位訊號與右聲道分離曲線相加,以獲得右聲道輸入訊號所對應之一右聲道分離相位訊號;以及將右聲道分離相位訊號與相應之右聲道權重參數相乘,以獲得上述之右聲道加權分離相位訊號。
根據本發明之一實施例,逆轉換模組更用以於前述左聲道加權平移振幅訊號之數量以及前述左聲道加權分離相位訊號之數量大於一時,將左聲道加權平移振幅訊號
加總,以獲得左聲道加總振幅訊號,以及將左聲道加權分離相位訊號加總,以獲得左聲道加總相位訊號;對左聲道加總振幅訊號和左聲道加總相位訊號進行第一逆轉換步驟,以獲得對應至時域之已優化左聲道聲音訊號。
根據本發明之一實施例,逆轉換模組更用以於前述右聲道加權平移振幅訊號之數量以及前述右聲道加權分離相位訊號之數量大於一時,將右聲道加權平移振幅訊號加總,以獲得右聲道加總振幅訊號,以及將右聲道加權分離相位訊號加總,以獲得右聲道加總相位訊號;對右聲道加總振幅訊號和右聲道加總相位訊號進行第二逆轉換步驟,以獲得對應至時域之已優化右聲道聲音訊號。
100:音訊處理系統
110:分類模組
120:轉換模組
130:左聲道平移模組
140:右聲道平移模組
150:左聲道寬廣化模組
160:右聲道寬廣化模組
170:逆轉換模組
180:音訊輸出模組
300:音訊處理方法
310-360:步驟
341-346:步驟
351-356:步驟
C1-Cn:類別標籤
LSe1-LSen:左聲道分離曲線
PC1、PC2:平移角度曲線
SC1:左聲道分離曲線
SC2:右聲道分離曲線
RSe1-RSen:右聲道分離曲線
Sh1-Shn:平移角度曲線
W1-Wn:權重參數
為讓本發明之上述和其他目的、特徵、優點與實施例能更明顯易懂,所附圖式之詳細說明如下:[圖1]係繪示根據本發明實施例之音訊處理系統的功能方塊示意圖;[圖2a]係繪示根據本發明實施例之對應至一類別的平移曲線;[圖2b]係繪示根據本發明實施例之對應至一類別的平移曲線;[圖2c]係繪示根據本發明實施例之左聲道分離曲線和右聲道分離曲線;
[圖3]係繪示根據本發明實施例之音訊處理方法的流程示意圖;[圖4]係繪示根據本發明實施例之左聲道調整步驟的流程示意圖;以及[圖5]係繪示根據本發明實施例之右聲道調整步驟的流程示意圖。
關於本文中所使用之『第一』、『第二』、...等,並非特別指次序或順位的意思,其僅為了區別以相同技術用語描述的元件或操作。
請參照圖1,其係繪示根據本發明實施例之音訊處理系統100的功能方塊示意圖。音訊處理系統100係用以外部輸入之聲音訊號,以優化其聲音表現。此聲音訊號包含左聲道訊號和右聲道訊號。在本發明之實施例中,聲音訊號可由多種不同聲音訊號所組成。為了方便說明,以下的實施例的輸入聲音訊號包含演講和音樂兩種不同聲音訊號,但本發明之實施例並不受限於此。
音訊處理系統100包含分類模組110、轉換模組120、左聲道平移模組130、右聲道平移模組140、左聲道寬廣化模組150、右聲道寬廣化模組160以及逆轉換模組170。分類模組110係用以對左聲道訊號和右聲道訊號進行分類步驟。在本發明之實施例中,分類模組110儲存有複數個處理參數組和複數個類別標籤C1-Cn,其中這些處理參數
組係一對一地對應至這些類別標籤C1-Cn,而每個類別標籤代表一種聲音訊號的類別,例如演講或音樂。在本發明之實施例中,分類模組110係透過機器學習(Machine Leaning;ML)技術來實現,但本發明之實施例並不受限於此。
每個處理參數組包含一個平移角度(panning angle)曲線、一個對應至左聲道的分離(separation)曲線、一個對應至右聲道的分離曲線以及一個權重參數。請同時參照圖2a和圖2b,圖2a係繪示對應音樂類別的平移角度曲線PC1,而圖2b係繪示對應演講類別的平移角度曲線PC2。在圖2a和圖2b中,平移角度曲線PC1和PC2係代表時間對平移角度(panning angle)的關係,其中平移角度係代表聲音訊號在左右方向上的角度,以指出聲音訊號的方向性。在本實施例中,平移角度曲線PC1係代表對應至音樂類別之平移角度曲線,其中平移角度曲線PC1可以下式表示:θ 1=0.01 x sin70t (1)其中θ 1代表平移角度,t代表時間。平移角度曲線PC2係代表對應至演講類別之平移角度曲線,其中平移角度曲線PC2可以下式表示:θ 2=0.1 x sin50t (2)其中θ 2代表平移角度。在本實施例中,θ 1和θ 2之單位為rad。
由上式(1)和(2)可知,在本實施例中對應至音樂類別之平移角度曲線PC1和對應至演講類別之平移角度曲線PC2為正弦函數,但本發明之實施例並不受限於此。
請參照圖2c,其係繪示對應演講類別之左聲道
的分離曲線SC1和右聲道的分離曲線SC2。如圖2c所示,左聲道的分離曲線SC1和右聲道的分離曲線SC2係代表分離相位角的角度與頻譜頻率S之間的關係,其中分離相位角度係代表聲音訊號中不同頻率所對應之相位角之間的相位角度差值。在本實施例中,左聲道的分離曲線SC1和右聲道的分離曲線SC2係對應至演講類別。左聲道的分離曲線SC1可以下式表示:△Ø L (s)=Ø△ cos(2πf 1 s)cos(2πf 2 s) (3)其中△Ø L 代表左聲道之分離相位角度,Ø△代表最大分離相位角度,f 1和f 2為預設之頻率值,其可根據使用者需求來進行調整。右聲道的分離曲線SC2可以下式表示:△Ø R (s)=-Ø△ cos(2πf 1 s)cos(2πf 2 s) (4)其中△Ø R 代表右聲道之分離相位角度。在本發明之一實施例中,Ø△=π/3,f 1=700,f 2=0.5,但本發明之實施例並不受限於此。
由上式(3)和(4)可知,在本實施例中,左聲道的分離曲線SC1和右聲道的分離曲線SC2彼此反相,但本發明之實施例並不受限於此。另外,在本實施例中,對應音樂類別之左聲道的分離曲線和右聲道的分離曲線為常數函數,且其常數為0。
如此,分類模組110儲存類別標籤C1-Cn、平移角度曲線Sh1-Shn、左聲道的分離曲線LSe1-LSen、右聲道的分離曲線RSe1-RSen以及權重參數W1-Wn,其中平移角度曲線Sh1、左聲道的分離曲線LSe1、右聲道的分離曲線
RSe1以及權重參數W1組成一個處理參數組且對應至類別標籤C1;平移角度曲線Sh2、左聲道的分離曲線LSe2、右聲道的分離曲線RSe2以及權重參數W2組成一個處理參數組且對應至類別標籤C2;平移角度曲線Shn、左聲道的分離曲線LSen、右聲道的分離曲線RSen以及權重參數Wn組成一個處理參數組且對應至類別標籤Cn。
當分類模組110對左聲道輸入訊號和右聲道輸入訊號進行分類步驟時,分類模組110會根據類別標籤C1-Cn來對左聲道輸入訊號和右聲道輸入訊號進行分類。例如,左聲道輸入訊號經分類後會對應至演講類別以及音樂類別。換句話說,左聲道輸入訊號包含演講類別的音訊成份以及音樂類別的音訊成份。又例如,右聲道輸入訊號經分類後會對應至演講類別以及音樂類別。換句話說,右聲道輸入訊號包含演講類別的音訊成份以及音樂類別的音訊成份。
在本發明之一實施例中,分類模組110係根據左聲道輸入訊號和右聲道輸入訊號的音訊特徵進行分類,並對不同的類別提供不同的信心值。這些信心值即為上述之權重參數W1-Wn。
如此,當分類模組110對左聲道輸入訊號進行分類步驟後,可獲得左聲道輸入訊號所對應之至少一個類別(以下稱為左聲道聲音類別)以及對應此左聲道聲音類別之平移角度曲線(以下稱為左聲道平移角度曲線)、分離曲線(以下稱為左聲道分離曲線)以及權重參數(以下稱為左聲道權重參數)。類似地,當分類模組110對右聲道輸入訊號進
行分類步驟後,可獲得右聲道輸入訊號所對應之至少一個類別(以下稱為右聲道聲音類別)以及對應此右聲道聲音類別之平移角度曲線(以下稱為右聲道平移角度曲線)、分離曲線(以下稱為右聲道分離曲線)以及權重參數(以下稱為右聲道權重參數)。
例如,本實施例之左聲道輸入訊號對應至演講類別標籤C1和音樂類別標籤C2。透過演講類別標籤C1,左聲道輸入訊號係對應至左聲道平移角度曲線Sh1、左聲道分離曲線LSe1和左聲道權重參數W1。透過音樂類別標籤C2,左聲道輸入訊號係對應至左聲道平移角度曲線Sh2、左聲道分離曲線LSe2和左聲道權重參數W2。再例如,本實施例之右聲道輸入訊號對應至演講類別標籤C1和音樂類別標籤C2。透過演講類別標籤C1,右聲道輸入訊號係對應至右聲道平移角度曲線Sh1、右聲道分離曲線RSe1和右聲道權重參數W1。透過音樂類別標籤C2,右聲道輸入訊號係對應至右聲道平移角度曲線Sh2、右聲道分離曲線RSe2和右聲道權重參數W2。
轉換模組120係用以對左聲道輸入訊號和右聲道輸入訊號進行轉換步驟,以將左聲道輸入訊號和右聲道輸入訊號轉換至頻域,並獲得左聲道輸入訊號所對應之左聲道振幅訊號和左聲道相位訊號,以及獲得右聲道輸入訊號所對應之右聲道振幅訊號和右聲道相位訊號。例如,將左聲道輸入訊號被轉換為左聲道振幅訊號LSA和左聲道相位訊號LSP。又例如,右聲道輸入訊號被轉換為右聲道振幅訊號
RSA和右聲道相位訊號RSP。在本實施例中,轉換模組120係利用傅立葉轉換(Fourier Transform)來將左聲道輸入訊號和右聲道輸入訊號轉換至頻域,但本發明之實施例並不受限於此。
左聲道平移模組130係用以對左聲道振幅訊號LSA進行第一平移步驟,以根據左聲道輸入訊號的類別來相映地調整左聲道輸入訊號的方向性。在本發明之實施例中,經過分類模組110之分類步驟後,左聲道輸入訊號係對應至至少一個類別標籤之左聲道平移角度曲線以及左聲道權重參數。在第一平移步驟中,左聲道平移模組130先根據左聲道平移角度曲線來計算左聲道輸入訊號所對應之左聲道平移曲線。左聲道平移曲線P L (θ)可以下式表示:
其中θ為前述之平移角度,例如θ 1或θ 2。
然後,將左聲道輸入訊號所對應之左聲道平移曲線乘以相應之左聲道權重參數,以獲得左聲道加權平移曲線。接著,左聲道平移模組130再將左聲道振幅訊號LSA乘以相應之左聲道加權平移曲線,以獲得左聲道加權平移振幅訊號。在第一平移步驟後,左聲道平移模組130更進行一第一加總步驟,以將所有的左聲道加權平移振幅訊號加總,而獲得一左聲道加總振幅訊號。
例如,左聲道輸入訊號對應至演講類別標籤C1,則左聲道平移模組130先根據左聲道平移角度曲線Sh1來計算出左聲道平移曲線P L (Sh1),再將左聲道平移曲線和
左聲道權重參數W1相乘,以獲得左聲道加權平移曲線(W1 * P L (Sh1))。接著,再將左聲道振幅訊號LSA乘以左聲道加權平移曲線,以獲得一個左聲道加權平移振幅訊號(LSA * W1 * P L (Sh1))。又例如,左聲道輸入訊號也對應至音樂類別標籤C2,則左聲道平移模組130先根據左聲道平移角度曲線Sh2來計算出左聲道平移曲線P L (Sh2),再將左聲道平移曲線和左聲道權重參數W2相乘,以獲得左聲道加權平移曲線(W2 * P L (Sh2))。接著,再將左聲道振幅訊號LSA乘以左聲道加權平移曲線,以獲得另一個左聲道加權平移振幅訊號(LSA * W2 * P L (Sh2))。然後,左聲道平移模組130將上述之左聲道加權平移振幅訊號加總,以獲得左聲道加總振幅訊號(LSA * W1 * P L (Sh1)+LSA * W2 * P L (Sh2))。
在本發明之其他實施例中,左聲道平移模組130可先將左聲道平移曲線與左聲道振幅訊號LSA相乘,再將其乘積與左聲道權重參數相乘。另外,若左聲道輸入訊號僅對應至一個類別,則表示左聲道平移模組130只會產生一個左聲道加權平移振幅訊號。如此,左聲道平移模組130便會省略上述加總之步驟。
右聲道平移模組140之功能係類似於左聲道平移模組130。右聲道平移模組140係用以對右聲道輸入訊號所對應之右聲道振幅訊號RSA進行第二平移步驟,以根據右聲道輸入訊號的類別來相應地調整右聲道輸入訊號的方向性。在本發明之實施例中,經過分類模組110之分類步驟後,右聲道輸入訊號係對應至少一個類別標籤之右聲道平移
角度曲線以及右聲道權重參數。在第二平移步驟中,右聲道平移模組140先根據右聲道平移角度曲線來計算右聲道平移曲線。右聲道平移曲線P R (θ)可以下式表示:
其中θ為前述之平移角度,例如θ 1或θ 2。
然後,將右聲道輸入訊號所對應之右聲道平移曲線乘以相應之右聲道權重參數,以獲得相應之右聲道加權平移曲線。接著,右聲道平移模組140再將右聲道輸入訊號所對應之右聲道振幅訊號RSA乘以相應之右聲道加權平移曲線,以獲得右聲道加權平移振幅訊號。在第二平移步驟後,右聲道平移模組140更進行一第二加總步驟,以將所有的右聲道加權平移振幅訊號加總,而獲得一右聲道加總振幅訊號。
例如,右聲道輸入訊號對應至演講類別標籤C1,則右聲道平移模組140先根據右聲道平移角度曲線Sh1來計算出右聲道平移曲線P R (Sh1),再將右聲道平移曲線和右聲道權重參數W1相乘,以獲得右聲道加權平移曲線(W1 * P R (Sh1))。接著,再將右聲道振幅訊號RSA乘以右聲道加權平移曲線,以獲得右聲道加權平移振幅訊號(RSA * W1 * P R (Sh1))。又例如,右聲道輸入訊號也對應至音樂類別C2,則右聲道平移模組140先根據右聲道平移角度曲線Sh2來計算出右聲道平移曲線P R (Sh2),再將右聲道平移曲線和右聲道權重參數W2相乘,以獲得右聲道加權平移曲線(W2 * P R (Sh2))。接著,再將右聲道振幅訊號RSA乘以右
聲道加權平移曲線,以獲得右聲道加權平移振幅訊號(RSA * W2 * P R (Sh2))。然後,右聲道平移模組140將上述之右聲道加權平移振幅訊號加總,以獲得右聲道加總振幅訊號(RSA * W1 * P R (Sh1)+RSA * W2 * P R (Sh2))。
在本發明之其他實施例中,右聲道平移模組140可先將右聲道平移曲線與右聲道振幅訊號RSA相乘,再將其乘積與右聲道權重參數相乘。另外,若右聲道輸入訊號僅對應至一個類別,則表示右聲道平移模組140只會產生一個右聲道加權平移振幅訊號。如此,右聲道平移模組140便會省略上述加總之步驟。
左聲道寬廣化模組150係用以對左聲道輸入訊號所對應之左聲道相位訊號進行第一分離步驟,以根據左聲道輸入訊號的類別來相應地調整左聲道輸入訊號的寬廣程度。在本發明之實施例中,左聲道輸入訊號係對應至至少一個類別標籤與其左聲道分離曲線和左聲道權重參數。在第一分離步驟中,左聲道寬廣化模組150先將左聲道輸入訊號所對應之左聲道相位訊號LSP與左聲道分離曲線相加,以獲得左聲道輸入訊號所對應之左聲道分離相位訊號。接著,左聲道寬廣化模組150再將左聲道輸入訊號所對應之左聲道分離相位訊號乘以相應之左聲道權重參數,以獲得左聲道加權分離相位訊號。在第一分離步驟後,左聲道寬廣化模組150更進行一第三加總步驟,以將所有的左聲道加權分離相位訊號加總,而獲得一左聲道加總相位訊號。
例如,左聲道輸入訊號係對應至演講類別標籤
C1,則左聲道寬廣化模組150將左聲道相位訊號LSP和左聲道分離曲線LSe1相加,以獲得左聲道分離相位訊號(LSP+LSe1)。接著,再將此左聲道分離相位訊號乘以左聲道權重參數,以獲得左聲道加權分離相位訊號((LSP+LSe1) * W1)。又例如,左聲道輸入訊號也對應至音樂類別標籤C2,則左聲道寬廣化模組150將左聲道相位訊號LSP和左聲道分離曲線LSe2相加,以獲得左聲道分離相位訊號(LSP+LSe2)。接著,再將此左聲道分離相位訊號乘以左聲道權重參數,以獲得左聲道加權分離相位訊號((LSP+LSe2) * W2)。然後,左聲道寬廣化模組150將上述之左聲道加權分離相位訊號加總,以獲得左聲道加總相位訊號((LSP+LSe1) * W1+(LSP+LSe2) * W2)。
另外,若左聲道輸入訊號僅對應至一個類別,則表示左聲道寬廣化模組150只會產生一個左聲道加權分離相位訊號。如此,左聲道寬廣化模組150便會省略上述加總之步驟。
右聲道寬廣化模組160係類似於左聲道寬廣化模組150。右聲道寬廣化模組160係用以對右聲道輸入訊號所對應之右聲道相位訊號進行第二分離步驟,以根據右聲道輸入訊號的類別來相應地調整右聲道輸入訊號的寬廣程度。在本發明之實施例中,右聲道輸入訊號係對應至至少一個類別標籤與其右聲道分離曲線和右聲道權重參數。在第二分離步驟中,右聲道寬廣化模組160先將右聲道輸入訊號所對應之右聲道相位訊號RSP與右聲道分離曲線相加,以獲得
右聲道輸入訊號所對應之右聲道分離相位訊號。接著,右聲道寬廣化模組160再將右聲道輸入訊號所對應之右聲道分離相位訊號乘以相應之右聲道權重參數,以獲得右聲道加權分離相位訊號。在第二分離步驟後,右聲道寬廣化模組160更進行一第四加總步驟,以將所有的右聲道加權分離相位訊號加總,而獲得一右聲道加總相位訊號。
例如,右聲道輸入訊號係對應至演講類別標籤C1,則右聲道寬廣化模組160將右聲道相位訊號RSP和右聲道分離曲線RSe1相加,以獲得右聲道分離相位訊號(RSP+RSe1)。接著,再將此右聲道分離相位訊號乘以右聲道權重參數,以獲得右聲道加權分離相位訊號((RSP+RSe1) * W1)。又例如,右聲道輸入訊號對應至音樂類別標籤C2,則右聲道寬廣化模組160將右聲道相位訊號RSP和右聲道分離曲線RSe2相加,以獲得右聲道分離相位訊號(RSP+RSe2)。接著,再將此右聲道分離相位訊號乘以右聲道權重參數,以獲得右聲道加權分離相位訊號((RSP+RSe2) * W2)。然後,右聲道寬廣化模組160將上述之右聲道加權分離相位訊號加總,以獲得右聲道加總相位訊號((RSP+RSe1) * W1+(RSP+RSe2) * W2)。
另外,若右聲道輸入訊號僅對應至一個類別,則表示右聲道寬廣化模組160只會產生一個右聲道加權分離相位訊號。如此,右聲道寬廣化模組160便不會進行上述加總之步驟。
逆轉換模組170係用以對左聲道加總振幅訊
號、左聲道加總相位訊號、右聲道加總振幅訊號以及右聲道加總相位訊號進行一逆轉換步驟,以獲得對應至時域之一已優化左聲道聲音訊號以及一已優化右聲道聲音訊號。例如,逆轉換模組170係對左聲道加總振幅訊號和左聲道加總相位訊號進行逆轉換步驟,以獲得已優化左聲道聲音訊號。又例如,逆轉換模組170係對右聲道加總振幅訊號和右聲道加總相位訊號進行逆轉換步驟,以獲得已優化右聲道聲音訊號。在本實施例中,上述之逆轉換步驟為逆傅立葉轉換(Inverse Fourier Transform),但本發明之實施例並不受限於此。
在本發明之一實施例中,當左聲道輸入訊號僅對應至一個類別時,則表示此實施例中只有一個左聲道加權平移振幅訊號和一個左聲道加權分離相位訊號。如此,逆轉換模組170便會對左聲道加權平移振幅訊號和左聲道加權分離相位訊號進行前述之逆轉換步驟。類似地,在本發明之另一實施例中,當右聲道輸入訊號僅對應至一個類別時,則表示此實施例中只有一個右聲道加權平移振幅訊號和一個右聲道加權分離相位訊號。如此,逆轉換模組170便會對右聲道加權平移振幅訊號和右聲道加權分離相位訊號進行前述之逆轉換步驟。
在本發明之又一實施例中,音訊輸出模組180係用以輸出已優化左聲道聲音訊號以及已優化右聲道聲音訊號。在本實施例中,音訊輸出模組180為音效卡(sound card),但本發明之實施力並不受限於此。
由上述實施例可知,音訊處理系統100係對輸入聲音訊號進行分類,以利用不同的處理參數組來對不同類別之輸入聲音訊號進行處理,以優化輸入聲音訊號的聲音效果。由於處理參數組包含平移曲線、分離曲線以及權重參數,音訊處理系統100可使得輸入聲音訊號的立體聲音效果和寬廣效果更為明顯,且可讓左右聲道的切換更為平滑。
請參照圖3,其係繪示根據本發明實施例之音訊處理系統100所對應之音訊處理方法300的流程示意圖。在在音訊處理方法300中,首先進行步驟310,以提供輸入聲音訊號。接著,進行步驟320,以提供複數個類別(即類別標籤)與處理參數組。在本發明之實施例中,這些類別與處理參數組預先設定於分類模組110中。然後,進行步驟330,以根據類別來對輸入聲音訊號進行分類。在本發明之實施例中,步驟330係利用分類模組110來進行。接著,分別進行左聲道調整步驟340和右聲道調整步驟350,以獲得已優化左聲道聲音訊號和已優化右聲道聲音訊號。然後,進行步驟360,以輸出已優化左聲道聲音訊號和已優化右聲道聲音訊號。
請參照圖4,其係繪示根據本發明實施例之左聲道調整步驟340的流程示意圖。在左聲道調整步驟340中,首先進行步驟341,以利用轉換模組120來進行前述之轉換步驟,以將左聲道輸入訊號轉換至頻域。然後,進行步驟342-343以及步驟344-345,以利用處理參數組來處理左聲道輸入訊號之頻譜。在步驟342中,對左聲道振幅訊號進行
第一平移步驟,而獲得複數個左聲道加權平移振幅訊號。接著,在步驟343中,將左聲道加權平移振幅訊號加總,以獲得左聲道加總振幅訊號。在本發明之實施例中,步驟342-343係利用左聲道平移模組130來進行。在步驟344中,對左聲道相位訊號進行第一分離步驟,以獲得複數個左聲道加權分離相位訊號。接著,在步驟345中,將左聲道加權分離相位訊號加總,以獲得左聲道加總相位訊號。在本發明之實施例中,步驟344-345係利用左聲道寬廣化模組150來進行。在步驟342-345之後,接著進行步驟346,以對左聲道加總振幅訊號和左聲道加總相位訊號進行逆轉換步驟,而獲得對應至時域之已優化左聲道聲音訊號。在本發明之實施例中,步驟346係利用逆轉換模組170來進行。
另外,當左聲道輸入訊號僅對應至一個類別時,前述之左聲道加權平移振幅訊號和左聲道加權分離相位訊號的數量僅會有一個。如此,前述之步驟343和345可被省略,而前述之步驟346則對此左聲道加權平移振幅訊號和左聲道加權分離相位訊號進行逆轉換步驟。
請參照圖5,其係繪示根據本發明實施例之右聲道調整步驟350的流程示意圖。在右聲道調整步驟350中,首先進行步驟351,以利用轉換模組120來進行前述之轉換步驟,以將右聲道輸入訊號轉換至頻域。然後,進行步驟352-353以及步驟354-355,以利用處理參數組來處理右聲道輸入訊號之頻譜。在步驟352中,對右聲道振幅訊號進行第二平移步驟,而獲得複數個右聲道加權平移振幅訊號。接
著,在步驟353中,將右聲道加權平移振幅訊號加總,以獲得右聲道加總振幅訊號。在本發明之實施例中,步驟352-353係利用右聲道平移模組140來進行。在步驟354中,對右聲道相位訊號進行第二分離步驟,以獲得複數個右聲道加權分離相位訊號。接著,在步驟355中,將右聲道加權分離相位訊號加總,以獲得右聲道加總相位訊號。在本發明之實施例中,步驟354-355係利用右聲道寬廣化模組160來進行。在步驟352-355之後,接著進行步驟356,以對右聲道加總振幅訊號和右聲道加總相位訊號進行逆轉換步驟,而獲得對應至時域之已優化右聲道聲音訊號。在本發明之實施例中,步驟356係利用逆轉換模組170來進行。
另外,當右聲道輸入訊號僅對應至一個類別時,前述之右聲道加權平移振幅訊號和右聲道加權分離相位訊號的數量僅會有一個。如此,前述之步驟353和355可被省略,而前述之步驟356則對此右聲道加權平移振幅訊號和右聲道加權分離相位訊號進行逆轉換步驟。
雖然本發明已以數個實施例揭露如上,然其並非用以限定本發明,在本發明所屬技術領域中任何具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100:音訊處理系統
110:分類模組
120:轉換模組
130:左聲道平移模組
140:右聲道平移模組
150:左聲道寬廣化模組
160:右聲道寬廣化模組
170:逆轉換模組
180:音訊輸出模組
C1-Cn:類別標籤
LSe1-LSen:左聲道分離曲線
RSe1-RSen:右聲道分離曲線
Sh1-Shn:平移角度曲線
W1-Wn:權重參數
Claims (10)
- 一種音訊處理方法,包含:提供一輸入聲音訊號;提供複數個類別,其中該些類別係一對一地對應至複數個處理參數組,每一該些處理參數組包含一平移角度曲線、一分離曲線以及一權重參數;根據該些類別來對該輸入聲音訊號進行一分類步驟,以獲得該輸入聲音訊號所對應之至少一輸入聲音類別,以及對應該至少一輸入聲音類別之該平移角度曲線、該分離曲線與該權重參數,其中該至少一輸入聲音類別為該些類別之其中至少一者;對該輸入聲音訊號進行一轉換步驟,以將該輸入聲音訊號轉換至頻域,並獲得該輸入聲音訊號所對應之一振幅訊號和一相位訊號;根據該輸入聲音訊號之該至少一輸入聲音類別以及該至少一輸入聲音類別所對應之該平移角度曲線和該權重參數,對該振幅訊號進行一平移步驟,以獲得該輸入聲音訊號之至少一加權平移振幅訊號;根據該輸入聲音訊號之該至少一輸入聲音類別以及該至少一輸入聲音類別所對應之該分離曲線和該權重參數,對該相位訊號進行一分離步驟,以獲得該輸入聲音訊號之至少一加權分離相位訊號;其中,當該至少一加權平移振幅訊號之數量以及該至少一加權分離相位訊號之數量為一時,對該加權平移振幅訊號和該加權分離相位訊號進行一逆轉換步驟,以獲得對 應至時域之一已優化聲音訊號。
- 如申請專利範圍第1項所述之音訊處理方法,其中該平移步驟包含:根據該至少一輸入聲音類別所對應之該平移角度曲線來計算一平移曲線;將該至少一輸入聲音類別所對應之該平移曲線乘以該至少一輸入聲音類別所對應之該權重參數,以獲得該輸入聲音訊號所對應之一加權平移曲線;以及將該振幅訊號乘以相應之該加權平移曲線,以獲得該至少一加權平移振幅訊號。
- 如申請專利範圍第1項所述之音訊處理方法,其中該分離步驟包含:將該相位訊號與相應之該分離曲線相加,以獲得該輸入聲音訊號所對應之一分離相位訊號;以及將該分離相位訊號與相應之該權重參數相乘,以獲得該至少一加權分離相位訊號。
- 如申請專利範圍第1項所述之音訊處理方法,其中:當該至少一加權平移振幅訊號之數量以及該至少一加權分離相位訊號之數量大於一時,將該些加權平移振幅訊號加總以獲得一加總振幅訊號,以及將該些加權分離相位訊號加總以獲得一加總相位訊號;以及 對該加總振幅訊號和該加總相位訊號進行一逆轉換步驟,以獲得對應至時域之一已優化聲音訊號。
- 如申請專利範圍第1項所述之音訊處理方法,其中該轉換步驟為傅立葉轉換(Fourier Transform),該逆轉換步驟為逆傅立葉轉換(Inverse Fourier Transform)。
- 一種音訊處理方法,包含:提供一輸入聲音訊號,其中該輸入聲音訊號包含一左聲道輸入訊號和一右聲道輸入訊號;提供複數個類別,其中該些類別係一對一地對應至複數個處理參數組,每一該些處理參數組包含一平移角度曲線、一第一分離曲線、一第二分離曲線以及一權重參數,其中該第一分離曲線係對應至左聲道,該第二分離曲線係對應右聲道;根據該些類別來對該左聲道輸入訊號進行一第一分類步驟,以獲得該左聲道輸入訊號所對應之至少一左聲道聲音類別,並根據該至少一左聲道聲音類別來獲得該左聲道輸入訊號所對應之至少一左聲道平移角度曲線、至少一左聲道分離曲線與至少一左聲道權重參數;根據該些類別來對該右聲道輸入訊號進行一第二分類步驟,以獲得該右聲道輸入訊號所對應之至少一右聲道聲音類別,並根據該至少一右聲道聲音類別來獲得該右聲道輸入訊號所對應之至少一右聲道平移角度曲線、至少一右 聲道分離曲線與至少一右聲道權重參數,其中該至少一左聲道聲音類別為該些類別之其中至少一者,該至少一右聲道聲音類別為該些類別之其中至少一者;進行一左聲道音訊調整步驟,包含:進行一第一轉換步驟,以將該左聲道輸入訊號轉換至頻域,並獲得該左聲道輸入訊號所對應之一左聲道振幅訊號和一左聲道相位訊號;根據該至少一左聲道平移角度曲線和該至少一左聲道權重參數,對該左聲道振幅訊號進行一第一平移步驟,以獲得該左聲道輸入訊號之至少一左聲道加權平移振幅訊號;根據該至少一左聲道分離曲線和該至少一左聲道權重參數,對該左聲道相位訊號進行一第一分離步驟,以獲得該左聲道輸入訊號之至少一左聲道加權分離相位訊號;當該至少一左聲道加權平移振幅訊號之數量以及該至少一左聲道加權分離相位訊號之數量為一時,對該左聲道加權平移振幅訊號和該左聲道加權分離相位訊號進行一第一逆轉換步驟,以獲得對應至時域之一已優化左聲道聲音訊號;以及進行一右聲道音訊調整步驟,包含:進行一第二轉換步驟,以將該右聲道輸入訊號轉換至頻域,並獲得該右聲道輸入訊號所對應之一右聲道振幅訊號和一右聲道相位訊號;根據該右聲道輸入訊號所對應之該至少一右聲 道平移角度曲線和該至少一右聲道權重參數,對該右聲道振幅訊號進行一第二平移步驟,以獲得該右聲道輸入訊號之至少一右聲道加權平移振幅訊號;根據該右聲道輸入訊號所對應之該至少一右聲道分離曲線和該至少一右聲道權重參數,對該右聲道輸入訊號所對應之該右聲道相位訊號進行一第二分離步驟,以獲得該右聲道輸入訊號之至少一右聲道加權分離相位訊號;當該至少一右聲道加權平移振幅訊號之數量以及該至少一右聲道加權分離相位訊號之數量為一時,對該右聲道加權平移振幅訊號和該右聲道加權分離相位訊號進行一第二逆轉換步驟,以獲得對應至時域之一已優化右聲道聲音訊號。
- 如申請專利範圍第6項所述之音訊處理方法,其中當該至少一左聲道聲音類別之數量為一時,該第一平移步驟包含:根據該至少一左聲道平移角度曲線來計算一左聲道平移曲線;將該左聲道平移曲線乘以該至少一左聲道權重參數,以獲得該左聲道輸入訊號所對應之一左聲道加權平移曲線;以及將該左聲道振幅訊號乘以相應之該左聲道加權平移曲線,以獲得該至少一左聲道加權平移振幅訊號。
- 如申請專利範圍第6項所述之音訊處理方法,其中當該至少一左聲道聲音類別之數量為一時,該第一分離步驟包含:將該左聲道相位訊號與該至少一左聲道分離曲線相加,以獲得該左聲道輸入訊號所對應之一左聲道分離相位訊號;以及將該左聲道分離相位訊號與相應之該左聲道權重參數相乘,以獲得該至少一左聲道加權分離相位訊號。
- 如申請專利範圍第6項所述之音訊處理方法,其中:當該至少一左聲道加權平移振幅訊號之數量以及該至少一左聲道加權分離相位訊號之數量大於一時,將該些左聲道加權平移振幅訊號加總,以獲得一左聲道加總振幅訊號,以及將該些左聲道加權分離相位訊號加總,以獲得一左聲道加總相位訊號;以及對該左聲道加總振幅訊號和左聲道加總相位訊號進行該第一逆轉換步驟,以獲得對應至時域之一已優化左聲道聲音訊號。
- 一種音訊處理系統,用以處理一輸入聲音訊號,其中該輸入聲音訊號包含一左聲道輸入訊號和一右聲道輸入訊號,該音訊處理系統包含:一分類模組,用以儲存複數個處理參數組,其中該些處理參數組係一對一地對應至複數個類別,每一該些處理 參數組包含一平移角度曲線、對應至左聲道之一第一分離曲線、對應至右聲道之一第二分離曲線以及一權重參數,該分類模組更用以根據該些類別來對該左聲道輸入訊號和該右聲道輸入訊號進行一第一分類步驟和一第二分類步驟,以獲得該左聲道輸入訊號所對應之至少一左聲道聲音類別至少一左聲道平移角度曲線、至少一左聲道分離曲線與至少一左聲道權重參數,以及獲得該右聲道輸入訊號所對應之至少一右聲道聲音類別、至少一右聲道平移曲線、至少一右聲道分離曲線與至少一右聲道權重參數,其中該至少一左聲道聲音類別為該些類別之其中一者,該至少一右聲道聲音類別為該些類別之其中一者;一轉換模組,用以對該左聲道輸入訊號和該右聲道輸入訊號進行一轉換步驟,以將該左聲道輸入訊號和該右聲道輸入訊號轉換至頻域,並獲得該左聲道輸入訊號所對應之一左聲道振幅訊號和一左聲道相位訊號,以及獲得該右聲道輸入訊號所對應之一右聲道振幅訊號和一右聲道相位訊號;一左聲道平移模組,用以根據該至少一左聲道平移角度曲線和該至少一左聲道權重參數,對該左聲道振幅訊號進行一第一平移步驟,以獲得該左聲道輸入訊號之至少一左聲道加權平移振幅訊號;一右聲道平移模組,用以根據該至少一右聲道平移角度曲線和該至少一右聲道權重參數,對該右聲道振幅訊號進行一第二平移步驟,以獲得該右聲道輸入訊號之至少一右聲道加權平移振幅訊號; 一左聲道寬廣化模組,用以根據該至少一左聲道分離曲線和該至少一左聲道權重參數,對該左聲道相位訊號進行一第一分離步驟,以獲得該左聲道輸入訊號之至少一左聲道加權分離相位訊號;一右聲道寬廣化模組,用以根據該至少一右聲道分離曲線和該至少一右聲道權重參數,對該右聲道相位訊號進行一第二分離步驟,以獲得該右聲道輸入訊號之至少一右聲道加權分離相位訊號;以及一逆轉換模組,其中:該逆轉換模組用以於該至少一左聲道加權平移振幅訊號之數量以及該至少一左聲道加權分離相位訊號之數量為一時,對該左聲道加權平移振幅訊號和該左聲道加權分離相位訊號進行一第一逆轉換步驟,以獲得對應至時域之一已優化左聲道聲音訊號;以及該逆轉換模組用以於該至少一右聲道加權平移振幅訊號之數量以及該至少一右聲道加權分離相位訊號之數量為一時,對該右聲道加權平移振幅訊號和該右聲道加權分離相位訊號進行一第二逆轉換步驟,以獲得對應至時域之一已優化右聲道聲音訊號。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108109843A TWI692719B (zh) | 2019-03-21 | 2019-03-21 | 音訊處理方法與音訊處理系統 |
US16/545,055 US10939221B2 (en) | 2019-03-21 | 2019-08-20 | Audio processing method and audio processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108109843A TWI692719B (zh) | 2019-03-21 | 2019-03-21 | 音訊處理方法與音訊處理系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI692719B true TWI692719B (zh) | 2020-05-01 |
TW202036268A TW202036268A (zh) | 2020-10-01 |
Family
ID=71896029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108109843A TWI692719B (zh) | 2019-03-21 | 2019-03-21 | 音訊處理方法與音訊處理系統 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10939221B2 (zh) |
TW (1) | TWI692719B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12119022B2 (en) | 2020-01-21 | 2024-10-15 | Rishi Amit Sinha | Cognitive assistant for real-time emotion detection from human speech |
US11189265B2 (en) * | 2020-01-21 | 2021-11-30 | Ria Sinha | Systems and methods for assisting the hearing-impaired using machine learning for ambient sound analysis and alerts |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW337570B (en) * | 1995-11-22 | 1998-08-01 | Nintendo Co Ltd | High-performance low-cost video game system with coprocessor providing high speed efficient 3D graphics and digital audio signal processing |
CN102197662A (zh) * | 2009-05-18 | 2011-09-21 | 哈曼国际工业有限公司 | 效率优化的音频系统 |
CN104217729A (zh) * | 2013-05-31 | 2014-12-17 | 杜比实验室特许公司 | 音频处理方法和音频处理装置以及训练方法 |
TW201537452A (zh) * | 2014-03-26 | 2015-10-01 | Fraunhofer Ges Forschung | 針對音源轉譯採用幾何距離定義的裝置以及方法 |
CN105336333A (zh) * | 2014-08-12 | 2016-02-17 | 北京天籁传音数字技术有限公司 | 多声道声音信号编码方法、解码方法及装置 |
CN107277697A (zh) * | 2011-03-24 | 2017-10-20 | 奥迪康有限公司 | 音频处理装置、系统及方法 |
CN107968984A (zh) * | 2016-10-20 | 2018-04-27 | 中国科学院声学研究所 | 一种5-2通道音频转换优化方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102007008738A1 (de) * | 2007-02-22 | 2008-08-28 | Siemens Audiologische Technik Gmbh | Verfahren zur Verbesserung der räumlichen Wahrnehmung und entsprechende Hörvorrichtung |
WO2008106680A2 (en) * | 2007-03-01 | 2008-09-04 | Jerry Mahabub | Audio spatialization and environment simulation |
CN103250208B (zh) * | 2010-11-24 | 2015-06-17 | 日本电气株式会社 | 信号处理装置和信号处理方法 |
-
2019
- 2019-03-21 TW TW108109843A patent/TWI692719B/zh active
- 2019-08-20 US US16/545,055 patent/US10939221B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW337570B (en) * | 1995-11-22 | 1998-08-01 | Nintendo Co Ltd | High-performance low-cost video game system with coprocessor providing high speed efficient 3D graphics and digital audio signal processing |
CN102197662A (zh) * | 2009-05-18 | 2011-09-21 | 哈曼国际工业有限公司 | 效率优化的音频系统 |
CN107277697A (zh) * | 2011-03-24 | 2017-10-20 | 奥迪康有限公司 | 音频处理装置、系统及方法 |
CN104217729A (zh) * | 2013-05-31 | 2014-12-17 | 杜比实验室特许公司 | 音频处理方法和音频处理装置以及训练方法 |
TW201537452A (zh) * | 2014-03-26 | 2015-10-01 | Fraunhofer Ges Forschung | 針對音源轉譯採用幾何距離定義的裝置以及方法 |
CN105336333A (zh) * | 2014-08-12 | 2016-02-17 | 北京天籁传音数字技术有限公司 | 多声道声音信号编码方法、解码方法及装置 |
CN107968984A (zh) * | 2016-10-20 | 2018-04-27 | 中国科学院声学研究所 | 一种5-2通道音频转换优化方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200304934A1 (en) | 2020-09-24 |
US10939221B2 (en) | 2021-03-02 |
TW202036268A (zh) | 2020-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101415026B1 (ko) | 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치 | |
JP6466968B2 (ja) | インフォームド空間のフィルタリングに基づく矛盾しない音響場面再生のためのシステムおよび装置および方法 | |
CN102907120B (zh) | 用于声音处理的系统和方法 | |
US8718293B2 (en) | Signal separation system and method for automatically selecting threshold to separate sound sources | |
US20120082322A1 (en) | Sound scene manipulation | |
US20080298597A1 (en) | Spatial Sound Zooming | |
US8873762B2 (en) | System and method for efficient sound production using directional enhancement | |
GB2540175A (en) | Spatial audio processing apparatus | |
US10412226B2 (en) | Audio signal processing apparatus and method | |
US10798511B1 (en) | Processing of audio signals for spatial audio | |
TWI692719B (zh) | 音訊處理方法與音訊處理系統 | |
CN109640242B (zh) | 音频源分量及环境分量提取方法 | |
CN109036455B (zh) | 直达声与背景声提取方法、扬声器系统及其声重放方法 | |
He et al. | Primary-ambient extraction using ambient phase estimation with a sparsity constraint | |
Stefanakis et al. | Foreground suppression for capturing and reproduction of crowded acoustic environments | |
CN111757239B (zh) | 音频处理方法与音频处理系统 | |
Chen et al. | Primary ambient extraction for random sign Hilbert filtering decorrelation | |
TWI719429B (zh) | 音訊處理方法與音訊處理系統 | |
CN111757240B (zh) | 音频处理方法与音频处理系统 | |
Herzog et al. | Signal-Dependent Mixing for Direction-Preserving Multichannel Noise Reduction | |
Uhle et al. | Subband center signal scaling using power ratios | |
Khan et al. | Speech separation with dereverberation-based pre-processing incorporating visual cues | |
Llerena-Aguilar et al. | Improving speech mixture synchronization in blind source separation problems | |
Goodwin | Primary-ambient decomposition and dereverberation of two-channel and multichannel audio | |
Liang et al. | An audio-video based IVA algorithm for source separation and evaluation on the AV16. 3 corpus |