TWI581255B - 前端音頻處理系統 - Google Patents
前端音頻處理系統 Download PDFInfo
- Publication number
- TWI581255B TWI581255B TW105120417A TW105120417A TWI581255B TW I581255 B TWI581255 B TW I581255B TW 105120417 A TW105120417 A TW 105120417A TW 105120417 A TW105120417 A TW 105120417A TW I581255 B TWI581255 B TW I581255B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- audio
- unit
- valid
- audio signal
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims description 50
- 230000005236 sound signal Effects 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 20
- 238000000926 separation method Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000002829 reductive effect Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 17
- 230000009467 reduction Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 6
- 230000008030 elimination Effects 0.000 description 6
- 238000003379 elimination reaction Methods 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Manipulator (AREA)
Description
本發明關於智能語音互動領域,特別是關於一種前端音頻處理系統。
隨著嵌入式技術和人工智慧技術的發展,在智慧機器人上,語音識別技術開始得到廣泛的應用,再次掀起了人機互動的革命。語音識別技術是一種讓機器通過識別和理解過程把自然語音訊號轉變為相應文字或命令的技術。語音識別技術的關鍵性能參考是識別率,如果識別率太低,那麼使用者會因為要多次朗讀語音命令而影響人機間通信的流暢性。音頻前端處理就是一系列以提高有效語音訊雜比為目標的從機器語音採集到演算法預處理過程的全稱。常見的語音前端處理技術包括環境噪音消除技術,自身音源消除技術以及增益自動控制技術。環境噪音消除技術用於降低真實世界中的穩態和非穩態噪音,一般環境消除技術都對穩態噪音有較好的效果,而對非穩態噪音,由於其具有能量大,規律性不強的特點,常見環境噪音消除效果較差。自身音源消除技術旨在減少機器人自身發聲對自身音頻收集的影響,比如一台閱讀報紙的機器人,報紙上的內容會通過TTS技術轉換成語音信息由機器人播放出來,此時播放出來的語音信息有可能會干擾機器人的語音識別系統,使機器人出現錯誤識別和識別率下降的問題。自動增益控制技術則旨在自動調節麥克風採集到音頻的增益,在麥克風一定的情況下,如果採集到的音頻能量過大,則會出現訊號
截幅導致其頻譜變化從而出現識別率下降的問題。另外由於聲音能量隨距離而衰減,如果命令發出者距離機器人較遠,則需要提升有效音頻訊號的能量。
大多數智慧機器人採用的操作系統Linux或Android已經將上述技術以單獨演算法模組的形式集成在系統內部。比如在Android系統中,環境噪音消除技術和自身音源消除技術被抽象為音頻特效(Audio Effect),這些音效以單獨演算法的形式構造成鏈式結構,通過設定檔由音頻服務在啟動時決定是否使用這些演算法,而增益自動控制則可選的實現在更底層的驅動抽象層或音頻服務當中。這些獨立存在於不同組件中的音頻前端處理演算法雖然能滿足常規的諸如手機或平板的智慧設備應用,但是由於模組之間相互獨立,很多場景需要演算法協同配合以及參考訊號採集困難的問題不能滿足複雜且使用場景靈活多變的智慧機器人。
由於目前智慧操作系統的前端音頻處理系統存在演算法設計和結構設計上的兩個問題。
首先這些演算法仍然是針對傳統平板或手機等傳統智能設備設計的。環境降噪演算法在傳統手機上的目標是降低穩態噪音,演算法參數配置上不注重對穩態噪音的消除。自身音源消除演算法則依賴於自身參考音源,傳統智慧操作系統的自身參考音樂來自自身的音頻輸出緩衝區,而緩衝區的不確定性這會導致自身參考音源訊號和接收到的音源訊號延時不固定,從而影響演算法的效果,基於上述原因針對手機或平板的自身音源消除演算法都比較保守,在有效語音和自身音源訊雜比較低的情況下,效果較差。由於傳統智慧操作系統多針對手機平板,這些智能設備多配備指向性麥克風,並且使用者使用麥克風時習慣性離設備很近,故傳統操作系統的自動增益控制並不是必須技術。
其次在結構設計上為當前智慧操作系統添加這些演算法模組並不能解決問題,這是因為智慧機器人所位於的真實場景十分複雜多變,原來各種相互獨立的前端音頻問題會互相關聯在一起。比如自動增益演算法如果參數不正確或調用順序不對會將本身細小的噪音放大然後干擾其他演算法。
鑒於上述問題,本發明提供一種前端音頻處理系統,應用於家庭智慧機器人,其中,包括:訊號分離單元,用以對一採集訊號進行分離處理以獲得有效訊號和參考訊號;第一處理單元,連接所述訊號分離單元,用以接收所述訊號分離單元輸出的所述有效訊號,並對所述有效訊號進行分析去除所述有效訊號中的低頻噪音訊號;第二處理單元,分別連接所述訊號分離單元和所述第一處理單元,分別接收所述訊號分離單元輸出的所述參考訊號和所述第一處理單元輸出的經過去除低頻噪音訊號處理的所述有效訊號,用以根據所述參考訊號按照預定的演算法去除所述有效訊號中的自噪音訊號形成純淨音頻訊號;比較單元,連接所述第二處理單元,用以接收經所述第二處理單元的所述純淨音頻訊號,並將所述純淨音頻訊號和所述有效訊號做比較,形成一比較結果;計算單元,於所述有效音頻訊號小於所述純淨音頻訊號一預設閾值的狀態下,對所述有效音頻訊號進行放大,於所述有效音頻訊號不小於所述純淨音頻訊號的所述預設閾值的狀態下,對所述有效音頻訊號進行減小。
於一較佳實施方式中,其中更包括:採集轉化單元,連接所述訊號分離單元,用以接收不同採集單元獲取的不同格式的採集訊號,並對所述採集訊號轉化成預定格式的採集訊號輸出至所述訊號分離單元。
於一較佳實施方式中,其中更包括:一麥克風,設置於所述音頻
播放裝置的輸出端,用以採集所述音頻播放裝置輸出的音頻並形成所述參考訊號。
於另一較佳實施方式中,其中所述訊號分離單元將所述有效訊號和參考訊號分佈於複數個不同聲道中,並將每個所述聲道上的所述有效訊號和所述參考訊號進行分離。
於又一較佳實施方式中,其中所述純淨音頻訊號的獲取方法為回聲時延估計方法。
於另一較佳實施方式中,其中所述純淨音頻訊號的獲取方法為歸一化最小均方自適應演算法。
於另一較佳實施方式中,其中所述純淨音頻訊號的獲取方法為非線性濾波和舒適噪音產生方法。
於又一較佳實施方式中,其中應用單元,連接所述計算單元,用於將所述計算單元輸出的所述有效音頻訊號進行變換並輸出。
綜上所述,本發明設計的一種前端音頻處理系統,該系統填補了目前市面常見嵌入式操作系統在智慧機器人領域語音前端處理方面的缺失,該框架可以再不修改現有嵌入式操作系統代碼的基礎上為後端語音識別應用提供前端語音降噪功能,具有較高的系統可擴展性和靈活性。
參考所附附圖,以更加充分的描述本發明的實施例。然而,所附附圖僅用於說明和闡述,並不構成對本發明範圍的限制:圖1本發明系統框架示意圖。
為了使本發明的技術方案及優點更加易於理解,下面結合附圖作進一步詳細說明。應當說明,此處所描述的具體實施例僅用以解釋本發明,並並不用於限定本發明。
本發明的核心思想是:通過對採集到的音頻數據進行層層處理後得到家庭智慧機器人上的應用所需要的音頻訊號,在不修改現有嵌入式操作系統代碼的基礎上為後端語音識別應用提供前端語音降噪功能,具有較高的系統可擴展性和靈活性。
所以本發明涉及一種前端音頻處理系統,該系統應用於家庭智慧機器人中,包括有:採集轉化單元,該單元採集音頻並進行預處理,由於目前不同的操作系統對音頻數據的採集方式不同,所以需要採集轉化單元來抽象音頻訊號的數據採集;訊號分離單元,與採集轉化單元連接,並用來採集參考訊號資訊,該訊號分離單元通過硬體參考訊號採集法在家庭智慧機器人的音頻模擬訊號輸出端進行訊號採集,然後將採集到的訊號合成複數不同聲道,並將每個聲道上的有效訊號和參考訊號進行分離;第一處理單元,與訊號分離單元連接,用以接收訊號分離單元輸出的有效訊號,並對有效訊號進行分析去除有效訊號中的低頻噪音訊號;第二處理單元,分別連接所述訊號分離單元和所述第一處理單元,分別接收所述訊號分離單元輸出的所述參考訊號和所述第一處理單元輸出的經過去除低頻噪音訊號處理的所述有效訊號,用以根據所述參考訊號按照預定的演算法去除所述有效訊號中的自噪音訊號形成純淨音頻訊號;比較單元,連接所述第二處理單元,用以接收經所述第二處理單元的所述純淨音頻訊號,並將所述純淨音頻訊號和所述有效訊號做比較,形成一比較結果;計算單元,於所述有效音頻訊號小於所述純淨音頻訊號一預設閾值的狀態下,對
所述有效音頻訊號進行放大,於所述有效音頻訊號不小於所述純淨音頻訊號的所述預設閾值的狀態下,對所述有效音頻訊號進行減小。
應用介面,與計算單元連接,將有效音頻訊號根據家庭智慧機器人的應用需要的聲道進行轉換並傳輸給家庭智能機器人的應用。
下面將結合具體實施例進行說明:如圖1所示,本發明針對目前家庭智慧機器人前端音頻處理問題,設計一種應用於家庭智能機器人的前端音頻處理系統,該系統主要包括有:採集轉化單元,訊號分離單元,第一處理單元,第二處理單元,比較單元和計算單元,以及應用介面;採集轉化單元是用於面向不同操作系統設計的音頻採集預處理模組,由於不同操作系統間對音頻數據的採集數據方式不同,需要一個採集轉化單元將不同數據格式轉化為訊號分離單元可識別的數據格式輸出。
訊號分離單元用於將採集訊號進行分離從而獲得有效訊號和參考訊號,本方案中採用透過設置一硬體電路獲取參考訊號,例如採用一個麥克風設置在音頻播放裝置的輸出端,麥克風採集音頻播放裝置輸出的音頻訊號並形成參考訊號,所述訊號分離單元將所述有效訊號和參考訊號分佈於複數個不同聲道中,並將每個所述聲道上的所述有效訊號和所述參考訊號進行分離。
第一處理單元用於給有效音頻訊號進行降噪處理,本方案採用基於改進的維納濾波器設計的環境音降噪演算法,該層僅對有效音頻訊號進行降噪處理,參考訊號不經過處理直接送往上層。
第二處理單元根據參考訊號消除採集轉化單元採集到的來自自身的干擾音頻訊號,該單元需要來自訊號分離單元的參考訊號和來自第一處理單元降噪後有效音頻訊號作為輸入訊號,用以根據所述參考訊號按照預定的演
算法去除所述有效訊號中的自噪音訊號形成純淨音頻訊號;其中,純淨音頻訊號的獲取方法可採用下述的任一種或幾種結合:回聲時延估計、歸一化最小均方自適應演算法、非線性濾波、舒適噪音產生。
比較單元和計算單元用於根據當前純淨音頻訊號的平均能量值對當前音頻訊號進行處理,如果當前音頻訊號能量值小於預設閾值則放大當前音頻訊號能量,如果大於則減小當前音頻訊號能量。
應用介面針對家庭智慧機器人的應用需要的聲道數,採樣並進行最後轉換工作,然後將需要的音頻訊號導出給家庭智慧機器人的語音應用。
在結構整個處理過程採用流水線式設計,每個單元都有工作線程來處理本單元的內容,然後單元間通過一個無鎖循環緩衝區進行數據通信,這樣可以提升數據的輸送量,儘量減少音頻處理帶來的延遲,除此之外,工作線程僅執行自己模組有助於在某些處理器上提高分支預測命中率。
當上述系統應用到家庭智慧機器人當中,在一個基於Android嵌入式智慧操作系統的基於語音互動的家庭智慧機器人中,實現本發明前端音頻處理系統來保證家庭智慧機器人語音識別功能在多個場景下的正常使用。首先系統的操作系統音頻介面對Android的音頻庫tinyalsa進行再封裝,然後在封裝基礎上接入採集轉化單元,這裏封裝了tinyalsa的pcm_open(用於打開一個PCM音頻流),pcm_close(用於關閉一個PCM音頻流),pcm_frames_to_bytes(用於將音頻幀數值轉換成字節值),pcm_get_buffer_size(獲得緩衝區大小),pcm_read(從tinyalsa中讀取音頻數據)等函數。訊號分離單元通過採集轉化單元提供的xread函數來讀取來音頻數據,此時系統的模擬參考音頻訊號和採集到音頻訊號混合成了一個雙聲道數據,其中第一個聲道為採集到的音頻訊號,第二個聲道
為來自系統自身的參考音頻訊號。訊號分離單元將訊號的左右聲道進行分離,一路提交給第二處理單元,一路提交給第一處理單元。第一處理單元對麥克風採集的音頻訊號進行降噪處理,然後記錄環境音降噪的演算法所消耗的時間,將時間和經過處理的音頻訊號提交給第二處理單元。第二處理單元根據音頻參考訊號,採集的音頻訊號,參考延遲時間進行降噪處理,並將結果提交到比較單元和計算單元。比較單元和計算單元根據當前音頻訊號的平均能量對音頻訊號進行增益調整,最後提交給應用介面的緩衝區。
本發明設計的一種前端音頻處理系統,該系統填補了目前市面常見嵌入式操作系統在智慧機器人領域語音前端處理方面的缺失,該框架可以再不修改現有嵌入式操作系統代碼的基礎上為後端語音識別應用提供前端語音降噪功能,具有較高的系統可擴展性和靈活性。
通過說明和附圖,給出了具體實施方式的特定結構的典型實施例,基於本發明精神,還可作其他的轉換。儘管上述發明提出了現有的較佳實施例,然而,這些內容並不作為局限。
對於本領域的技術人員而言,閱讀上述說明後,各種變化和修正無疑將顯而易見。因此,所附的權利要求書應看作是涵蓋本發明的真實意圖和範圍的全部變化和修正。在權利要求書範圍內任何和所有等價的範圍與內容,都應認為仍屬本發明的意圖和範圍內。
Claims (7)
- 一種前端音頻處理系統,應用於家庭智慧機器人,包括:訊號分離單元,用以對一採集訊號進行分離處理以獲得有效訊號和參考訊號;第一處理單元,連接所述訊號分離單元,用以接收所述訊號分離單元輸出的所述有效訊號,並對所述有效訊號進行分析去除所述有效訊號中的低頻噪音訊號;第二處理單元,分別連接所述訊號分離單元和所述第一處理單元,分別接收所述訊號分離單元輸出的所述參考訊號和所述第一處理單元輸出的經過去除低頻噪音訊號處理的所述有效訊號,用以根據所述參考訊號按照預定的演算法去除所述有效訊號中的自噪音訊號形成純淨音頻訊號;比較單元,連接所述第二處理單元,用以接收經所述第二處理單元的所述純淨音頻訊號,並將所述純淨音頻訊號和所述有效訊號做比較,形成一比較結果;計算單元,於所述有效音頻訊號小於所述純淨音頻訊號一預設閾值的狀態下,對所述有效音頻訊號進行放大,於所述有效音頻訊號不小於所述純淨音頻訊號的所述預設閾值的狀態下,對所述有效音頻訊號進行減小;採集轉化單元,連接所述訊號分離單元,用以接收不同採集單元獲取的不同格式的採集訊號,並對所述採集訊號轉化成預定格式的所述採集訊號輸出至所述訊號分離單元。
- 如申請專利範圍第1項所述之系統,其中更包括: 一麥克風,設置於所述音頻播放裝置的輸出端,用以採集所述音頻播放裝置輸出的音頻並形成所述參考訊號。
- 如申請專利範圍第2項所述之系統,其中所述訊號分離單元將所述有效訊號和參考訊號分佈於複數個不同聲道中,並將每個所述聲道上的所述有效訊號和所述參考訊號進行分離。
- 如申請專利範圍第1項所述之系統,其中所述純淨音頻訊號的獲取方法為回聲時延估計方法。
- 如申請專利範圍第1項所述之系統,其中所述純淨音頻訊號的獲取方法為歸一化最小均方自適應演算法。
- 如申請專利範圍第1項所述之系統,其中所述純淨音頻訊號的獲取方法為非線性濾波和舒適噪音產生方法。
- 如申請專利範圍第1項所述之系統,其中還包括應用介面,連接所述計算單元,用於將所述計算單元輸出的所述有效音頻訊號進行變換並輸出。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510385306.8A CN106328154B (zh) | 2015-06-30 | 2015-06-30 | 一种前端音频处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201701275A TW201701275A (zh) | 2017-01-01 |
TWI581255B true TWI581255B (zh) | 2017-05-01 |
Family
ID=57607841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105120417A TWI581255B (zh) | 2015-06-30 | 2016-06-29 | 前端音頻處理系統 |
Country Status (4)
Country | Link |
---|---|
CN (1) | CN106328154B (zh) |
HK (1) | HK1231622A1 (zh) |
TW (1) | TWI581255B (zh) |
WO (1) | WO2017000772A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI671738B (zh) * | 2018-10-04 | 2019-09-11 | 塞席爾商元鼎音訊股份有限公司 | 聲音播放裝置及其降低噪音之方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10013995B1 (en) * | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
CN109410935A (zh) * | 2018-11-01 | 2019-03-01 | 平安科技(深圳)有限公司 | 一种基于语音识别的目的地搜索方法及装置 |
CN111179931B (zh) * | 2020-01-03 | 2023-07-21 | 青岛海尔科技有限公司 | 用于语音交互的方法、装置及家用电器 |
CN115294952A (zh) * | 2022-05-23 | 2022-11-04 | 神盾股份有限公司 | 音频处理方法及装置、非瞬时性计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101031963A (zh) * | 2004-09-16 | 2007-09-05 | 法国电信 | 处理有噪声的声音信号的方法以及实现该方法的装置 |
CN101369427A (zh) * | 2007-08-13 | 2009-02-18 | 哈曼贝克自动系统股份有限公司 | 通过组合的波束形成和后滤波的降噪 |
TW201042634A (en) * | 2008-10-24 | 2010-12-01 | Qualcomm Inc | Audio source proximity estimation using sensor array for noise reduction |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0666942B2 (ja) * | 1985-07-17 | 1994-08-24 | ソニー株式会社 | ヘリカルスキヤン方式磁気記録再生装置 |
JPH0746083A (ja) * | 1993-07-27 | 1995-02-14 | Toshiba Corp | 音声合成兼帯域制限回路及び低音増強回路 |
ATE444613T1 (de) * | 2004-06-02 | 2009-10-15 | Panasonic Corp | Vorrichtung und verfahren zum empfangen von audiodaten |
JP2006074642A (ja) * | 2004-09-06 | 2006-03-16 | Matsushita Electric Ind Co Ltd | 会議電話装置 |
CN1809105B (zh) * | 2006-01-13 | 2010-05-12 | 北京中星微电子有限公司 | 适用于小型移动通信设备的双麦克语音增强方法及系统 |
CN1946101A (zh) * | 2006-10-31 | 2007-04-11 | 华为技术有限公司 | 一种实现移动终端音频信号自适应的方法及装置 |
US8175871B2 (en) * | 2007-09-28 | 2012-05-08 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
CN101751918B (zh) * | 2008-12-18 | 2012-04-18 | 李双清 | 新型消音装置及消音方法 |
CN101562669B (zh) * | 2009-03-11 | 2012-10-03 | 上海朗谷电子科技有限公司 | 自适应全双工全频段回声消除的方法 |
CN101667426A (zh) * | 2009-09-23 | 2010-03-10 | 中兴通讯股份有限公司 | 一种消除环境噪声的装置及方法 |
JP2011107603A (ja) * | 2009-11-20 | 2011-06-02 | Sony Corp | 音声認識装置、および音声認識方法、並びにプログラム |
CN101901601A (zh) * | 2010-05-17 | 2010-12-01 | 天津大学 | 一种车内降噪语音通讯的方法与系统 |
CN102347027A (zh) * | 2011-07-07 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及其语音增强方法 |
CN102800324A (zh) * | 2012-07-30 | 2012-11-28 | 东莞宇龙通信科技有限公司 | 用于移动终端的音频处理系统和方法 |
CN102831897A (zh) * | 2012-08-15 | 2012-12-19 | 歌尔声学股份有限公司 | 一种多媒体设备和一种多媒体信号处理方法 |
CN104378774A (zh) * | 2013-08-15 | 2015-02-25 | 中兴通讯股份有限公司 | 一种语音质量处理的方法及装置 |
CN104517607A (zh) * | 2014-12-16 | 2015-04-15 | 佛山市顺德区美的电热电器制造有限公司 | 滤除语音控制电器中的噪声的方法及语音控制电器 |
-
2015
- 2015-06-30 CN CN201510385306.8A patent/CN106328154B/zh active Active
-
2016
- 2016-06-14 WO PCT/CN2016/085755 patent/WO2017000772A1/zh active Application Filing
- 2016-06-29 TW TW105120417A patent/TWI581255B/zh not_active IP Right Cessation
-
2017
- 2017-05-19 HK HK17105080.1A patent/HK1231622A1/zh not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101031963A (zh) * | 2004-09-16 | 2007-09-05 | 法国电信 | 处理有噪声的声音信号的方法以及实现该方法的装置 |
CN101369427A (zh) * | 2007-08-13 | 2009-02-18 | 哈曼贝克自动系统股份有限公司 | 通过组合的波束形成和后滤波的降噪 |
TW201042634A (en) * | 2008-10-24 | 2010-12-01 | Qualcomm Inc | Audio source proximity estimation using sensor array for noise reduction |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI671738B (zh) * | 2018-10-04 | 2019-09-11 | 塞席爾商元鼎音訊股份有限公司 | 聲音播放裝置及其降低噪音之方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106328154B (zh) | 2019-09-17 |
HK1231622A1 (zh) | 2017-12-22 |
TW201701275A (zh) | 2017-01-01 |
CN106328154A (zh) | 2017-01-11 |
WO2017000772A1 (zh) | 2017-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI581255B (zh) | 前端音頻處理系統 | |
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
CN113205803B (zh) | 一种具有自适应降噪能力的语音识别方法及装置 | |
WO2020147642A1 (zh) | 语音信号处理方法、装置、计算机可读介质及电子设备 | |
US11587560B2 (en) | Voice interaction method, device, apparatus and server | |
CN108461081B (zh) | 语音控制的方法、装置、设备和存储介质 | |
CN105551498A (zh) | 一种语音识别的方法及装置 | |
CN110780741A (zh) | 模型训练方法、应用运行方法、装置、介质及电子设备 | |
CN109493877A (zh) | 一种助听装置的语音增强方法和装置 | |
WO2023284402A1 (zh) | 音频信号处理方法、系统、装置、电子设备和存储介质 | |
CN110473568A (zh) | 场景识别方法、装置、存储介质及电子设备 | |
CN111540370A (zh) | 音频处理方法、装置、计算机设备及计算机可读存储介质 | |
CN110992967A (zh) | 一种语音信号处理方法、装置、助听器及存储介质 | |
CN116403592A (zh) | 一种语音增强方法、装置、电子设备、芯片及存储介质 | |
US12142259B2 (en) | Detection of live speech | |
US20190361664A1 (en) | Robot and speech interaction recognition rate improvement circuit and method thereof | |
WO2017045512A1 (zh) | 一种语音识别的方法、装置、终端及语音识别设备 | |
CN113744732B (zh) | 设备唤醒相关方法、装置及故事机 | |
CN117219107B (zh) | 一种回声消除模型的训练方法、装置、设备及存储介质 | |
CN112243182B (zh) | 拾音电路、方法及装置 | |
AU2017355584A1 (en) | Intelligent hearing aid | |
CN112562712A (zh) | 一种录音数据处理方法、系统、电子设备及存储介质 | |
CN109473111B (zh) | 一种语音赋能装置及方法 | |
CN114023352B (zh) | 一种基于能量谱深度调制的语音增强方法及装置 | |
CN105491336A (zh) | 一种低功耗图像识别模块 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |