JP2020012976A - 音源分離の評価装置および音源分離装置 - Google Patents
音源分離の評価装置および音源分離装置 Download PDFInfo
- Publication number
- JP2020012976A JP2020012976A JP2018135067A JP2018135067A JP2020012976A JP 2020012976 A JP2020012976 A JP 2020012976A JP 2018135067 A JP2018135067 A JP 2018135067A JP 2018135067 A JP2018135067 A JP 2018135067A JP 2020012976 A JP2020012976 A JP 2020012976A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- separation
- spatial correlation
- correlation matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 149
- 238000011156 evaluation Methods 0.000 title claims abstract description 35
- 239000011159 matrix material Substances 0.000 claims abstract description 94
- 238000001228 spectrum Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000004364 calculation method Methods 0.000 claims abstract description 36
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 24
- 230000004913 activation Effects 0.000 claims description 11
- 238000001994 activation Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 16
- 239000013598 vector Substances 0.000 description 6
- 238000005457 optimization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
図1は、第1の実施の形態の音源分離の評価装置1の構成を示す図である。第1の実施の形態の音源分離の評価装置1は、混合系手法によって音源分離を行い、その分離性能を評価する装置である。図1は、音源数L=3の場合を記載している。
図3は、第2の実施の形態の音源分離の評価装置2の構成を示す図である。第2の実施の形態の音源分離の評価装置2は、例えば独立成分分析、独立ベクトル分析等の分離系手法によって音源を分離する装置である。図3では、音源数L=3の場合を記載している。
y =Wf x ・・・(6)
図4は、第3の実施の形態の音源分離の評価装置3の構成を示す図である。図2に示したように、音源の分離結果とMUSICスペクトルの重なりには関係がある。第3の実施の形態の音源分離の評価装置3は、分離度算出部16を備えている。分離度算出部16は、第1の実施の形態と同様にして推定されたMUSICスペクトルSfl(θ)を用いて、音源の分離度を定量的に評価する。
|0.4-(-1)|+|-1-(-1.25)|+|0.4-(-1.25)|=3.3
である。これに対して、右のケースでは、音源S1,S2,S3のピーク位置がそれぞれ0.25,0.25,−1である。各ピーク位置の差の絶対値の総和は、
|0.25-0.25|+|0.25-(-1)|+|0.25-(-1)|=2.5
である。したがって、左のケースの方が、各ピーク位置の差が大きく、音源の分離度が大きいと判断できる。
第4の実施の形態の音源分離装置について説明する。第4の実施の形態では、MUSICスペクトルの情報をパーミュテーションの解決に使う。全周波数ビンに対して足し合わせたMUSICスペクトル
4 音源分離装置
10 マイク
11 音源分離部
12 空間相関行列算出部
13 固有値分解部
14 到来方向推定部
15 逆行列算出部
16 分離度算出部
17 パーミュテーション算出部
Claims (11)
- 複数の音源から到来した音を収音する収音部と、
前記収音部にて収音した音の音源を分離する音源分離部と、
前記各音源に対する空間相関行列を求める空間相関行列算出部と、
前記空間相関行列を固有値分解して固有値及び固有ベクトルを求める固有値分解部と、
前記固有値及び固有ベクトルを用いて、MUSIC法により、各音源の各周波数について、MUSICスペクトルを求める到来方向推定部と、
を備える音源分離の評価装置。 - 前記音源分離部は、前記収音部にて収音した音のスペクトログラムを複数の基底とそれに対応するアクティベーションに分解し、前記基底とアクティベーションをクラスタリングして音源分離し、
前記空間相関行列算出部は、前記音源分離部にて分離された各音源について、空間相関行列を求める、請求項1に記載の音源分離の評価装置。 - 前記音源分離部は、前記収音部にて収音した音を独立した信号に分離する分離行列を、前記音のスペクトログラムの周波数ビンごとに推定して音源を分離し、
前記空間相関行列算出部は、前記分離行列の逆行列を求めることにより、各音源の空間相関行列を求める、請求項1に記載の音源分離の評価装置。 - 前記到来方向推定部にて求めた各音源のMUSICスペクトルの近さを評価する分離度算出部をさらに備える、請求項1乃至3のいずれかに記載の音源分離の評価装置。
- 複数の音源から到来した音を収音する収音部と、
前記収音部にて収音した音の音源を分離する音源分離部と、
前記各音源に対する空間相関行列を求める空間相関行列算出部と、
前記空間相関行列を固有値分解して固有値及び固有ベクトルを求める固有値分解部と、
前記固有値及び固有ベクトルを用いて、MUSIC法により、各音源の各周波数について、MUSICスペクトルを求める到来方向推定部と、
各音源のMUSICスペクトルと、周波数ごとのMUSICスペクトルとを比較して、パーミュテーションが起こっているか否かを判定するパーミュテーション算出部と、
を備え、
前記音源分離部は、前記パーミュテーション算出部での判定結果を、音源の分離に用いる音源分離装置。 - 前記音源分離部は、前記収音部にて収音した音のスペクトログラムを複数の基底とそれに対応するアクティベーションに分解し、前記基底とアクティベーションをクラスタリングして音源分離し、
前記空間相関行列算出部は、前記音源分離部にて分離された各音源について、空間相関行列を求める、請求項5に記載の音源分離装置。 - 前記音源分離部は、前記収音部にて収音した音を独立した信号に分離する分離行列を、前記音のスペクトログラムの周波数ビンごとに推定して音源を分離し、
前記空間相関行列算出部は、前記分離行列の逆行列を求めることにより、各音源の空間相関行列を求める、請求項5に記載の音源分離装置。 - 到来した音の音源を分離し、その分離性能を評価する方法であって、
収音した音の音源を分離するステップと、
前記各音源に対する空間相関行列を求めるステップと、
前記空間相関行列を固有値分解して固有値及び固有ベクトルを求めるステップと、
前記固有値及び固有ベクトルを用いて、MUSIC法により、各音源の各周波数について、MUSICスペクトルを求めるステップと、
を備える音源分離の評価方法。 - 到来した音の音源を分離する方法であって、
収音した音の音源を分離するステップと、
前記各音源に対する空間相関行列を求めるステップと、
前記空間相関行列を固有値分解して固有値及び固有ベクトルを求めるステップと、
前記固有値及び固有ベクトルを用いて、MUSIC法により、各音源の各周波数について、MUSICスペクトルを求めるステップと、
各音源のMUSICスペクトルと、周波数ごとのMUSICスペクトルとを比較して、パーミュテーションが起こっているか否かを判定するステップと、
を備え、
前記各音源を分離するステップにおいて、前記パーミュテーションが起こっているか否かの判定結果を、音源の分離に用いる音源分離方法。 - 到来した音の音源を分離し、その分離性能を評価するためのプログラムであって、コンピュータに、
収音した音の音源を分離するステップと、
前記各音源に対する空間相関行列を求めるステップと、
前記空間相関行列を固有値分解して固有値及び固有ベクトルを求めるステップと、
前記固有値及び固有ベクトルを用いて、MUSIC法により、各音源の各周波数について、MUSICスペクトルを求めるステップと、
を実行させるプログラム。 - 到来した音の音源を分離するためのプログラムであって、コンピュータに、
収音した音の音源を分離するステップと、
前記各音源に対する空間相関行列を求めるステップと、
前記空間相関行列を固有値分解して固有値及び固有ベクトルを求めるステップと、
前記固有値及び固有ベクトルを用いて、MUSIC法により、各音源の各周波数について、MUSICスペクトルを求めるステップと、
各音源のMUSICスペクトルと、周波数ごとのMUSICスペクトルとを比較して、パーミュテーションが起こっているか否かを判定するステップと、
を実行させ、
前記各音源を分離するステップにおいて、前記パーミュテーションが起こっているか否かの判定結果を、音源の分離に用いるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018135067A JP7014682B2 (ja) | 2018-07-18 | 2018-07-18 | 音源分離の評価装置および音源分離装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018135067A JP7014682B2 (ja) | 2018-07-18 | 2018-07-18 | 音源分離の評価装置および音源分離装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020012976A true JP2020012976A (ja) | 2020-01-23 |
JP7014682B2 JP7014682B2 (ja) | 2022-02-01 |
Family
ID=69169196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018135067A Active JP7014682B2 (ja) | 2018-07-18 | 2018-07-18 | 音源分離の評価装置および音源分離装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7014682B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593529A (zh) * | 2021-07-09 | 2021-11-02 | 北京字跳网络技术有限公司 | 说话人分离算法的评估方法、装置、电子设备和存储介质 |
JP7524109B2 (ja) | 2021-03-09 | 2024-07-29 | 株式会社東芝 | データ分析装置、方法及びプログラム |
WO2024237132A1 (ja) * | 2023-05-16 | 2024-11-21 | パナソニックIpマネジメント株式会社 | 情報処理方法、情報処理装置、音登録システム、及び、プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014137226A (ja) * | 2013-01-15 | 2014-07-28 | Advanced Telecommunication Research Institute International | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 |
WO2018207453A1 (ja) * | 2017-05-08 | 2018-11-15 | ソニー株式会社 | 情報処理装置 |
-
2018
- 2018-07-18 JP JP2018135067A patent/JP7014682B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014137226A (ja) * | 2013-01-15 | 2014-07-28 | Advanced Telecommunication Research Institute International | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 |
WO2018207453A1 (ja) * | 2017-05-08 | 2018-11-15 | ソニー株式会社 | 情報処理装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7524109B2 (ja) | 2021-03-09 | 2024-07-29 | 株式会社東芝 | データ分析装置、方法及びプログラム |
CN113593529A (zh) * | 2021-07-09 | 2021-11-02 | 北京字跳网络技术有限公司 | 说话人分离算法的评估方法、装置、电子设备和存储介质 |
WO2024237132A1 (ja) * | 2023-05-16 | 2024-11-21 | パナソニックIpマネジメント株式会社 | 情報処理方法、情報処理装置、音登録システム、及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7014682B2 (ja) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Arberet et al. | A robust method to count and locate audio sources in a multichannel underdetermined mixture | |
US7647209B2 (en) | Signal separating apparatus, signal separating method, signal separating program and recording medium | |
KR20090033716A (ko) | 혼합 사운드로부터의 음원 판별 방법 및 장치 | |
US10262678B2 (en) | Signal processing system, signal processing method and storage medium | |
CN109923430B (zh) | 用于进行相位差展开的装置及方法 | |
EP2187389B1 (en) | Sound processing device | |
JP7014682B2 (ja) | 音源分離の評価装置および音源分離装置 | |
US20220286775A1 (en) | Acoustic processing device, acoustic processing method, and storage medium | |
Aissa-El-Bey et al. | Blind separation of underdetermined convolutive mixtures using their time–frequency representation | |
EP2940687A1 (en) | Methods and systems for processing and mixing signals using signal decomposition | |
US8452592B2 (en) | Signal separating apparatus and signal separating method | |
CN110709929A (zh) | 处理声音数据以分离多声道信号中的声源 | |
EP3113508A1 (en) | Signal-processing device, method, and program | |
Osterwise et al. | On over-determined frequency domain BSS | |
Orovi et al. | Time-frequency analysis and singular value decomposition applied to the highly multicomponent musical signals | |
CN106297820A (zh) | 具有基于迭代加权的源方向确定的音频源分离 | |
JP6448567B2 (ja) | 音響信号解析装置、音響信号解析方法、及びプログラム | |
JP4946330B2 (ja) | 信号分離装置及び方法 | |
CN110265060B (zh) | 一种基于密度聚类的说话人数目自动检测方法 | |
JP2011176535A (ja) | 信号処理装置 | |
TW201342364A (zh) | 於旋積混合盲信號源中將多個訊號源進行分離之方法 | |
JP5078717B2 (ja) | 入射波数推定装置及び入射波数推定方法 | |
Bai et al. | Acoustic source localization and deconvolution-based separation | |
KR100653173B1 (ko) | 다중경로 혼합신호 분리계수의 교환 모호성을 해소하는방법 및 그 장치 | |
JP5328210B2 (ja) | 入射波数推定装置及び入射波数推定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7014682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |