JP2017097188A - 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム - Google Patents
話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム Download PDFInfo
- Publication number
- JP2017097188A JP2017097188A JP2015229670A JP2015229670A JP2017097188A JP 2017097188 A JP2017097188 A JP 2017097188A JP 2015229670 A JP2015229670 A JP 2015229670A JP 2015229670 A JP2015229670 A JP 2015229670A JP 2017097188 A JP2017097188 A JP 2017097188A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- utterance
- registered
- similarity
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 236
- 238000004364 calculation method Methods 0.000 claims abstract description 76
- 238000012795 verification Methods 0.000 claims description 73
- 238000000034 method Methods 0.000 claims description 36
- 238000012935 Averaging Methods 0.000 claims description 13
- 238000013441 quality evaluation Methods 0.000 claims 3
- 238000010606 normalization Methods 0.000 description 46
- 239000011159 matrix material Substances 0.000 description 45
- 238000012545 processing Methods 0.000 description 39
- 238000004458 analytical method Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 20
- 238000000605 extraction Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 8
- 230000007423 decrease Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】登録発話から登録発話の区間より短い区間を有する分割済登録発話を生成し、分割済登録発話から分割済登録発話話者特徴ベクトルを算出する分割済登録発話話者特徴ベクトル算出部1001と、認識発話から認識発話話者特徴ベクトルを算出する認識発話話者特徴ベクトル算出部1002と、認識発話話者特徴ベクトルと分割済登録発話話者特徴ベクトルを用いて認識発話と分割済登録発話の類似度を計算する類似度計算部150とを有する。
【選択図】図10
Description
話者特徴ベクトルには、発話長が長くなるほど話者情報が強く表れるという性質以外に、話者情報だけでなく発話に含まれる言葉の情報にも依存するという性質もあることが知られている。この性質から、同程度の発話長でも発話に含まれる言葉が異なるほど話者特徴ベクトルの類似度が低下する傾向にある。例えば「おとな」と「おとこ」という発話の話者特徴ベクトルの類似度は高く、「おとな」と「こども」という発話の話者特徴ベクトルの類似度は低くなりやすいという傾向がある。
(参考非特許文献2:A. O. Hatch, S. Kajarekar, A. Stolcke, “Within-Class Covariance Normalization for SVM-based Speaker Recognition”, Proc. Interspeech 2006, pp.1471-1474, 2006.)
1.登録発話の音声を短時間ごと(識別発話と同程度の長さが好ましい)に分割し、分割後の各音声(分割済登録発話という)に対して話者特徴ベクトルを算出する(S110、S820−1、S830−1)。
2.話者特徴ベクトルと登録発話の話者名を組にして登録発話データベースに登録する(S840)。
1.正規化行列学習用発話の音声に対して話者特徴ベクトルを算出する(S820−3、S830−3)。
2.話者ごとに話者特徴ベクトルの分散共分散行列を求め、これらの行列の平均をとることで話者特徴ベクトル正規化行列を学習する(S180)。
1.識別発話の音声に対して話者特徴ベクトルを算出する(S820−2、S830−2)。
2.識別発話の話者特徴ベクトルと各分割済登録発話の話者特徴ベクトルとの類似度を計算する(S150)。
3.2.で求めた類似度を話者ごとに平均化し、話者ごとの平均類似度を計算する(S160)。
4.話者ごとの平均類似度の最大値に対応する話者名を識別発話の話者(識別結果)として返す(S870)。
<発話分割部110>
入力:登録発話
出力:分割済登録発話
登録発話集合の各登録発話を短時間ごとに分割し、分割済登録発話を生成する(S110)。分割時、区間の重複は許すものとする。つまり、図9にあるように分割済登録発話の音声には重なりがある。分割時の窓幅は、話者識別の利用時に想定される識別発話と同程度となるようにし、例えば1.5秒とする。シフト幅は例えば0.5秒とする。
入力:分割済登録発話、認識発話、正規化行列学習用発話
出力:音響特徴量ベクトル系列
各発話から音響特徴量ベクトル系列を算出する(S820−1、S820−2、S820−3)。算出した音響特徴量ベクトル系列をそれぞれ分割済登録発話音響特徴量ベクトル系列、認識発話音響特徴量ベクトル系列、正規化行列学習用発話音響特徴量ベクトル系列という。話者識別装置の音響分析部820−2に識別発話が入力されること、話者照合装置の音響分析部820−2に照合発話が入力されることに対応して、認識発話音響特徴量ベクトル系列のことをそれぞれ識別発話音響特徴量ベクトル系列、照合発話音響特徴量ベクトル系列という。
(参考非特許文献3:鹿野清宏、伊藤克亘、河原達也、武田一哉、山本幹雄、“IT Text 音声認識システム”、pp.13-14、オーム社、2001)
入力:音響特徴量ベクトル系列、UBMモデル、話者特徴量抽出モデル
出力:話者特徴ベクトル
各音響特徴量ベクトルからUBMモデル、話者特徴量抽出モデルを用いて話者特徴ベクトルを算出する(S830−1、S830−2、S830−3)。算出した話者特徴ベクトルをそれぞれ分割済登録発話話者特徴ベクトル、認識発話話者特徴ベクトル、正規化行列学習用発話話者特徴ベクトルという。話者特徴ベクトルとして、話者識別装置800と同じく、i−vectorを用いる。音響分析部820−2と同様、話者特徴ベクトル算出部830−2の入力が識別発話音響特徴量ベクトル系列、照合発話音響特徴量ベクトル系列であることに対応して、認識発話話者特徴ベクトルのことをそれぞれ識別発話話者特徴ベクトル、照合発話話者特徴ベクトルという。
入力:分割済登録発話話者特徴ベクトル、話者名
出力先:登録発話データベース
分割済登録発話話者特徴ベクトルとそれに対応する話者名(分割元となった登録発話の話者名)を組とし、登録発話記録部803の登録発話データベースへ追加する(S840)。話者名は、先述の通り、人手で与えるものとする。つまり、登録発話データベースには登録発話集合の各登録発話に対して1つ以上の分割済登録発話話者特徴ベクトルが登録されることとなる。
入力:正規化行列学習用話者特徴ベクトル、正規化行列学習用話者名
出力:話者特徴ベクトル正規化行列
話者特徴ベクトル正規化行列の学習を行う(S180)。話者特徴ベクトル正規化行列は、話者ごとに(つまり、正規化行列学習用話者名が同一の正規化行列学習用話者特徴ベクトル群から)話者特徴ベクトルの分散共分散行列を求め、求めた分散共分散行列を全話者で平均化することで得られる。
入力:話者特徴ベクトル正規化行列、識別発話話者特徴ベクトル、分割済登録発話話者特徴ベクトル、話者名
出力:類似度、話者名
識別発話話者特徴ベクトルと登録発話データベースに含まれるすべての分割済登録発話話者特徴ベクトルとの類似度を計算する(S150)。計算した類似度は、分割済登録発話話者特徴ベクトルに対応する話者名と組にして出力される。
入力:類似度、話者名
出力:話者ごとの平均類似度、話者名
類似度を話者ごとに平均化し、話者ごとの平均類似度を求める(S160)。計算した平均類似度は、分割済登録発話話者特徴ベクトルに対応する話者名と組にして出力される。話者ごとの平均をとるために、例えば、分割元を同じくする分割済登録発話話者特徴ベクトルとの類似度の範囲で平均をとるなどすればよい。また、同一話者による複数の登録発話が話者識別装置100に入力され、当該登録発話から算出される分割済登録発話話者特徴ベクトルが登録データベースに登録されている場合は、同一の話者名と組になっているこれらの分割済登録発話話者特徴ベクトルのすべてあるいは一部を用いて平均類似度を求めるようにしてもよい。
入力:話者ごとの平均類似度、話者名
出力:識別結果(話者名)
話者ごとの平均類似度のうち、最大となる平均類似度に対応する話者名(つまり、分割元となった登録発話の話者名)を選択、識別結果として返す(S870)。
入力:登録発話、UBMモデル、話者特徴量抽出モデル
出力:分割済登録発話話者特徴ベクトル
登録発話から生成した分割済登録発話から、UBMモデルと話者特徴量抽出モデルを用いて分割済登録発話話者特徴ベクトルを算出する(S110、S820−1、S830−1)。
入力:認識発話、UBMモデル、話者特徴量抽出モデル
出力:認識発話話者特徴ベクトル
認識発話から、UBMモデルと話者特徴量抽出モデルを用いて認識発話話者特徴ベクトルを算出する(S820−2、S830−2)。
入力:識別発話話者特徴ベクトル、分割済登録発話話者特徴ベクトル、話者名
出力:類似度、話者名
識別発話話者特徴ベクトルと登録発話データベースに含まれるすべての分割済登録発話話者特徴ベクトルとの類似度を計算する(S850)。類似度は非特許文献1のコサイン類似度とする。計算した類似度は、分割済登録発話話者特徴ベクトルに対応する話者名と組にして出力される。
入力:話者ごとの平均類似度、話者名
出力:平均類似度の最大値に対応する話者名、平均類似度の最大値
話者ごとの平均類似度のうち、最大となる平均類似度に対応する話者名を選択、選択した話者名に対応する平均類似度(つまり、平均類似度の最大値)を出力する(S875)。話者識別部870では平均類似度の最大値に対応する話者名を識別結果として出力したが、話者識別部875では平均類似度の最大値もあわせて出力する。
入力:平均類似度の最大値に対応する話者名、平均類似度の最大値、閾値
出力:識別結果
識別発話の話者が登録外話者かを判定し、識別発話の話者が登録発話データベースにいる場合は話者名を、識別発話の話者が登録発話データベースにない場合は登録外話者である旨を識別結果として出力する(S310)。登録外話者の判定は、平均類似度の最大値の閾値処理により実現する。閾値は事前に設定されているものとする。
1.登録発話の音声を短時間ごと(識別発話と同程度の長さが好ましい)に分割し、分割後の各音声(分割済登録発話という)に対して話者特徴ベクトルを算出する(S110、S820−1、S830−1)。
2.話者特徴ベクトルを登録発話データベースに登録する(S940)。
1.照合発話の音声に対して話者特徴ベクトルを算出する(S820−2、S830−2)。
2.照合発話の話者特徴ベクトルと各分割済登録発話の話者特徴ベクトルとの類似度を計算する(S450)。
3.2.で求めた類似度を登録発話ごとに平均化し、登録発話ごとの平均類似度を計算する(S460)。
4.平均類似度の最大値が閾値より大きいかに基づき、登録話者本人であるかを判定し、照合結果を返す(S970)。
入力:分割済登録発話話者特徴ベクトル
出力先:登録発話データベース
分割済登録発話話者特徴ベクトルを登録発話記録部903の登録発話データベースへ追加する(S940)。実施例1と同様、登録発話データベースには登録発話集合の各登録発話に対して1つ以上の分割済登録発話話者特徴ベクトルが登録されることとなる。
入力:話者特徴ベクトル正規化行列、照合発話話者特徴ベクトル、分割済登録発話話者特徴ベクトル
出力:類似度
照合発話話者特徴ベクトルと登録発話データベースに含まれるすべての分割済登録発話話者特徴ベクトルとの類似度を計算する(S450)。正規化あり類似度計算部150との違いは、話者名を入出力としない点である。
入力:類似度
出力:平均類似度
類似度を登録発話ごとに平均化し、登録発話ごとの平均類似度を求める(S460)。類似度平均化部160との違いは、話者名を入出力としない点である。平均値を計算する範囲を登録発話単位ではなく、同一の話者の発話に由来するものであるか否かの判断に利用できる情報で特定できる範囲としてもよい。
入力:平均類似度、閾値
出力:照合結果
平均類似度の最大値が閾値よりも大きい場合は登録発話の話者と同一話者、閾値よりも小さい場合は別話者であると判定し、照合結果として返す(S970)。または、類似度計算部950の出力である類似度各々について閾値との比較を行い、一つでも閾値より大きいものがある場合に登録発話の話者であるとの照合結果を生成し、出力するようにしてもよい(S970)。登録外話者判定部310と同様、閾値以上であるか否かにより閾値処理を行ってもよい。
入力:照合発話話者特徴ベクトル、分割済登録発話話者特徴ベクトル
出力:類似度
照合発話話者特徴ベクトルと登録発話データベースに含まれるすべての分割済登録発話話者特徴ベクトルとの類似度を計算する(S950)。類似度は非特許文献1のコサイン類似度とする。類似度計算部850との違いは、話者名を入出力としない点である。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (8)
- 話者識別または話者照合の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
前記登録発話から当該登録発話の区間より短い区間を有する分割済登録発話を生成し、当該分割済登録発話から分割済登録発話話者特徴ベクトルを算出する分割済登録発話話者特徴ベクトル算出部と、
前記認識発話から認識発話話者特徴ベクトルを算出する認識発話話者特徴ベクトル算出部と、
前記認識発話話者特徴ベクトルと前記分割済登録発話話者特徴ベクトルを用いて前記認識発話と前記分割済登録発話の類似度を計算する類似度計算部と
を有する話者らしさ評価装置。 - 請求項1に記載の話者らしさ評価装置であって、
前記分割済登録発話話者特徴ベクトル算出部は、2以上の分割済登録発話を生成するものであり、
前記類似度計算部は、前記2以上の分割済登録発話の各々に対して前記類似度を計算するものであり、
さらに、
前記類似度の平均値である平均類似度を計算する類似度平均化部と
を有する話者らしさ評価装置。 - 話者識別の対象となる話者の発話音声を識別発話、1以上の登録発話を要素とする登録発話の集合を登録発話集合とし、
前記識別発話と前記登録発話集合の登録発話の各々に対して請求項1または請求項2に記載の話者らしさ評価装置を用いて計算した前記類似度または前記平均類似度から、前記識別発話の識別結果を生成する話者識別装置であって、
前記類似度または前記平均類似度の最大値に対応する登録発話の話者名を選択し、前記話者名を前記識別結果とする話者識別部と
を有する話者識別装置。 - 話者識別の対象となる話者の発話音声を識別発話、1以上の登録発話を要素とする登録発話の集合を登録発話集合とし、
前記識別発話と前記登録発話集合の登録発話の各々に対して請求項1または請求項2に記載の話者らしさ評価装置を用いて計算した前記類似度または前記平均類似度から、前記識別発話の識別結果を生成する話者識別装置であって、
前記類似度または前記平均類似度の最大値に対応する登録発話の話者名と当該最大値を選択する話者識別部と、
前記最大値が大きいことを示す所定の範囲にある場合に前記話者名を前記識別結果とする登録外話者判定部と
を有する話者識別装置。 - 話者照合の対象となる話者の発話音声を照合発話、1以上の登録発話を要素とする登録発話の集合を登録発話集合とし、
前記照合発話と前記登録発話集合の登録発話の各々に対して請求項1または請求項2に記載の話者らしさ評価装置を用いて計算した前記類似度または前記平均類似度から、前記照合発話の照合結果を生成する話者照合装置であって、
前記最大値が大きいことを示す所定の範囲にある場合に前記登録発話の話者であるとの照合結果を生成する話者照合部と
を有する話者照合装置。 - 話者識別または話者照合の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
前記登録発話から当該登録発話の区間より短い区間を有する分割済登録発話を生成し、当該分割済登録発話から分割済登録発話話者特徴ベクトルを算出する分割済登録発話話者特徴ベクトル算出ステップと、
前記認識発話から認識発話話者特徴ベクトルを算出する認識発話話者特徴ベクトル算出ステップと、
前記認識発話話者特徴ベクトルと前記分割済登録発話話者特徴ベクトルを用いて前記認識発話と前記分割済登録発話の類似度を計算する類似度計算ステップと
を実行する話者らしさ評価方法。 - 請求項6に記載の話者らしさ評価方法であって、
前記分割済登録発話話者特徴ベクトル算出ステップは、2以上の分割済登録発話を生成するものであり、
前記類似度計算ステップは、前記2以上の分割済登録発話の各々に対して前記類似度を計算するものであり、
さらに、
前記類似度の平均値である平均類似度を計算する類似度平均化ステップと
を実行する話者らしさ評価方法。 - 請求項6または7に記載の話者らしさ評価方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015229670A JP2017097188A (ja) | 2015-11-25 | 2015-11-25 | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015229670A JP2017097188A (ja) | 2015-11-25 | 2015-11-25 | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017097188A true JP2017097188A (ja) | 2017-06-01 |
Family
ID=58817786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015229670A Pending JP2017097188A (ja) | 2015-11-25 | 2015-11-25 | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017097188A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020086430A (ja) * | 2018-11-19 | 2020-06-04 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者識別装置、話者識別方法、及び、プログラム |
CN111462762A (zh) * | 2020-03-25 | 2020-07-28 | 清华大学 | 一种说话人向量正则化方法、装置、电子设备和存储介质 |
CN111816184A (zh) * | 2019-04-12 | 2020-10-23 | 松下电器(美国)知识产权公司 | 讲话人识别方法、识别装置以及记录介质、数据库生成方法、生成装置以及记录介质 |
CN113593529A (zh) * | 2021-07-09 | 2021-11-02 | 北京字跳网络技术有限公司 | 说话人分离算法的评估方法、装置、电子设备和存储介质 |
WO2022113218A1 (ja) * | 2020-11-25 | 2022-06-02 | 日本電信電話株式会社 | 話者認識方法、話者認識装置および話者認識プログラム |
JP7473910B2 (ja) | 2020-03-27 | 2024-04-24 | 株式会社フュートレック | 話者認識装置、話者認識方法およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008064928A (ja) * | 2006-09-06 | 2008-03-21 | Yamaha Corp | 生体認証装置、生体認証方法およびプログラム |
JP2009294307A (ja) * | 2008-06-03 | 2009-12-17 | Sony Corp | 話者認識装置と話者認識方法およびプログラム |
-
2015
- 2015-11-25 JP JP2015229670A patent/JP2017097188A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008064928A (ja) * | 2006-09-06 | 2008-03-21 | Yamaha Corp | 生体認証装置、生体認証方法およびプログラム |
JP2009294307A (ja) * | 2008-06-03 | 2009-12-17 | Sony Corp | 話者認識装置と話者認識方法およびプログラム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020086430A (ja) * | 2018-11-19 | 2020-06-04 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者識別装置、話者識別方法、及び、プログラム |
JP7353839B2 (ja) | 2018-11-19 | 2023-10-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 話者識別装置、話者識別方法、及び、プログラム |
CN111816184A (zh) * | 2019-04-12 | 2020-10-23 | 松下电器(美国)知识产权公司 | 讲话人识别方法、识别装置以及记录介质、数据库生成方法、生成装置以及记录介质 |
CN111816184B (zh) * | 2019-04-12 | 2024-02-23 | 松下电器(美国)知识产权公司 | 讲话人识别方法、识别装置以及记录介质 |
CN111462762A (zh) * | 2020-03-25 | 2020-07-28 | 清华大学 | 一种说话人向量正则化方法、装置、电子设备和存储介质 |
CN111462762B (zh) * | 2020-03-25 | 2023-02-24 | 清华大学 | 一种说话人向量正则化方法、装置、电子设备和存储介质 |
JP7473910B2 (ja) | 2020-03-27 | 2024-04-24 | 株式会社フュートレック | 話者認識装置、話者認識方法およびプログラム |
WO2022113218A1 (ja) * | 2020-11-25 | 2022-06-02 | 日本電信電話株式会社 | 話者認識方法、話者認識装置および話者認識プログラム |
CN113593529A (zh) * | 2021-07-09 | 2021-11-02 | 北京字跳网络技术有限公司 | 说话人分离算法的评估方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9536547B2 (en) | Speaker change detection device and speaker change detection method | |
JP2017097188A (ja) | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム | |
JP6622505B2 (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
US20160071520A1 (en) | Speaker indexing device and speaker indexing method | |
JPWO2014112375A1 (ja) | 話者識別装置、話者識別方法、および話者識別用プログラム | |
JP6845489B2 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
JP2016180917A (ja) | 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム | |
US20230069908A1 (en) | Recognition apparatus, learning apparatus, methods and programs for the same | |
JP7160095B2 (ja) | 属性識別装置、属性識別方法、およびプログラム | |
JP2019008131A (ja) | 話者判定装置、話者判定情報生成方法、プログラム | |
JP6636374B2 (ja) | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム | |
JP6996570B2 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
US11798578B2 (en) | Paralinguistic information estimation apparatus, paralinguistic information estimation method, and program | |
US12057105B2 (en) | Speech recognition device, speech recognition method, and program | |
JP7107377B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP6728083B2 (ja) | 中間特徴量計算装置、音響モデル学習装置、音声認識装置、中間特徴量計算方法、音響モデル学習方法、音声認識方法、プログラム | |
Nguyen et al. | Resident identification in smart home by voice biometrics | |
JP6546070B2 (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
US12125474B2 (en) | Learning apparatus, estimation apparatus, methods and programs for the same | |
JP2018132678A (ja) | ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 | |
WO2006027844A1 (ja) | 話者照合装置 | |
JP2012118441A (ja) | 音響モデル作成方法とその装置とプログラム | |
JP2012242590A (ja) | 話者分類装置、話者分類方法、プログラム | |
Mamodiya et al. | Exploring acoustic factor analysis for limited test data speaker verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190416 |