JP7456492B2 - 音声処理装置、音声処理システム、音声処理方法及びプログラム - Google Patents
音声処理装置、音声処理システム、音声処理方法及びプログラム Download PDFInfo
- Publication number
- JP7456492B2 JP7456492B2 JP2022510606A JP2022510606A JP7456492B2 JP 7456492 B2 JP7456492 B2 JP 7456492B2 JP 2022510606 A JP2022510606 A JP 2022510606A JP 2022510606 A JP2022510606 A JP 2022510606A JP 7456492 B2 JP7456492 B2 JP 7456492B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- user
- field
- gaze position
- positional relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 39
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Circuit For Audible Band Transducer (AREA)
- User Interface Of Digital Computer (AREA)
Description
本開示の実施形態の説明に先立って、本開示にかかる実施の形態の概要について説明する。図1は、本開示の実施の形態にかかる音声処理装置1の概要を示す図である。音声処理装置1は、例えば、サーバ等のコンピュータである。
以下、実施形態について、図面を参照しながら説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
次に、実施の形態2について、図面を参照しながら説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。なお、実施の形態2にかかるシステム構成については、図3に示したものと実質的に同様であるので、説明を省略する。また、実施の形態2にかかる音声処理装置100の構成は、図4に示したものと実質的に同様であるので、説明を省略する。実施の形態2は、ユーザがフィールド90の外の特定の領域を注視した場合でもユーザに特定の音声を提供する点で、実施の形態1と異なる。
次に、実施の形態3について、図面を参照しながら説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。なお、実施の形態3にかかるシステム構成については、図3に示したものと実質的に同様であるので、説明を省略する。また、実施の形態3にかかる音声処理装置100の構成は、図4に示したものと実質的に同様であるので、説明を省略する。実施の形態3は、多数のユーザが注視している領域の音声を他のユーザにも提供する点で、他の実施の形態と異なる。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述した複数の実施の形態は、相互に適用可能である。例えば、実施の形態3にかかる構成を実施の形態2に組み合わせてもよい。他の実施の形態についても同様である。
2 位置関係特定部
4 音声取得部
6 方向判定部
8 注視位置判定部
10 音声提供部
50 音声処理システム
52 ネットワーク
60 ユーザ機器
61 通信部
62 音声出力装置
64 撮影装置
66 姿勢検出部
68 視線検出部
69 表示部
70 集音装置
80 観客席
82 特定領域
90 フィールド
92 領域
94 境界
96 境界部分
100 音声処理装置
112 ユーザ情報格納部
114 フィールド情報格納部
120 位置関係特定部
130 音声取得部
140 方向判定部
150 注視位置判定部
152 音声合成部
160 音声提供部
Claims (10)
- イベントが行われ、周囲に複数の観客のための観客席が設けられたフィールドと、前記観客席にいる少なくとも1人のユーザとの位置関係を特定する位置関係特定手段と、
前記フィールドに関する予め定められた複数の領域それぞれの音声を収集する少なくとも1つの集音装置から音声を取得する音声取得手段と、
前記ユーザの向いている方向を判定する方向判定手段と、
特定された前記位置関係と、判定された前記方向とに基づいて、前記ユーザが見ている位置である注視位置を判定する注視位置判定手段と、
判定された前記注視位置に対応する前記領域に関する前記音声を前記ユーザに提供するための処理を行う音声提供手段と、
を有し、
前記注視位置が前記フィールドの外の特定領域に対応する場合に、前記音声提供手段は、前記特定領域に対応し前記集音装置から取得された音声とは異なる予め定められた音声を、前記ユーザに提供するための処理を行う、
音声処理装置。 - 前記音声取得手段は、前記複数の領域それぞれについて設けられた複数の前記集音装置から音声を取得する、
請求項1に記載の音声処理装置。 - 前記注視位置が隣り合う2つ以上の前記領域の境界近傍に設けられた境界部分に対応する場合に、前記境界部分に対応する前記2つ以上の前記領域に関する前記音声を合成し、合成された音声である合成音声を生成する音声合成手段、
をさらに有し、
前記注視位置が前記境界部分に対応する場合に、前記音声提供手段は、前記合成音声を前記ユーザに提供するための処理を行う、
請求項1又は2に記載の音声処理装置。 - 前記音声合成手段は、前記境界部分に対応する前記2つ以上の前記領域のうち、前記境界部分において前記注視位置に近い前記領域に関する音声の割合が大きくなるように、前記合成音声を生成する、
請求項3に記載の音声処理装置。 - 前記特定領域に対応する音声は、前記フィールドで行われている前記イベントに関する音声である、
請求項1から4のいずれか1項に記載の音声処理装置。 - イベントが行われ、周囲に複数の観客のための観客席が設けられたフィールドと、前記観客席にいる少なくとも1人のユーザとの位置関係を特定する位置関係特定手段と、
前記フィールドに関する予め定められた複数の領域それぞれの音声を収集する少なくとも1つの集音装置から音声を取得する音声取得手段と、
前記ユーザの向いている方向を判定する方向判定手段と、
特定された前記位置関係と、判定された前記方向とに基づいて、前記ユーザが見ている位置である注視位置を判定する注視位置判定手段と、
判定された前記注視位置に対応する前記領域に関する前記音声を前記ユーザに提供するための処理を行う音声提供手段と、
を有し、
予め定められた数以上の前記ユーザである第1のユーザの注視位置が前記複数の領域のうちの第1の領域に対応する場合に、前記音声提供手段は、前記第1のユーザ以外の前記ユーザに対して、前記第1の領域に関する音声を提供するための処理を行う、
音声処理装置。 - イベントが行われ、周囲に複数の観客のための観客席が設けられたフィールドに関する予め定められた複数の領域それぞれの音声を収集する少なくとも1つの集音装置と、
音声処理装置と、
を有し、
前記音声処理装置は、
前記フィールドと、前記観客席にいる少なくとも1人のユーザとの位置関係を特定する位置関係特定手段と、
前記集音装置から音声を取得する音声取得手段と、
前記ユーザの向いている方向を判定する方向判定手段と、
特定された前記位置関係と、判定された前記方向とに基づいて、前記ユーザが見ている位置である注視位置を判定する注視位置判定手段と、
判定された前記注視位置に対応する前記領域に関する前記音声を前記ユーザに提供するための処理を行う音声提供手段と、
を有し、
前記注視位置が前記フィールドの外の特定領域に対応する場合に、前記音声提供手段は、前記特定領域に対応し前記集音装置から取得された音声とは異なる予め定められた音声を、前記ユーザに提供するための処理を行う、
音声処理システム。 - イベントが行われ、周囲に複数の観客のための観客席が設けられたフィールドと、前記観客席にいる少なくとも1人のユーザとの位置関係を特定し、
前記フィールドに関する予め定められた複数の領域それぞれの音声を収集する少なくとも1つの集音装置から音声を取得し、
前記ユーザの向いている方向を判定し、
特定された前記位置関係と、判定された前記方向とに基づいて、前記ユーザが見ている位置である注視位置を判定し、
判定された前記注視位置に対応する前記領域に関する前記音声を前記ユーザに提供するための処理を行い、
前記注視位置が前記フィールドの外の特定領域に対応する場合に、前記特定領域に対応し前記集音装置から取得された音声とは異なる予め定められた音声を、前記ユーザに提供するための処理を行う、
音声処理方法。 - イベントが行われ、周囲に複数の観客のための観客席が設けられたフィールドと、前記観客席にいる少なくとも1人のユーザとの位置関係を特定し、
前記フィールドに関する予め定められた複数の領域それぞれの音声を収集する少なくとも1つの集音装置から音声を取得し、
前記ユーザの向いている方向を判定し、
特定された前記位置関係と、判定された前記方向とに基づいて、前記ユーザが見ている位置である注視位置を判定し、
判定された前記注視位置に対応する前記領域に関する前記音声を前記ユーザに提供するための処理を行い、
予め定められた数以上の前記ユーザである第1のユーザの注視位置が前記複数の領域のうちの第1の領域に対応する場合に、前記第1のユーザ以外の前記ユーザに対して、前記第1の領域に関する音声を提供するための処理を行う、
音声処理方法。 - イベントが行われ、周囲に複数の観客のための観客席が設けられたフィールドと、前記観客席にいる少なくとも1人のユーザとの位置関係を特定するステップと、
前記フィールドに関する予め定められた複数の領域それぞれの音声を収集する少なくとも1つの集音装置から音声を取得するステップと、
前記ユーザの向いている方向を判定するステップと、
特定された前記位置関係と、判定された前記方向とに基づいて、前記ユーザが見ている位置である注視位置を判定するステップと、
判定された前記注視位置に対応する前記領域に関する前記音声を前記ユーザに提供するための処理を行うステップと、
前記注視位置が前記フィールドの外の特定領域に対応する場合に、前記特定領域に対応し前記集音装置から取得された音声とは異なる予め定められた音声を、前記ユーザに提供するための処理を行うステップと、
をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020056340 | 2020-03-26 | ||
JP2020056340 | 2020-03-26 | ||
PCT/JP2021/012288 WO2021193734A1 (ja) | 2020-03-26 | 2021-03-24 | 音声処理装置、音声処理システム、音声処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021193734A1 JPWO2021193734A1 (ja) | 2021-09-30 |
JPWO2021193734A5 JPWO2021193734A5 (ja) | 2022-11-08 |
JP7456492B2 true JP7456492B2 (ja) | 2024-03-27 |
Family
ID=77892250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022510606A Active JP7456492B2 (ja) | 2020-03-26 | 2021-03-24 | 音声処理装置、音声処理システム、音声処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US12160714B2 (ja) |
JP (1) | JP7456492B2 (ja) |
WO (1) | WO2021193734A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016033764A (ja) | 2014-07-31 | 2016-03-10 | セイコーエプソン株式会社 | 表示装置、表示装置の制御方法、および、プログラム |
JP2019033497A (ja) | 2018-09-20 | 2019-02-28 | キヤノン株式会社 | 情報処理システム及びその制御方法、コンピュータプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3294457B2 (ja) | 1995-01-31 | 2002-06-24 | 日本放送協会 | 自動ミクシング装置 |
JP5008234B2 (ja) | 2001-08-27 | 2012-08-22 | 任天堂株式会社 | ゲーム装置、プログラム、ゲーム処理方法およびゲームシステム |
JP2009111833A (ja) | 2007-10-31 | 2009-05-21 | Mitsubishi Electric Corp | 情報提示装置 |
JP2012029209A (ja) | 2010-07-27 | 2012-02-09 | Hitachi Ltd | 音処理システム |
JP2013240000A (ja) | 2012-05-17 | 2013-11-28 | Kyocera Corp | 電子機器、録音制御プログラムおよび録音制御方法 |
GB201419396D0 (en) * | 2014-10-31 | 2014-12-17 | Univ Salford Entpr Ltd | Assistive Mixing System And Method Of Assembling A Synchronised Spattial Sound Stage |
US9609383B1 (en) * | 2015-03-23 | 2017-03-28 | Amazon Technologies, Inc. | Directional audio for virtual environments |
CN108604439B (zh) * | 2016-02-04 | 2021-12-28 | 奇跃公司 | 增强现实系统中定向音频的技术 |
US9980075B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Audio source spatialization relative to orientation sensor and output |
FR3079706B1 (fr) * | 2018-03-29 | 2021-06-04 | Inst Mines Telecom | Procede et systeme de diffusion d'un flux audio multicanal a des terminaux de spectateurs assistant a un evenement sportif |
US11561610B2 (en) * | 2020-03-11 | 2023-01-24 | Moea Technologies, Inc. | Augmented audio conditioning system |
-
2021
- 2021-03-24 JP JP2022510606A patent/JP7456492B2/ja active Active
- 2021-03-24 US US17/911,205 patent/US12160714B2/en active Active
- 2021-03-24 WO PCT/JP2021/012288 patent/WO2021193734A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016033764A (ja) | 2014-07-31 | 2016-03-10 | セイコーエプソン株式会社 | 表示装置、表示装置の制御方法、および、プログラム |
JP2019033497A (ja) | 2018-09-20 | 2019-02-28 | キヤノン株式会社 | 情報処理システム及びその制御方法、コンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2021193734A1 (ja) | 2021-09-30 |
US12160714B2 (en) | 2024-12-03 |
JPWO2021193734A1 (ja) | 2021-09-30 |
US20230101693A1 (en) | 2023-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6017854B2 (ja) | 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム | |
US10855967B2 (en) | Image processing apparatus, image processing method, and storage medium | |
CN107943275B (zh) | 模拟环境显示系统及方法 | |
EP4503653A2 (en) | Personalized hrtfs via optical capture | |
CN118873933A (zh) | 混合现实装置中的虚拟和真实对象记录 | |
WO2016009864A1 (ja) | 情報処理装置、表示装置、情報処理方法、プログラム、および情報処理システム | |
JP2019527956A (ja) | 仮想、拡張、および複合現実 | |
JP7100824B2 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP6410769B2 (ja) | 情報処理システム及びその制御方法、コンピュータプログラム | |
JP2011033993A (ja) | 情報提示装置、および情報提示方法 | |
US10664128B2 (en) | Information processing apparatus, configured to generate an audio signal corresponding to a virtual viewpoint image, information processing system, information processing method, and non-transitory computer-readable storage medium | |
JP7091133B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20110228983A1 (en) | Information processor, information processing method and program | |
JP2020520576A (ja) | 空間オーディオの提示のための装置および関連する方法 | |
JP2019087973A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
CN111492342A (zh) | 音频场景处理 | |
JP7235098B2 (ja) | 情報配信装置、情報配信方法、情報配信プログラム | |
US20250071500A1 (en) | Systems and methods for orientation-responsive audio enhancement | |
JP7456492B2 (ja) | 音声処理装置、音声処理システム、音声処理方法及びプログラム | |
JP2018019295A (ja) | 情報処理システム及びその制御方法、コンピュータプログラム | |
JP6456171B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021190082A (ja) | コンピュータプログラム、情報処理装置、情報処理システム、拡張現実画像表示方法及び情報処理方法 | |
JP2005295181A (ja) | 音声情報生成装置 | |
US11967335B2 (en) | Foveated beamforming for augmented reality devices and wearables | |
US20230421984A1 (en) | Systems and methods for dynamic spatial separation of sound objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220907 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7456492 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |