KR20210106546A - 딥 러닝 이미지 분석을 사용한 룸 음향 시뮬레이션 - Google Patents
딥 러닝 이미지 분석을 사용한 룸 음향 시뮬레이션 Download PDFInfo
- Publication number
- KR20210106546A KR20210106546A KR1020217023354A KR20217023354A KR20210106546A KR 20210106546 A KR20210106546 A KR 20210106546A KR 1020217023354 A KR1020217023354 A KR 1020217023354A KR 20217023354 A KR20217023354 A KR 20217023354A KR 20210106546 A KR20210106546 A KR 20210106546A
- Authority
- KR
- South Korea
- Prior art keywords
- acoustic
- sound
- preset
- image
- presets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H7/00—Measuring reverberation time ; room acoustic measurements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/13—Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G06K9/00664—
-
- G06N3/0445—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/10—Noise analysis or noise optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Civil Engineering (AREA)
- Architecture (AREA)
- Structural Engineering (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
도 1b는, 유저에 의해 착용될 수도 있고 AR 경험을 유저에게 전달하도록 구성될 수도 있는 예시적인 AR 디바이스 또는 시스템의 사시도이다.
도 2는 음향 프리셋(acoustic preset)에 기초하여 XR 시스템에 의해 시뮬레이팅될 수도 있는 환경에 대한 예시적인 사운드 응답의 예시이다.
도 3은, XR 시스템에 의해 수행될 수도 있는 가상 사운드 오브젝트로부터의 사운드의 렌더링과 결합되는 이미지의 머신 러닝(machine learning; ML) 기반의 분류의 예시적인 방법의 예시이다.
도 4는 실세계 환경의 이미지를 음향 환경 시뮬레이션을 위한 음향 파라미터의 음향 프리셋으로 직접적으로 분류하기 위해 ML 분류를 사용하는 예시적인 방법의 플로우차트이다.
도 5는 실세계 환경의 이미지를 룸 타입(room type) - 이것으로부터, 그 다음, 음향 환경 시뮬레이션을 위한 음향 프리셋이 유도될 수도 있음 - 으로 분류하기 위해 ML 분류를 사용하는 예시적인 방법의 플로우차트이다.
도 6은, 실세계 환경의 장면 및 그들의 관련된 음향 프리셋의 캐시에 기초하여 실세계 환경의 이미지를 음향 환경 시뮬레이션을 위한 음향 파라미터의 음향 프리셋으로 직접적으로 분류하기 위해 ML 분류를 사용하는 예시적인 방법의 플로우차트이다.
도 7은, 실세계 환경의 이미지를, 음향 환경 시뮬레이션을 위한 일반적인/기본 음향 프리셋(primary acoustic preset) 및 보조 음향 수정자(secondary acoustic modifier)로 직접적으로 분류하기 위해 ML 분류를 사용하는 예시적인 방법의 플로우차트이다.
도 8은, 삼차원(3D) 메쉬(mesh) 및 3D 메쉬의 재료 속성(material property)으로부터 유도되는 음향 파라미터를 생성하도록 도 7의 방법을 확장시키는 예시적인 방법의 플로우차트이다.
도 9a는, 제1 트레이닝 시나리오에 따라 트레이닝 이미지에 기초하여 XR 시스템의 ML 분류기를 트레이닝시키고, 일단 트레이닝되면, ML 분류기를 사용하여 이미지를 분류하는 예시적인 방법의 예시이다.
도 9b는 도 9a의 트레이닝 방법에 대한 사전 트레이닝 데이터 준비(pre-training data preparation)의 예시이다.
도 10은 제2 및 제3 트레이닝 시나리오에 따라 ML 분류기를 트레이닝시키는 예시적인 방법의 예시이다.
도 11a는 제4 트레이닝 시나리오에 따라 ML 분류기를 트레이닝시키는 예시적인 방법의 예시이다.
도 11b는, 백투백(back-to-back) 180° 어안 렌즈(fish eye lens)를 포함하며, 두 개의 카메라 관점(camera perspective)에서 룸(room)의 360° 이미지를 캡쳐하는 예시적인 이미지 센서의 예시이다.
도 12는 도 1a의 XR 프로세서 실시형태와 비교하여 추가적인 기능성(functionality)을 포함하는 예시적인 XR 프로세서의 블록도이다.
도 13은 음향 파라미터에 기초하여 오디오 환경 시뮬레이션을 수행하기 위해 XR 프로세서에서 또는 그와 함께 사용될 수도 있는 예시적인 상호 작용식 오디오 엔진(interactive audio engine; IAE)의 블록도이다.
도 14는 도 12의 XR 프로세서에 의해 수행될 수도 있는 예시적인 음향 파라미터 미세 조정 프로세스(acoustic parameter refinement process)의 흐름도이다.
도 15는 도 12의 XR 프로세서에 의해 생성되는 예시적인 음향 파라미터의 테이블이다.
도 16은 캐싱된(cached) 음향 프리셋을 사용하는 예시적인 XR 프로세서의 블록도이다.
도 17은 음향 프리셋 사이를 전이하는 예시적인 방법의 플로우차트이다.
도 18은 음향 프리셋 사이를 전이하며 사용 가능한 이미지 안전성 체크를 수행하는 예시적인 방법의 플로우차트이다.
도 19는 교정된(calibrated) 장면 실시형태에서 음향 프리셋 사이를 전이하는 예시적인 방법의 플로우차트이다.
도 20은 트레이닝되지 않은 조건 상태의 ML 분류기로 시작하는, ML 분류기의 심층 신경망(deep neural network; DNN) 트레이닝의 예시적인 방법의 예시이다.
도 21은 XR 프로세서 및/또는 상호 작용식 오디오 엔진이 구현될 수도 있는 예시적인 컴퓨터 디바이스의 블록도이다.
도 22는 이미지를 음향 프리셋으로 직접적으로 분류하는 예시적인 요약 방법(summary method)의 플로우차트이다.
도 23은 도 22의 방법에서 분류되는 이미지와 관련하여 후속하는 또는 제2 이미지를 직접적으로 분류하는 예시적인 방법의 플로우차트이다.
Claims (25)
- 방법으로서,
실세계 환경의 이미지를 수신하는 단계;
머신 러닝 분류기(machine learning classifier)를 사용하여, 음향 환경 시뮬레이션을 위한 음향 프리셋(acoustic preset) - 상기 음향 프리셋 각각은 사운드 반향(sound reverberation)을 나타내는 음향 파라미터를 포함함 - 과 관련되는 분류를 생성하기 위해 상기 이미지를 분류하는 단계; 및
상기 분류에 기초하여 상기 음향 프리셋 중에서 음향 프리셋을 선택하는 단계
를 포함하는, 방법. - 제1항에 있어서,
상기 음향 프리셋의 상기 음향 파라미터에 기초하여 상기 음향 환경 시뮬레이션을 수행하는 단계
를 더 포함하는, 방법. - 제2항에 있어서,
상기 음향 환경 시뮬레이션을 수행하는 단계는, 상기 음향 프리셋의 상기 음향 파라미터에 기초하여 상기 실세계 환경에서 가상으로 배치되는 하나 이상의 가상 사운드 오브젝트에 대한 사운드 반향을 모델링하는 단계를 포함한 것인, 방법. - 제2항에 있어서,
상기 머신 러닝 분류기를 사용하여, 상기 이미지, 또는 하나 이상의 추가적인 이미지를 분류하여, 하나 이상의 음향 파라미터 수정자(acoustic parameter modifier)를 생성하는 단계; 및
상기 하나 이상의 음향 파라미터 수정자에 기초하여 상기 음향 프리셋의 상기 음향 파라미터를 수정하여, 상기 음향 환경 시뮬레이션을 위한 수정된 음향 파라미터를 포함하는 수정된 음향 프리셋을 생성하는 단계
를 더 포함하되,
상기 음향 환경 시뮬레이션을 수행하는 단계는, 상기 수정된 음향 파라미터를 사용하여 상기 음향 환경 시뮬레이션을 수행하는 단계를 포함한 것인, 방법. - 제1항에 있어서,
상기 음향 파라미터는 주파수 종속 감쇠 시간(frequency dependent decay time), 룸 사이즈, 반사 지연, 조기 시작 시간(early onset time), 및 확산 레벨 중 하나 이상을 포함한 것인, 방법. - 제1항에 있어서,
상기 분류하는 단계는 상기 이미지를 상기 분류 및 관련된 상기 음향 프리셋으로 직접적으로 분류하는 단계를 포함한 것인, 방법. - 제1항에 있어서,
상기 분류하는 단계는, 상기 분류가 각각의 신뢰도 레벨을 가지도록 상기 이미지를 분류하여 상기 분류를 생성하는 단계를 포함하고;
상기 선택하는 단계는, 상기 음향 프리셋이, 상기 분류 중에서, 상기 각각의 신뢰도 레벨 중 가장 높은 신뢰도 레벨을 갖는 분류와 관련되도록 상기 음향 프리셋을 선택하는 단계를 포함한 것인, 방법. - 제7항에 있어서,
상기 실세계 환경의 제2 이미지를 수신하는 단계;
상기 머신 러닝 분류기를 사용하여, 상기 제2 이미지를 분류하여 각각의 제2 신뢰도 레벨을 갖는 제2 분류를 생성하는 단계;
상기 제2 분류 중 하나 이상이 신뢰도 레벨 임계치를 초과하는 각각의 제2 신뢰도 레벨을 갖는지의 여부를 결정하는 단계; 및
상기 제2 분류 중 하나 이상이, 상기 신뢰 레벨 임계치를 초과하는 각각의 제2 신뢰도 레벨을 갖는 경우, 상기 제2 분류에 기초하여 상기 음향 프리셋 중에서 제2 음향 프리셋을 선택하고, 상기 음향 환경 시뮬레이션을 위한 상기 음향 프리셋을 상기 제2 음향 프리셋으로 대체하는 단계
를 더 포함하는, 방법. - 제8항에 있어서,
상기 제2 분류 중 하나 이상이 상기 신뢰도 레벨 임계치를 초과하는 대응하는 제2 신뢰도 레벨을 갖지 않는 경우, 상기 제2 음향 프리셋을 선택하지 않고, 상기 음향 환경 시뮬레이션을 위한 상기 음향 프리셋을 대체하지 않는 단계
를 더 포함하는, 방법. - 제1항에 있어서,
상기 실세계 환경의 상기 이미지를 수신하는 단계는, 상기 이미지를 상기 실세계 환경의 360 도 이미지로서 수신하는 단계를 포함한 것인, 방법. - 제1항에 있어서,
상기 이미지는 상이한 이미지의 합성을 나타내는 것인, 방법. - 제1항에 있어서,
상기 음향 프리셋의 상기 음향 파라미터는, 상기 머신 러닝 분류기가 트레이닝되었던 트레이닝 이미지에서 표현된 실세계 환경을 나타내는 음향 임펄스 응답으로부터 알고리즘적으로 유도된 것인, 방법. - 제1항에 있어서,
상기 음향 프리셋의 상기 음향 파라미터는 주관적인 사운드 설계에 기초하여 개발된 것인, 방법. - 제1항에 있어서,
상기 음향 프리셋에 대해 음향 파라미터 안전성 체크를 수행하는 단계
를 더 포함하는, 방법. - 제1항에 있어서,
상기 머신 러닝 분류기는, 상기 음향 프리셋의 각각의 음향 프리셋을 사용하여 라벨링된(labeled) 실세계 환경의 트레이닝 이미지에 대해 트레이닝된 것인, 방법. - 제1항에 있어서,
디지털 삼차원(three-dimensional; 3D) 메쉬를 수신하는 단계; 및
상기 3D 메쉬에서 표현되는 물리적 재료의 음향 속성을 추정하여, 상기 음향 환경 시뮬레이션을 위한 조기 반사 파라미터(early reflection parameter)를 생성하는 단계
를 더 포함하는, 방법. - 장치로서,
프로세서를 포함하되, 상기 프로세서는:
실세계 환경의 이미지를 수신하도록;
하나 이상의 신경망을 포함하는 트레이닝된 머신 러닝 분류기를 사용하여, 상기 이미지를, 음향 환경 시뮬레이션을 위한 음향 프리셋 - 상기 음향 프리셋 각각은 사운드 반향을 나타내는 음향 파라미터를 포함함 - 과 관련되는 분류로 직접적으로 분류하도록;
상기 분류에 기초하여 상기 음향 프리셋 중에서 음향 프리셋을 선택하도록;
상기 음향 프리셋의 상기 음향 파라미터에 기초하여 상기 음향 환경 시뮬레이션을 수행하도록 구성된 것인, 장치. - 제17항에 있어서,
상기 프로세서는, 상기 음향 프리셋의 상기 음향 파라미터에 기초하여 상기 실세계 환경에서 가상으로 배치되는 하나 이상의 가상 사운드 오브젝트에 대한 사운드 반향을 모델링하는 것에 의해 상기 음향 환경 시뮬레이션을 수행하도록 구성된 것인, 장치. - 제18항에 있어서,
상기 프로세서는 또한:
상기 머신 러닝 분류기를 사용하여 상기 이미지를 추가로 분류하여 하나 이상의 음향 파라미터 수정자를 생성하도록;
상기 하나 이상의 음향 파라미터 수정자에 기초하여 상기 음향 프리셋의 상기 음향 파라미터를 수정하여, 상기 음향 환경 시뮬레이션을 위한 수정된 음향 파라미터를 포함하는 수정된 음향 프리셋을 생성하도록;
상기 수정된 음향 파라미터를 사용하여 상기 음향 환경 시뮬레이션을 추가로 수행하도록 구성된 것인, 장치. - 제17항에 있어서,
상기 분류는 각각의 신뢰도 레벨을 가지고;
상기 프로세서는, 상기 음향 프리셋이, 상기 분류 중에서, 상기 각각의 신뢰도 레벨 중 가장 높은 신뢰도 레벨을 갖는 분류와 관련되도록 상기 음향 프리셋을 선택하는 것에 의해 선택하도록 구성된 것인, 장치. - 제17항에 있어서,
상기 머신 러닝 분류기는, 상기 음향 프리셋의 각각의 음향 프리셋을 사용하여 라벨링된 실세계 환경의 트레이닝 이미지에 대해 트레이닝된 것인, 장치. - 명령어로 인코딩되는 비일시적 컴퓨터 판독 가능 매체로서,
상기 명령어는, 프로세서에 의해 실행될 때, 상기 프로세서로 하여금:
실세계 환경의 이미지를 수신하게 하고;
음향 프리셋 - 음향 프리셋 각각은 사운드 반향을 나타내는 음향 파라미터를 포함함 - 의 각각의 음향 프리셋을 사용하여 라벨링되는 실세계 환경의 트레이닝 이미지에 대해 이미 트레이닝된 머신 러닝 분류기를 사용하여, 상기 이미지를, 상기 음향 환경 시뮬레이션을 위한 상기 음향 프리셋과 관련되는 분류로 직접적으로 분류하게 하고;
상기 분류에 기초하여 상기 음향 프리셋 중에서 음향 프리셋을 선택하게 하고;
상기 음향 프리셋의 상기 음향 파라미터에 기초하여 상기 음향 환경 시뮬레이션을 수행하게 하는 것인, 비일시적 컴퓨터 판독 가능 매체. - 제22항에 있어서,
상기 프로세서로 하여금 상기 음향 환경 시뮬레이션을 수행하게 하는 명령어는, 상기 프로세서로 하여금, 상기 음향 프리셋의 상기 음향 파라미터에 기초하여 상기 실세계 환경에서 가상으로 배치되는 하나 이상의 가상 사운드 오브젝트에 대한 사운드 반향을 모델링하게 하는 명령어를 포함하는 것인, 비일시적 컴퓨터 판독 가능 매체. - 제23항에 있어서,
상기 프로세서로 하여금:
상기 머신 러닝 분류기를 사용하여 상기 이미지를 추가로 분류하여 하나 이상의 음향 파라미터 수정자를 생성하게 하고;
상기 하나 이상의 음향 파라미터 수정자에 기초하여 상기 음향 프리셋의 상기 음향 파라미터를 수정하여, 상기 음향 환경 시뮬레이션을 위한 수정된 음향 파라미터를 포함하는 수정된 음향 프리셋을 생성하게 하며;
상기 수정된 음향 파라미터를 사용하여 상기 음향 환경 시뮬레이션을 추가로 수행하게 하는 명령어를 더 포함하는, 비일시적 컴퓨터 판독 가능 매체. - 제22항에 있어서,
상기 분류는 각각의 신뢰도 레벨을 가지고;
상기 프로세서로 하여금 선택하게 하는 상기 명령어는, 상기 프로세서로 하여금, 상기 음향 프리셋이, 상기 분류 중에서, 상기 각각의 신뢰도 레벨 중 가장 높은 신뢰도 레벨을 갖는 분류와 관련되도록 상기 음향 프리셋을 선택하게 하는 명령어를 포함하는 것인, 비일시적 컴퓨터 판독 가능 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862784648P | 2018-12-24 | 2018-12-24 | |
US62/784,648 | 2018-12-24 | ||
PCT/US2019/066315 WO2020139588A1 (en) | 2018-12-24 | 2019-12-13 | Room acoustics simulation using deep learning image analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210106546A true KR20210106546A (ko) | 2021-08-30 |
KR102804488B1 KR102804488B1 (ko) | 2025-05-07 |
Family
ID=69174585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217023354A Active KR102804488B1 (ko) | 2018-12-24 | 2019-12-13 | 딥 러닝 이미지 분석을 사용한 룸 음향 시뮬레이션 |
Country Status (6)
Country | Link |
---|---|
US (1) | US12112521B2 (ko) |
EP (1) | EP3903510B1 (ko) |
JP (1) | JP7631198B2 (ko) |
KR (1) | KR102804488B1 (ko) |
CN (1) | CN113439447A (ko) |
WO (1) | WO2020139588A1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3903510B1 (en) * | 2018-12-24 | 2025-04-09 | DTS, Inc. | Room acoustics simulation using deep learning image analysis |
WO2021235126A1 (ja) * | 2020-05-19 | 2021-11-25 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
GB2603515A (en) * | 2021-02-05 | 2022-08-10 | Nokia Technologies Oy | Appartus, method and computer programs for enabling audio rendering |
CN112926159B (zh) * | 2021-03-16 | 2022-02-22 | 中国科学院声学研究所 | 一种基于深度学习的二阶亥姆霍兹共鸣器设计方法 |
US12283265B1 (en) * | 2021-04-09 | 2025-04-22 | Apple Inc. | Own voice reverberation reconstruction |
EP4325479A4 (en) * | 2021-04-12 | 2024-09-04 | Panasonic Intellectual Property Corporation of America | Acoustic feature value estimation method, acoustic feature value estimation system, program, and rendering method |
US11620761B2 (en) * | 2021-06-07 | 2023-04-04 | Microsoft Technology Licensing, Llc | Depth sensing via device case |
GB2612173A (en) * | 2021-09-21 | 2023-04-26 | Apple Inc | Determining a virtual listening environment |
US12311265B2 (en) * | 2021-12-03 | 2025-05-27 | Sony Interactive Entertainment Inc. | Systems and methods for training a model to determine a type of environment surrounding a user |
US12293773B2 (en) | 2022-11-03 | 2025-05-06 | Robert Bosch Gmbh | Automatically selecting a sound recognition model for an environment based on audio data and image data associated with the environment |
US12328569B2 (en) * | 2023-01-07 | 2025-06-10 | Sony Interactive Entertainment Inc. | Transforming computer game audio using impulse response of a virtual 3D space generated by NeRF input to a convolutional reverberation engine |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014049118A (ja) * | 2012-08-31 | 2014-03-17 | Fujitsu Ltd | 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 |
US20180232471A1 (en) * | 2017-02-16 | 2018-08-16 | The University Of North Carolina At Chapel Hill | Methods, systems, and computer readable media for acoustic classification and optimization for multi-modal rendering of real-world scenes |
Family Cites Families (225)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8392188B1 (en) | 1999-11-05 | 2013-03-05 | At&T Intellectual Property Ii, L.P. | Method and system for building a phonotactic model for domain independent speech recognition |
US6738479B1 (en) | 2000-11-13 | 2004-05-18 | Creative Technology Ltd. | Method of audio signal processing for a loudspeaker located close to an ear |
US6894714B2 (en) | 2000-12-05 | 2005-05-17 | Koninklijke Philips Electronics N.V. | Method and apparatus for predicting events in video conferencing and other applications |
US20030007648A1 (en) | 2001-04-27 | 2003-01-09 | Christopher Currell | Virtual audio system and techniques |
US7409423B2 (en) | 2001-06-28 | 2008-08-05 | Horvitz Eric J | Methods for and applications of learning and inferring the periods of time until people are available or unavailable for different forms of communication, collaboration, and information access |
US7493369B2 (en) | 2001-06-28 | 2009-02-17 | Microsoft Corporation | Composable presence and availability services |
US7689521B2 (en) | 2001-06-28 | 2010-03-30 | Microsoft Corporation | Continuous time bayesian network models for predicting users' presence, activities, and component usage |
US7233933B2 (en) | 2001-06-28 | 2007-06-19 | Microsoft Corporation | Methods and architecture for cross-device activity monitoring, reasoning, and visualization for providing status and forecasts of a users' presence and availability |
US7567675B2 (en) | 2002-06-21 | 2009-07-28 | Audyssey Laboratories, Inc. | System and method for automatic multiple listener room acoustic correction with low filter orders |
US7203635B2 (en) | 2002-06-27 | 2007-04-10 | Microsoft Corporation | Layered models for context awareness |
JP4393169B2 (ja) | 2003-12-04 | 2010-01-06 | キヤノン株式会社 | 複合現実感提示方法および装置 |
US7542903B2 (en) | 2004-02-18 | 2009-06-02 | Fuji Xerox Co., Ltd. | Systems and methods for determining predictive models of discourse functions |
US10223934B2 (en) | 2004-09-16 | 2019-03-05 | Lena Foundation | Systems and methods for expressive language, developmental disorder, and emotion assessment, and contextual feedback |
US20060122834A1 (en) | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
FR2880755A1 (fr) | 2005-01-10 | 2006-07-14 | France Telecom | Procede et dispositif d'individualisation de hrtfs par modelisation |
WO2006091540A2 (en) | 2005-02-22 | 2006-08-31 | Verax Technologies Inc. | System and method for formatting multimode sound content and metadata |
EP1946612B1 (fr) | 2005-10-27 | 2012-11-14 | France Télécom | Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif |
US8484146B2 (en) | 2006-01-18 | 2013-07-09 | Sony Corporation | Interaction device implementing a bayesian's estimation |
US8396671B2 (en) | 2006-02-16 | 2013-03-12 | Microsoft Corporation | Cluster modeling, and learning cluster specific parameters of an adaptive double threading model |
US8730156B2 (en) | 2010-03-05 | 2014-05-20 | Sony Computer Entertainment America Llc | Maintaining multiple views on a shared stable virtual space |
US8392418B2 (en) | 2009-06-25 | 2013-03-05 | University Of Tennessee Research Foundation | Method and apparatus for predicting object properties and events using similarity-based information retrieval and model |
US7801836B2 (en) | 2006-09-27 | 2010-09-21 | Infosys Technologies Ltd. | Automated predictive data mining model selection using a genetic algorithm |
US20090138415A1 (en) | 2007-11-02 | 2009-05-28 | James Justin Lancaster | Automated research systems and methods for researching systems |
US8270616B2 (en) | 2007-02-02 | 2012-09-18 | Logitech Europe S.A. | Virtual surround for headphones and earbuds headphone externalization system |
EP2119306A4 (en) | 2007-03-01 | 2012-04-25 | Jerry Mahabub | SOUND SPECIALIZATION AND ENVIRONMENT SIMULATION |
US7792674B2 (en) | 2007-03-30 | 2010-09-07 | Smith Micro Software, Inc. | System and method for providing virtual spatial sound with an audio visual player |
US8229134B2 (en) | 2007-05-24 | 2012-07-24 | University Of Maryland | Audio camera using microphone arrays for real time capture of audio images and method for jointly processing the audio images with video images |
US8254393B2 (en) | 2007-06-29 | 2012-08-28 | Microsoft Corporation | Harnessing predictive models of durations of channel availability for enhanced opportunistic allocation of radio spectrum |
US8140188B2 (en) | 2008-02-18 | 2012-03-20 | Toyota Motor Engineering & Manufacturing North America, Inc. | Robotic system and method for observing, learning, and supporting human activities |
US8170222B2 (en) | 2008-04-18 | 2012-05-01 | Sony Mobile Communications Ab | Augmented reality enhanced audio |
WO2010011918A2 (en) | 2008-07-24 | 2010-01-28 | University Of Cincinnati | Methods for prognosing mechanical systems |
US20100025483A1 (en) | 2008-07-31 | 2010-02-04 | Michael Hoeynck | Sensor-Based Occupancy and Behavior Prediction Method for Intelligently Controlling Energy Consumption Within a Building |
EP2157545A1 (en) | 2008-08-19 | 2010-02-24 | Sony Computer Entertainment Europe Limited | Entertainment device, system and method |
US8788270B2 (en) | 2009-06-16 | 2014-07-22 | University Of Florida Research Foundation, Inc. | Apparatus and method for determining an emotion state of a speaker |
US8396870B2 (en) | 2009-06-25 | 2013-03-12 | University Of Tennessee Research Foundation | Method and apparatus for predicting object properties and events using similarity-based information retrieval and modeling |
WO2011002735A1 (en) | 2009-07-01 | 2011-01-06 | Carnegie Mellon University | Methods and apparatuses for monitoring energy consumption and related operations |
US20120116186A1 (en) | 2009-07-20 | 2012-05-10 | University Of Florida Research Foundation, Inc. | Method and apparatus for evaluation of a subject's emotional, physiological and/or physical state with the subject's physiological and/or acoustic data |
US10326978B2 (en) * | 2010-06-30 | 2019-06-18 | Warner Bros. Entertainment Inc. | Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning |
US8767968B2 (en) | 2010-10-13 | 2014-07-01 | Microsoft Corporation | System and method for high-precision 3-dimensional audio for augmented reality |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
KR101458939B1 (ko) | 2010-12-02 | 2014-11-07 | 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 | 증강 현실 시스템 |
JP5857071B2 (ja) | 2011-01-05 | 2016-02-10 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ・システムおよびその動作方法 |
US9183509B2 (en) | 2011-05-11 | 2015-11-10 | Ari M. Frank | Database of affective response and attention levels |
AU2012279357B2 (en) | 2011-07-01 | 2016-01-14 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
US8963956B2 (en) | 2011-08-19 | 2015-02-24 | Microsoft Technology Licensing, Llc | Location based skins for mixed reality displays |
WO2013028813A1 (en) | 2011-08-23 | 2013-02-28 | Microsoft Corporation | Implicit sharing and privacy control through physical behaviors using sensor-rich devices |
WO2013028908A1 (en) | 2011-08-24 | 2013-02-28 | Microsoft Corporation | Touch and social cues as inputs into a computer |
US20150178865A1 (en) | 2011-09-20 | 2015-06-25 | The Trustees Of Columbia University In The City Of New York | Total property optimization system for energy efficiency and smart buildings |
US9015084B2 (en) | 2011-10-20 | 2015-04-21 | Gil Thieberger | Estimating affective response to a token instance of interest |
KR20130053466A (ko) | 2011-11-14 | 2013-05-24 | 한국전자통신연구원 | 인터랙티브 증강공간 제공을 위한 콘텐츠 재생 장치 및 방법 |
US9497501B2 (en) | 2011-12-06 | 2016-11-15 | Microsoft Technology Licensing, Llc | Augmented reality virtual monitor |
US20130155105A1 (en) | 2011-12-19 | 2013-06-20 | Nokia Corporation | Method and apparatus for providing seamless interaction in mixed reality |
EP2795893A4 (en) | 2011-12-20 | 2015-08-19 | Intel Corp | PRESENTATIONS OF AN ADVANCED REALITY BETWEEN SEVERAL EQUIPMENT |
US8831255B2 (en) | 2012-03-08 | 2014-09-09 | Disney Enterprises, Inc. | Augmented reality (AR) audio with position and action triggered virtual sound effects |
US20130278633A1 (en) | 2012-04-20 | 2013-10-24 | Samsung Electronics Co., Ltd. | Method and system for generating augmented reality scene |
US9183676B2 (en) | 2012-04-27 | 2015-11-10 | Microsoft Technology Licensing, Llc | Displaying a collision between real and virtual objects |
US9165381B2 (en) | 2012-05-31 | 2015-10-20 | Microsoft Technology Licensing, Llc | Augmented books in a mixed reality environment |
US10176635B2 (en) | 2012-06-28 | 2019-01-08 | Microsoft Technology Licensing, Llc | Saving augmented realities |
US20140002492A1 (en) | 2012-06-29 | 2014-01-02 | Mathew J. Lamb | Propagation of real world properties into augmented reality images |
US9417692B2 (en) | 2012-06-29 | 2016-08-16 | Microsoft Technology Licensing, Llc | Deep augmented reality tags for mixed reality |
US9292085B2 (en) | 2012-06-29 | 2016-03-22 | Microsoft Technology Licensing, Llc | Configuring an interaction zone within an augmented reality environment |
US20140046879A1 (en) | 2012-08-13 | 2014-02-13 | Predixion Software, Inc. | Machine learning semantic model |
US10019983B2 (en) | 2012-08-30 | 2018-07-10 | Aravind Ganapathiraju | Method and system for predicting speech recognition performance using accuracy scores |
US20140122391A1 (en) | 2012-10-31 | 2014-05-01 | 21Ct, Inc. | Top-Down Abstraction Learning Using Prediction as a Supervisory Signal |
US9449613B2 (en) | 2012-12-06 | 2016-09-20 | Audeme Llc | Room identification using acoustic features in a recording |
US9398393B2 (en) | 2012-12-11 | 2016-07-19 | The University Of North Carolina At Chapel Hill | Aural proxies and directionally-varying reverberation for interactive sound propagation in virtual environments |
US9187104B2 (en) | 2013-01-11 | 2015-11-17 | International Buslness Machines Corporation | Online learning using information fusion for equipment predictive maintenance in railway operations |
US20140240351A1 (en) | 2013-02-27 | 2014-08-28 | Michael Scavezze | Mixed reality augmentation |
US10163049B2 (en) | 2013-03-08 | 2018-12-25 | Microsoft Technology Licensing, Llc | Inconspicuous tag for generating augmented reality experiences |
US20140272883A1 (en) | 2013-03-14 | 2014-09-18 | Northwestern University | Systems, methods, and apparatus for equalization preference learning |
US20140285519A1 (en) | 2013-03-22 | 2014-09-25 | Nokia Corporation | Method and apparatus for providing local synchronization of information for augmented reality objects |
US20160088417A1 (en) | 2013-04-30 | 2016-03-24 | Intellectual Discovery Co., Ltd. | Head mounted display and method for providing audio content by using same |
WO2014189550A1 (en) | 2013-05-24 | 2014-11-27 | University Of Maryland | Statistical modelling, interpolation, measurement and anthropometry based prediction of head-related transfer functions |
WO2014188393A1 (en) | 2013-05-24 | 2014-11-27 | Awe Company Limited | Systems and methods for a shared mixed reality experience |
US10262462B2 (en) | 2014-04-18 | 2019-04-16 | Magic Leap, Inc. | Systems and methods for augmented and virtual reality |
US9248569B2 (en) | 2013-11-22 | 2016-02-02 | Brain Corporation | Discrepancy detection apparatus and methods for machine learning |
EP3090576B1 (en) | 2014-01-03 | 2017-10-18 | Dolby Laboratories Licensing Corporation | Methods and systems for designing and applying numerically optimized binaural room impulse responses |
US9658100B2 (en) | 2014-02-21 | 2017-05-23 | New York University | Systems and methods for audio information environmental analysis |
US20150242036A1 (en) | 2014-02-21 | 2015-08-27 | Amin Heidari | System and method for detecting taps on a surface or on a device |
US20170307435A1 (en) | 2014-02-21 | 2017-10-26 | New York University | Environmental analysis |
EP3111411A4 (en) | 2014-02-28 | 2017-08-09 | Delos Living, LLC | Systems, methods and articles for enhancing wellness associated with habitable environments |
US10142761B2 (en) | 2014-03-06 | 2018-11-27 | Dolby Laboratories Licensing Corporation | Structural modeling of the head related impulse response |
US9677840B2 (en) | 2014-03-14 | 2017-06-13 | Lineweight Llc | Augmented reality simulator |
US10335091B2 (en) | 2014-03-19 | 2019-07-02 | Tactonic Technologies, Llc | Method and apparatus to infer object and agent properties, activity capacities, behaviors, and intents from contact and pressure images |
CA2944023A1 (en) | 2014-03-27 | 2015-10-01 | Game Complex, Inc. | Gamification of actions in physical space |
US9741169B1 (en) | 2014-05-20 | 2017-08-22 | Leap Motion, Inc. | Wearable augmented reality devices with object detection and tracking |
US20170153866A1 (en) | 2014-07-03 | 2017-06-01 | Imagine Mobile Augmented Reality Ltd. | Audiovisual Surround Augmented Reality (ASAR) |
US20170208415A1 (en) | 2014-07-23 | 2017-07-20 | Pcms Holdings, Inc. | System and method for determining audio context in augmented-reality applications |
US20160086087A1 (en) | 2014-09-19 | 2016-03-24 | King Fahd University Of Petroleum And Minerals | Method for fast prediction of gas composition |
US10465931B2 (en) | 2015-01-30 | 2019-11-05 | Schneider Electric It Corporation | Automated control and parallel learning HVAC apparatuses, methods and systems |
US10846589B2 (en) | 2015-03-12 | 2020-11-24 | William Marsh Rice University | Automated compilation of probabilistic task description into executable neural network specification |
US9736580B2 (en) * | 2015-03-19 | 2017-08-15 | Intel Corporation | Acoustic camera based audio visual scene analysis |
US10713594B2 (en) | 2015-03-20 | 2020-07-14 | Salesforce.Com, Inc. | Systems, methods, and apparatuses for implementing machine learning model training and deployment with a rollback mechanism |
DK3082350T3 (en) | 2015-04-15 | 2019-04-23 | Starkey Labs Inc | USER INTERFACE WITH REMOTE SERVER |
US10573304B2 (en) | 2015-05-26 | 2020-02-25 | Katholieke Universiteit Leuven | Speech recognition system and method using an adaptive incremental learning approach |
US9824499B2 (en) | 2015-06-23 | 2017-11-21 | Microsoft Technology Licensing, Llc | Mixed-reality image capture |
US9530426B1 (en) | 2015-06-24 | 2016-12-27 | Microsoft Technology Licensing, Llc | Filtering sounds for conferencing applications |
US10529318B2 (en) | 2015-07-31 | 2020-01-07 | International Business Machines Corporation | Implementing a classification model for recognition processing |
US20170038829A1 (en) | 2015-08-07 | 2017-02-09 | Microsoft Technology Licensing, Llc | Social interaction for remote communication |
US20170039986A1 (en) | 2015-08-07 | 2017-02-09 | Microsoft Technology Licensing, Llc | Mixed Reality Social Interactions |
US9818228B2 (en) | 2015-08-07 | 2017-11-14 | Microsoft Technology Licensing, Llc | Mixed reality social interaction |
US10255285B2 (en) | 2015-08-31 | 2019-04-09 | Bose Corporation | Predicting acoustic features for geographic locations |
US10127725B2 (en) | 2015-09-02 | 2018-11-13 | Microsoft Technology Licensing, Llc | Augmented-reality imaging |
WO2017045077A1 (en) | 2015-09-16 | 2017-03-23 | Rising Sun Productions Limited | System and method for reproducing three-dimensional audio with a selectable perspective |
US9442496B1 (en) | 2015-09-18 | 2016-09-13 | Amazon Technologies, Inc. | Active airborne noise abatement |
JP6807556B2 (ja) | 2015-10-01 | 2021-01-06 | パナソニックIpマネジメント株式会社 | 空調制御方法、空調制御装置及び空調制御プログラム |
US20170103420A1 (en) | 2015-10-12 | 2017-04-13 | ArcSecond, Inc. | Generating a Contextual-Based Sound Map |
US10089578B2 (en) | 2015-10-23 | 2018-10-02 | Spotify Ab | Automatic prediction of acoustic attributes from an audio signal |
CA3003075C (en) | 2015-10-26 | 2023-01-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a filtered audio signal realizing elevation rendering |
US10319374B2 (en) | 2015-11-25 | 2019-06-11 | Baidu USA, LLC | Deployed end-to-end speech recognition |
WO2017094207A1 (ja) | 2015-11-30 | 2017-06-08 | 日本電気株式会社 | 情報処理システム、情報処理方法および情報処理用プログラム |
EP3174005A1 (en) | 2015-11-30 | 2017-05-31 | Nokia Technologies Oy | Apparatus and method for controlling audio mixing in virtual reality environments |
SG10201800147XA (en) * | 2018-01-05 | 2019-08-27 | Creative Tech Ltd | A system and a processing method for customizing audio experience |
US10068376B2 (en) | 2016-01-11 | 2018-09-04 | Microsoft Technology Licensing, Llc | Updating mixed reality thumbnails |
US20170228916A1 (en) | 2016-01-18 | 2017-08-10 | Paperclip Productions, Inc. | System and method for an enhanced, multiplayer mixed reality experience |
US10475447B2 (en) | 2016-01-25 | 2019-11-12 | Ford Global Technologies, Llc | Acoustic and domain based speech recognition for vehicles |
KR20240028560A (ko) * | 2016-01-27 | 2024-03-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 음향 환경 시뮬레이션 |
KR102642275B1 (ko) | 2016-02-02 | 2024-02-28 | 디티에스, 인코포레이티드 | 증강 현실 헤드폰 환경 렌더링 |
US10169922B2 (en) | 2016-02-16 | 2019-01-01 | Microsoft Technology Licensing, Llc | Reality mixer for mixed reality |
US10726326B2 (en) | 2016-02-24 | 2020-07-28 | International Business Machines Corporation | Learning of neural network |
US9986363B2 (en) | 2016-03-03 | 2018-05-29 | Mach 1, Corp. | Applications and format for immersive spatial sound |
US10943036B2 (en) | 2016-03-08 | 2021-03-09 | Az, Llc | Virtualization, visualization and autonomous design and development of objects |
US10482663B2 (en) | 2016-03-29 | 2019-11-19 | Microsoft Technology Licensing, Llc | Virtual cues for augmented-reality pose alignment |
US9984682B1 (en) | 2016-03-30 | 2018-05-29 | Educational Testing Service | Computer-implemented systems and methods for automatically generating an assessment of oral recitations of assessment items |
EP3236363A1 (en) | 2016-04-18 | 2017-10-25 | Nokia Technologies Oy | Content search |
US10380800B2 (en) | 2016-04-18 | 2019-08-13 | Disney Enterprises, Inc. | System and method for linking and interacting between augmented reality and virtual reality environments |
US20170311095A1 (en) | 2016-04-20 | 2017-10-26 | Starkey Laboratories, Inc. | Neural network-driven feedback cancellation |
US20170308808A1 (en) | 2016-04-26 | 2017-10-26 | Paypal, Inc | Machine learning system |
US10496156B2 (en) | 2016-05-17 | 2019-12-03 | Google Llc | Techniques to change location of objects in a virtual/augmented reality system |
US9959682B2 (en) | 2016-05-28 | 2018-05-01 | Acoustic Knowledge, LLC | Digital camera system for acoustic modeling |
US10031718B2 (en) | 2016-06-14 | 2018-07-24 | Microsoft Technology Licensing, Llc | Location based audio filtering |
EP3261367B1 (en) | 2016-06-21 | 2020-07-22 | Nokia Technologies Oy | Method, apparatus, and computer program code for improving perception of sound objects in mediated reality |
EP3260950B1 (en) | 2016-06-22 | 2019-11-06 | Nokia Technologies Oy | Mediated reality |
US10042604B2 (en) | 2016-07-01 | 2018-08-07 | Metrik LLC | Multi-dimensional reference element for mixed reality environments |
JP2018004473A (ja) | 2016-07-04 | 2018-01-11 | ファナック株式会社 | 軸受の予測寿命を学習する機械学習装置、寿命予測装置および機械学習方法 |
US9906885B2 (en) | 2016-07-15 | 2018-02-27 | Qualcomm Incorporated | Methods and systems for inserting virtual sounds into an environment |
US20180082673A1 (en) | 2016-07-28 | 2018-03-22 | Theodore Tzanetos | Active noise cancellation for defined spaces |
CN109791441A (zh) | 2016-08-01 | 2019-05-21 | 奇跃公司 | 具有空间化音频的混合现实系统 |
US10169921B2 (en) | 2016-08-03 | 2019-01-01 | Wipro Limited | Systems and methods for augmented reality aware contents |
EP3287867A1 (en) | 2016-08-26 | 2018-02-28 | Nokia Technologies Oy | Audio processing |
US10192363B2 (en) | 2016-08-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Math operations in mixed or virtual reality |
JP6821795B2 (ja) | 2016-09-14 | 2021-01-27 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 空間化オーディオを用いた仮想現実、拡張現実、および複合現実システム |
US10325407B2 (en) | 2016-09-15 | 2019-06-18 | Microsoft Technology Licensing, Llc | Attribute detection tools for mixed reality |
FI129137B (en) * | 2016-09-22 | 2021-08-13 | Noiseless Acoustics Oy | An acoustic camera and a method for revealing acoustic emissions from various locations and devices |
EP3301675B1 (en) | 2016-09-28 | 2019-08-21 | Panasonic Intellectual Property Corporation of America | Parameter prediction device and parameter prediction method for acoustic signal processing |
US9886954B1 (en) | 2016-09-30 | 2018-02-06 | Doppler Labs, Inc. | Context aware hearing optimization engine |
US10896544B2 (en) | 2016-10-07 | 2021-01-19 | Htc Corporation | System and method for providing simulated environment |
US10499178B2 (en) | 2016-10-14 | 2019-12-03 | Disney Enterprises, Inc. | Systems and methods for achieving multi-dimensional audio fidelity |
US20180108440A1 (en) | 2016-10-17 | 2018-04-19 | Jeffrey Stevens | Systems and methods for medical diagnosis and biomarker identification using physiological sensors and machine learning |
EP3319341A1 (en) | 2016-11-03 | 2018-05-09 | Nokia Technologies OY | Audio processing |
US10931758B2 (en) | 2016-11-17 | 2021-02-23 | BrainofT Inc. | Utilizing context information of environment component regions for event/activity prediction |
US10938587B2 (en) | 2016-11-28 | 2021-03-02 | Cisco Technology, Inc. | Predicting utilization of a shared collaboration resource |
US10531220B2 (en) | 2016-12-05 | 2020-01-07 | Magic Leap, Inc. | Distributed audio capturing techniques for virtual reality (VR), augmented reality (AR), and mixed reality (MR) systems |
US10806405B2 (en) | 2016-12-13 | 2020-10-20 | Cochlear Limited | Speech production and the management/prediction of hearing loss |
JP6386523B2 (ja) | 2016-12-15 | 2018-09-05 | ファナック株式会社 | Nandフラッシュメモリの寿命を予測する機械学習装置、寿命予測装置、数値制御装置、生産システム、及び機械学習方法 |
US11832969B2 (en) | 2016-12-22 | 2023-12-05 | The Johns Hopkins University | Machine learning approach to beamforming |
EP3346731A1 (en) | 2017-01-04 | 2018-07-11 | Harman Becker Automotive Systems GmbH | Systems and methods for generating natural directional pinna cues for virtual sound source synthesis |
US10282656B2 (en) | 2017-01-11 | 2019-05-07 | Thomas Danaher Harvey | Method and device for detecting unauthorized tranfer between persons |
US10659906B2 (en) | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
US10643121B2 (en) | 2017-01-19 | 2020-05-05 | Deepmind Technologies Limited | Optimizing data center controls using neural networks |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US20180232937A1 (en) | 2017-02-14 | 2018-08-16 | Philip Moyer | System and Method for Implementing Virtual Reality |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US11347054B2 (en) | 2017-02-16 | 2022-05-31 | Magic Leap, Inc. | Systems and methods for augmented reality |
KR102819340B1 (ko) | 2017-02-28 | 2025-06-11 | 매직 립, 인코포레이티드 | 혼합 현실 디바이스에서의 가상 및 실제 객체 레코딩 |
WO2018165284A1 (en) | 2017-03-07 | 2018-09-13 | vSports, LLC | Mixed reality sport simulation and training system |
WO2018165278A1 (en) | 2017-03-07 | 2018-09-13 | vGolf, LLC | Mixed reality golf simulation and training system |
KR20180102870A (ko) | 2017-03-08 | 2018-09-18 | 엘지전자 주식회사 | 전자 장치 및 그 전자 장치의 제어 방법 |
US11004568B2 (en) | 2017-03-10 | 2021-05-11 | Altair Engineering, Inc. | Systems and methods for multi-dimensional fluid modeling of an organism or organ |
US10803211B2 (en) | 2017-03-10 | 2020-10-13 | General Electric Company | Multiple fluid model tool for interdisciplinary fluid modeling |
US10977397B2 (en) | 2017-03-10 | 2021-04-13 | Altair Engineering, Inc. | Optimization of prototype and machine design within a 3D fluid modeling environment |
KR101963244B1 (ko) | 2017-03-20 | 2019-03-28 | ㈜라이커스게임 | 현실 음향을 반영한 증강 현실 3차원 음향 구현 시스템 및 프로그램 |
AU2018244316B2 (en) | 2017-03-28 | 2022-09-29 | Magic Leap, Inc. | Augmented reality system with spatialized audio tied to user manipulated virtual object |
US9942687B1 (en) | 2017-03-30 | 2018-04-10 | Microsoft Technology Licensing, Llc | System for localizing channel-based audio from non-spatial-aware applications into 3D mixed or virtual reality space |
US11270510B2 (en) | 2017-04-04 | 2022-03-08 | David Peter Warhol | System and method for creating an augmented reality interactive environment in theatrical structure |
WO2018187748A1 (en) | 2017-04-07 | 2018-10-11 | Unveil, LLC | Systems and methods for mixed reality medical training |
US10468032B2 (en) | 2017-04-10 | 2019-11-05 | Intel Corporation | Method and system of speaker recognition using context aware confidence modeling |
US10436615B2 (en) | 2017-04-24 | 2019-10-08 | Carnegie Mellon University | Virtual sensor system |
US10643153B2 (en) | 2017-04-24 | 2020-05-05 | Virginia Tech Intellectual Properties, Inc. | Radio signal identification, identification system learning, and identifier deployment |
US10416954B2 (en) | 2017-04-28 | 2019-09-17 | Microsoft Technology Licensing, Llc | Streaming of augmented/virtual reality spatial audio/video |
US11054894B2 (en) | 2017-05-05 | 2021-07-06 | Microsoft Technology Licensing, Llc | Integrated mixed-input system |
US10154360B2 (en) | 2017-05-08 | 2018-12-11 | Microsoft Technology Licensing, Llc | Method and system of improving detection of environmental sounds in an immersive environment |
US11054272B2 (en) | 2017-05-11 | 2021-07-06 | Disney Enterprises, Inc. | Physical navigation guided via story-based augmented and/or mixed reality experiences |
US9843883B1 (en) | 2017-05-12 | 2017-12-12 | QoSound, Inc. | Source independent sound field rotation for virtual and augmented reality applications |
US10235128B2 (en) | 2017-05-19 | 2019-03-19 | Intel Corporation | Contextual sound filter |
US10234848B2 (en) | 2017-05-24 | 2019-03-19 | Relativity Space, Inc. | Real-time adaptive control of additive manufacturing processes using machine learning |
US20180350145A1 (en) | 2017-05-30 | 2018-12-06 | Reston Restoration | Augmented Reality Devices and Methods Thereof for Rendering Virtual Objects |
US10390166B2 (en) | 2017-05-31 | 2019-08-20 | Qualcomm Incorporated | System and method for mixing and adjusting multi-input ambisonics |
US10255550B1 (en) | 2017-06-07 | 2019-04-09 | States Title, Inc. | Machine learning using multiple input data types |
US10602296B2 (en) | 2017-06-09 | 2020-03-24 | Nokia Technologies Oy | Audio object adjustment for phase compensation in 6 degrees of freedom audio |
US10325409B2 (en) | 2017-06-16 | 2019-06-18 | Microsoft Technology Licensing, Llc | Object holographic augmentation |
US10445941B2 (en) | 2017-06-21 | 2019-10-15 | Number 9, LLC | Interactive mixed reality system for a real-world event |
GB201710085D0 (en) * | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
KR102339716B1 (ko) | 2017-06-30 | 2021-12-14 | 삼성에스디에스 주식회사 | 음성 인식 방법 및 그 장치 |
US20190007726A1 (en) | 2017-06-30 | 2019-01-03 | Intel Corporation | Audio, video, and actuation (a/v/a) synchronization for mixed reality |
US11035227B2 (en) | 2017-07-14 | 2021-06-15 | The Board Of Regents Of The University Of Oklahoma | Generating spectral responses of materials |
US20190019011A1 (en) | 2017-07-16 | 2019-01-17 | Tsunami VR, Inc. | Systems and methods for identifying real objects in an area of interest for use in identifying virtual content a user is authorized to view using an augmented reality device |
EP3432172B1 (en) | 2017-07-20 | 2025-05-21 | Bricsys NV | Predicting user desirability of a constructional connection in a building information model |
US10938833B2 (en) | 2017-07-21 | 2021-03-02 | Nec Corporation | Multi-factor authentication based on room impulse response |
US20190102946A1 (en) | 2017-08-04 | 2019-04-04 | Magical Technologies, Llc | Systems, methods and apparatuses for deployment and targeting of context-aware virtual objects and behavior modeling of virtual objects based on physical principles |
US10068557B1 (en) | 2017-08-23 | 2018-09-04 | Google Llc | Generating music with deep neural networks |
US10835809B2 (en) | 2017-08-26 | 2020-11-17 | Kristina Contreras | Auditorium efficient tracking in auditory augmented reality |
EP3695326A4 (en) | 2017-09-05 | 2021-07-28 | Shaw Industries Group, Inc. | AUDIBLE ACOUSTIC PERFORMANCE TOOL |
US10276143B2 (en) | 2017-09-20 | 2019-04-30 | Plantronics, Inc. | Predictive soundscape adaptation |
US20190096130A1 (en) | 2017-09-26 | 2019-03-28 | Akn Korea Inc. | Virtual mobile terminal implementing system in mixed reality and control method thereof |
US10394229B2 (en) | 2017-09-27 | 2019-08-27 | International Business Machines Corporation | Orchestration of learning and execution of model predictive control tool for manufacturing processes |
US10665223B2 (en) | 2017-09-29 | 2020-05-26 | Udifi, Inc. | Acoustic and other waveform event detection and correction systems and methods |
WO2019070328A1 (en) | 2017-10-04 | 2019-04-11 | Google Llc | METHODS AND SYSTEMS FOR AUTOMATICALLY EQUALIZING AUDIO OUTPUT BASED ON THE CHARACTERISTICS OF THE PART |
CA3078420A1 (en) | 2017-10-17 | 2019-04-25 | Magic Leap, Inc. | Mixed reality spatial audio |
WO2019084214A1 (en) | 2017-10-24 | 2019-05-02 | Whisper.Ai, Inc. | AUDIO SEPARATION AND RECOMBINATION FOR INTELLIGIBILITY AND COMFORT |
EP3477466A1 (en) | 2017-10-31 | 2019-05-01 | Nokia Technologies Oy | Provision of virtual reality content |
WO2019089811A1 (en) | 2017-11-01 | 2019-05-09 | Vrgineers, Inc. | Interactive augmented or virtual reality devices |
EP3489821A1 (en) | 2017-11-27 | 2019-05-29 | Nokia Technologies Oy | A user interface for user selection of sound objects for rendering, and/or a method for rendering a user interface for user selection of sound objects for rendering |
US10013654B1 (en) | 2017-11-29 | 2018-07-03 | OJO Labs, Inc. | Cooperatively operating a network of supervised learning processors to concurrently distribute supervised learning processor training and provide predictive responses to input data |
US10206055B1 (en) | 2017-12-28 | 2019-02-12 | Verizon Patent And Licensing Inc. | Methods and systems for generating spatialized audio during a virtual experience |
US10390171B2 (en) * | 2018-01-07 | 2019-08-20 | Creative Technology Ltd | Method for generating customized spatial audio with head tracking |
US11032662B2 (en) * | 2018-05-30 | 2021-06-08 | Qualcomm Incorporated | Adjusting audio characteristics for augmented reality |
US10593119B2 (en) | 2018-06-25 | 2020-03-17 | Intel Corporation | Projected augmented reality to obscure physical objects |
EP3903510B1 (en) * | 2018-12-24 | 2025-04-09 | DTS, Inc. | Room acoustics simulation using deep learning image analysis |
US10721521B1 (en) * | 2019-06-24 | 2020-07-21 | Facebook Technologies, Llc | Determination of spatialized virtual acoustic scenes from legacy audiovisual media |
US11989232B2 (en) * | 2020-11-06 | 2024-05-21 | International Business Machines Corporation | Generating realistic representations of locations by emulating audio for images based on contextual information |
US11895466B2 (en) * | 2020-12-28 | 2024-02-06 | Hansong (Nanjing) Technology Ltd. | Methods and systems for determining parameters of audio devices |
US11810354B2 (en) * | 2021-04-12 | 2023-11-07 | Meta Platforms, Inc. | Generating digital floorplans from sparse digital video utilizing an audio-visual floorplan reconstruction machine learning model |
GB2612173A (en) * | 2021-09-21 | 2023-04-26 | Apple Inc | Determining a virtual listening environment |
-
2019
- 2019-12-13 EP EP19839195.5A patent/EP3903510B1/en active Active
- 2019-12-13 KR KR1020217023354A patent/KR102804488B1/ko active Active
- 2019-12-13 JP JP2021537089A patent/JP7631198B2/ja active Active
- 2019-12-13 WO PCT/US2019/066315 patent/WO2020139588A1/en active IP Right Grant
- 2019-12-13 CN CN201980090751.8A patent/CN113439447A/zh active Pending
-
2021
- 2021-06-22 US US17/354,668 patent/US12112521B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014049118A (ja) * | 2012-08-31 | 2014-03-17 | Fujitsu Ltd | 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 |
US20180232471A1 (en) * | 2017-02-16 | 2018-08-16 | The University Of North Carolina At Chapel Hill | Methods, systems, and computer readable media for acoustic classification and optimization for multi-modal rendering of real-world scenes |
Also Published As
Publication number | Publication date |
---|---|
US20220101623A1 (en) | 2022-03-31 |
EP3903510C0 (en) | 2025-04-09 |
US12112521B2 (en) | 2024-10-08 |
WO2020139588A1 (en) | 2020-07-02 |
EP3903510A1 (en) | 2021-11-03 |
JP2022515266A (ja) | 2022-02-17 |
JP7631198B2 (ja) | 2025-02-18 |
KR102804488B1 (ko) | 2025-05-07 |
CN113439447A (zh) | 2021-09-24 |
EP3903510B1 (en) | 2025-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12112521B2 (en) | Room acoustics simulation using deep learning image analysis | |
KR102008771B1 (ko) | 청각-공간-최적화 전달 함수들의 결정 및 사용 | |
JP7038688B2 (ja) | ヘッドフォンを介した空間音響レンダリングのための室内特性を修正するシステムおよび方法 | |
CN104995681B (zh) | 多声道音频数据的视频分析辅助产生 | |
US11930337B2 (en) | Audio encoding with compressed ambience | |
CN109313907A (zh) | 合并音频信号与空间元数据 | |
CN109068263A (zh) | 使用元数据处理的耳机的双耳呈现 | |
CA2744429C (en) | Converter and method for converting an audio signal | |
CN106023983A (zh) | 基于虚拟现实vr场景的多用户语音交互方法以及装置 | |
GB2612173A (en) | Determining a virtual listening environment | |
WO2019197709A1 (en) | An apparatus, a method and a computer program for reproducing spatial audio | |
JP2023514121A (ja) | ビデオ情報に基づく空間オーディオ拡張 | |
CN113709619A (zh) | 音频处理方法、装置、用户终端及计算机可读介质 | |
KR20220036210A (ko) | 영상의 음질을 향상시키는 디바이스 및 방법 | |
GB2550877A (en) | Object-based audio rendering | |
CN111787464B (zh) | 一种信息处理方法、装置、电子设备和存储介质 | |
Kearney et al. | Design of an interactive virtual reality system for ensemble singing | |
Grimm et al. | Comparison of distance perception in simulated and real rooms | |
France | Immersive Audio Production: Providing structure to research and development in an emerging production format | |
CN119785818A (zh) | 音视频处理方法、装置、音视频设备和计算机存储介质 | |
TW202509754A (zh) | 產生音訊資料信號 | |
CN119729331A (zh) | 音频渲染方法、存储介质及电子装置 | |
CN119497030A (zh) | 音频处理方法及电子设备 | |
Maempel et al. | Opto-acoustic simulation of concert halls–a data-based approach (Opto-akustische Simulation von Konzerträumen–ein datenbasierter Ansatz) | |
HK40029925A (en) | Systems and methods for modifying room characteristics for spatial audio rendering over headphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20210722 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20221128 Comment text: Request for Examination of Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240131 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20241029 Comment text: Decision to Refuse Application Patent event code: PE06012S01D |
|
PX0701 | Decision of registration after re-examination |
Patent event date: 20250124 Comment text: Decision to Grant Registration Patent event code: PX07013S01D |
|
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20250430 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20250430 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |