CN103971678A - 关键词检测方法和装置 - Google Patents
关键词检测方法和装置 Download PDFInfo
- Publication number
- CN103971678A CN103971678A CN201310034769.0A CN201310034769A CN103971678A CN 103971678 A CN103971678 A CN 103971678A CN 201310034769 A CN201310034769 A CN 201310034769A CN 103971678 A CN103971678 A CN 103971678A
- Authority
- CN
- China
- Prior art keywords
- phoneme
- keyword
- model
- phonemes
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 69
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 238000013507 mapping Methods 0.000 claims description 46
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000002372 labelling Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000003066 decision tree Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000000945 filler Substances 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Electrically Operated Instructional Devices (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (18)
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310034769.0A CN103971678B (zh) | 2013-01-29 | 2013-01-29 | 关键词检测方法和装置 |
| PCT/CN2013/085905 WO2014117547A1 (en) | 2013-01-29 | 2013-10-24 | Method and device for keyword detection |
| US14/103,775 US9466289B2 (en) | 2013-01-29 | 2013-12-11 | Keyword detection with international phonetic alphabet by foreground model and background model |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310034769.0A CN103971678B (zh) | 2013-01-29 | 2013-01-29 | 关键词检测方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN103971678A true CN103971678A (zh) | 2014-08-06 |
| CN103971678B CN103971678B (zh) | 2015-08-12 |
Family
ID=51241097
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201310034769.0A Active CN103971678B (zh) | 2013-01-29 | 2013-01-29 | 关键词检测方法和装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9466289B2 (zh) |
| CN (1) | CN103971678B (zh) |
| WO (1) | WO2014117547A1 (zh) |
Cited By (38)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105161096A (zh) * | 2015-09-22 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 基于垃圾模型的语音识别处理方法及装置 |
| CN106297776A (zh) * | 2015-05-22 | 2017-01-04 | 中国科学院声学研究所 | 一种基于音频模板的语音关键词检索方法 |
| CN106847273A (zh) * | 2016-12-23 | 2017-06-13 | 北京云知声信息技术有限公司 | 语音识别的唤醒词选择方法及装置 |
| CN106856092A (zh) * | 2015-12-09 | 2017-06-16 | 中国科学院声学研究所 | 基于前向神经网络语言模型的汉语语音关键词检索方法 |
| CN106920558A (zh) * | 2015-12-25 | 2017-07-04 | 展讯通信(上海)有限公司 | 关键词识别方法及装置 |
| CN107123417A (zh) * | 2017-05-16 | 2017-09-01 | 上海交通大学 | 基于鉴别性训练的定制语音唤醒优化方法及系统 |
| WO2017166625A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 用于语音识别的声学模型训练方法、装置和电子设备 |
| WO2017166966A1 (zh) * | 2016-03-29 | 2017-10-05 | 腾讯科技(深圳)有限公司 | 数字语音识别中语音解码网络的构建方法、装置及存储介质 |
| CN108154177A (zh) * | 2017-12-20 | 2018-06-12 | 广东宜通世纪科技股份有限公司 | 业务识别方法、装置、终端设备及存储介质 |
| WO2019113911A1 (zh) * | 2017-12-15 | 2019-06-20 | 海尔优家智能科技(北京)有限公司 | 设备控制方法、云端设备、智能设备、计算机介质及设备 |
| CN110111767A (zh) * | 2018-01-31 | 2019-08-09 | 通用汽车环球科技运作有限责任公司 | 多语言语音辅助支持 |
| CN110232131A (zh) * | 2019-04-26 | 2019-09-13 | 特赞(上海)信息科技有限公司 | 基于创意标签的创意素材搜索方法及装置 |
| CN110534102A (zh) * | 2019-09-19 | 2019-12-03 | 北京声智科技有限公司 | 一种语音唤醒方法、装置、设备及介质 |
| CN110781270A (zh) * | 2018-07-13 | 2020-02-11 | 北京搜狗科技发展有限公司 | 一种解码网络中非关键词模型的构建方法和装置 |
| CN110992929A (zh) * | 2019-11-26 | 2020-04-10 | 苏宁云计算有限公司 | 一种基于神经网络的语音关键词检测方法、装置及系统 |
| CN111128128A (zh) * | 2019-12-26 | 2020-05-08 | 华南理工大学 | 一种基于互补模型评分融合的语音关键词检测方法 |
| CN111128172A (zh) * | 2019-12-31 | 2020-05-08 | 达闼科技成都有限公司 | 一种语音识别方法、电子设备和存储介质 |
| CN111462777A (zh) * | 2020-03-30 | 2020-07-28 | 厦门快商通科技股份有限公司 | 关键词检索方法、系统、移动终端及存储介质 |
| CN111540363A (zh) * | 2020-04-20 | 2020-08-14 | 合肥讯飞数码科技有限公司 | 关键词模型及解码网络构建方法、检测方法及相关设备 |
| CN111583939A (zh) * | 2019-02-19 | 2020-08-25 | 富港电子(东莞)有限公司 | 语音识别用于特定目标唤醒的方法及装置 |
| CN111737553A (zh) * | 2020-06-16 | 2020-10-02 | 苏州朗动网络科技有限公司 | 企业关联词的选取方法、设备和存储介质 |
| CN112017648A (zh) * | 2020-08-25 | 2020-12-01 | 北京声智科技有限公司 | 加权有限状态转换器构建方法、语音识别方法及装置 |
| CN112259077A (zh) * | 2020-10-20 | 2021-01-22 | 网易(杭州)网络有限公司 | 语音识别方法、装置、终端和存储介质 |
| CN112447176A (zh) * | 2019-08-29 | 2021-03-05 | 株式会社东芝 | 信息处理装置、关键词检测装置以及信息处理方法 |
| CN112820294A (zh) * | 2021-01-06 | 2021-05-18 | 镁佳(北京)科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
| CN112837675A (zh) * | 2019-11-22 | 2021-05-25 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置及相关系统和设备 |
| CN113035247A (zh) * | 2021-03-17 | 2021-06-25 | 广州虎牙科技有限公司 | 一种音频文本对齐方法、装置、电子设备及存储介质 |
| CN113096648A (zh) * | 2021-03-20 | 2021-07-09 | 杭州知存智能科技有限公司 | 用于语音识别的实时解码方法和装置 |
| CN113192535A (zh) * | 2021-04-16 | 2021-07-30 | 中国科学院声学研究所 | 一种语音关键词检索方法、系统和电子装置 |
| CN113643718A (zh) * | 2021-08-16 | 2021-11-12 | 北京房江湖科技有限公司 | 音频数据处理方法和装置 |
| CN113918791A (zh) * | 2021-11-11 | 2022-01-11 | 国网江苏省电力有限公司无锡供电分公司 | 一种多源异构电网信息采集系统 |
| TWI759003B (zh) * | 2020-12-10 | 2022-03-21 | 國立成功大學 | 語音辨識模型的訓練方法 |
| CN114283788A (zh) * | 2020-09-27 | 2022-04-05 | 华为技术有限公司 | 发音评测方法、发音评测系统的训练方法、装置及设备 |
| CN114783427A (zh) * | 2022-06-20 | 2022-07-22 | 成都启英泰伦科技有限公司 | 基于命令词的语音识别模型压缩方法 |
| CN114944157A (zh) * | 2022-05-27 | 2022-08-26 | 上海互问信息科技有限公司 | 一种支持多语种和语音自定义的语音唤醒方法 |
| CN115810350A (zh) * | 2022-11-15 | 2023-03-17 | 北京声智科技有限公司 | 训练数据获取方法、装置、设备及存储介质 |
| CN116013268A (zh) * | 2022-12-26 | 2023-04-25 | 思必驰科技股份有限公司 | 设备自学习方法、设备及介质 |
| CN116013268B (zh) * | 2022-12-26 | 2026-02-06 | 思必驰科技股份有限公司 | 设备自学习方法、设备及介质 |
Families Citing this family (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103544140A (zh) * | 2012-07-12 | 2014-01-29 | 国际商业机器公司 | 一种数据处理方法、展示方法和相应的装置 |
| US9336781B2 (en) * | 2013-10-17 | 2016-05-10 | Sri International | Content-aware speaker recognition |
| CN104143326B (zh) * | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
| US9589564B2 (en) * | 2014-02-05 | 2017-03-07 | Google Inc. | Multiple speech locale-specific hotword classifiers for selection of a speech locale |
| TWI612472B (zh) * | 2016-12-01 | 2018-01-21 | 財團法人資訊工業策進會 | 指令轉換方法與系統以及非暫態電腦可讀取記錄媒體 |
| US10186265B1 (en) * | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
| CN110199575B (zh) * | 2017-01-19 | 2023-07-14 | 皇家飞利浦有限公司 | 用于生成x射线辐射的x射线源装置 |
| US10607601B2 (en) * | 2017-05-11 | 2020-03-31 | International Business Machines Corporation | Speech recognition by selecting and refining hot words |
| CN107680582B (zh) | 2017-07-28 | 2021-03-26 | 平安科技(深圳)有限公司 | 声学模型训练方法、语音识别方法、装置、设备及介质 |
| US10943580B2 (en) * | 2018-05-11 | 2021-03-09 | International Business Machines Corporation | Phonological clustering |
| CN110610695B (zh) * | 2018-05-28 | 2022-05-17 | 宁波方太厨具有限公司 | 一种基于孤立词的语音识别方法及应用有该方法的吸油烟机 |
| CN109036464B (zh) * | 2018-09-17 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 发音检错方法、装置、设备及存储介质 |
| US11308939B1 (en) * | 2018-09-25 | 2022-04-19 | Amazon Technologies, Inc. | Wakeword detection using multi-word model |
| CN111161718A (zh) * | 2018-11-07 | 2020-05-15 | 珠海格力电器股份有限公司 | 语音识别方法、装置、设备、存储介质及空调 |
| US11335347B2 (en) * | 2019-06-03 | 2022-05-17 | Amazon Technologies, Inc. | Multiple classifications of audio data |
| CN110570838B (zh) * | 2019-08-02 | 2022-06-07 | 北京葡萄智学科技有限公司 | 语音流处理方法和装置 |
| KR20210030160A (ko) * | 2019-09-09 | 2021-03-17 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
| CN111128174A (zh) * | 2019-12-31 | 2020-05-08 | 北京猎户星空科技有限公司 | 一种语音信息的处理方法、装置、设备及介质 |
| CN113903340A (zh) * | 2020-06-18 | 2022-01-07 | 北京声智科技有限公司 | 样本筛选方法及电子设备 |
| CN111862959B (zh) * | 2020-08-07 | 2024-04-19 | 广州视琨电子科技有限公司 | 发音错误检测方法、装置、电子设备及存储介质 |
| CN113703579B (zh) * | 2021-08-31 | 2023-05-30 | 北京字跳网络技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
| CN114898736B (zh) * | 2022-03-30 | 2025-11-14 | 北京小米移动软件有限公司 | 语音信号识别方法、装置、电子设备和存储介质 |
| CN114863918B (zh) * | 2022-04-20 | 2025-12-12 | 时擎智能科技(上海)有限公司 | 解码网系统、语音识别方法、装置、设备及介质 |
| CN117524263A (zh) * | 2022-07-26 | 2024-02-06 | 北京三星通信技术研究有限公司 | 数据处理方法、设备唤醒方法、电子设备及存储介质 |
| CN117351944B (zh) * | 2023-12-06 | 2024-04-12 | 科大讯飞股份有限公司 | 语音识别方法、装置、设备及可读存储介质 |
| CN117727296B (zh) * | 2023-12-18 | 2024-08-09 | 杭州恒芯微电子技术有限公司 | 基于单火面板的语音识别控制系统 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5199077A (en) * | 1991-09-19 | 1993-03-30 | Xerox Corporation | Wordspotting for voice editing and indexing |
| EP1471501A2 (en) * | 2003-04-25 | 2004-10-27 | Pioneer Corporation | Speech recognition apparatus, speech recognition method, and recording medium on which speech recognition program is computer-readable recorded |
| US20060190259A1 (en) * | 2005-02-18 | 2006-08-24 | Samsung Electronics Co., Ltd. | Method and apparatus for recognizing speech by measuring confidence levels of respective frames |
| CN101415259A (zh) * | 2007-10-18 | 2009-04-22 | 三星电子株式会社 | 嵌入式设备上基于双语语音查询的信息检索系统及方法 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5613037A (en) * | 1993-12-21 | 1997-03-18 | Lucent Technologies Inc. | Rejection of non-digit strings for connected digit speech recognition |
| US5675706A (en) * | 1995-03-31 | 1997-10-07 | Lucent Technologies Inc. | Vocabulary independent discriminative utterance verification for non-keyword rejection in subword based speech recognition |
| US5737489A (en) * | 1995-09-15 | 1998-04-07 | Lucent Technologies Inc. | Discriminative utterance verification for connected digits recognition |
| US5797123A (en) * | 1996-10-01 | 1998-08-18 | Lucent Technologies Inc. | Method of key-phase detection and verification for flexible speech understanding |
| US6125345A (en) * | 1997-09-19 | 2000-09-26 | At&T Corporation | Method and apparatus for discriminative utterance verification using multiple confidence measures |
| EP1097447A1 (de) * | 1998-07-23 | 2001-05-09 | Siemens Aktiengesellschaft | Verfahren und vorrichtung zur erkennung vorgegebener schlüsselwörter in gesprochener sprache |
| US7149688B2 (en) * | 2002-11-04 | 2006-12-12 | Speechworks International, Inc. | Multi-lingual speech recognition with cross-language context modeling |
| JP4497834B2 (ja) * | 2003-04-28 | 2010-07-07 | パイオニア株式会社 | 音声認識装置及び音声認識方法並びに音声認識用プログラム及び情報記録媒体 |
| GB2404040A (en) * | 2003-07-16 | 2005-01-19 | Canon Kk | Lattice matching |
| WO2005010866A1 (en) * | 2003-07-23 | 2005-02-03 | Nexidia Inc. | Spoken word spotting queries |
| KR100679051B1 (ko) * | 2005-12-14 | 2007-02-05 | 삼성전자주식회사 | 복수의 신뢰도 측정 알고리즘을 이용한 음성 인식 장치 및방법 |
| WO2007134293A2 (en) * | 2006-05-12 | 2007-11-22 | Nexidia, Inc. | Wordspotting system |
| CN101231660A (zh) * | 2008-02-19 | 2008-07-30 | 林超 | 电话自然对话中关键信息的挖掘系统及其方法 |
| US8972253B2 (en) * | 2010-09-15 | 2015-03-03 | Microsoft Technology Licensing, Llc | Deep belief network for large vocabulary continuous speech recognition |
| US9031844B2 (en) * | 2010-09-21 | 2015-05-12 | Microsoft Technology Licensing, Llc | Full-sequence training of deep structures for speech recognition |
| CN104143328B (zh) * | 2013-08-15 | 2015-11-25 | 腾讯科技(深圳)有限公司 | 一种关键词检测方法和装置 |
| CN104143329B (zh) * | 2013-08-19 | 2015-10-21 | 腾讯科技(深圳)有限公司 | 进行语音关键词检索的方法及装置 |
-
2013
- 2013-01-29 CN CN201310034769.0A patent/CN103971678B/zh active Active
- 2013-10-24 WO PCT/CN2013/085905 patent/WO2014117547A1/en not_active Ceased
- 2013-12-11 US US14/103,775 patent/US9466289B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5199077A (en) * | 1991-09-19 | 1993-03-30 | Xerox Corporation | Wordspotting for voice editing and indexing |
| EP1471501A2 (en) * | 2003-04-25 | 2004-10-27 | Pioneer Corporation | Speech recognition apparatus, speech recognition method, and recording medium on which speech recognition program is computer-readable recorded |
| US20060190259A1 (en) * | 2005-02-18 | 2006-08-24 | Samsung Electronics Co., Ltd. | Method and apparatus for recognizing speech by measuring confidence levels of respective frames |
| CN101415259A (zh) * | 2007-10-18 | 2009-04-22 | 三星电子株式会社 | 嵌入式设备上基于双语语音查询的信息检索系统及方法 |
Non-Patent Citations (1)
| Title |
|---|
| JOACHIM KÖHLER: "Multilingual phone models for vocabulary-independent speech recognition tasks", 《SPEECH COMMUNICATION》 * |
Cited By (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106297776B (zh) * | 2015-05-22 | 2019-07-09 | 中国科学院声学研究所 | 一种基于音频模板的语音关键词检索方法 |
| CN106297776A (zh) * | 2015-05-22 | 2017-01-04 | 中国科学院声学研究所 | 一种基于音频模板的语音关键词检索方法 |
| CN105161096B (zh) * | 2015-09-22 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 基于垃圾模型的语音识别处理方法及装置 |
| CN105161096A (zh) * | 2015-09-22 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 基于垃圾模型的语音识别处理方法及装置 |
| CN106856092A (zh) * | 2015-12-09 | 2017-06-16 | 中国科学院声学研究所 | 基于前向神经网络语言模型的汉语语音关键词检索方法 |
| CN106856092B (zh) * | 2015-12-09 | 2019-11-15 | 中国科学院声学研究所 | 基于前向神经网络语言模型的汉语语音关键词检索方法 |
| CN106920558A (zh) * | 2015-12-25 | 2017-07-04 | 展讯通信(上海)有限公司 | 关键词识别方法及装置 |
| US10699699B2 (en) | 2016-03-29 | 2020-06-30 | Tencent Technology (Shenzhen) Company Limited | Constructing speech decoding network for numeric speech recognition |
| WO2017166966A1 (zh) * | 2016-03-29 | 2017-10-05 | 腾讯科技(深圳)有限公司 | 数字语音识别中语音解码网络的构建方法、装置及存储介质 |
| WO2017166625A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 用于语音识别的声学模型训练方法、装置和电子设备 |
| CN106847273A (zh) * | 2016-12-23 | 2017-06-13 | 北京云知声信息技术有限公司 | 语音识别的唤醒词选择方法及装置 |
| CN107123417B (zh) * | 2017-05-16 | 2020-06-09 | 上海交通大学 | 基于鉴别性训练的定制语音唤醒优化方法及系统 |
| CN107123417A (zh) * | 2017-05-16 | 2017-09-01 | 上海交通大学 | 基于鉴别性训练的定制语音唤醒优化方法及系统 |
| WO2019113911A1 (zh) * | 2017-12-15 | 2019-06-20 | 海尔优家智能科技(北京)有限公司 | 设备控制方法、云端设备、智能设备、计算机介质及设备 |
| CN108154177A (zh) * | 2017-12-20 | 2018-06-12 | 广东宜通世纪科技股份有限公司 | 业务识别方法、装置、终端设备及存储介质 |
| CN108154177B (zh) * | 2017-12-20 | 2020-01-21 | 宜通世纪科技股份有限公司 | 业务识别方法、装置、终端设备及存储介质 |
| CN110111767A (zh) * | 2018-01-31 | 2019-08-09 | 通用汽车环球科技运作有限责任公司 | 多语言语音辅助支持 |
| CN110781270A (zh) * | 2018-07-13 | 2020-02-11 | 北京搜狗科技发展有限公司 | 一种解码网络中非关键词模型的构建方法和装置 |
| CN111583939A (zh) * | 2019-02-19 | 2020-08-25 | 富港电子(东莞)有限公司 | 语音识别用于特定目标唤醒的方法及装置 |
| CN110232131A (zh) * | 2019-04-26 | 2019-09-13 | 特赞(上海)信息科技有限公司 | 基于创意标签的创意素材搜索方法及装置 |
| CN110232131B (zh) * | 2019-04-26 | 2021-04-27 | 特赞(上海)信息科技有限公司 | 基于创意标签的创意素材搜索方法及装置 |
| CN112447176A (zh) * | 2019-08-29 | 2021-03-05 | 株式会社东芝 | 信息处理装置、关键词检测装置以及信息处理方法 |
| CN110534102B (zh) * | 2019-09-19 | 2020-10-30 | 北京声智科技有限公司 | 一种语音唤醒方法、装置、设备及介质 |
| CN110534102A (zh) * | 2019-09-19 | 2019-12-03 | 北京声智科技有限公司 | 一种语音唤醒方法、装置、设备及介质 |
| CN112837675A (zh) * | 2019-11-22 | 2021-05-25 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置及相关系统和设备 |
| CN110992929A (zh) * | 2019-11-26 | 2020-04-10 | 苏宁云计算有限公司 | 一种基于神经网络的语音关键词检测方法、装置及系统 |
| CN111128128A (zh) * | 2019-12-26 | 2020-05-08 | 华南理工大学 | 一种基于互补模型评分融合的语音关键词检测方法 |
| CN111128128B (zh) * | 2019-12-26 | 2023-05-23 | 华南理工大学 | 一种基于互补模型评分融合的语音关键词检测方法 |
| CN111128172A (zh) * | 2019-12-31 | 2020-05-08 | 达闼科技成都有限公司 | 一种语音识别方法、电子设备和存储介质 |
| CN111462777A (zh) * | 2020-03-30 | 2020-07-28 | 厦门快商通科技股份有限公司 | 关键词检索方法、系统、移动终端及存储介质 |
| CN111540363A (zh) * | 2020-04-20 | 2020-08-14 | 合肥讯飞数码科技有限公司 | 关键词模型及解码网络构建方法、检测方法及相关设备 |
| CN111540363B (zh) * | 2020-04-20 | 2023-10-24 | 合肥讯飞数码科技有限公司 | 关键词模型及解码网络构建方法、检测方法及相关设备 |
| CN111737553A (zh) * | 2020-06-16 | 2020-10-02 | 苏州朗动网络科技有限公司 | 企业关联词的选取方法、设备和存储介质 |
| CN112017648A (zh) * | 2020-08-25 | 2020-12-01 | 北京声智科技有限公司 | 加权有限状态转换器构建方法、语音识别方法及装置 |
| CN114283788A (zh) * | 2020-09-27 | 2022-04-05 | 华为技术有限公司 | 发音评测方法、发音评测系统的训练方法、装置及设备 |
| CN112259077A (zh) * | 2020-10-20 | 2021-01-22 | 网易(杭州)网络有限公司 | 语音识别方法、装置、终端和存储介质 |
| CN112259077B (zh) * | 2020-10-20 | 2024-04-09 | 网易(杭州)网络有限公司 | 语音识别方法、装置、终端和存储介质 |
| TWI759003B (zh) * | 2020-12-10 | 2022-03-21 | 國立成功大學 | 語音辨識模型的訓練方法 |
| CN112820294A (zh) * | 2021-01-06 | 2021-05-18 | 镁佳(北京)科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
| CN113035247A (zh) * | 2021-03-17 | 2021-06-25 | 广州虎牙科技有限公司 | 一种音频文本对齐方法、装置、电子设备及存储介质 |
| CN113096648A (zh) * | 2021-03-20 | 2021-07-09 | 杭州知存智能科技有限公司 | 用于语音识别的实时解码方法和装置 |
| CN113192535A (zh) * | 2021-04-16 | 2021-07-30 | 中国科学院声学研究所 | 一种语音关键词检索方法、系统和电子装置 |
| CN113643718A (zh) * | 2021-08-16 | 2021-11-12 | 北京房江湖科技有限公司 | 音频数据处理方法和装置 |
| CN113643718B (zh) * | 2021-08-16 | 2024-06-18 | 贝壳找房(北京)科技有限公司 | 音频数据处理方法和装置 |
| CN113918791A (zh) * | 2021-11-11 | 2022-01-11 | 国网江苏省电力有限公司无锡供电分公司 | 一种多源异构电网信息采集系统 |
| CN114944157A (zh) * | 2022-05-27 | 2022-08-26 | 上海互问信息科技有限公司 | 一种支持多语种和语音自定义的语音唤醒方法 |
| CN114783427A (zh) * | 2022-06-20 | 2022-07-22 | 成都启英泰伦科技有限公司 | 基于命令词的语音识别模型压缩方法 |
| CN115810350A (zh) * | 2022-11-15 | 2023-03-17 | 北京声智科技有限公司 | 训练数据获取方法、装置、设备及存储介质 |
| CN116013268A (zh) * | 2022-12-26 | 2023-04-25 | 思必驰科技股份有限公司 | 设备自学习方法、设备及介质 |
| CN116013268B (zh) * | 2022-12-26 | 2026-02-06 | 思必驰科技股份有限公司 | 设备自学习方法、设备及介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN103971678B (zh) | 2015-08-12 |
| US20140236600A1 (en) | 2014-08-21 |
| US9466289B2 (en) | 2016-10-11 |
| WO2014117547A1 (en) | 2014-08-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103971678B (zh) | 关键词检测方法和装置 | |
| CN109410914B (zh) | 一种赣方言语音和方言点识别方法 | |
| US6542866B1 (en) | Speech recognition method and apparatus utilizing multiple feature streams | |
| JP4195428B2 (ja) | 多数の音声特徴を利用する音声認識 | |
| US6618702B1 (en) | Method of and device for phone-based speaker recognition | |
| EP2888669B1 (en) | Method and system for selectively biased linear discriminant analysis in automatic speech recognition systems | |
| Lin et al. | OOV detection by joint word/phone lattice alignment | |
| WO2018077244A1 (en) | Acoustic-graphemic model and acoustic-graphemic-phonemic model for computer-aided pronunciation training and speech processing | |
| KR101153078B1 (ko) | 음성 분류 및 음성 인식을 위한 은닉 조건부 랜덤 필드모델 | |
| KR102199246B1 (ko) | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 | |
| CN101118745A (zh) | 语音识别系统中的置信度快速求取方法 | |
| Ravinder | Comparison of hmm and dtw for isolated word recognition system of punjabi language | |
| US6662158B1 (en) | Temporal pattern recognition method and apparatus utilizing segment and frame-based models | |
| Zhang et al. | Wake-up-word spotting using end-to-end deep neural network system | |
| Luo et al. | Automatic pronunciation evaluation of language learners' utterances generated through shadowing. | |
| Kou et al. | Fix it where it fails: Pronunciation learning by mining error corrections from speech logs | |
| Meyer et al. | Boosting HMM acoustic models in large vocabulary speech recognition | |
| Li et al. | Improving mandarin tone mispronunciation detection for non-native learners with soft-target tone labels and blstm-based deep models | |
| Hwang et al. | Building a highly accurate Mandarin speech recognizer | |
| Abdou et al. | Enhancing the confidence measure for an Arabic pronunciation verification system | |
| Zhang et al. | Improved mandarin keyword spotting using confusion garbage model | |
| Benıtez et al. | Different confidence measures for word verification in speech recognition | |
| Kumaran et al. | Attention shift decoding for conversational speech recognition. | |
| JP6199994B2 (ja) | コンテキスト情報を使用した音声認識システムにおける誤警報低減 | |
| Qian et al. | Tone-enhanced generalized character posterior probability (GCPP) for Cantonese LVCSR |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| TR01 | Transfer of patent right | ||
| TR01 | Transfer of patent right |
Effective date of registration: 20200827 Address after: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer Co-patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd. Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403 Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |