CN110534110B - 一种机器人及提高其语音交互识别率的方法、装置和电路 - Google Patents
一种机器人及提高其语音交互识别率的方法、装置和电路 Download PDFInfo
- Publication number
- CN110534110B CN110534110B CN201810514764.0A CN201810514764A CN110534110B CN 110534110 B CN110534110 B CN 110534110B CN 201810514764 A CN201810514764 A CN 201810514764A CN 110534110 B CN110534110 B CN 110534110B
- Authority
- CN
- China
- Prior art keywords
- sound
- robot
- digital signal
- signal
- analog signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims description 34
- 238000012545 processing Methods 0.000 claims abstract description 29
- 230000001629 suppression Effects 0.000 claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J13/00—Controls for manipulators
- B25J13/003—Controls for manipulators by means of an audio-responsive input
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Quality & Reliability (AREA)
- Toys (AREA)
- Manipulator (AREA)
Abstract
一种提高机器人语音交互识别率的电路包括第一解码器、模数转换器、麦克风、主控制器,其中:所述主控制器检测到机器人处于运动状态时,向所述第一解码器发送预先录制的舵机声文件;所述第一解码器将所述舵机声文件解码得到舵机声的第一声音模拟信号;所述模数转换器将所述第一解码器发送的舵机声的第一声音模拟信号转换为第一声音数字信号,以及所述麦克风采集的环境中第二声音模拟信号转换为第二声音数字信号;所述主控制器还根据所述第一声音数字信号和第二声音数字信号,对获取的第二声音数字信号中的舵机声进行抑制处理。从而使得经过抑制处理后的声音能够有效的减少机器舵机声的影响,使得机器人语音交互时的识别率更高。
Description
技术领域
本申请属于机器人领域,尤其涉及一种机器人及提高其语音交互识别率的方法、装置和电路。
背景技术
语音作为人类所特有的能力,是人类之间交流及获取外界信息资源的重要的工具和渠道,对于人类文明的发展具有重要的意义。语音识别技术作为人机交互分支的重要组成,是人机交互的重要接口,对于人工智能的发展具有重要的实际意义。语音识别技术经过数十年的发展,已经取得了显著的进步,逐步开始从实验室慢慢走向市场。目前,针对特定说话人的语音识别系统已经有较高的识别精度,并被广泛应用于工业、家电、通信、汽车电子、医疗、家庭服务和消费电子类产品等领域。
目前,现有的语音交互产品大多基于专用的语音识别芯片,将麦克风输入的声音信号采样编码,再通过内部主控制器与其事先录制好的语音信息匹配,再将相应的语音信息通过片内的模块经过外置的扬声器输出。
如果在机器人处于运动状态,由于机器人自身的舵机会发出声音,如果在机器人运动时候采集到的语音,会包含有很强的舵机运动产生的噪声,影响用户和机器人语音交互时的识别率。
发明内容
有鉴于此,本申请实施例提供了一种提高机器人语音交互识别率的电路、方法和装置,以解决现有技术中由于机器人自身的舵机会发出声音,影响用户和机器人语音交互时的识别率的问题。
本申请实施例的第一方面提供了一种提高机器人语音交互识别率的电路,所述电路包括第一解码器、模数转换器、麦克风、主控制器,其中:
所述主控制器用于检测到机器人处于运动状态时,向所述第一解码器发送预先录制的舵机声文件;
所述第一解码器用于将所述舵机声文件解码得到舵机声的第一声音模拟信号;
所述模数转换器用于将所述第一解码器发送的舵机声的第一声音模拟信号转换为第一声音数字信号,以及所述麦克风采集的环境中第二声音模拟信号转换为第二声音数字信号;
所述主控制器还用于根据所述第一声音数字信号和第二声音数字信号,对获取的第二声音数字信号中的舵机声进行抑制处理。
结合第一方面,在第一方面的第一种可能实现方式中,所述电路还包括第二解码器、扬声器,其中:
所述第二解码器用于对主控制器发送的系统声音进行解码得到系统声音的第三声音模拟信号,将所述第三声音模拟信号发送至扬声器播放,以及将所述第三声音模拟信号发送至所述模数转换器;
所述主控制器还用于接收所述第三声音模拟信号,对所述第二声音模拟信号中的系统声音进行抑制处理。
结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,所述电路还包括对第二解码器输出的声音模拟信号进行信号放大的放大器,所述放大器输出第二声音模拟信号,通过所述第二声音模拟信号驱动扬声器。
本申请实施例的第二方面提供了一种提高机器人语音交互识别率的方法,所述方法包括:
当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号;
将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
结合第二方面,在第二方面的第一种可能实现方式中,所述方法还包括:
在机器人的扬声器输出系统声音信号时,获取所述系统声音的第三声音模拟信号;
将所述第三声音模拟信号转换得到第三声音数字信号,根据所述第三声音数字信号对第二声音数字信号中的系统声音进行抑制处理。
结合第二方面的第一种可能实现方式,在第二方面的第二种可能实现方式中,所述获取所述系统声音的第三声音模拟信号的步骤中,所述第三声音模拟信号为放大器放大后系统声音模拟信号,且所述第三声音模拟信号直接通过机器人扬声器输出。
本申请实施例的第三方面提供了一种提高机器人语音交互识别率的装置,其特征在于,所述装置包括:
第一声音信号获取单元,用于当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号;
第二声音信号获取单元,用于将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
第一抑制处理单元,用于根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
结合第三方面,在第三方面的第一种可能实现方式中,所述装置还包括:
第三声音信号获取单元,用于在机器人的扬声器输出系统声音信号时,获取所述系统声音的第三声音模拟信号;
第二抑制处理单元,用于将所述第三声音模拟信号转换得到第三声音数字信号,根据所述第三声音数字信号对第二声音数字信号中的系统声音进行抑制处理。
本申请实施例的第四方面提供了一种机器人,包括存储器、主控制器以及存储在所述存储器中并可在所述主控制器上运行的计算机程序,所述主控制器执行所述计算机程序时实现如第二方面任一项所述提高机器人语音交互识别率方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被主控制器执行时实现如第二方面任一项所述提高机器人语音交互识别率方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请通过预先设定机器人舵机声文件,并在检测到机器人处于运动状态时,获取所预先设定的舵机声文件对应的第一声音数字号,然后根据麦克风所采集的环境中的第二声音数字信号,对采集的第二声音数字信号中的舵机声进行抑制处理,从而使得经过抑制处理后的第二声音数字信号能够有效的减少机器舵机声的影响,使得机器人语音交互时的识别率更高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种提高机器人语音交互识别率的电路示意图;
图2是本申请实施例提供的一种提高机器人语音交互识别率的方法的实现流程示意图;
图3是本申请实施例提供的又一提高机器人语音交互识别率的方法的实现流程示意图;
图4是本申请实施例提供的一种提高机器人语音交互识别率的装置的示意图;
图5是本申请实施例提供的机器人的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
如图1所示为本申请实施例提供的一种提高机器人语音交互识别率的电路的结构示意图,详述如下:
所述电路包括第一解码器101、模数转换器102、麦克风103、主控制器104,其中:
所述主控制器104用于检测到机器人处于运动状态时,向所述第一解码器101发送预先录制的舵机声文件;
所述第一解码器101用于将所述舵机声文件解码得到舵机声的第一声音模拟信号;
所述模数转换器102用于将所述第一解码器101发送的舵机声的第一声音模拟信号转换为第一声音数字信号,以及所述麦克风103采集的环境中第二声音模拟信号转换为第二声音数字信号;
所述主控制器104还用于根据所述第一声音数字信号和第二声音数字信号,对获取的第二声音数字信号中的舵机声进行抑制处理。
所述主控制器104可以与第一解码器101、模数转换器102相连,所述麦克风103与所述模数转换器102相连。所述主控制器可以发送控制机器人的舵机的运动指令,从而使得机器人可以完成不同的动作。
所述主控制器104可以从存储器中读取预先录制的舵机声文件,将读取的文件发送给第一解码器101进行解码,得到所述舵机声文件对应的第一声音模拟信号,所述模数转换器102可以将所述第一声音模拟信号转换为第一声音数字信号,并将转换后的第一声音数字信号发送给主控制器104,便于主控制器进行后续的声音抑制处理的计算。
所述麦克风103可以为麦克风阵列,可以通过一个或者多个麦克风获取环境中的声音后,生成第二声音的模拟信号,可由所述模数转换器102对所述第二声音模拟信号进行转换,得到第二声音数字信号。当机器人处于运动状态时,在第二声音数字信号中,包括机器人运动的舵机声、环境中的用户对机器人发送的指令声。当所述主控制器获得第一声音的数字信号和第二声音的数字信号后,可以根据第一声音数字信号对第二声音数字信号进行抑制处理,即对第二声音数字信号中包括的第一声音数字信号进行消除,可通过第二声音数字信号减去第一声音数字信号,得到对第机器人的舵机声进行抑制后的声音信号,对抑制后的声音信号进行语音识别等操作,可以提高对用户的语音指令的识别准确度。
在本申请中,所述第一解码电路101、模数转换器102、主控制器104可以集成在同一芯片中,也可以由不同的芯片分别完成相应的处理。
另外,如图1所示,优选的一种实施方式中,所述提高机器人语音交互识别率的电路还包括第二解码器105、扬声器106,所述第二解码器105与所述主控制器104相连,在机器人需要播放语音时,通过所述第二解码器105对语音文件进行解码得到第三声音的模块信号,可由所述扬声器106对所述第三声音的模拟信号进行播放。
通过第二解码器105解码得到第三声音的模拟信号后,所述模数转换器102可以获取所述第三声音的模拟信号,并将其转换为第三声音的数字信号并发送给所述主控制器104。所述主控制器104可以根据第二声音的数字信号,减去其中包括的第一声音的数字信号和第三声音的数字信号,从而能够得到用户的语音控制指令的声音信号,进一步提高语音识别的准确度。
另外,更进一步优化的实施方式中,所述提高机器人语音交互识别率的电路还包括放大器107,所述放大器107用于对第二解码器105解码得到语音信号进一步放大,使得其满足扬声器106播放的要求,并且将放大后的信号发送给模数转换器102,得到扬声器106所播放的语音信号强度的准确值,便于对扬声器106所播放的语音进行更为准确的抑制处理。
图2为本申请实施例提供的一种提高机器人语音交互识别率的方法的实现流程,所述方法包括:
在步骤S201中,当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号;
其中,所述运动状态是指机器人由于接收到控制指令而控制舵机转动而产生的运动,比如行走、挥手、转头等。
检测到机器人处于运动状态,可以通过检测是否有控制机器人舵机进行转动的指令来确定机器人是否处于运动状态。通过舵机控制指令的检测,可以更为准确的检测和区别出机器人当前的运动状态是由机器人中的舵机所控制的运动。
所述预先录制的舵机声文件,是通过控制机器人的舵机转动时对应的声音,可以将机器人设置在安装的场景下,避免环境声音的干扰,在机器人舵机位置设置麦克风,当控制机器人运动时,通过所述麦克风采集的声音,即为舵机声。所述舵机声文件可以预先存储在机器人中的存储器中。
在检测到机器人处于运动状态,即机器人舵机运动时,可以读取预先存储的机器人的舵机声文件,并对所述舵机声文件进行解码,得到舵机声对应的模块信号,即第一声音的模拟信号。可以通过第一解码器对所述第一声音的模拟信号进行转换,得到第一声音的数字信号。所述第一声音的数字信号即机器人的舵机声的数字信号。
在步骤S202中,将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
所述麦克风可以为一个麦克风或者麦克阵列,通过麦克风阵列进行第二声音的采集的同时,还可以获取第二声音的方位,从而便于机器人根据第二声音的方位相等相应的操作,比如控制机器人朝向第二声音的来源。
通过麦克风获取第二声音时,如果机器人处于运动状态,则除了包括环境声音外,还会包括机器人的舵机声。所述环境声中可能包括用户的语音指令,以及环境中的噪声。另外,为了提高语音交互识别率,还可以对环境中的噪声进行过滤,通过对第二声音数字信号中的低频信号进行过滤,从而有效的去除环境中的噪声。
在步骤S203中,根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
获取到第一声音数字信号和第二声音数字信号后,通过对第一声音数字信号和第二声音数字信号中包括的声音进行分析,发现第一声音数字信号为机器人的舵机声所对应的数字信号,第二声音数字信号包括机器人的舵机声、用户发出的控制指令的语音,通过将第二声音数字信号中包括的第一声音数字信号去除,比如可以在第一声音的数字信号的声音内容中,去除第二声音数字信号的声音内容,即可得到抑制处理后的声音。
本申请通过预先设定机器人舵机声文件,并在检测到机器人处于运动状态时,获取所预先设定的舵机声文件对应的第一声音数字号,然后根据麦克风所采集的环境中的第二声音数字信号,对采集的第二声音数字信号中的舵机声进行抑制处理,从而使得经过抑制处理后的第二声音数字信号能够有效的减少机器舵机声的影响,使得机器人语音交互时的识别率更高。
图3为本申请实施例提供的又一种提高机器人语音交互识别率的方法的实现流程,详述如下:
在步骤S301中,当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号;
在步骤S302中,将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
在步骤S303中,根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理;
在步骤S301-S303与图2中的步骤S201-S203基本相同。
在步骤S304中,在机器人的扬声器输出系统声音信号时,获取所述系统声音的第三声音模拟信号;
考虑到机器人自身会发出系统声音,比如机器人会播放音乐、讲故事、回答用户的问题等与用户进行交互的语音,为了避免机器人自身的语音对识别率的影响,本申请还包括对机器人输出的语音的模拟信号,即检测到机器人输出系统声音信号时,对系统输出的第三声音模拟信号进行截取,所述第三声音的模拟信号为输出至扬声器前的模拟信号。
在步骤S305中,将所述第三声音模拟信号转换得到第三声音数字信号,根据所述第三声音数字信号对第二声音数字信号中的系统声音进行抑制处理。
将第三声音模拟信号进行转换后得到第三声音的数字信号,根据第二声音数字信号、第三声音数字信号进行相减处理,即去除第二声音数字信号中包括的系统声音对应的数字信号,从而使得第二声音数字信号中留下的声音信号更加纯净,因而在后续的语音识别时,也就能够达到更高的识别率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图4为本申请实施例提供的一种提高机器人语音交互识别率的装置的结构示意图,详述如下:
所述提高机器人语音交互识别率的装置,包括:
第一声音信号获取单元401,用于当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号;
第二声音信号获取单元402,用于将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
第一抑制处理单元403,用于根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
优选的,所述装置还包括:
第三声音信号获取单元,用于在机器人的扬声器输出系统声音信号时,获取所述系统声音的第三声音模拟信号;
第二抑制处理单元,用于将所述第三声音模拟信号转换得到第三声音数字信号,根据所述第三声音数字信号对第二声音数字信号中的系统声音进行抑制处理。
图4所述提高机器人语音交互识别率的装置,与图2所述的提高机器人语音交互识别率的方法对应,在此不作重复赘述。
图5是本申请一实施例提供的机器人的示意图。如图5所示,该实施例的机器人5包括:主控制器50、存储器51以及存储在所述存储器51中并可在所述主控制器50上运行的计算机程序52,例如提高机器人语音交互识别率程序。所述主控制器50执行所述计算机程序52时实现上述各个提高机器人语音交互识别率方法实施例中的步骤,例如图2所示的步骤201至203。或者,所述主控制器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块401至403的功能。
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述主控制器50执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述机器人5中的执行过程。例如,所述计算机程序52可以被分割成第一声音信号获取单元、第二声音信号获取单元和第一抑制处理单元,各单元具体功能如下:
第一声音信号获取单元,用于当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号;
第二声音信号获取单元,用于将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
第一抑制处理单元,用于根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
所述机器人可包括,但不仅限于,主控制器50、存储器51。本领域技术人员可以理解,图5仅仅是机器人5的示例,并不构成对机器人5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述机器人还可以包括输入输出设备、网络接入设备、总线等。
所称主控制器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用主控制器、声音数字信号主控制器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用主控制器可以是微主控制器或者该主控制器也可以是任何常规的主控制器等。
所述存储器51可以是所述机器人5的内部存储单元,例如机器人5的硬盘或内存。所述存储器51也可以是所述机器人5的外部存储设备,例如所述机器人5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述机器人5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述机器人所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被主控制器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种提高机器人语音交互识别率的电路,其特征在于,所述电路包括第一解码器、模数转换器、麦克风、主控制器,其中:
所述主控制器用于检测到机器人处于运动状态时,向所述第一解码器发送预先录制的舵机声文件,其中,通过检测是否有控制机器人舵机进行转动的指令来确定机器人是否处于运动状态;
所述第一解码器用于将所述舵机声文件解码得到舵机声的第一声音模拟信号;
所述模数转换器用于将所述第一解码器发送的舵机声的第一声音模拟信号转换为第一声音数字信号,以及所述麦克风采集的环境中第二声音模拟信号转换为第二声音数字信号;
所述主控制器还用于根据所述第一声音数字信号和第二声音数字信号,对获取的第二声音数字信号中的舵机声进行抑制处理。
2.根据权利要求1所述的提高机器人语音交互识别率的电路,其特征在于,所述电路还包括第二解码器、扬声器,其中:
所述第二解码器用于对主控制器发送的系统声音进行解码得到系统声音的第三声音模拟信号,将所述第三声音模拟信号发送至扬声器播放,以及将所述第三声音模拟信号发送至所述模数转换器;
所述主控制器还用于接收所述第三声音模拟信号,对所述第二声音模拟信号中的系统声音进行抑制处理。
3.根据权利要求2所述的提高机器人语音交互识别率的电路,其特征在于,所述电路还包括对第二解码器输出的声音模拟信号进行信号放大的放大器,所述放大器输出第二声音模拟信号,通过所述第二声音模拟信号驱动扬声器。
4.一种提高机器人语音交互识别率的方法,其特征在于,所述方法包括:
当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号,其中,通过检测是否有控制机器人舵机进行转动的指令来确定机器人是否处于运动状态;
将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
5.根据权利要求4所述的提高机器人语音交互识别率的方法,其特征在于,所述方法还包括:
在机器人的扬声器输出系统声音信号时,获取所述系统声音的第三声音模拟信号;
将所述第三声音模拟信号转换得到第三声音数字信号,根据所述第三声音数字信号对第二声音数字信号中的系统声音进行抑制处理。
6.根据权利要求5所述的提高机器人语音交互识别率的方法,其特征在于,所述获取所述系统声音的第三声音模拟信号的步骤中,所述第三声音模拟信号为放大器放大后系统声音模拟信号,且所述第三声音模拟信号直接通过机器人扬声器输出。
7.一种提高机器人语音交互识别率的装置,其特征在于,所述装置包括:
第一声音信号获取单元,用于当检测检测到机器人处于运动状态时,获取预先录制的舵机声文件并解码为第一声音模拟信号,并转换得到第一声音数字信号,其中,通过检测是否有控制机器人舵机进行转动的指令来确定机器人是否处于运动状态;
第二声音信号获取单元,用于将麦克风采集的第二声音模拟信号转换为第二声音数字信号;
第一抑制处理单元,用于根据所述第一声音数字信号和第二声音数字信号,对第二声音数字信号中的舵机声进行抑制处理。
8.根据权利要求7所述的提高机器人语音交互识别率的装置,其特征在于,所述装置还包括:
第三声音信号获取单元,用于在机器人的扬声器输出系统声音信号时,获取所述系统声音的第三声音模拟信号;
第二抑制处理单元,用于将所述第三声音模拟信号转换得到第三声音数字信号,根据所述第三声音数字信号对第二声音数字信号中的系统声音进行抑制处理。
9.一种机器人,包括存储器、主控制器以及存储在所述存储器中并可在所述主控制器上运行的计算机程序,其特征在于,所述主控制器执行所述计算机程序时实现如权利要求4至6任一项所述提高机器人语音交互识别率方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被主控制器执行时实现如权利要求4至6任一项所述提高机器人语音交互识别率方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810514764.0A CN110534110B (zh) | 2018-05-25 | 2018-05-25 | 一种机器人及提高其语音交互识别率的方法、装置和电路 |
US16/163,582 US10747494B2 (en) | 2018-05-25 | 2018-10-18 | Robot and speech interaction recognition rate improvement circuit and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810514764.0A CN110534110B (zh) | 2018-05-25 | 2018-05-25 | 一种机器人及提高其语音交互识别率的方法、装置和电路 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110534110A CN110534110A (zh) | 2019-12-03 |
CN110534110B true CN110534110B (zh) | 2022-04-15 |
Family
ID=68613709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810514764.0A Active CN110534110B (zh) | 2018-05-25 | 2018-05-25 | 一种机器人及提高其语音交互识别率的方法、装置和电路 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10747494B2 (zh) |
CN (1) | CN110534110B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10866783B2 (en) * | 2011-08-21 | 2020-12-15 | Transenterix Europe S.A.R.L. | Vocally activated surgical control system |
JP2021074202A (ja) * | 2019-11-07 | 2021-05-20 | ソニー株式会社 | 自律移動体、情報処理方法、プログラム、及び、情報処理装置 |
CN112256234B (zh) * | 2020-11-06 | 2021-07-23 | 易普森智慧健康科技(深圳)有限公司 | 一种控制音量的方法、装置及计算机可读介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442138A (zh) * | 2013-08-26 | 2013-12-11 | 华为终端有限公司 | 语音控制方法、装置及终端 |
CN105810189A (zh) * | 2016-03-22 | 2016-07-27 | 北京京东尚科信息技术有限公司 | 设备的语音控制方法、装置及系统 |
CN106782591A (zh) * | 2016-12-26 | 2017-05-31 | 惠州Tcl移动通信有限公司 | 一种在背景噪音下提高语音识别率的装置及其方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2845920B2 (ja) * | 1989-02-09 | 1999-01-13 | パイオニア株式会社 | 記録再生方式 |
US5065389A (en) * | 1989-08-24 | 1991-11-12 | U.S. Philips Corporation | Information recording and read device, information recording device, and record carrier obtained by means of one of the device |
US6947893B1 (en) * | 1999-11-19 | 2005-09-20 | Nippon Telegraph & Telephone Corporation | Acoustic signal transmission with insertion signal for machine control |
US8983776B2 (en) * | 2002-03-28 | 2015-03-17 | Jason A. Dean | Programmable robotic apparatus |
JP4317892B2 (ja) * | 2005-03-28 | 2009-08-19 | パイオニア株式会社 | オーディオ信号再生装置 |
US20080071540A1 (en) * | 2006-09-13 | 2008-03-20 | Honda Motor Co., Ltd. | Speech recognition method for robot under motor noise thereof |
US9378752B2 (en) * | 2012-09-05 | 2016-06-28 | Honda Motor Co., Ltd. | Sound processing device, sound processing method, and sound processing program |
US20140149118A1 (en) * | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
JP6029985B2 (ja) * | 2013-01-11 | 2016-11-24 | クラリオン株式会社 | 情報処理装置、操作システム、および、情報処理装置の操作方法 |
US9358685B2 (en) * | 2014-02-03 | 2016-06-07 | Brain Corporation | Apparatus and methods for control of robot actions based on corrective user inputs |
US9550578B2 (en) * | 2014-02-04 | 2017-01-24 | Honeywell International Inc. | Systems and methods for utilizing voice commands onboard an aircraft |
HK1195445A2 (zh) * | 2014-05-08 | 2014-11-07 | 黃偉明 | 終端混音系統和播放方法 |
CN106328165A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
US9878664B2 (en) * | 2015-11-04 | 2018-01-30 | Zoox, Inc. | Method for robotic vehicle communication with an external environment via acoustic beam forming |
CN206283664U (zh) * | 2016-11-23 | 2017-06-27 | 成都电科创品机器人科技有限公司 | 一种用于智能机器人系统的多功能语音卡 |
CN106952654A (zh) * | 2017-04-24 | 2017-07-14 | 北京奇虎科技有限公司 | 机器人降噪方法、装置及机器人 |
US10547936B2 (en) * | 2017-06-23 | 2020-01-28 | Abl Ip Holding Llc | Lighting centric indoor location based service with speech-based user interface |
CN107240399A (zh) * | 2017-06-29 | 2017-10-10 | 上海思依暄机器人科技股份有限公司 | 一种提高语音指令识别效果的方法和装置 |
CN107610698A (zh) * | 2017-08-28 | 2018-01-19 | 深圳市金立通信设备有限公司 | 一种实现语音控制的方法、机器人及计算机可读存储介质 |
US11161236B2 (en) * | 2017-09-14 | 2021-11-02 | Sony Interactive Entertainment Inc. | Robot as personal trainer |
-
2018
- 2018-05-25 CN CN201810514764.0A patent/CN110534110B/zh active Active
- 2018-10-18 US US16/163,582 patent/US10747494B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442138A (zh) * | 2013-08-26 | 2013-12-11 | 华为终端有限公司 | 语音控制方法、装置及终端 |
CN105810189A (zh) * | 2016-03-22 | 2016-07-27 | 北京京东尚科信息技术有限公司 | 设备的语音控制方法、装置及系统 |
CN106782591A (zh) * | 2016-12-26 | 2017-05-31 | 惠州Tcl移动通信有限公司 | 一种在背景噪音下提高语音识别率的装置及其方法 |
Non-Patent Citations (2)
Title |
---|
Sensor health monitoring using simple data driven approaches;Vipin Mathew;《2016 Indian Control Conference (ICC)》;20160328;32-38 * |
基于Linux的工业机器人状态检测系统研究;李少游;《中国优秀硕士学位论文全文数据库信息科技辑》;20180228;I140-731 * |
Also Published As
Publication number | Publication date |
---|---|
CN110534110A (zh) | 2019-12-03 |
US20190361664A1 (en) | 2019-11-28 |
US10747494B2 (en) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107910013B (zh) | 一种语音信号的输出处理方法及装置 | |
CN110534110B (zh) | 一种机器人及提高其语音交互识别率的方法、装置和电路 | |
US20140257813A1 (en) | Microphone circuit assembly and system with speech recognition | |
CN108681440A (zh) | 一种智能设备音量控制方法及系统 | |
CN108461081B (zh) | 语音控制的方法、装置、设备和存储介质 | |
US10755728B1 (en) | Multichannel noise cancellation using frequency domain spectrum masking | |
KR101158717B1 (ko) | 반향 음향 신호를 코딩하는 방법 | |
KR20170044689A (ko) | 음성 웨이크 업 방법 및 장치 | |
CN108682428A (zh) | 机器人语音控制系统和机器人对语音信号的处理方法 | |
CN105427866A (zh) | 一种语音处理方法、装置及拾音电路 | |
CN112202956A (zh) | 终端设备及其音频采集方法 | |
CN112312258B (zh) | 一种具有听力防护及听力补偿的智能耳机 | |
TWI581255B (zh) | 前端音頻處理系統 | |
CN108074581B (zh) | 用于人机交互智能终端的控制系统 | |
CN108053834B (zh) | 音频数据处理方法、装置、终端及系统 | |
CN106887228B (zh) | 机器人的语音控制方法、装置及机器人 | |
CN103117083A (zh) | 一种音频信息采集装置及方法 | |
US20070064960A1 (en) | Apparatus to convert analog signal of array microphone into digital signal and computer system including the same | |
CN105261363A (zh) | 一种语音识别的方法、装置及终端 | |
CN112562712A (zh) | 一种录音数据处理方法、系统、电子设备及存储介质 | |
CN108899041B (zh) | 语音信号加噪方法、装置及存储介质 | |
CN106210290A (zh) | 一种语音通信方法及移动终端 | |
CN206283664U (zh) | 一种用于智能机器人系统的多功能语音卡 | |
CN110808064B (zh) | 一种音频处理方法及装置 | |
CN209168731U (zh) | 机器人语音控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |