CN104517606A - 语音识别测试方法及装置 - Google Patents
语音识别测试方法及装置 Download PDFInfo
- Publication number
- CN104517606A CN104517606A CN201310465675.9A CN201310465675A CN104517606A CN 104517606 A CN104517606 A CN 104517606A CN 201310465675 A CN201310465675 A CN 201310465675A CN 104517606 A CN104517606 A CN 104517606A
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- speech
- file
- time point
- speech samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000009434 installation Methods 0.000 claims description 63
- 238000010998 test method Methods 0.000 claims description 22
- 230000002123 temporal effect Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 2
- 238000004904 shortening Methods 0.000 abstract 1
- 230000004044 response Effects 0.000 description 15
- 239000000284 extract Substances 0.000 description 8
- 230000009467 reduction Effects 0.000 description 5
- 238000011179 visual inspection Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音识别测试方法及装置,属于计算机领域。所述方法包括:获取本地预先存储的语音样本文件;根据所述语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;接收所述语音识别服务器返回的识别结果;根据所述识别结果获得语音识别测试结果。本发明通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,并根据识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
Description
技术领域
本发明涉及计算机领域,特别涉及一种语音识别测试方法及装置。
背景技术
随着语音识别技术的不断发展,语音识别服务也逐渐走进人们的日常生活。在一款语音识别系统正式投入应用之前,测试人员通常需要对该语音识别系统的各项指标进行测试。
以对语音识别系统的识别准确性进行测试为例,现有的语音识别测试方法,主要通过人工进行测试。具体的,测试人员在终端中打开语音识别客户端,并对着终端的语音采集单元说话以输入待测试的语音样本,语音识别客户端将语音采集单元采集到的语音样本转换为指定格式的文件发送给语音识别服务器;终端接收语音识别服务器对该语音样本进行识别后返回的识别结果并显示在终端的显示屏中,测试人员通过肉眼观察显示屏中显示的识别结果来判断语音识别系统的识别准确性。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
对语音识别系统进行测试时,通常需要测试多个不同的语音样本,并且对相同的语音样本也需要反复进行多次测试,这就需要测试人员多次人工输入语音样本,操作步骤繁琐、测试周期长且人工成本高。
发明内容
为了解决现有技术中需要测试人员多次人工输入语音样本,操作步骤繁琐、测试周期长且人工成本高的问题,本发明实施例提供了一种语音识别测试方法及装置。所述技术方案如下:
一方面,提供了一种语音识别测试方法,所述方法包括:
获取本地预先存储的语音样本文件;
根据所述语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
接收所述语音识别服务器返回的识别结果;
根据所述识别结果获得语音识别测试结果。
另一方面,提供了一种语音识别测试装置,所述装置包括:
文件获取模块,用于获取本地预先存储的语音样本文件;
请求发送模块,用于根据所述文件获取模块获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
识别结果接收模块,用于接收所述语音识别服务器返回的识别结果;
测试结果获得模块,用于根据所述识别结果获得语音识别测试结果。
本发明实施例提供的技术方案带来的有益效果是:
通过根据预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的语音识别测试方法的方法流程图;
图2是本发明实施例二提供的语音识别测试方法的方法流程图;
图3是本发明实施例三提供的语音识别测试装置的装置结构图;
图4是本发明实施例四提供的语音识别测试装置的装置结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
请参见图1,其示出了本发明实施例一提供的语音识别测试方法的方法流程图。该语音识别测试方法可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。该语音识别测试方法可以包括:
步骤102,获取本地预先存储的语音样本文件;
步骤104,根据该语音样本文件向语音识别服务器发送语音识别请求,该语音识别请求用于指示语音识别服务器对该语音样本文件对应的语音进行识别;
步骤106,接收语音识别服务器返回的识别结果;
步骤108,根据该识别结果获得语音识别测试结果。
其中,该语音识别服务器可以是社交应用中的语音识别服务器。
综上所述,本发明实施例提供的语音识别测试方法,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以从本地获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
实施例二
为了对上述实施例一提供的语音识别测试方法做进一步的描述,请参见图2,其示出了本发明实施例二提供的语音识别测试方法的方法流程图。该语音识别测试方法可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。以对一语音识别系统的响应时间和识别准确性进行检测为例,该语音识别测试方法可以包括:
步骤202,语音识别测试装置获取本地预先存储的语音样本文件;
在获取语音样本文件之前,语音识别测试装置首先通过语音采集单元采集输入的语音,根据采集到的语音生成该语音样本文件,并本地存储生成的该语音样本文件。当语音识别测试装置需要对语音识别系统进行多次内容相同的测试时,可以直接从本地提取该语音样本文件进行测试,无需测试人员人工反复输入语音样本。
进一步的,在生成该语音样本文件后,语音识别测试装置还可以接收输入的,用于表征该语音的内容的文本,并将接收到的该文本与该语音样本文件对应存储,以便后续根据该文本检测语音识别系统的识别准确性。
其中,将接收到的文本与语音样本文件对应存储时,可以将接收到的文本与语音样本文件分别进行存储,并建立两者之间的映射关系;或者,也可以将接收到的文本与语音样本文件一并存储,比如,将接收到的文本存储为语音样本文件的文件名。
具体的,以将接收到的文本存储为语音样本文件的文件名为例,测试人员向语音识别测试装置或者包含有语音识别测试装置的设备输入待测试的语音,比如,测试人员可以对着语音采集单元,比如麦克风,人工输入语音“查询明天的天气”,语音采集单元采集到该语音后,根据采集到的语音生成MP3(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)文件“未命名.MP3”,测试人员在语音识别测试装置或者包含有语音识别测试装置的设备中选择修改文件名后,输入文本“查询明天的天气”,语音识别测试装置接收到该文本后,将该MP3文件名修改为“查询明天的天气.MP3”并存储在本地。需要说明的是,本发明实施例提供的方法仅以MP3格式为例加以说明,实际应用中,语音识别测试装置还可以根据语音采集单元采集到的语音生成其它格式的音频文件,比如WMA(Windows Media Audio,视窗操作系统媒体音频)文件,对此,本发明实施例不做具体限定。
步骤204,语音识别测试装置根据该语音样本文件向语音识别服务器发送语音识别请求;
其中,该语音识别服务器可以是社交应用中的语音识别服务器,该语音识别请求用于指示语音识别系统中的语音识别服务器对该语音样本文件对应的语音进行识别。语音识别测试装置可以通过接口模拟拼装该语音识别请求并发送给语音识别服务器。
此外,语音识别测试装置存储的语音样本文件的格式与语音识别服务器能够识别的文件格式可能不一致,因此,语音识别测试装置在根据该语音样本文件向语音识别服务器发送语音识别请求时,若该语音样本文件的格式为指定格式,则向该语音识别服务器发送包含有该语音样本文件的该语音识别请求,若该语音样本文件的格式为非指定格式,则将该语音样本文件的格式转换为指定格式,获得新的语音样本文件,并向该语音识别服务器发送包含有该新的语音样本文件的该语音识别请求。其中,该指定格式为语音识别服务器能够识别的文件的格式。
具体的,若语音识别服务器能够识别的文件的格式为speex格式,语音识别测试装置获取文件名为“查询明天的天气.MP3”的语音样本文件之后,将该语音样本文件的格式转换为speex格式,获得新的语音样本文件,将该新的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
或者,语音识别测试装置在存储语音样本文件时,也可以直接将语音样本文件存储为speex格式。语音识别测试装置获取语音样本文件后,可以直接将获取到的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
步骤206,语音识别测试装置接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果;
语音识别测试装置可以获取预先与该语音样本文件对应存储的文本,检测该识别结果与该文本是否匹配,获得检测结果,并将该检测结果获取为该语音识别测试结果。
具体比如,语音识别测试装置获取本地存储的文件名为“查询明天的天气.MP3”的语音样本文件时,还可以提取出该文件名中去除后缀的文本“查询明天的天气”。语音识别测试装置接收语音识别服务器返回的识别结果后,提取识别结果中携带的文本,并将从识别结果中提取出的文本与“查询明天的天气”相比对,若两者一致,则确定本次测试结果为语音识别准确,若两者不一致,则确定本次测试结果为语音识别不准确。
步骤208,语音识别测试装置采集第一时间点和第二时间点,并将该第一时间点和该第二时间点之间的差值添加入该语音识别测试结果。
其中,该第一时间点为向该语音识别服务器发送该语音识别请求的时间点,该第二时间点为该语音识别服务器返回该识别结果的时间点。
进一步的,语音识别测试装置采集第一时间点和第二时间点时,可以获取该语音识别请求对应的数据包的包头以及该识别结果对应的数据包的包头,该语音识别请求对应的数据包的包头以及该识别结果对应的数据包的包头中分别携带有时间信息;语音识别测试装置根据该语音识别请求对应的数据包的包头中携带的时间信息获取该第一时间点,并根据该识别结果对应的数据包的包头中携带有时间信息获取该第二时间点。
本发明实施例提供的方法,除了可以用于测试语音识别系统的识别准确性之外,还可以测试语音识别系统的响应时间,该响应时间具体可以表征为语音识别测试装置发送语音识别请求与语音识别服务器返回识别结果之间的时间间隔。
具体的,语音识别测试装置可以获取语音识别请求对应的数据包的包头,该语音识别请求对应的数据包的包头中包含有语音识别请求的生成时间点,语音识别测试装置将该语音识别请求的生成时间点获取为第一时间点;语音识别测试装置还可以获取语音识别服务器返回的识别结果对应的数据包的包头,该识别结果对应的数据包的包头中包含有该识别结果的生成时间点,语音识别测试装置将该识别结果的生成时间点获取为第二时间点;语音识别测试装置将第一时间点和第二时间点之间的差值作为语音识别系统的响应时间。
或者,语音识别测试装置也可以直接记录发送语音识别请求的时间点为第一时间点,并记录接收到识别结果的时间点为第二时间点,将第一时间点和第二时间点之间的差值作为语音识别系统的响应时间。
以对某款社交应用软件“QX桌面”中的XX语音识别服务的识别准确性和响应时间进行测试为例,测试人员小王预先通过运行有“QX桌面”的智能手机上的麦克风输入三个待测试的语音样本,各个语音样本的内容各不相同,智能手机将采集到的语音样本以MP3格式存储在本地,同时,小王还在智能手机中将各个MP3文件命名为各自对应的语音内容。当进行语音识别测试时,小王在智能手机的测试界面中选择三个MP3文件中的一个或者多个,并发出开始测试的指令。智能手机从本地提取小王选择的MP3文件,将提取的MP3文件转换为speex文件后发送给XX语音识别服务对应的语音识别服务器,并接收该语音识别服务器返回的识别结果,同时,智能手机还记录向语音识别服务器发送该speex文件的第一时间点以及接收到语音识别服务器返回数据包的第二时间点。智能手机将接收到的识别结果与小王选择的MP3文件的文件名进行匹配,并输出匹配结果;同时,智能手机还将第一时间点和第二时间点之间的时间间隔输出为语音识别服务的响应时间。此外,小王还可以在测试界面中设置测试次数,智能手机根据该测试次数对、选择的MP3文件进行反复测试。
通过本发明实施例提供的方法,当需要对同一语音样本进行多次重复测试时,无需测试人员对相同的语音样本反复进行人工输入,只需要预先在本地存储一个语音样本文件,测试时重复提取同一语音样本文件进行测试,能够简化操作步骤、缩短测试周期并且降低人工成本。本发明实施例提供的方法还可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本。
另外,现有技术中的语音识别测试方法,当人工输入内容相同的语音样本时,可能会因为测试人员的语速以及口音的变化而导致两次输入的语音样本存在一定的差异,影响测试准确性。而本发明实施例提供的语音识别测试方法,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,不存在两次测试的语音样本不一致的情形,相对于现有技术能够提高测试的准确性。
综上所述,本发明实施例提供的语音识别测试方法,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的;此外,本发明实施例提供的语音识别测试方法,可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本;最后,本发明实施例提供的语音识别测试方法,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,解决了现有技术中两次测试的语音样本不一致的情形,达到提高测试的准确性的目的。
实施例三
请参见图3,其示出了本发明实施例三提供的语音识别测试装置的装置结构图。该语音识别测试装置可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。该语音识别测试装置可以包括:
文件获取模块301,用于获取本地预先存储的语音样本文件;
请求发送模块302,用于根据所述文件获取模块301获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
识别结果接收模块303,用于接收所述语音识别服务器返回的识别结果;
测试结果获得模块304,用于根据所述识别结果获得语音识别测试结果。
综上所述,本发明实施例提供的语音识别测试装置,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的。
实施例四
为了对上述实施例三提供的语音识别测试装置做进一步的描述,请参见图4,其示出了本发明实施例四提供的语音识别测试装置的装置结构图。该语音识别测试装置可以用于对语音识别系统进行测试,该语音识别系统可以是社交应用中的语音识别系统。以对一语音识别系统的响应时间和识别准确性进行检测为例,该语音识别测试装置可以包括:
文件获取模块401,用于获取本地预先存储的语音样本文件;
请求发送模块402,用于根据所述文件获取模块401获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
所述语音识别服务器可以为社交应用中的语音识别服务器。
其中,请求发送模块402可以通过接口模拟拼装该语音识别请求并发送给语音识别服务器。
识别结果接收模块403,用于接收所述语音识别服务器返回的识别结果;
测试结果获得模块404,用于根据所述识别结果获得语音识别测试结果。
此外,所述装置还包括:
语音采集模块405,用于在所述文件获取模块401获取预先存储的语音样本文件之前,通过语音采集单元采集输入的所述语音;
文件生成模块406,用于根据所述语音采集模块405采集到的所述语音生成所述语音样本文件;
文件存储模块407,用于本地存储所述文件生成模块406生成的所述语音样本文件。
在文件获取模块401获取语音样本文件之前,语音采集模块405首先通过语音采集单元采集输入的语音,文件生成模块406根据采集到的语音生成该语音样本文件,文件存储模块407本地存储生成的该语音样本文件。当语音识别测试装置需要对语音识别系统进行多次内容相同的测试时,文件获取模块401可以直接提取该语音样本文件进行测试,无需测试人员人工反复输入语音样本。
所述请求发送模块402,包括:
第一发送子模块402a,用于若所述语音样本文件的格式为指定格式,则向所述语音识别服务器发送包含有所述语音样本文件的所述语音识别请求;
格式转换子模块402b,用于若所述语音样本文件的格式为非指定格式,则将所述语音样本文件的格式转换为指定格式,获得新的语音样本文件;
第二发送子模块402c,用于向所述语音识别服务器发送包含有所述新的语音样本文件的所述语音识别请求。
语音识别测试装置存储的语音样本文件的格式与语音识别服务器能够识别的文件格式可能不一致,因此,请求发送模块402在根据该语音样本文件向语音识别服务器发送语音识别请求时,若该语音样本文件的格式为指定格式,则向该语音识别服务器发送包含有该语音样本文件的该语音识别请求,若该语音样本文件的格式为非指定格式,则将该语音样本文件的格式转换为指定格式,获得新的语音样本文件,并向该语音识别服务器发送包含有该新的语音样本文件的该语音识别请求。其中,该指定格式为语音识别服务器能够识别的文件的格式。
具体的,若语音识别服务器能够识别的文件的格式为speex格式,语音识别测试装置获取文件名为“查询明天的天气.MP3”的语音样本文件之后,将该语音样本文件的格式转换为speex格式,获得新的语音样本文件,将该新的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
或者,语音识别测试装置在存储语音样本文件时,也可以直接将语音样本文件存储为speex格式。语音识别测试装置获取语音样本文件后,可以直接将获取到的语音样本文件添加在语音识别请求中并发送给语音识别服务器。
所述测试结果获得模块404,包括:
文本获取子模块404a,用于获取预先与所述语音样本文件对应存储的文本,所述文本用于表征所述语音的内容;
检测子模块404b,用于检测所述识别结果与所述文本获取子模块获取到的文本是否匹配,获得检测结果;
测试结果获取子模块404c,用于将所述检测结果获取为所述语音识别测试结果。
所述装置还包括:
文本接收模块408,用于在所述文本获取子模块404a获取预先存储的语音样本文件之前,接收输入的所述文本;
文本存储模块409,用于将所述文本接收模块408接收到的所述文本与所述语音样本文件对应存储。
进一步的,文本接收模块408还可以接收输入的,用于表征该语音的内容的文本,文本存储模块409将接收到的该文本与该语音样本文件对应存储,以便后续根据该文本检测语音识别系统的识别准确性。
其中,将接收到的文本与语音样本文件对应存储时,可以将接收到的文本与语音样本文件分别进行存储,并建立两者之间的映射关系;或者,也可以将接收到的文本与语音样本文件一并存储,比如,将接收到的文本存储为语音样本文件的文件名。
具体的,以将接收到的文本存储为语音样本文件的文件名为例,测试人员向语音识别测试装置或者包含有语音识别测试装置的设备输入待测试的语音,比如,测试人员可以对着语音采集单元,比如麦克风,人工输入语音“查询明天的天气”,语音采集单元采集到该语音后,根据采集到的语音生成MP3文件“未命名.MP3”,测试人员在语音识别测试装置或者包含有语音识别测试装置的设备中选择修改文件名后,输入文本“查询明天的天气”,语音识别测试装置接收到该文本后,将该MP3文件名修改为“查询明天的天气.MP3”并存储在本地。需要说明的是,本发明实施例提供的方法仅以MP3格式为例加以说明,实际应用中,语音识别测试装置还可以根据语音采集单元采集到的语音生成其它格式的音频文件,比如WMA文件,对此,本发明实施例不做具体限定。
语音识别测试装置获取文件名为“查询明天的天气.MP3”的语音样本文件时,还可以提取出该文件名中去除后缀的文本“查询明天的天气”。语音识别测试装置接收语音识别服务器返回的识别结果后,提取识别结果中携带的文本,并将从识别结果中提取出的文本与“查询明天的天气”相比对,若两者一致,则确定本次测试结果为语音识别准确,若两者不一致,则确定本次测试结果为语音识别不准确。
所述装置还包括:
时间点采集模块410,用于采集第一时间点和第二时间点,所述第一时间点为向所述语音识别服务器发送所述语音识别请求的时间点,所述第二时间点为所述语音识别服务器返回所述识别结果的时间点;
测试结果添加模块411,用于将所述第一时间点和所述第二时间点之间的差值添加入所述语音识别测试结果。
所述时间点采集模块410,包括:
包头获取子模块410a,用于获取所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头,所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头中分别携带有时间信息;
第一获取子模块410b,用于根据所述语音识别请求对应的数据包的包头中携带的时间信息获取所述第一时间点;
第二获取子模块410c,用于根据所述识别结果对应的数据包的包头中携带有时间信息获取所述第二时间点。
本发明实施例提供的装置,除了可以用于测试语音识别系统的识别准确性之外,还可以测试语音识别系统的响应时间,该响应时间具体可以表征为语音识别测试装置发送语音识别请求与语音识别服务器返回识别结果之间的时间间隔。
具体的,包头获取子模块410a可以获取语音识别请求对应的数据包的包头,该语音识别请求对应的数据包的包头中包含有语音识别请求的生成时间点,第一获取子模块410b将该语音识别请求的生成时间点获取为第一时间点;包头获取子模块410a还可以获取语音识别服务器返回的识别结果对应的数据包的包头,该识别结果对应的数据包的包头中包含有该识别结果的生成时间点,第二获取子模块410c将该识别结果的生成时间点获取为第二时间点;测试结果添加模块411将第一时间点和第二时间点之间的差值作为语音识别系统的响应时间。
通过本发明实施例提供的装置,当需要对同一语音样本进行多次重复测试时,无需测试人员对相同的语音样本反复进行人工输入,只需要在本地预先存储一个语音样本文件,测试时重复提取同一语音样本文件进行测试,能够简化操作步骤、缩短测试周期并且降低人工成本。本发明实施例提供的装置还可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本。
另外,在现有技术中,当人工输入内容相同的语音样本时,可能会因为测试人员的语速以及口音的变化而导致两次输入的语音样本存在一定的差异,影响测试准确性。而本发明实施例提供的语音识别测试装置,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,不存在两次测试的语音样本不一致的情形,相对于现有技术能够提高测试的准确性。
综上所述,本发明实施例提供的语音识别测试装置,通过根据本地预先存储的语音样本文件向语音识别服务器发送语音识别请求,接收语音识别服务器返回的识别结果,并根据该识别结果获得语音识别测试结果,对相同语音样本进行反复测试时可以获取同一语音样本文件,解决了现有技术中需要测试人员多次人工输入语音样本的问题,达到简化操作步骤、缩短测试周期且降低人工成本的目的;此外,本发明实施例提供的语音识别测试装置,可以自动测试语音识别系统的识别准确性和响应时间,无需测试人员通过肉眼观察识别结果来判断识别准确性,进一步简化操作步骤、缩短测试周期并且降低人工成本;最后,本发明实施例提供的语音识别测试装置,对相同内容的语音样本进行重复测试时,每次都提取同一语音样本文件,解决了现有技术中两次测试的语音样本不一致的情形,达到提高测试的准确性的目的。
需要说明的是:上述实施例提供的语音识别测试装置在对语音识别系统进行测试时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音识别测试装置与语音识别测试方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种语音识别测试方法,其特征在于,所述方法包括:
获取本地预先存储的语音样本文件;
根据所述语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
接收所述语音识别服务器返回的识别结果;
根据所述识别结果获得语音识别测试结果。
2.根据权利要求1所述的方法,其特征在于,所述获取本地预先存储的语音样本文件之前,所述方法还包括:
通过语音采集单元采集输入的所述语音;
根据采集到的所述语音生成所述语音样本文件;
本地存储生成的所述语音样本文件。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述语音样本文件向语音识别服务器发送语音识别请求,包括:
若所述语音样本文件的格式为指定格式,则向所述语音识别服务器发送包含有所述语音样本文件的所述语音识别请求;
若所述语音样本文件的格式为非指定格式,则将所述语音样本文件的格式转换为指定格式,获得新的语音样本文件,并向所述语音识别服务器发送包含有所述新的语音样本文件的所述语音识别请求。
4.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果获得语音识别测试结果,包括:
获取预先与所述语音样本文件对应存储的文本,所述文本用于表征所述语音的内容;
检测所述识别结果与所述文本是否匹配,获得检测结果;
将所述检测结果获取为所述语音识别测试结果。
5.根据权利要求4所述的方法,其特征在于,所述获取预先存储的语音样本文件之前,所述方法还包括:
接收输入的所述文本;
将接收到的所述文本与所述语音样本文件对应存储。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采集第一时间点和第二时间点,所述第一时间点为向所述语音识别服务器发送所述语音识别请求的时间点,所述第二时间点为所述语音识别服务器返回所述识别结果的时间点;
将所述第一时间点和所述第二时间点之间的差值添加入所述语音识别测试结果。
7.根据权利要求6所述的方法,其特征在于,所述采集第一时间点和第二时间点,包括:
获取所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头,所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头中分别携带有时间信息;
根据所述语音识别请求对应的数据包的包头中携带的时间信息获取所述第一时间点;
根据所述识别结果对应的数据包的包头中携带有时间信息获取所述第二时间点。
8.根据权利要求1所述的方法,其特征在于,所述语音识别服务器为社交应用中的语音识别服务器。
9.一种语音识别测试装置,其特征在于,所述装置包括:
文件获取模块,用于获取本地预先存储的语音样本文件;
请求发送模块,用于根据所述文件获取模块获取到的语音样本文件向语音识别服务器发送语音识别请求,所述语音识别请求用于指示所述语音识别服务器对所述语音样本文件对应的语音进行识别;
识别结果接收模块,用于接收所述语音识别服务器返回的识别结果;
测试结果获得模块,用于根据所述识别结果获得语音识别测试结果。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
语音采集模块,用于在所述文件获取模块获取预先存储的语音样本文件之前,通过语音采集单元采集输入的所述语音;
文件生成模块,用于根据所述语音采集模块采集到的所述语音生成所述语音样本文件;
文件存储模块,用于本地存储所述文件生成模块生成的所述语音样本文件。
11.根据权利要求9或10所述的装置,其特征在于,所述请求发送模块,包括:
第一发送子模块,用于若所述语音样本文件的格式为指定格式,则向所述语音识别服务器发送包含有所述语音样本文件的所述语音识别请求;
格式转换子模块,用于若所述语音样本文件的格式为非指定格式,则将所述语音样本文件的格式转换为指定格式,获得新的语音样本文件;
第二发送子模块,用于向所述语音识别服务器发送包含有所述新的语音样本文件的所述语音识别请求。
12.根据权利要求9所述的装置,其特征在于,所述测试结果获得模块,包括:
文本获取子模块,用于获取预先与所述语音样本文件对应存储的文本,所述文本用于表征所述语音的内容;
检测子模块,用于检测所述识别结果与所述文本获取子模块获取到的文本是否匹配,获得检测结果;
测试结果获取子模块,用于将所述检测结果获取为所述语音识别测试结果。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
文本接收模块,用于在所述文本获取子模块获取预先存储的语音样本文件之前,接收输入的所述文本;
文本存储模块,用于将所述文本接收模块接收到的所述文本与所述语音样本文件对应存储。
14.根据权利要求9所述的装置,其特征在于,所述装置还包括:
时间点采集模块,用于采集第一时间点和第二时间点,所述第一时间点为向所述语音识别服务器发送所述语音识别请求的时间点,所述第二时间点为所述语音识别服务器返回所述识别结果的时间点;
测试结果添加模块,用于将所述第一时间点和所述第二时间点之间的差值添加入所述语音识别测试结果。
15.根据权利要求14所述的装置,其特征在于,所述时间点采集模块,包括:
包头获取子模块,用于获取所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头,所述语音识别请求对应的数据包的包头以及所述识别结果对应的数据包的包头中分别携带有时间信息;
第一获取子模块,用于根据所述语音识别请求对应的数据包的包头中携带的时间信息获取所述第一时间点;
第二获取子模块,用于根据所述识别结果对应的数据包的包头中携带有时间信息获取所述第二时间点。
16.根据权利要求9所述的装置,其特征在于,所述语音识别服务器为社交应用中的语音识别服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310465675.9A CN104517606A (zh) | 2013-09-30 | 2013-09-30 | 语音识别测试方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310465675.9A CN104517606A (zh) | 2013-09-30 | 2013-09-30 | 语音识别测试方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104517606A true CN104517606A (zh) | 2015-04-15 |
Family
ID=52792812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310465675.9A Pending CN104517606A (zh) | 2013-09-30 | 2013-09-30 | 语音识别测试方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104517606A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105702257A (zh) * | 2015-08-12 | 2016-06-22 | 乐视致新电子科技(天津)有限公司 | 语音处理方法与装置 |
CN106559729A (zh) * | 2015-09-25 | 2017-04-05 | 神讯电脑(昆山)有限公司 | Mic语音自动识别测试系统及方法 |
CN107221341A (zh) * | 2017-06-06 | 2017-09-29 | 北京云知声信息技术有限公司 | 一种语音测试方法及装置 |
CN107221319A (zh) * | 2017-05-16 | 2017-09-29 | 厦门盈趣科技股份有限公司 | 一种语音识别测试系统和方法 |
CN108228468A (zh) * | 2018-02-12 | 2018-06-29 | 腾讯科技(深圳)有限公司 | 一种测试方法、装置、测试设备及存储介质 |
CN109119065A (zh) * | 2018-09-10 | 2019-01-01 | 四川长虹电器股份有限公司 | 用于智能语音产品的服务智商测试评分系统及方法 |
CN109147778A (zh) * | 2018-07-24 | 2019-01-04 | 上海庆科信息技术有限公司 | 一种智能插座语音测试的方法、装置及系统 |
CN109300339A (zh) * | 2018-11-19 | 2019-02-01 | 王泓懿 | 一种英语口语的练习方法及系统 |
CN110335590A (zh) * | 2019-07-04 | 2019-10-15 | 中国联合网络通信集团有限公司 | 语音识别测试方法、装置及系统 |
CN110728975A (zh) * | 2019-10-10 | 2020-01-24 | 南京创维信息技术研究院有限公司 | 一种asr识别率自动化测试的系统及方法 |
CN111210817A (zh) * | 2019-12-30 | 2020-05-29 | 深圳市优必选科技股份有限公司 | 数据处理方法及装置 |
CN111785268A (zh) * | 2020-06-30 | 2020-10-16 | 北京声智科技有限公司 | 语音交互响应速度的测试方法、装置及电子设备 |
CN111986706A (zh) * | 2020-07-31 | 2020-11-24 | 广州市凯泽利科技有限公司 | 一种基于音频分析的语音响应时间测试方法 |
CN113436610A (zh) * | 2020-03-23 | 2021-09-24 | 阿里巴巴集团控股有限公司 | 测试方法、装置及系统 |
CN114726763A (zh) * | 2021-01-04 | 2022-07-08 | 中国移动通信有限公司研究院 | Dpi系统的业务识别能力的检测方法及系统 |
CN115171657A (zh) * | 2022-05-26 | 2022-10-11 | 青岛海尔科技有限公司 | 语音设备的测试方法和装置、存储介质 |
CN115188368A (zh) * | 2022-06-30 | 2022-10-14 | 北京百度网讯科技有限公司 | 语音测试方法、装置、电子设备及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5715369A (en) * | 1995-11-27 | 1998-02-03 | Microsoft Corporation | Single processor programmable speech recognition test system |
US6622121B1 (en) * | 1999-08-20 | 2003-09-16 | International Business Machines Corporation | Testing speech recognition systems using test data generated by text-to-speech conversion |
CN1476714A (zh) * | 2000-12-08 | 2004-02-18 | �ʼҷ����ֵ�������˾ | 用于互联网接入的分布式语音识别 |
CN1567431A (zh) * | 2003-07-10 | 2005-01-19 | 上海优浪信息科技有限公司 | 一种说话者身份识别方法和系统 |
CN1746973A (zh) * | 2004-09-06 | 2006-03-15 | 三星电子株式会社 | 分布式语音识别系统和方法 |
CN1953054A (zh) * | 2005-10-21 | 2007-04-25 | 华为技术有限公司 | 一种实现语音识别功能的方法 |
CN101286317A (zh) * | 2008-05-30 | 2008-10-15 | 同济大学 | 语音识别装置、模型训练方法、及交通信息服务平台 |
US20090157399A1 (en) * | 2007-12-18 | 2009-06-18 | Electronics And Telecommunications Research Institute | Apparatus and method for evaluating performance of speech recognition |
CN101923856A (zh) * | 2009-06-12 | 2010-12-22 | 华为技术有限公司 | 语音识别训练处理、控制方法及装置 |
CN102427465A (zh) * | 2011-08-18 | 2012-04-25 | 青岛海信电器股份有限公司 | 语音服务代理方法及装置、通过代理集成语音应用的系统 |
CN102571833A (zh) * | 2010-12-15 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 基于服务器集群的分布式语音识别系统及方法 |
CN102723080A (zh) * | 2012-06-25 | 2012-10-10 | 惠州市德赛西威汽车电子有限公司 | 一种语音识别测试系统及方法 |
CN103187059A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 基于车载应用的语音处理系统 |
CN103218295A (zh) * | 2013-04-17 | 2013-07-24 | 广东电网公司电力科学研究院 | Esb消息处理能力的测试方法和系统 |
CN103714816A (zh) * | 2012-09-28 | 2014-04-09 | 三星电子株式会社 | 电子装置、服务器及其控制方法 |
-
2013
- 2013-09-30 CN CN201310465675.9A patent/CN104517606A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5715369A (en) * | 1995-11-27 | 1998-02-03 | Microsoft Corporation | Single processor programmable speech recognition test system |
US6622121B1 (en) * | 1999-08-20 | 2003-09-16 | International Business Machines Corporation | Testing speech recognition systems using test data generated by text-to-speech conversion |
CN1476714A (zh) * | 2000-12-08 | 2004-02-18 | �ʼҷ����ֵ�������˾ | 用于互联网接入的分布式语音识别 |
CN1567431A (zh) * | 2003-07-10 | 2005-01-19 | 上海优浪信息科技有限公司 | 一种说话者身份识别方法和系统 |
CN1746973A (zh) * | 2004-09-06 | 2006-03-15 | 三星电子株式会社 | 分布式语音识别系统和方法 |
CN1953054A (zh) * | 2005-10-21 | 2007-04-25 | 华为技术有限公司 | 一种实现语音识别功能的方法 |
US20090157399A1 (en) * | 2007-12-18 | 2009-06-18 | Electronics And Telecommunications Research Institute | Apparatus and method for evaluating performance of speech recognition |
CN101286317A (zh) * | 2008-05-30 | 2008-10-15 | 同济大学 | 语音识别装置、模型训练方法、及交通信息服务平台 |
CN101923856A (zh) * | 2009-06-12 | 2010-12-22 | 华为技术有限公司 | 语音识别训练处理、控制方法及装置 |
CN102571833A (zh) * | 2010-12-15 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 基于服务器集群的分布式语音识别系统及方法 |
CN102427465A (zh) * | 2011-08-18 | 2012-04-25 | 青岛海信电器股份有限公司 | 语音服务代理方法及装置、通过代理集成语音应用的系统 |
CN103187059A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 基于车载应用的语音处理系统 |
CN102723080A (zh) * | 2012-06-25 | 2012-10-10 | 惠州市德赛西威汽车电子有限公司 | 一种语音识别测试系统及方法 |
CN103714816A (zh) * | 2012-09-28 | 2014-04-09 | 三星电子株式会社 | 电子装置、服务器及其控制方法 |
CN103218295A (zh) * | 2013-04-17 | 2013-07-24 | 广东电网公司电力科学研究院 | Esb消息处理能力的测试方法和系统 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105702257A (zh) * | 2015-08-12 | 2016-06-22 | 乐视致新电子科技(天津)有限公司 | 语音处理方法与装置 |
CN106559729A (zh) * | 2015-09-25 | 2017-04-05 | 神讯电脑(昆山)有限公司 | Mic语音自动识别测试系统及方法 |
CN107221319A (zh) * | 2017-05-16 | 2017-09-29 | 厦门盈趣科技股份有限公司 | 一种语音识别测试系统和方法 |
CN107221341A (zh) * | 2017-06-06 | 2017-09-29 | 北京云知声信息技术有限公司 | 一种语音测试方法及装置 |
CN108228468A (zh) * | 2018-02-12 | 2018-06-29 | 腾讯科技(深圳)有限公司 | 一种测试方法、装置、测试设备及存储介质 |
CN109147778A (zh) * | 2018-07-24 | 2019-01-04 | 上海庆科信息技术有限公司 | 一种智能插座语音测试的方法、装置及系统 |
CN109119065A (zh) * | 2018-09-10 | 2019-01-01 | 四川长虹电器股份有限公司 | 用于智能语音产品的服务智商测试评分系统及方法 |
CN109300339A (zh) * | 2018-11-19 | 2019-02-01 | 王泓懿 | 一种英语口语的练习方法及系统 |
CN110335590B (zh) * | 2019-07-04 | 2021-09-03 | 中国联合网络通信集团有限公司 | 语音识别测试方法、装置及系统 |
CN110335590A (zh) * | 2019-07-04 | 2019-10-15 | 中国联合网络通信集团有限公司 | 语音识别测试方法、装置及系统 |
CN110728975A (zh) * | 2019-10-10 | 2020-01-24 | 南京创维信息技术研究院有限公司 | 一种asr识别率自动化测试的系统及方法 |
CN111210817A (zh) * | 2019-12-30 | 2020-05-29 | 深圳市优必选科技股份有限公司 | 数据处理方法及装置 |
CN111210817B (zh) * | 2019-12-30 | 2023-06-13 | 深圳市优必选科技股份有限公司 | 数据处理方法及装置 |
CN113436610A (zh) * | 2020-03-23 | 2021-09-24 | 阿里巴巴集团控股有限公司 | 测试方法、装置及系统 |
CN113436610B (zh) * | 2020-03-23 | 2024-08-20 | 阿里巴巴集团控股有限公司 | 测试方法、装置及系统 |
CN111785268A (zh) * | 2020-06-30 | 2020-10-16 | 北京声智科技有限公司 | 语音交互响应速度的测试方法、装置及电子设备 |
CN111986706A (zh) * | 2020-07-31 | 2020-11-24 | 广州市凯泽利科技有限公司 | 一种基于音频分析的语音响应时间测试方法 |
CN114726763A (zh) * | 2021-01-04 | 2022-07-08 | 中国移动通信有限公司研究院 | Dpi系统的业务识别能力的检测方法及系统 |
CN114726763B (zh) * | 2021-01-04 | 2025-02-14 | 中国移动通信有限公司研究院 | Dpi系统的业务识别能力的检测方法及系统 |
CN115171657A (zh) * | 2022-05-26 | 2022-10-11 | 青岛海尔科技有限公司 | 语音设备的测试方法和装置、存储介质 |
CN115188368A (zh) * | 2022-06-30 | 2022-10-14 | 北京百度网讯科技有限公司 | 语音测试方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104517606A (zh) | 语音识别测试方法及装置 | |
US10803861B2 (en) | Method and apparatus for identifying information | |
CN108766418B (zh) | 语音端点识别方法、装置及设备 | |
CN103871419A (zh) | 一种信息处理方法及电子设备 | |
CN109326305B (zh) | 一种批量测试语音识别和文本合成的方法和测试系统 | |
CN103886860B (zh) | 一种信息处理方法和电子设备 | |
CN105183881B (zh) | 信息查询方法和装置 | |
CN102368384A (zh) | 一种语音模块测试方法及语音模块测试设备 | |
CN110019848A (zh) | 对话交互方法、装置及机器人 | |
CN110310127B (zh) | 录音获取方法、装置、计算机设备及存储介质 | |
EP4276827A1 (en) | Speech similarity determination method, device and program product | |
CN110096612A (zh) | 语音日志的在线音频分析数据的获取方法及系统 | |
CN110955709B (zh) | 一种数据的处理方法、装置及电子设备 | |
US9453863B2 (en) | Implementing frequency spectrum analysis using causality Hilbert Transform results of VNA-generated S-parameter model information | |
CN113223496A (zh) | 一种语音技能测试方法、装置及设备 | |
CN204989336U (zh) | 基于远程桌面的微波组件远程测控系统 | |
CN113593536A (zh) | 一种检测语音识别准确率的装置和系统 | |
CN116297883B (zh) | 一种基于敲击声的结构识别方法、装置、系统及终端设备 | |
US20170098449A1 (en) | Control device for recording system, and recording system | |
CN105791043B (zh) | 一种业务网络服务体验质量自动评价方法及系统 | |
CN107872352B (zh) | 一种网管系统的性能测试方法、装置及系统 | |
CN117074870A (zh) | 一种电缆诊断方法及系统 | |
CN205812273U (zh) | 一种音频输出设备的机震测试工装和系统 | |
CN114420304A (zh) | 一种基于深度学习的新型新冠辅助筛查方法及装置 | |
CN115695628A (zh) | 音频处理方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150415 |