CN106230689B - 一种语音信息交互的方法、装置及服务器 - Google Patents
一种语音信息交互的方法、装置及服务器 Download PDFInfo
- Publication number
- CN106230689B CN106230689B CN201610590228.XA CN201610590228A CN106230689B CN 106230689 B CN106230689 B CN 106230689B CN 201610590228 A CN201610590228 A CN 201610590228A CN 106230689 B CN106230689 B CN 106230689B
- Authority
- CN
- China
- Prior art keywords
- request information
- terminal
- voice
- information
- voice request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000004044 response Effects 0.000 claims abstract description 188
- 238000013475 authorization Methods 0.000 claims abstract description 12
- 230000005540 biological transmission Effects 0.000 claims abstract 6
- 238000004458 analytical method Methods 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 239000000945 filler Substances 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 210000001364 upper extremity Anatomy 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音信息交互的方法、装置及服务器,其包括接收已授权终端传送的携带有用户标签的语音请求信息;根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备。该语音信息交互的方法、装置及服务器通过引入与所述终端关联的关联设备,丰富了反馈服务内容,提高了用户体验。
Description
技术领域
本发明涉及电通信技术领域,更具体地,涉及一种语音信息交互的方法、装置及服务器。
背景技术
语音识别和自动应答已经广泛应用于多种电子设备,可以通过语音来触发设备的某种操作或服务,例如通过语音来获取旅游信息。但是,现有技术中的语音自动应答技术,响应用户的信息往往被限制在某一领域,不便于用户多元的需求,用户体验较差。
发明内容
鉴于上述问题,本发明提出了一种语音信息交互的方法、装置及服务器。
为实现该目的,本发明采用如下技术方案:
方案一:
提供一种语音信息交互的方法,包括:
接收已授权终端传送的携带有用户标签的语音请求信息;
根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;
若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
本发明中,所述接收已授权终端传送的携带有用户标签的语音请求信息之前包括:
接收终端的注册申请信息并授权。
本发明中,所述注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
本发明中,所述根据所述语音请求信息生成语义请求信息包括:
通过语音识别算法将语音请求信息转换成文字请求信息;
通过语音理解算法识别出所述文字请求信息的语义;
根据所述文字请求信息的语义生成语义请求信息。
本发明中,所述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
本发明中,所述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
本发明中,所述在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息包括:
根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
获取与所述语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
根据用户特征模型、上文对话信息从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息。
本发明中,所述将该第一应答信息反馈至所述终端包括:
根据第一应答信息合成第一应答语音信息;
将所述第一应答语音信息反馈至所述终端。
本发明中,所述预设时间为1秒。
本发明中,所述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
本发明中,所述预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
本发明中,所述按照预设规则将所述语音请求信息转发到与所述终端绑定的相应的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端包括:
根据语义请求信息判断语音请求信息的类型,并根据所述语音请求信息的类型将其转发与所述终端绑定的相应的关联设备;
接收所述关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
本发明中,当所述语音请求信息的类型为隐私型,则所述关联设备为预设的隐私式服务设备。
本发明中,当所述语音请求信息的类型为开放型,则所述关联设备为预设的开放式服务设备。
方案二:
提供一种语音信息交互的装置,包括:
接收模块,用于接收已授权终端传送的携带有用户标签的语音请求信息;
生成查找模块,用于根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;
第一应答模块,用于在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
第二应答模块,用于在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
本发明中,所述装置还包括:授权模块,用于在接收已授权终端传送的携带有用户标签的语音请求信息之前接收终端的注册申请信息并授权。
本发明中,所述注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
本发明中,所述生成查找模块包括:
文字单元,用于通过语音识别算法将语音请求信息转换成文字请求信息;
语义单元,用于通过语音理解算法识别出所述文字请求信息的语义;
生成单元,用于根据所述文字请求信息的语义生成语义请求信息。
本发明中,所述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
本发明中,所述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
本发明中,所述第一应答模块包括:
特征单元,用于根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
上下文单元,用于获取与所述语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
查询单元,用于根据用户特征模型、上文对话信息从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息。
本发明中,所述第一应答模块包括:
合成单元,用于根据第一应答信息合成第一应答语音信息;
第一反馈单元,用于将所述第一应答语音信息反馈至所述终端。
本发明中,所述预设时间为1秒。
本发明中,所述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
本发明中,所述预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
本发明中,所述第二应答模块包括:
判断单元,用于根据语义请求信息判断语音请求信息的类型,并根据所述语音请求信息的类型将其转发与所述终端绑定的相应的关联设备;
第二反馈单元,用于接收所述关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
本发明中,当所述语音请求信息的类型为隐私型,则所述关联设备为预设的隐私式服务设备。
本发明中,当所述语音请求信息的类型为开放型,则所述关联设备为预设的开放式服务设备。
方案三:
提供一种服务器,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:
接收已授权终端传送的携带有用户标签的语音请求信息;
根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;
若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
本发明中,所述接收已授权终端传送的携带有用户标签的语音请求信息之前包括:
接收终端的注册申请信息并授权。
本发明中,所述注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
本发明中,所述根据所述语音请求信息生成语义请求信息包括:
通过语音识别算法将语音请求信息转换成文字请求信息;
通过语音理解算法识别出所述文字请求信息的语义;
根据所述文字请求信息的语义生成语义请求信息。
本发明中,所述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
本发明中,所述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
本发明中,所述在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息包括:
根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
获取与所述语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
根据用户特征模型、上文对话信息从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息。
本发明中,所述将该第一应答信息反馈至所述终端包括:
根据第一应答信息合成第一应答语音信息;
将所述第一应答语音信息反馈至所述终端。
本发明中,所述预设时间为1秒。
本发明中,所述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
本发明中,所述预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
本发明中,所述按照预设规则将所述语音请求信息转发到与所述终端绑定的相应的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端包括:
根据语义请求信息判断语音请求信息的类型,并根据所述语音请求信息的类型将其转发与所述终端绑定的相应的关联设备;
接收所述关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
本发明中,当所述语音请求信息的类型为隐私型,则所述关联设备为预设的隐私式服务设备。
本发明中,当所述语音请求信息的类型为开放型,则所述关联设备为预设的开放式服务设备。
与现有技术相比,该发明一种语音信息交互的方法、装置及服务器具有如下有益效果:
该语音信息交互的方法、装置及服务器通过引入与所述终端关联的关联设备,拓宽了语音请求信息的反馈信息源头,丰富了反馈服务内容,在一定程度上解决了响应用户的信息往往被限制在某一领域的问题,提高了用户体验。
该语音信息交互的方法、装置及服务器通过将关联设备进行按分类,在更好的响应用户的多元需求的基础上更好的避免了用户隐私的泄露,在一定程度上了提高了交互的安全性。
该语音信息交互的方法、装置及服务器对语音请求信息予以语音反馈,在一定程度上提升了交互的趣味性,增强了用户粘性,促进了产业的发展。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一个实施例中语音信息交互的方法的应用场景图;
图2示出了本发明一个实施例中语音信息交互的方法的流程图示意图;
图3示出了本发明一个实施例中语音信息交互的装置的模块示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,在一些实施例中,提供了一种语音信息交互的方法,其应用于终端、服务于终端的服务器以及与终端关联的关联设备三者之间的语音信息交互系统,其中,终端可以为固定终端、手持终端、车载终端等;服务器可以为云端,也可以为单独的服务器,还可以为多个服务器构成的服务器集群;关联设备包括隐私式服务设备和开放式服务设备,隐私式服务设备优选为终端用户的好友或者家人使用的设备,其主要服务于用户的隐私性请求信息,譬如说终端用户发出的请求相关家庭成员的生日日期;开放式服务设备优选为公共服务设备,其主要服务于用户的开放性请求信息,譬如说终端用户发出的请求导航信息。
上述云端,又称云服务,其是硬件资源集约化然后进行分割出租,相比传统专用服务器而言它能够动态调配计算资源,在平台总容量可以接纳、应用软件可以根据硬件资源的变化进行相应的优化的情况下能够有效解决高峰时期的处理速度,图1所示的语音信息交互系统,该语音信息交互系统包括终端101、云端103、第一关联设备105以及第二关联设备107,其中,第一关联设备105为开放式服务设备;第二关联设备107为隐私式服务设备;终端101、第一关联设备105以及第二关联设备107分别和云端103连接。
在一些实施例中,考虑到隐私性请求信息的结果具有一定封闭性以及开放性请求信息的答案具有多样性,因此为了节省系统负担,同时为了能够更好的响应用户的请求信息,可以按照关联设备的类型将其预设分为隐私式服务设备或者开放式服务设备,例如当关联设备为手持移动终端,则将其预设为隐私式服务设备;当关联设备为导航地图服务器,则将其预设为开放式服务设备。
在一些实施例中,考虑到关联设备的类型与实际服务内容可能存在一定的差异,为了更好减少失误以更好的服务用户,还可以将关联设备按照其服务内容动态划分为隐私式服务设备或者开放式服务设备。
请参阅图2,在一些实施例中,提供了一种语音信息交互的方法,本实施例以该方法应用于语音信息交互系统来举例说明。该方法包括如下步骤:
步骤202:接收已授权终端传送的携带有用户标签的语音请求信息。
具体的,在接收已授权终端传送的携带有用户标签的语音请求信息之前包括:
接收终端的注册申请信息并授权。
其中,注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种,其中,终端设备编码是指用一个唯一的代码来定义企业生产的每一个产品,例如苹果某手机设备编码是为C8PN5FN2FMLD;国际移动设备识别码,又称电子系列号,其是每一台移动设备(例如移动电话、智能手机、平板电脑等)独有的参数;集成电路卡识别码是IC卡的唯一识别号码,其固化在手机SIM卡中。
在一些实施例中,若终端为手机,则上述接收终端的注册申请信息并授权包括如下步骤:
判断终端发送的信息类型;
当终端发送信息为注册申请信息时,解析注册申请信息获取账号和密码,并将所述账号和密码添加到授权管理数据库;
当终端发送信息为登录信息时,解析登录信息获取账号和密码,并查询该账号和密码是否与授权管理数据库中的预存的账号与密码相吻合,若是,则登录成功。
在一些实施例中,上述账号为用户的手机号码、邮箱或者第三方账号体系,其中,第三方账号体系相比于该语音信息交互系统的账号体系而言,适用于当用户还不是很了解时,这时用户可以在不注册一个新的账号的情况下通过这种方式进行体验,在一定程度上更加方便快捷,
上述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
在一些实施例中,在终端上可以将上述用户标签加载至用户的语音消息中进而生成语音请求信息。
步骤204:根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库。
具体的,上述根据所述语音请求信息生成语义请求信息包括:
通过语音识别算法将语音请求信息转换成文字请求信息;
通过语音理解算法识别出文字请求信息的语义;
根据文字请求信息的语义生成语义请求信息。
上述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种,其中,
N-Gram算法是基于这样的一个假设:即在字符串中第n个词的出现只与前面n-1个词相关,而与其他任何词都不相关,整个字符串出现的概率就是各个词出现的概率的乘积,其中,当N=1时称为unigram,N=2称为bigram,N=3称为trigram,以此类推。例如中文:“你今天休假了吗”,它的bigram依次为:你今,今天,天休,休假,假了,了吗。值得一提的是,当采用N-Gram算法将语音请求信息转换成文字请求信息时需要构建一个大词汇表,该大词汇表可以通过大量书面的文本语料训练得到;
关键词算法,又称为关键词检出就是在连续的、无限制的自然语音流中识别出一组给定的词——关键词。与连续语音识别相比,关键词识别策略可以忽略关键词以外的语音部分,如口头语、插入语以及咳嗽等口语现象,而不影响对语音关键部分的识别。根据吸收垃圾词所用的补白模型的不同,关键词识别算法主要分为三类:集外词补白模型算法、子词补白模型算法和在线补白模型算法,其中,集外词补白模型算法为补白训练专门的声学模型,识别中补白模型与关键词模型相互竞争。补白模型可以是一个也可以是多个,对训练数据中除了关键词以外的其他词进行聚类,每一类对应一个补白模型;子词补白模型算法不为关键词以外的词训练专门的声学模型,而是通过拼接子词模型来形成补白模型,识别中通过调整关键词和补白模型的权重来区分关键词和补白。该建模方法不需要专门训练的补白模型,灵活性较好,当采用上下文相关的子词模型时可以取得不错的识别效果;在线补白模型算法不是专门为补白建立模型,而是在搜索的过程中动态地形成一个补白,跟关键词竞争,对于每一帧语音,补白模型的似然分是该帧信号对应的N个最优匹配成绩的平均分。在这种情况下,补白永远不是得分最高的候选,但是总是排在前几名,当一段语音连续跟某个关键词候选都是最佳匹配的时候,关键词候选才能在与补白的竞争中胜出。在线补白模型方法具有一定的抗噪能力;
模板匹配算法通常用有限状态网络来描述上层的语言知识,并用这个有限状态网络指导识别搜索的过程。基于规则分析的对话系统中一般都有一个上下文无关的领域文法,它描述了特定领域中可能出现的语言表达。领域文法可以生成一个对应的有限状态网络,该网络具有高度的预测性,用它来指导识别,限制搜索空间,能够大大提高识别率。
在一些实施例中,通过N-Gram算法将语音请求信息转换成文字请求信息。
上述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种,其中,
文法分析算法是基于规则的语言理解算法,其建立在乔姆斯基形式语言的体系之上,其核心是用文法来描述语言、分析语言。根据策略不同,文法分析算法分为两类:自顶向下文法分析算法和自底向上文法分析算法,其中,自顶向下文法分析算法是从文法的开始符号出发,反复使用文法产生式,寻找与输入符号串匹配的推导;自底向上文法分析算法将输入符号串为语法分析树的末端结点符号串,试图向着根结点方向向上构造语法分析树,使识别符号正是根结点。上述文法是用于描述语言的语法结构的形式规则;语法分析是根据某种给定的形式文法对由单词序列构成的输入文本进行分析并确定其语法结构的一种过程;语法分析树是语法分析出的分层的语法结构;
隐马尔科夫模型算法是一种用参数表示的用于描述随机过程统计特性的概率模型,是一个双重随机过程由两个部分组成:马尔科夫链和一般随机过程,其中马尔科夫链用来描述状态的转移,用转移概率描述;一般随机过程用来描述状态与观察序列的关系,用观察值概率描述。在语音理解中,隐马尔科夫模型算法基于统计的语言理解算法,其主要是对从语音识别结果得到语义概念表示的分析过程进行概率建模,对识别结果对应的语义表示进行概率打分,从中选取一个概率分最高的语义表示形式。
在一些实施例中,通过隐马尔科夫模型算法识别出所述文字请求信息的语义。
在一些实施例中,通过文法分析算法识别出文字请求信息的语义。
在一些实施例中,在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息包括:
根据用户标签获取用户特征模型,其中用户特征模型基于用户交互的历史信息创建;
获取与语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
根据用户特征模型、上文对话信息从预设的应答数据库中查询与语义请求信息对应的第一应答信息。
在一些实施例中,用户特征模型可以生成学习算法创建,其中,生成学习算法是对多种可能的结果分别进行建模,然后分别和输入进行比对,计算出相应的概率。
生成学习算法包括高斯判别分析和朴素贝叶斯,其中,高斯判别分析的基本的假设是得到的数据是独立同分布;朴素贝叶斯是对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,选择类别概率最大的将待分类项归属于此类别。
在一些实施例中,考虑到汉语中同一个字或者词语有若干个意思,譬如说手就既可以是指使用工具的上肢前端,如手臂,也可以是指做某种事情或擅长某种技能的人,如生产能手,为了解决这个问题,可以基于用户交互的历史信息中的同一个字或者词语有若干个意思的意思倾向生成用户特征模型,这样当用户的语义请求信息含有“手”字时,就能根据用户特征模型进一步提高针对性,从而减少从预设的应答数据库中的查询范围,在一定程度上提高响应速度。
在一些实施例中,考虑到用户自定义的词汇与大众词汇的真实意思的不一致,譬如说,喜大普奔表示一件让大家欢乐的事情,大家要分享出去,相互告知,共同庆祝的意思,但是在正常的大众词汇中其没有具体的含义,为了解决这个问题,可以基于用户交互的历史信息中特定词汇的使用生成用户特征模型,从而满足了用户的个性化需求,还在一定程度上增强了交互的趣味性,提高了用户的粘性。
在一些实施例中,考虑到用户个人不同的交互习惯,譬如说,我想吃饭,一般而言,考虑到用户的个人口味该句对应的餐饮需求应该会有所不同,又如,我想创业,一般而言,考虑到用户的个人资源该句对应的创业需求应该会有所不同,可以基于用户交互的历史信息中的服务器反馈内容生成用户特征模型,这样就能更有针对性的满足用户的需求。
在一些实施例中,考虑到用户说话时的前提语境因此会省略一部分词汇,为了提高相应的针对性,因此创建了上文对话信息,该上文对话信息可以通过预设的关键词过滤对上文对话的记录信息进行创建,譬如说,预设的关键词包括时间词,则在创建上文对话信息时保留原上文对话的记录信息中的时间信息,还可以通过为上文对话的记录信息创建索引的形式创建上文对话信息。
可以理解的是,上文对话信息用户补充语义请求信息的内容,用户特征模型用于界定语义请求信息所指代的用户的真正含义从而更好的满足用户的多元化的交互需求。
步骤206:若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端。
优选地,上述预设时间为1秒。
在一些实施例中,考虑到应答数据库一般为通用应答文本数据库,为了增强交互性,上述将该第一应答信息反馈至所述终端包括:
根据第一应答信息合成第一应答语音信息;
将第一应答语音信息反馈至所述终端。
步骤208:若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
上述预设规则为根据语音请求信息的类型将语音请求信息转发到与所述终端绑定的相应的关联设备。
具体地,上述按照预设规则将所述语音请求信息转发到与终端绑定的相应的关联设备,接收关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至终端包括:
根据语义请求信息判断语音请求信息的类型,并根据语音请求信息的类型将其转发与终端绑定的相应的关联设备;
接收关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至终端。
在一些实施例中,语音请求信息的类型包括隐私型和开放型。
在一些实施例中,当语音请求信息的类型为隐私型,则关联设备为预设的隐私式服务设备。
在一些实施例中,当语音请求信息的类型为开放型,则关联设备为预设的开放式服务设备。
如前所述,隐私式服务设备优选为终端用户的好友或者家人使用的设备,其主要服务于用户的隐私性请求信息,譬如说终端用户发出的请求相关家庭成员的生日日期;开放式服务设备优选为公共服务设备,其主要服务于用户的开放性请求信息,譬如说终端用户发出的请求导航信息。
在一些实施例中,为了增强交互性,也可以将第二应答信息转换为第二应答语音信息反馈至终端。
请参阅图3,基于同一个发明构思,还提供一种语音信息交互的装置,包括接收模块3001、生成查找模块3003、第一应答模块3005以及第二应答模块3006,其中,
接收模块3001,用于接收已授权终端传送的携带有用户标签的语音请求信息;
生成查找模块3003,用于根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;
第一应答模块3005,用于在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
第二应答模块3006,用于在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
上述语音信息交互的装置还包括:授权模块,用于在接收已授权终端传送的携带有用户标签的语音请求信息之前接收终端的注册申请信息并授权。
在一些实施例中,注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
在一些实施例中,上述生成查找模块3003包括:
文字单元,用于通过语音识别算法将语音请求信息转换成文字请求信息;
语义单元,用于通过语音理解算法识别出文字请求信息的语义;
生成单元,用于根据文字请求信息的语义生成语义请求信息。
上述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
上述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
在一些实施例中,上述第一应答模块3005包括:
特征单元,用于根据用户标签获取用户特征模型,其中用户特征模型基于用户交互的历史信息创建;
上下文单元,用于获取与语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
查询单元,用于根据用户特征模型、上文对话信息从预设的应答数据库中查询与语义请求信息对应的第一应答信息。
在一些实施例中,上述第一应答模块3005包括:
合成单元,用于根据第一应答信息合成第一应答语音信息;
第一反馈单元,用于将第一应答语音信息反馈至所述终端。
优选地,上述预设时间为1秒。
优选地,用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
上述预设规则为根据语音请求信息的类型将语音请求信息转发到与终端绑定的相应的关联设备。
在一些实施例中,第二应答模块3005包括:
判断单元,用于根据语义请求信息判断语音请求信息的类型,并根据语音请求信息的类型将其转发与终端绑定的相应的关联设备;
第二反馈单元,用于接收关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至终端。
在一些实施例中,当语音请求信息的类型为隐私型,则关联设备为预设的隐私式服务设备。
在一些实施例中,当语音请求信息的类型为开放型,则关联设备为预设的开放式服务设备。
基于同一个发明构思,还提供一种服务器,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中,
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行服务器的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件;
上述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:
接收已授权终端传送的携带有用户标签的语音请求信息;
根据所述语音请求信息生成语义请求信息,并在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;
若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
上述接收已授权终端传送的携带有用户标签的语音请求信息之前包括:
接收终端的注册申请信息并授权。
在一些实施例中,注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码一种或者多种。
在一些实施例中,根据语音请求信息生成语义请求信息包括:
通过语音识别算法将语音请求信息转换成文字请求信息;
通过语音理解算法识别出文字请求信息的语义;
根据文字请求信息的语义生成语义请求信息。
上述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
上述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
在一些实施例中,在预设的时间内根据所述用户标签从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息包括:
根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
获取与语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
根据用户特征模型、上文对话信息从预设的应答数据库中查询与语义请求信息对应的第一应答信息。
在一些实施例中,将该第一应答信息反馈至终端包括:
根据第一应答信息合成第一应答语音信息;
将第一应答语音信息反馈至终端。
在一些实施例中,预设时间为1秒。
上述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
在一些实施例中,预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
在一些实施例中,按照预设规则将语音请求信息转发到与终端绑定的相应的关联设备,接收关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至终端包括:
根据语义请求信息判断语音请求信息的类型,并根据语音请求信息的类型将其转发与终端绑定的相应的关联设备;
接收关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
在一些实施例中,当语音请求信息的类型为隐私型,则关联设备为预设的隐私式服务设备。
在一些实施例中,当语音请求信息的类型为开放型,则关联设备为预设的开放式服务设备。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccessMemory)、磁盘或光盘等。
与现有技术相比,该发明一种语音信息交互的方法、装置及服务器具有如下有益效果:
该语音信息交互的方法、装置及服务器通过引入与所述终端关联的关联设备,拓宽了语音请求信息的反馈信息源头,丰富了反馈服务内容,在一定程度上解决了响应用户的信息往往被限制在某一领域的问题,提高了用户体验。
该语音信息交互的方法、装置及服务器通过将关联设备进行按分类,在更好的响应用户的多元需求的基础上更好的避免了用户隐私的泄露,在一定程度上了提高了交互的安全性。
该语音信息交互的方法、装置及服务器对语音请求信息予以语音反馈,在一定程度上提升了交互的趣味性,增强了用户粘性,促进了产业的发展。
以上对本发明所提供的一种语音信息交互的方法、装置及服务器进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (39)
1.一种语音信息交互的方法,其特征在于,包括:
接收已授权终端传送的携带有用户标签的语音请求信息;
根据所述语音请求信息生成语义请求信息;
根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
获取与所述语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
在预设的时间内根据用户特征模型、上文对话信息从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
2.根据权利要求1所述的语音信息交互的方法,其特征在于,所述接收已授权终端传送的携带有用户标签的语音请求信息之前包括:
接收终端的注册申请信息并授权。
3.根据权利要求2所述的语音信息交互的方法,其特征在于,所述注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
4.根据权利要求1所述的语音信息交互的方法,其特征在于,所述根据所述语音请求信息生成语义请求信息包括:
通过语音识别算法将语音请求信息转换成文字请求信息;
通过语音理解算法识别出所述文字请求信息的语义;
根据所述文字请求信息的语义生成语义请求信息。
5.根据权利要求4所述的语音信息交互的方法,其特征在于,所述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
6.根据权利要求4所述的语音信息交互的方法,其特征在于,所述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
7.根据权利要求1所述的语音信息交互的方法,其特征在于,所述将该第一应答信息反馈至所述终端包括:
根据第一应答信息合成第一应答语音信息;
将所述第一应答语音信息反馈至所述终端。
8.根据权利要求1所述的语音信息交互的方法,其特征在于,所述预设时间为1秒。
9.根据权利要求1所述的语音信息交互的方法,其特征在于,所述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
10.根据权利要求1所述的语音信息交互的方法,其特征在于,所述预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
11.根据权利要求10所述的语音信息交互的方法,其特征在于,所述按照预设规则将所述语音请求信息转发到与所述终端绑定的相应的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端包括:
根据语义请求信息判断语音请求信息的类型,并根据所述语音请求信息的类型将其转发与所述终端绑定的相应的关联设备;
接收所述关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
12.根据权利要求11所述的语音信息交互的方法,其特征在于,当所述语音请求信息的类型为隐私型,则所述关联设备为预设的隐私式服务设备。
13.根据权利要求11所述的语音信息交互的方法,其特征在于,当所述语音请求信息的类型为开放型,则所述关联设备为预设的开放式服务设备。
14.一种语音信息交互的装置,其特征在于,包括:
接收模块,用于接收已授权终端传送的携带有用户标签的语音请求信息;
生成查找模块,用于根据所述语音请求信息生成语义请求信息;
特征单元,用于根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
上下文单元,用于获取与所述语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
查询单元,用于在预设的时间内根据用户特征模型、上文对话信息从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;第一应答模块,用于在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
第二应答模块,用于在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
15.根据权利要求14所述的语音信息交互的装置,其特征在于,所述装置还包括:授权模块,用于在接收已授权终端传送的携带有用户标签的语音请求信息之前接收终端的注册申请信息并授权。
16.根据权利要求15所述的语音信息交互的装置,其特征在于,所述注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
17.根据权利要求14所述的语音信息交互的装置,其特征在于,所述生成查找模块包括:
文字单元,用于通过语音识别算法将语音请求信息转换成文字请求信息;
语义单元,用于通过语音理解算法识别出所述文字请求信息的语义;
生成单元,用于根据所述文字请求信息的语义生成语义请求信息。
18.根据权利要求17所述的语音信息交互的装置,其特征在于,所述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
19.根据权利要求17所述的语音信息交互的装置,其特征在于,所述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
20.根据权利要求14所述的语音信息交互的装置,其特征在于,所述第一应答模块包括:
合成单元,用于根据第一应答信息合成第一应答语音信息;
第一反馈单元,用于将所述第一应答语音信息反馈至所述终端。
21.根据权利要求14所述的语音信息交互的装置,其特征在于,所述预设时间为1秒。
22.根据权利要求14所述的语音信息交互的装置,其特征在于,所述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
23.根据权利要求14所述的语音信息交互的装置,其特征在于,所述预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
24.根据权利要求23所述的语音信息交互的装置,其特征在于,所述第二应答模块包括:
判断单元,用于根据语义请求信息判断语音请求信息的类型,并根据所述语音请求信息的类型将其转发与所述终端绑定的相应的关联设备;
第二反馈单元,用于接收所述关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
25.根据权利要求24所述的语音信息交互的装置,其特征在于,当所述语音请求信息的类型为隐私型,则所述关联设备为预设的隐私式服务设备。
26.根据权利要求24所述的语音信息交互的装置,其特征在于,当所述语音请求信息的类型为开放型,则所述关联设备为预设的开放式服务设备。
27.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:
接收已授权终端传送的携带有用户标签的语音请求信息;
根据所述语音请求信息生成语义请求信息;
根据用户标签获取用户特征模型,其中所述用户特征模型基于用户交互的历史信息创建;
获取与所述语义请求信息对应的上文对话信息,其中上文对话信息基于上文对话的记录信息创建;
在预设的时间内根据用户特征模型、上文对话信息从预设的应答数据库中查询与所述语义请求信息对应的第一应答信息,其中应答数据库为通用应答文本数据库;若在所述预设时间内查询到所述第一应答信息,则将该第一应答信息反馈至所述终端;
若在所述预设时间内未查询到所述第一应答信息,则按照预设规则将所述语音请求信息转发到与所述终端关联的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端。
28.根据权利要求27所述的服务器,其特征在于,所述接收已授权终端传送的携带有用户标签的语音请求信息之前包括:
接收终端的注册申请信息并授权。
29.根据权利要求28所述的服务器,其特征在于,所述注册申请信息包括终端设备编码、国际移动设备标识、集成电路卡识别码的一种或者多种。
30.根据权利要求27所述的服务器,其特征在于,所述根据所述语音请求信息生成语义请求信息包括:
通过语音识别算法将语音请求信息转换成文字请求信息;
通过语音理解算法识别出所述文字请求信息的语义;
根据所述文字请求信息的语义生成语义请求信息。
31.根据权利要求30所述的服务器,其特征在于,所述语音识别算法包括N-Gram算法、关键词算法以及模板匹配算法的一种或者多种。
32.根据权利要求30所述的服务器,其特征在于,所述语音理解算法包括文法分析算法、隐马尔科夫模型算法的一种或者多种。
33.根据权利要求27所述的服务器,其特征在于,所述将该第一应答信息反馈至所述终端包括:
根据第一应答信息合成第一应答语音信息;
将所述第一应答语音信息反馈至所述终端。
34.根据权利要求27所述的服务器,其特征在于,所述预设时间为1秒。
35.根据权利要求27所述的服务器,其特征在于,所述用户标签包括用户名、年龄、性别、终端系统类型、方言的一种或多种。
36.根据权利要求27所述的服务器,其特征在于,所述预设规则为根据语音请求信息的类型将所述语音请求信息转发到与所述终端绑定的相应的关联设备。
37.根据权利要求36所述的服务器,其特征在于,所述按照预设规则将所述语音请求信息转发到与所述终端绑定的相应的关联设备,接收所述关联设备响应所述语音请求信息的第二应答信息,并转发该第二应答信息至所述终端包括:
根据语义请求信息判断语音请求信息的类型,并根据所述语音请求信息的类型将其转发与所述终端绑定的相应的关联设备;
接收所述关联设备响应该语音请求信息的第二应答信息,并将该第二应答信息转发至所述终端。
38.根据权利要求37所述的服务器,其特征在于,当所述语音请求信息的类型为隐私型,则所述关联设备为预设的隐私式服务设备。
39.根据权利要求37所述的服务器,其特征在于,当所述语音请求信息的类型为开放型,则所述关联设备为预设的开放式服务设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610590228.XA CN106230689B (zh) | 2016-07-25 | 2016-07-25 | 一种语音信息交互的方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610590228.XA CN106230689B (zh) | 2016-07-25 | 2016-07-25 | 一种语音信息交互的方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106230689A CN106230689A (zh) | 2016-12-14 |
CN106230689B true CN106230689B (zh) | 2019-07-05 |
Family
ID=57531623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610590228.XA Active CN106230689B (zh) | 2016-07-25 | 2016-07-25 | 一种语音信息交互的方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106230689B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274882B (zh) * | 2017-08-08 | 2022-10-25 | 腾讯科技(深圳)有限公司 | 数据传输方法及装置 |
CN107471226B (zh) * | 2017-09-21 | 2024-07-02 | 塔米智能科技(北京)有限公司 | 一种服务机器人系统及其交互方法 |
CN107766482B (zh) * | 2017-10-13 | 2021-12-14 | 北京猎户星空科技有限公司 | 信息推送及发送方法、装置、电子设备、存储介质 |
CN107833573B (zh) * | 2017-10-23 | 2021-02-09 | 上海百芝龙网络科技有限公司 | 一种基于机器学习的家庭场景语义理解辅助方法 |
CN108231061A (zh) * | 2017-12-29 | 2018-06-29 | 江苏名通信息科技有限公司 | 一种基于文本解析和语音合成的网络人机交互方法 |
CN108153904A (zh) * | 2018-01-17 | 2018-06-12 | 北京百度网讯科技有限公司 | 语料收集方法、装置和计算机设备 |
CN109410944B (zh) | 2018-12-12 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 语音交互方法、装置和终端 |
CN111935348A (zh) * | 2019-05-13 | 2020-11-13 | 阿里巴巴集团控股有限公司 | 提供通话处理服务的方法和装置 |
CN110502368B (zh) * | 2019-08-14 | 2022-07-26 | 出门问问(武汉)信息科技有限公司 | 一种对话容错方法、中控设备、系统以及可读存储介质 |
CN111090305A (zh) * | 2019-11-27 | 2020-05-01 | 新华蓝海(北京)人工智能技术有限公司 | 一种3d智能税务服务设备 |
CN111785293B (zh) * | 2020-06-04 | 2023-04-25 | 杭州海康威视系统技术有限公司 | 语音传输方法、装置及设备、存储介质 |
CN112600982B (zh) * | 2020-12-08 | 2022-10-14 | 深圳供电局有限公司 | 供电服务热线交互式语音应答方法与系统、设备、介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187050A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音式音乐控制装置 |
CN103187076A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音式音乐控制装置 |
CN103188408A (zh) * | 2011-12-29 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音自动应答云端服务器、系统及方法 |
CN104715752A (zh) * | 2015-04-09 | 2015-06-17 | 刘文军 | 语音识别方法、装置及系统 |
CN105488164A (zh) * | 2015-11-30 | 2016-04-13 | 北京光年无限科技有限公司 | 问答数据处理方法及装置、智能机器人 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6054283B2 (ja) * | 2013-11-27 | 2016-12-27 | シャープ株式会社 | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラム、サーバの制御プログラムおよび音声認識端末の制御方法 |
-
2016
- 2016-07-25 CN CN201610590228.XA patent/CN106230689B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187050A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音式音乐控制装置 |
CN103187076A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音式音乐控制装置 |
CN103188408A (zh) * | 2011-12-29 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音自动应答云端服务器、系统及方法 |
CN104715752A (zh) * | 2015-04-09 | 2015-06-17 | 刘文军 | 语音识别方法、装置及系统 |
CN105488164A (zh) * | 2015-11-30 | 2016-04-13 | 北京光年无限科技有限公司 | 问答数据处理方法及装置、智能机器人 |
Also Published As
Publication number | Publication date |
---|---|
CN106230689A (zh) | 2016-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106230689B (zh) | 一种语音信息交互的方法、装置及服务器 | |
US12249332B2 (en) | Proactive command framework | |
US10891948B2 (en) | Identification of taste attributes from an audio signal | |
US20210201932A1 (en) | Method of and system for real time feedback in an incremental speech input interface | |
US10878808B1 (en) | Speech processing dialog management | |
KR102229850B1 (ko) | 대화형 상호작용 시스템에서 서치 입력에서의 사용자 의도를 추론하는 방법 및 이를 위한 시스템 | |
US11093110B1 (en) | Messaging feedback mechanism | |
US10917758B1 (en) | Voice-based messaging | |
US8935163B2 (en) | Automatic conversation system and conversation scenario editing device | |
US10997223B1 (en) | Subject-specific data set for named entity resolution | |
US10896222B1 (en) | Subject-specific data set for named entity resolution | |
WO2017127296A1 (en) | Analyzing textual data | |
US10366690B1 (en) | Speech recognition entity resolution | |
WO2008128423A1 (fr) | Système de dialogue intelligent et son procédé de réalisation | |
WO2023108994A1 (zh) | 一种语句生成方法及电子设备、存储介质 | |
US20100049500A1 (en) | Dialogue generation apparatus and dialogue generation method | |
US20230214579A1 (en) | Intelligent character correction and search in documents | |
US20240211206A1 (en) | System command processing | |
CN118152570B (zh) | 一种智能化的文本分类方法 | |
US11582174B1 (en) | Messaging content data storage | |
CN113743126B (zh) | 一种基于用户情绪的智能交互方法和装置 | |
CN115168558A (zh) | 一种实现多轮人机对话的方法 | |
US20240428787A1 (en) | Generating model output using a knowledge graph | |
CN116915916A (zh) | 通话处理方法、装置、电子设备及介质 | |
CN112966491A (zh) | 基于电子书的人物语调识别方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220728 Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015 Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Patentee before: Qizhi software (Beijing) Co.,Ltd. |