[go: up one dir, main page]

CN108986814A - 一种唤醒应用服务的方法及装置 - Google Patents

一种唤醒应用服务的方法及装置 Download PDF

Info

Publication number
CN108986814A
CN108986814A CN201811023956.8A CN201811023956A CN108986814A CN 108986814 A CN108986814 A CN 108986814A CN 201811023956 A CN201811023956 A CN 201811023956A CN 108986814 A CN108986814 A CN 108986814A
Authority
CN
China
Prior art keywords
information
service
personal assistant
virtual personal
voice messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811023956.8A
Other languages
English (en)
Inventor
马群立
张曈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chumen Wenwen Information Technology Co Ltd
Original Assignee
Chumen Wenwen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chumen Wenwen Information Technology Co Ltd filed Critical Chumen Wenwen Information Technology Co Ltd
Priority to CN201811023956.8A priority Critical patent/CN108986814A/zh
Publication of CN108986814A publication Critical patent/CN108986814A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例提供一种唤醒应用服务的方法及装置,所述方法包括:在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;基于所述第一语音信息,确定所述用户的服务需求信息;将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒,其中,所述网络应用服务由所述虚拟个人助理所关联的服务器提供。如此,使用耳机输入语音的方式,通过虚拟个人助理来实现唤醒虚拟个人助理中相应的网络应用服务,能够简化应用服务的唤醒过程,提高了交互方式的智能程度。

Description

一种唤醒应用服务的方法及装置
技术领域
本发明实施例涉及电子设备应用领域,尤其涉及一种唤醒应用服务的方法及装置。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备,如智能手机、平板电脑等,享受随着科技发展带来的越来越丰富的应用服务,比如,播放音乐、播放视频、进行语音导航等。
目前,当用户需要唤醒某一应用程序所提供的应用服务时,往往需要先打开安装有该应用程序的电子设备,再从电子设备的系统桌面中找到该应用程序的图标,通过在电子设备的触摸屏上点击该应用程序的图标来打开该应用程序,最后在该应用程序上进行相关操作,才能唤醒该应用程序所提供的应用服务。例如,在用户需要播放音乐时,需要先对电子设备进行解锁,再从电子设备中找到音乐类应用程序的图标,然后点击该图标打开该音乐类应用程序,选择需要播放的音频并点击“播放”按键,该音乐类应用程序才会播放音乐。
在使用上述电子设备启动应用程序所提供的应用服务的过程中,发明人发现目前唤醒应用服务的操作过程十分繁琐,存在交互方式智能程度较低的技术问题。
发明内容
有鉴于此,本发明实施例提供一种唤醒应用服务的方法及装置,使用耳机输入语音的方式,通过虚拟个人助理来实现唤醒虚拟个人助理中相应的网络应用服务,能够简化应用服务的唤醒过程,提高了交互方式的智能程度。
为解决上述技术问题,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供一种唤醒应用服务的方法,应用于虚拟个人助理,所述方法包括:在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;基于所述第一语音信息,确定所述用户的服务需求信息;将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒,其中,所述网络应用服务由所述虚拟个人助理所关联的服务器提供。
第二方面,本发明实施例提供一种唤醒应用服务的装置,所述装置包括:第一接收单元,用于在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;第一确定单元,用于基于所述第一语音信息,确定所述用户的服务需求信息;服务唤醒单元,用于将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒,其中,所述网络应用服务由所述虚拟个人助理所关联的服务器提供。
第三方面,本发明实施例提供一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述唤醒应用服务的方法的步骤。
第四方面,本发明实施例提供一种电子设备,所述电子设备包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述唤醒应用服务的方法的步骤。
本发明实施例提供的唤醒应用服务的方法及装置,当虚拟个人助理处于唤醒状态时,在虚拟个人助理接收到用户通过耳机输入的第一语音信息后,虚拟个人助理就可以基于该第一语音信息确定出该用户的服务需求信息,接下来,虚拟个人助理就会将虚拟个人助理中的能够满足该服务需求信息的网络应用服务唤醒,以便给用户提供应用服务。如此,无需用户手动在电子设备上进行操作,用户只需要通过耳机输入语音信息,就可以通过虚拟个人助理实现唤醒虚拟个人助理中的网络应用服务,操作起来十分简便,从而,实现了简化唤醒应用服务的操作过程,提高了交互方式智能程度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例中的唤醒应用服务的系统的结构示意图;
图2为本发明实施例中的唤醒应用服务的方法的流程示意图一;
图3为本发明实施例中的唤醒应用服务的方法的流程示意图二;
图4为本发明实施例中的唤醒应用服务的方法的流程示意图三;
图5为本发明实施例中的唤醒应用服务的装置的结构示意图;
图6为本发明实施例中的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供一种唤醒应用服务的系统,图1为本发明实施例中的唤醒应用服务的系统的结构示意图,参见图1所示,该系统10可以包括:电子设备101、虚拟个人助理(Virtual Personal Assistant,VPA)102、服务器103和耳机104,其中,虚拟个人助理102安装于电子设备101中,虚拟个人助理102与服务器103连接,耳机104能够与电子设备101连接。
这里,虚拟个人助理是一种应用程序,能够对用户输入的语音信息进行语义识别,能够根据用户的服务需求对与电子设备所关联的其它电子设备,如耳机、智能手表、智能音箱等进行控制,例如,通过虚拟个人助理,用户可以通过耳机输入语音信息,来向智能音箱输出音频数据。在实际应用中,上述虚拟个人助理也可以称为智能语音助手,或者,还可以称为AI(Artificial Intelligence,人工智能)助手等。
在实际应用中,上述服务器可以为虚拟个人助理的提供商所提供的服务器,也可以为第三方应用程序提供商所提供的服务器,如喜马拉雅、蜻蜓FM等。这里,本发明实施例不做具体限定。
在实际应用中,根据耳机与电子设备之间的数据传输方式的不同,上述耳机可以为有线耳机,此时,耳机可以通过数据线与电子设备连接,当然,上述耳机也可以为无线耳机,如蓝牙耳机,此时,耳机可以通过蓝牙技术与电子设备连接。这里,本发明实施例不做具体限定。
在实际应用中,上述电子设备可以以各种形式来实施。例如,本发明实施例中描述的安装有虚拟个人助理的电子设备可以为智能手机,也可以为平板电脑,当然还可以为其它能够安装虚拟个人助理的电子设备。再例如,本发明实施例中描述的与安装有虚拟个人助理的电子设备所关联的其它电子设备可以为诸如智能音箱、智能电视、智能机顶盒等智能家居设备,也可以为诸如智能手表、智能手环、耳机等随身设备,当然,还可以为其它类型的电子设备。这里,本发明实施例中不做具体限定。
进一步地,结合上述唤醒应用服务的系统,本发明实施例提供一种唤醒应用服务的方法,该唤醒应用服务的方法应用于虚拟个人助理。
图2为本发明实施例中的唤醒应用服务的方法的流程示意图一,参见图2所示,该唤醒应用服务的方法可以包括:
S201:在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;
S202:基于第一语音信息,确定用户的服务需求信息;
具体来说,为了减少电子设备的耗电量,在用户需要使用虚拟个人助理的应用服务时,虚拟个人助理就会处于唤醒状态,如工作模式、非省电模式等,此时,当虚拟个人助理接收用户通过耳机输入的第一语音信息,虚拟个人助理能够对基于用户输入的语音信息确定用户的服务需求信息,以便向用户提供对应的应用服务。
示例性地,当用户输入的第一语音信息为“我想听张三的歌曲”时,则可以确定出用户的服务需求信息为“打开音乐类应用服务,播放张三的音乐”;当用户输入的第一语音信息为“放音乐”、“播放歌曲”、“给我唱首歌”、“我想听歌”等时,则可以确定出用户的服务需求信息为“打开音乐类应用服务,播放默认音乐”;当用户输入的第一语音信息为“播放告白气球”,则可以确定出用户的服务需求信息为“打开音乐类应用服务,播放音乐名称为告白气球的歌曲”。
S203:将虚拟个人助理中的能够满足服务需求信息的网络应用服务唤醒。
其中,网络应用服务由虚拟个人助理所关联的服务器提供。
在实际应用中,虚拟个人助理所关联的服务器可以为虚拟个人助理的提供商所提供的服务器,也可以为第三方应用程序提供商所提供的服务器,如喜马拉雅、蜻蜓FM等。
在具体实施过程中,为了避免用户安装过多第三方应用程序,减少用户负担,提升用户体验,虚拟个人助理能够通过第三方应用程序所提供的用于与虚拟个人助理对接的API接口,与第三方应用程序提供商所提供的服务器关联上,那么,虚拟个人助理就能够从第三方应用程序提供商所提供的服务器上获取用户所需要的网络应用服务的数据资源,从而,虚拟个人助理可以向用户提供第三方应用程序的应用服务,此时,网络应用服务为第三方应用程序的应用服务。
在实际应用中,上述网络应用服务可以由各种类型的应用服务来实现。具体来说,本发明实施例中所描述的网络应用服务可以为音频类服务,如音乐、相声、电台等,也可以为订票类服务,如订飞机票、订火车票、订演唱会门票,还可以为导航类服务,如地图导航、旅游景点导航,当然,还可以为其它类型的服务。这里,本发明实施例不做具体限定。
在实际应用中,虚拟个人助理中的应用服务包括网络应用服务和本地应用服务。其中,虚拟个人助理中应用服务的数量为一个或多个。
由上述内容可知,本发明实施例所提供的唤醒应用服务的方法,当虚拟个人助理处于唤醒状态时,在虚拟个人助理接收到用户通过耳机输入的第一语音信息后,虚拟个人助理就可以基于该第一语音信息确定出该用户的服务需求信息,接下来,虚拟个人助理就会将虚拟个人助理中的能够满足该服务需求信息的网络应用服务唤醒,以便给用户提供应用服务。如此,无需用户手动在电子设备上进行操作,用户只需要通过耳机输入语音信息,就可以通过虚拟个人助理实现唤醒虚拟个人助理中的网络应用服务,操作起来十分简便,从而,实现了简化唤醒应用服务的操作过程,提高了交互方式智能程度。
基于前述实施例,在本发明其它实施例中,上述S202可以采用但不局限以下方法来实现。在具体实施过程中,为了获得用户的服务需求信息,以便虚拟个人助理根据服务需求信息唤醒匹配的网络应用服务,上述S202可以包括:对第一语音信息进行语音识别,获得文本识别信息;通过自然语言理解技术,对文本识别信息进行语义理解,获得服务需求信息。
示例性地,当用户输入的第一语音信息对应的文本识别信息为“我想听张三的歌曲”,则可以确定出用户的服务需求信息为“打开音乐类应用服务,播放张三的音乐”;当用户输入的第一语音信息对应的文本识别信息为“放音乐”、“播放歌曲”、“给我唱首歌”、“我想听歌”等,则可以确定出用户的服务需求信息为“打开音乐类应用服务,播放默认音乐”;当用户输入的第一语音信息对应的文本识别信息为“播放告白气球”,则可以确定出用户的服务需求信息为“打开音乐类应用服务,播放音乐名称为告白气球的歌曲”。
在本发明另一实施例中,为了从虚拟个人助理所提供的所有网络应用服务中,唤醒用户所需的网络应用服务,上述S203可以采用但不局限以下方法来实现。
第一种实现方法,不管虚拟个人助理中是否存在能够满足用户的服务需求信息的本地应用服务,直接唤醒虚拟个人助理中能够满足用户的服务需求信息的网络应用服务。
在具体实施过程中,上述S203可以包括:将虚拟个人助理中的与服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒,其中,服务标识信息为服务名称信息或服务类别信息。
这里,服务标识信息是指能够标识网络应用服务的信息。示例性地,服务标识信息可以为网络应用服务具体的服务名称信息,例如记事本、汇率计算、喜马拉雅、蜻蜓FM等,服务标识信息也可以为网络应用服务所属的服务类别信息,如音乐、订票、导航、翻译、手机银行、第三方支付等。
第二种实现方法,在虚拟个人助理中本地应用服务不满足用户的服务需求信息时,再唤醒虚拟个人助理中能够满足用户的服务需求信息的网络应用服务。
在具体实施过程中,上述S203还可以包括:将预设唤醒词与虚拟个人助理中的本地应用服务的应用标识信息进行匹配;如果不匹配,将虚拟个人助理中的与服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒。
具体来说,由于网络应用服务唤醒后一般需要占用较大的内存空间,而且网络应用服务一般需要消耗较多的网络流量,因此,为了减少应用服务唤醒后所占用的内存或者在用户的电子设备未连接Wi-Fi(Wireless-Fidelity,无线保真),而是使用数据网络,减少用户流量消耗,可以优先唤醒虚拟个人助理中能够满足用户的服务需求信息的本地应用服务,当虚拟个人助理中不存在能够满足用户的服务需求信息的本地应用服务时,再唤醒虚拟个人助理中能够满足用户的服务需求信息的网络应用服务。
基于前述实施例,在本发明另一实施例中,为了减少电子设备的耗电量,在用户不使用虚拟个人助理时,虚拟个人助理处于未唤醒状态。那么,在具体实施过程中,为了使得用户能够使用虚拟个人助理的网络应用服务,在上述S201之前,参见图3所示,上述方法还可以包括S301~S303:
S301:在虚拟个人助理处于未唤醒状态下,接收到用户通过耳机输入的第二语音信息;
这里,在虚拟个人助理处于未唤醒状态时,虚拟个人助理能够接收用户输入的语音信息并且可以确定该语音信息中是否有预设唤醒词,但是,虚拟个人助理不能对用户输入的语音信息进行语义识别,无法确定用户的向服务需求信息,不能向用户提供应用服务。
一般情况下,当用户长时间未使用虚拟个人助理时,或者,耳机与安装有虚拟个人助理的电子设备断开连接时,可以使得虚拟个人助理处于未唤醒状态,如待机、休眠、省电模式等。
S302:对第二语音信息进行分析,确定第二语音信息中是否包含预设唤醒词;
S303:如果第二语音信息中包含预设唤醒词,虚拟个人助理从未唤醒状态进入唤醒状态。
具体来说,在虚拟个人助理处理未唤醒状态下时,虚拟个人助理获得用户输入的第二语音信息后,虚拟个人助理可以检测第二语音信息中是否存在与预设唤醒词对应的语音信息,如果存在,则确定第二语音信息中包含预设唤醒词,此时,执行S303,虚拟个人助理就可以从未唤醒状态进入唤醒状态。否则,则确定第二语音信息中不包含预设唤醒词,此时,虚拟个人助理可以向耳机输出预设提示音,实现控制耳机报告预设提示音,以向用户提示虚拟个人助理未唤醒,无法提供应用服务。
在实际应用中,预设唤醒词可以是用户预先通过虚拟个人助理所在电子设备所提供的用户交互界面设置的一个词或者多个词的组合,也可以是虚拟个人助理预设设定的一个词或多个词的组合。示例性地,预设唤醒词可以为“你好,小问”、“你好,问问”、“你好,问问同学”等。
在具体实施过程中,当预设唤醒词由多个词的组合实现时,预设唤醒词中的多个词是不可拆分的,是连续的。例如,如果用户通过耳机所输入的第二语音信息为“小明,问问同学”、“你好,李四,问问”,则确定用户输入的第二语音信息中并不存在该预设唤醒词。
基于前述实施例,在本发明另一实施例中,在虚拟个人助理将满足用户的服务需求信息的网络应用服务唤醒后,为了便于用户对该网络应用服务进行相关操作,需要通过输出提示音的方式来向用户提示该网络应用服务已经唤醒。那么,在上述S203之后,上述唤醒应用服务的方法还可以包括以下步骤:将网络应用服务的服务标识信息作为提示关键词输入到预设提示模版中,生成包含网络应用服务的服务标识信息的提示文本信息;通过文本转语音技术,对提示文本信息进行语音合成处理,生成提示音频数据,其中,提示音频数据用于向用户提示网络应用服务已被唤醒;将提示音频数据输出至耳机。
在实际应用中,网络应用服务的服务标识信息可以为网络应用服务具体的服务名称信息,例如记事本、汇率计算、喜马拉雅、蜻蜓FM等,服务标识信息也可以为网络应用服务所属的服务类别信息,如音乐、订票、导航、翻译、手机银行、第三方支付等。
举例来说,以预先设置预设提示模版为“你好+提示关键字+应用服务已唤醒”,网络应用服务的服务标识信息为“音乐”为例,将网络应用服务的服务标识信息作为提示关键词输入到预设提示模版中,生成包含网络应用服务的服务标识信息的提示文本信息就可以为“你好音乐应用服务已唤醒”。
当然,在实际应用中,除了采用上述方法来向用户提示网络应用服务已被唤醒,还可以采用其它方法来实现,例如虚拟个人助理直接将预设提示音输出至耳机。示例性地,电子设备系统提示音库中预先存储有诸如“滴滴”、“嘟嘟”、“哒哒”等短提示音,可由本领域技术人员在电子设备中显示的虚拟个人助理的交互界面中,从电子设备的系统提示音库中为网络应用服务选择预设提示音,这样,在网络应用服务被唤醒后,虚拟个人助理可以直接向耳机输出该目标提示音,控制该耳机向用户播放目标提示音。从而,用户就可以知晓该网络应用服务已经被唤醒。
由上述内容可知,本发明实施例所提供的方法,在虚拟个人助理唤醒能够满足用户的用户需求信息的网络应用服务后,虚拟个人助理会向耳机输出提示音频数据,控制耳机向用户播放提示音频数据,以使用户知晓可以对应用服务进行语音操作。这样,能够避免用户的无效语音操作,从而,提高了交互方式的智能程度,提升了用户体验。
基于前述实施例,在本发明另一实施例中,当被唤醒的网络应用服务为诸如音乐、相声、有声小说、新闻、语音导航等音频服务时,为了更好地为用户提供音频服务,快速地给用户播放所需的目标音频数据,提升用户体验,在上述S203之后,参见图4所示,上述唤醒应用服务的方法还可以包括以下S401~S405:
S401:当网络应用服务为音频服务时,对服务需求信息进行分析,确定服务需求信息中是否包含用于指示目标音频数据的音频标识信息;
其中,音频标识信息为音频名称信息、音频类别信息、音频人物信息、音频标签信息和音频地理位置信息中的一种或多种。
在实际应用中,音频类别信息可以是指诸如音乐、相声、有声小说、新闻、娱乐消息等音频内容类型,也可以是指诸如国语、粤语、英语等音频内容的语言种类。音频人物信息可以是指音乐的演唱者名称、音乐的作词者名称、相声的表演者名称、电台节目的主持人名称、娱乐消息中明星的名称等。音频标签信息可以是指音频的风格,如舒缓、安静、节奏感等,也可以是指音频所适合的应用场景,如工作、学习、开车、看书、睡眠等,还可以为其它,例如,用户设置的分组信息。音频地理位置可以是指欧美、日韩、内地、港台等。这里,本发明实施例不做具体限定。
具体来说,为了获取目标音频数据的音频标识信息,如果确定服务需求信息中包含音频标识信息,此时,虚拟个人助理执行S402来获取目标音频数据的音频标识信息;如果确定服务需求信息中不包含音频标识信息,表明还需要用户通过耳机输入语音信息来指示目标音频数据的音频标识信息,此时,虚拟个人助理执行S403a~S403b来获取目标音频数据的音频标识信息。
S402:从服务需求信息中提取音频标识信息;
具体来说,为了减少用户操作、提高服务质量、提升用户体验,当服务需求信息中包含目标音频数据的音频标识信息时,虚拟个人助理就可以直接从该服务需求信息中
S403a:接收用户通过耳机输入的第三语音信息;
其中,第三语音信息用于指示目标音频数据的音频标识信息;
具体来说,为了更精准地向用户提供服务、提升用户体验,当服务需求信息中不包含目标音频数据的音频标识信息时,虚拟个人助理还需要接收用户通过耳机输入的第三语音信息,以便获取目标音频数据的音频标识信息。
S403b:对第三语音信息进行语音识别,从第三语音信息中提取音频标识信息;
具体来说,在虚拟个人助理接收到用户通过耳机输入的第三语音信息后,虚拟个人助理可以对该第三语音信息进行语音识别,获得该第三语音信息对应的文字识别信息,再从该第三语音信息对应的文字识别信息中提取出该目标音频数据的音频标识信息。
S404:基于音频标识信息,通过网络应用服务获取目标音频数据;
S405:将目标音频数据输出至耳机。
具体来说,在虚拟个人助理通过执行S402或者执行S403a~S403b获得了目标音频数据的音频标识信息后,虚拟个人助理就可以通过执行S404~S405来将目标音频数据输出至耳机,以实现控制耳机向用户播放目标音频数据。
由上述内容可知,本发明实施例所提供的方法,在虚拟个人助理接收到用户输入的语音信息后,虚拟个人助理能够向耳机输出用户所需的目标音频数据,实现控制耳机播放目标音频数据,以使用户收听到所需的目标音频。这样,在用户需要收听音频时,无需手动在电子设备上进行繁琐的操作,仅通过耳机向虚拟个人助理输入语音信息即可实现,操作起来十分简便,交互方式智能程度高,用户体验较好。
基于同一发明构思,作为对上述方法的实现,本发明实施例提供了一种唤醒应用服务的装置,该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本发明实施例中的装置能够对应实现前述方法实施例中的全部内容。
图5为本发明实施例中的唤醒应用服务的装置的结构示意图,参见图5所示,该装置50包括:第一接收单元501,用于在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;第一确定单元502,用于基于第一语音信息,确定用户的服务需求信息;服务唤醒单元503,用于将虚拟个人助理中的能够满足服务需求信息的网络应用服务唤醒,其中,网络应用服务由虚拟个人助理所关联的服务器提供。
在本发明实施例中,第一确定单元,用于对第一语音信息进行语音识别,获得文本识别信息;通过自然语言理解技术,对文本识别信息进行语义理解,获得服务需求信息;服务唤醒单元,用于将虚拟个人助理中的与服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒,其中,服务标识信息为服务名称信息或服务类别信息。
在本发明实施例中,服务唤醒单元,还用于将服务需求信息与虚拟个人助理中的本地应用服务的应用标识信息进行匹配;如果不匹配,将虚拟个人助理中的与服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒。
在本发明其它实施例中,上述装置还包括:第一生成单元,用于将网络应用服务的服务标识信息作为提示关键词输入到预设提示模版中,生成包含网络应用服务的服务标识信息的提示文本信息;第二生成单元,用于通过文本转语音技术,对提示文本信息进行语音合成处理,生成提示音频数据,其中,提示音频数据用于向用户提示网络应用服务已被唤醒;第一输出单元,将提示音频数据输出至耳机。
在本发明其它实施例中,上述装置还包括:第二接收单元,用于在虚拟个人助理处于未唤醒状态下,接收到用户通过耳机输入的第二语音信息;第二确定单元,用于对第二语音信息进行分析,确定第二语音信息中是否包含预设唤醒词;助理唤醒单元,用于如果第二确定单元确定第二语音信息中包含预设唤醒词,虚拟个人助理从未唤醒状态进入唤醒状态。
在本发明其它实施例中,上述装置还包括:第三确定单元,用于当网络应用服务为音频服务时,对服务需求信息进行分析,确定服务需求信息中是否包含用于指示目标音频数据的音频标识信息,其中,音频标识信息为音频名称信息、音频类别信息、音频人物信息、音频标签信息和音频地理位置信息中的一种或多种;第一提取单元,用于如果第三确定单元确定服务需求信息中包含音频标识信息,从服务需求信息中提取音频标识信息;获取单元,用于基于音频标识信息,通过网络应用服务获取目标音频数据;第二输出单元,用于将目标音频数据输出至耳机。
在本发明其它实施例中,上述装置还包括:第二接收单元,用于如果第三确定单元确定服务需求信息中不包含音频标识信息,接收用户通过耳机输入的第三语音信息,其中,第三语音信息用于指示音频标识信息;第二提取单元,用于对第三语音信息进行语音识别,从第三语音信息中提取音频标识信息。
由于本发明实施例所介绍的唤醒应用服务的装置为可以执行本发明实施例中的唤醒应用服务的方法的装置,故而基于本发明实施例中所介绍的唤醒应用服务的方法,本领域所属技术人员能够了解本发明实施例的唤醒应用服务的装置的具体实施方式以及其各种变化形式,所以在此对于该唤醒应用服务的装置如何实现本发明实施例中的唤醒应用服务的方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中唤醒应用服务的方法所采用的装置,都属于本申请所欲保护的范围。
在实际应用中,该唤醒应用服务的装置可应用于电子设备中。电子设备可以以各种形式来实施。例如,本发明实施例中描述的电子设备可以包括诸如智能音箱、智能电视、智能机顶盒等智能家居设备、诸如智能手机、平板电脑、智能手表、智能手环等随身设备等。当然,还可以为其它类型的音频设备,这里,本发明实施例中不做具体限定。
基于同一发明构思,本发明实施例提供一种电子设备。图6为本发明实施例中的电子设备的结构示意图,参见图6所示,该电子设备60包括:至少一个处理器61;以及与处理器61连接的至少一个存储器62、总线63;其中,处理器61、存储器62通过总线63完成相互间的通信;处理器61用于调用存储器62中的程序指令,以执行上述实施例中的唤醒应用服务的方法的步骤。
本发明实施例还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述实施例中的唤醒应用服务的方法。
上述处理器可由中央处理器(Central Processing Unit,CPU)、微处理器(MicroProcessor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)、或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。存储器可能包括计算机可读介质中的非永久性存储器,随机存储器(Random Access Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(Flash RAM),存储器包括至少一个存储芯片。
基于同一发明构思,本发明实施例提供一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例中的唤醒应用服务的方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,RAM和/或非易失性内存等形式,如ROM或Flash RAM。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质可以是ROM、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是快闪记忆体或其他内存技术、CD-ROM、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息;还可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种唤醒应用服务的方法,其特征在于,应用于虚拟个人助理,所述方法包括:
在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;
基于所述第一语音信息,确定所述用户的服务需求信息;
将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒,其中,所述网络应用服务由所述虚拟个人助理所关联的服务器提供。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一语音信息,确定所述用户的服务需求信息,包括:对所述第一语音信息进行语音识别,获得文本识别信息;通过自然语言理解技术,对所述文本识别信息进行语义理解,获得所述服务需求信息;
所述将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒,包括:将所述虚拟个人助理中的与所述服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒,其中,所述服务标识信息为服务名称信息或服务类别信息。
3.根据权利要求2所述的方法,其特征在于,所述将所述虚拟个人助理中的与所述服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒,包括:
将所述服务需求信息与所述虚拟个人助理中的本地应用服务的应用标识信息进行匹配;
如果不匹配,将所述虚拟个人助理中的与所述服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒。
4.根据权利要求2所述的方法,其特征在于,在所述将所述虚拟个人助理中的与所述服务需求信息匹配的服务标识信息所对应的网络应用服务唤醒之后,所述方法还包括:
将所述网络应用服务的服务标识信息作为提示关键词输入到预设提示模版中,生成包含所述网络应用服务的服务标识信息的提示文本信息;
通过文本转语音技术,对所述提示文本信息进行语音合成处理,生成提示音频数据,其中,所述提示音频数据用于向用户提示所述网络应用服务已被唤醒;
将所述提示音频数据输出至所述耳机。
5.根据权利要求1所述的方法,其特征在于,在所述在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息之前,所述方法还包括:
在虚拟个人助理处于未唤醒状态下,接收到用户通过所述耳机输入的第二语音信息;
对所述第二语音信息进行分析,确定所述第二语音信息中是否包含预设唤醒词;
如果所述第二语音信息中包含预设唤醒词,所述虚拟个人助理从未唤醒状态进入唤醒状态。
6.根据权利要求1所述的方法,其特征在于,在所述将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒之后,所述方法还包括:
当所述网络应用服务为音频服务时,对所述服务需求信息进行分析,确定所述服务需求信息中是否包含用于指示目标音频数据的音频标识信息,其中,所述音频标识信息为音频名称信息、音频类别信息、音频人物信息、音频标签信息和音频地理位置信息中的一种或多种;
如果确定所述服务需求信息中包含所述音频标识信息,从所述服务需求信息中提取所述音频标识信息;
基于所述音频标识信息,通过所述网络应用服务获取所述目标音频数据;
将所述目标音频数据输出至所述耳机。
7.根据权利要求6所述的方法,其特征在于,在所述基于所述音频标识信息,通过所述网络应用服务获取所述目标音频数据之前,所述方法还包括:
如果确定所述服务需求信息中不包含所述音频标识信息,接收所述用户通过耳机输入的第三语音信息,其中,所述第三语音信息用于指示所述音频标识信息;
对所述第三语音信息进行语音识别,从所述第三语音信息中提取所述音频标识信息。
8.一种唤醒应用服务的装置,其特征在于,所述装置包括:
第一接收单元,用于在虚拟个人助理处于唤醒状态下,接收用户通过耳机输入的第一语音信息;
第一确定单元,用于基于所述第一语音信息,确定所述用户的服务需求信息;
服务唤醒单元,用于将所述虚拟个人助理中的能够满足所述服务需求信息的网络应用服务唤醒,其中,所述网络应用服务由所述虚拟个人助理所关联的服务器提供。
9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1至7任一项所述的唤醒应用服务的方法的步骤。
10.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;
其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至7任一项所述的唤醒应用服务的方法的步骤。
CN201811023956.8A 2018-09-04 2018-09-04 一种唤醒应用服务的方法及装置 Pending CN108986814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811023956.8A CN108986814A (zh) 2018-09-04 2018-09-04 一种唤醒应用服务的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811023956.8A CN108986814A (zh) 2018-09-04 2018-09-04 一种唤醒应用服务的方法及装置

Publications (1)

Publication Number Publication Date
CN108986814A true CN108986814A (zh) 2018-12-11

Family

ID=64547761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811023956.8A Pending CN108986814A (zh) 2018-09-04 2018-09-04 一种唤醒应用服务的方法及装置

Country Status (1)

Country Link
CN (1) CN108986814A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109903763A (zh) * 2019-01-11 2019-06-18 百度在线网络技术(北京)有限公司 服务控制方法、装置及设备
CN110060678A (zh) * 2019-04-16 2019-07-26 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN110086930A (zh) * 2019-04-22 2019-08-02 努比亚技术有限公司 一种语音交互方法、可穿戴设备和计算机可读存储介质
CN111339348A (zh) * 2018-12-19 2020-06-26 北京京东尚科信息技术有限公司 信息服务方法、装置和系统
RU2735363C1 (ru) * 2019-08-16 2020-10-30 Бейджин Сяоми Мобайл Софтвеа Ко., Лтд. Способ и устройство для обработки звука и носитель информации
CN114115790A (zh) * 2021-11-12 2022-03-01 上汽通用五菱汽车股份有限公司 语音对话提示方法、装置、设备及计算机可读存储介质
CN115080149A (zh) * 2022-07-20 2022-09-20 荣耀终端有限公司 终端设备的控制方法和终端设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104243666A (zh) * 2013-06-13 2014-12-24 腾讯科技(深圳)有限公司 语言处理方法及装置
CN104239371A (zh) * 2013-06-24 2014-12-24 腾讯科技(深圳)有限公司 一种指令信息处理方法及装置
CN105183422A (zh) * 2015-08-31 2015-12-23 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
CN106531165A (zh) * 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
CN107122179A (zh) * 2017-03-31 2017-09-01 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
CN107710148A (zh) * 2015-09-30 2018-02-16 华为技术有限公司 一种语音控制的处理方法和装置
CN207053716U (zh) * 2017-07-12 2018-02-27 湖南海翼电子商务股份有限公司 一种耳机

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104243666A (zh) * 2013-06-13 2014-12-24 腾讯科技(深圳)有限公司 语言处理方法及装置
CN104239371A (zh) * 2013-06-24 2014-12-24 腾讯科技(深圳)有限公司 一种指令信息处理方法及装置
CN105183422A (zh) * 2015-08-31 2015-12-23 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
CN107710148A (zh) * 2015-09-30 2018-02-16 华为技术有限公司 一种语音控制的处理方法和装置
CN106531165A (zh) * 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
CN107122179A (zh) * 2017-03-31 2017-09-01 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
CN207053716U (zh) * 2017-07-12 2018-02-27 湖南海翼电子商务股份有限公司 一种耳机

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339348A (zh) * 2018-12-19 2020-06-26 北京京东尚科信息技术有限公司 信息服务方法、装置和系统
CN109903763A (zh) * 2019-01-11 2019-06-18 百度在线网络技术(北京)有限公司 服务控制方法、装置及设备
CN109903763B (zh) * 2019-01-11 2022-02-22 百度在线网络技术(北京)有限公司 服务控制方法、装置及设备
CN110060678A (zh) * 2019-04-16 2019-07-26 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN110060678B (zh) * 2019-04-16 2021-09-14 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN110086930A (zh) * 2019-04-22 2019-08-02 努比亚技术有限公司 一种语音交互方法、可穿戴设备和计算机可读存储介质
RU2735363C1 (ru) * 2019-08-16 2020-10-30 Бейджин Сяоми Мобайл Софтвеа Ко., Лтд. Способ и устройство для обработки звука и носитель информации
US11264027B2 (en) 2019-08-16 2022-03-01 Beijing Xiaomi Mobile Software Co., Ltd. Method and apparatus for determining target audio data during application waking-up
CN114115790A (zh) * 2021-11-12 2022-03-01 上汽通用五菱汽车股份有限公司 语音对话提示方法、装置、设备及计算机可读存储介质
CN115080149A (zh) * 2022-07-20 2022-09-20 荣耀终端有限公司 终端设备的控制方法和终端设备
CN115080149B (zh) * 2022-07-20 2023-06-27 荣耀终端有限公司 终端设备的控制方法和终端设备

Similar Documents

Publication Publication Date Title
CN108986814A (zh) 一种唤醒应用服务的方法及装置
CN108470034B (zh) 一种智能设备服务提供方法及系统
CN107832434A (zh) 基于语音交互生成多媒体播放列表的方法和装置
JP6783339B2 (ja) 音声を処理する方法及び装置
US20110066438A1 (en) Contextual voiceover
CN107623614A (zh) 用于推送信息的方法和装置
CN109493849A (zh) 语音唤醒方法、装置及电子设备
CN109543064A (zh) 歌词显示处理方法、装置、电子设备及计算机存储介质
CN108133707A (zh) 一种内容分享方法及系统
CN105264485A (zh) 在多个设备上提供内容
CN109257659A (zh) 字幕添加方法、装置、电子设备及计算机可读存储介质
CN104205209A (zh) 回放控制设备、回放控制方法和程序
CN106652996A (zh) 一种提示音生成方法和装置、移动终端
CN108899036A (zh) 一种语音数据的处理方法及装置
CN111640434A (zh) 用于控制语音设备的方法和装置
JP7497523B2 (ja) カスタム音色歌声の合成方法、装置、電子機器及び記憶媒体
JP2020149038A (ja) デバイスをウェイクアップするための方法及び装置
CN107591150A (zh) 语音识别方法及装置、计算机装置及计算机可读存储介质
CN107908743A (zh) 人工智能应用构建方法和装置
CN106297839A (zh) 一种音频播放设备
EP1402518A1 (en) Pattern processing system specific to a user group
WO2022262366A1 (zh) 跨设备的对话业务接续方法、系统、电子设备和存储介质
CN102868740A (zh) 基于移动通讯终端及互联网语音交互的玩具控制方法及系统
CN109065047B (zh) 一种唤醒应用服务的方法及装置
CN107205095A (zh) 语音信息的播放方法、装置及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181211

RJ01 Rejection of invention patent application after publication