CN109801620A - 文书编辑软件的语音控制方法及语音控制系统 - Google Patents
文书编辑软件的语音控制方法及语音控制系统 Download PDFInfo
- Publication number
- CN109801620A CN109801620A CN201711318291.9A CN201711318291A CN109801620A CN 109801620 A CN109801620 A CN 109801620A CN 201711318291 A CN201711318291 A CN 201711318291A CN 109801620 A CN109801620 A CN 109801620A
- Authority
- CN
- China
- Prior art keywords
- execution
- information
- editing
- feature
- phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供一种文书编辑软件的语音控制方法及系统,透过对输入的语音指令进行解析以得到相应的语音特征,据以令文书编辑软件执行相应的操作,藉以简化文书编辑操作,并提升用户的文书编辑软件的使用体验。
Description
技术领域
本发明涉及人机交互技术领域,更详而言的,指一种文书编辑软件的语音控制方法及系统。
背景技术
随着电子科技的不断发展,人们的日常工作和学习生活越来越离不开电子科技,而为了满足不同使用群体的使用需求,目前大多数的电子设备支持有语音输入功能,此功能可以极大地方便用户进行文字信息的输入操作。
然而,在现有技术中,针对文书编辑软件而言,仅针对文字信息的输入提供语音输入控制功能,然大都不支持文字的编辑操作,也就是针对文书编辑软件中的执行工具及其执行内容不提供语音输入控制的功能。以word文书编辑软件而言,当用户在编辑界面中输入了文字内容的后,还需要针对编辑界面中所显示的文字信息进行编辑,例如,字体、字体颜色、行间距等文字内容的编辑操作,或者打印、邮件等文档处理操作,目前,这些编辑操作还需依赖于使用者通过手工输入来完成,也就是需在word文书编辑软件的工具栏中找到相应的执行工具按钮,然后通过点选进入所述执行工具的操作界面,再于所述操作界面中选择相应的执行内容,才能实现上述的文字信息的编辑操作,所述操作过程较为繁复,且对于word文书编辑软件的操作界面不甚熟悉的操作者而言,往往需要花费很多时间在众多的执行工具选择中找出其所需要的执行工具,此极大地影响了使用者的使用体验,并降低了文字编辑的工作效率。
有鉴于此,如何提供一种文书编辑软件的输入控制方法,以克服习知技术中所存在的技术问题,乃为本申请待解决的技术课题。
发明内容
鉴于上述先前技术的缺点,本发明的主要目的提供一种文书编辑软件的语音控制方法及系统,可通过语音输入方式控制执行文书编辑操作,以简化文书编辑操作,并提升用户的文书编辑使用体验。
为达到上述目的以及其他目的,本发明提供一种文书编辑软件的语音控制方法,以语音方式控制文书编辑软件执行操作,所述语音控制方法包括:提供一语音指令数据库,以供储存一执行工具信息及其对应的至少一第一语音特征,以及储存一执行内容信息及其对应的至少一第二语音特征,其中所述执行工具信息对应于所述文书编辑软件的执行工具,所述执行内容信息对应于所述执行工具中的执行内容;输入一语音指令;解析所述语音指令的特征组成;当所述语音指令的特征组成与所述第一语音特征相符时,自所述语音指令数据库中提取与所述第一语音特征相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具;当所述语音指令的特征组成与所述第二语音特征相符时,自所述语音指令数据库中提取与所述第二语音特征相对应的执行内容信息,且当与所述第二语音特征对应执行内容的执行工具开启时,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作;以及,当所述语音指令的特征组成同时与所述第一、第二语音特征相符时,首先,自所述语音指令数据库中提取与所述第一语音特征信息相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具,而后,自所述语音指令数据库中提取与所述第二语音特征信息相对应的执行内容信息,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。
较佳地,于上述文书编辑软件的语音控制方法中,还包括提供输入一语音控制开启指令,令所述文书编辑软件根据所述输入的语音控制开启指令而启动一语音控制应用,而依据所输入的所述语音指令执行相应的操作。
较佳地,于上述文书编辑软件的语音控制方法中,所述文书编辑软件执行时提供有一执行窗口,所述执行窗口包含有一文书编辑界面与一执行工具栏界面,所述文书编辑界面用于显示文书编辑的状态,所述执行工具栏界面用于启动所述执行工具,当所述文书编辑软件的所述语音控制应用启动时,自动关闭所述执行工具栏界面,而使所述文书编辑界面占满所述执行窗口。
较佳地,于上述文书编辑软件的语音控制方法中,所述文书编辑软件执行时提供一浮动式指令触发界面,所述浮动式指令触发界面浮动设置于所述文书编辑界面,供触发生成所述语音控制开启指令。
较佳地,于上述文书编辑软件的语音控制方法中,所述文书编辑软件执行时提供一透明度调整界面,所述透明度调整界面用于调整所述浮动式指令触发界面于所述文书编辑界面上的透明度。
较佳地,于上述文书编辑软件的语音控制方法中,还包括提供一语音特征自定义界面,针对所述执行工具信息自定义所述第一语音特征,或者,针对所述执行内容信息自定义所述第二语音特征。
较佳地,于上述文书编辑软件的语音控制方法中,其中,所述执行内容信息包括执行一浏览文文件指令或执行至少一项编辑文文件指令。
较佳地,于上述文书编辑软件的语音控制方法中,还包括提供一语料数据库,储存语料数据,所述方法还包括依据所述语料数据对所述语音指令执行一语义解析处理,以解析所述语音指令的特征组成
较佳地,于上述文书编辑软件的语音控制方法中,还包括提供所述语音指令数据库储存一脚本信息及其对应的至少一第三语音特征,其中所述脚本信息包括复数所述执行内容信息,各所述执行内容信息对应于不同的所述执行工具中的执行内容;以及当解析所述语音指令的特征组成与所述第三语音特征相符时,自所述语音指令数据库中提取所述脚本信息,以令所述文书编辑软件运行所述脚本信息,而依序执行所述脚本信息中所包含的所述复数执行内容信息。
本发明还提供一种文书编辑软件的语音控制系统,以语音方式控制文书编辑软件执行操作,所述语音控制系统包括:用于储存一执行工具信息及其对应的至少一第一语音特征的一语音指令数据库,以及储存一执行内容信息及其对应的至少一第二语音特征,其中所述执行工具信息对应于所述文书编辑软件的执行工具,所述执行内容信息对应于执行工具中的执行内容;提供输入一语音指令的一语音输入模块;用于解析所述语音指令的特征组成的一解析模块;以及一执行模块,依据所述解析模块的解析结果,控制所述文书编辑软件执行相应的操作,其中,当所述解析模块的解析结果为所述语音指令的特征组成与所述第一语音特征相符时,所述执行模块自所述语音指令数据库中提取与所述第一语音特征相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具;当所述解析模块的解析结果为所述语音指令的特征组成与所述第二语音特征相符时,所述执行模块自所述语音指令数据库中提取与所述第二语音特征相对应的执行内容信息,且当与所述第二语音特征对应执行内容的执行工具开启时,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作;当所述解析模块的解析结果为所述语音指令的特征组成同时与所述第一、第二语音特征相符时,所述执行模块首先自所述语音指令数据库中提取与所述第一语音特征信息相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具,而后自所述语音指令数据库中提取与所述第二语音特征信息相对应的执行内容信息,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。
较佳地,于上述文书编辑软件的语音控制系统中,还包括一触发模块,提供输入一语音控制开启指令,使所述文书编辑软件根据所述输入的语音控制开启指令启动语音控制应用,而藉由所述语音输入模块输入所述语音指令,并依据输入的所述语音指令执行相应的操作。
较佳地,于上述文书编辑软件的语音控制系统中,所述文书编辑软件执行时提供有一执行窗口,所述执行窗口包含有一文书编辑界面与一执行工具栏界面,所述文书编辑界面用于显示文书编辑的状态,所述执行工具栏界面用于启动所述执行工具,所述触发模块还包括当启动所述文书编辑软件的所述语音控制应用时,自动关闭所述执行工具栏界面,而使所述文书编辑界面占满所述执行窗口。
较佳地,于上述文书编辑软件的语音控制系统中,所述触发模块为所述文书编辑软件执行时所提供的一浮动式指令触发界面,所述浮动式指令触发界面浮动设置于所述文书编辑界面,供触发生成所述语音控制开启指令。
较佳地,于上述文书编辑软件的语音控制系统中,还包括一透明度调整模块,为所述文书编辑软件执行时所提供的一透明度调整界面,用于调整所述浮动式指令触发界面于所述文书编辑界面上的透明度。
较佳地,于上述文书编辑软件的语音控制系统中,还包括一自定义模块,提供一语音特征自定义界面,针对所述执行工具信息自定义所述第一语音特征,或者,针对所述执行内容信息自定义所述第二语音特征。
较佳地,于上述文书编辑软件的语音控制系统中,所述执行内容信息包括执行一浏览文文件指令或执行至少一项编辑文文件指令。
较佳地,于上述文书编辑软件的语音控制系统中,还包括提供一语料数据库,储存语料数据,供所述解析模块依据所述语料数据对所述语音指令执行一语义解析处理,以解析所述语音指令的特征组成。
较佳地,于上述文书编辑软件的语音控制系统中,所述语音指令数据库还储存一脚本信息及其对应的至少一第三语音特征,其中所述脚本信息包括复数所述执行内容信息,各所述执行内容信息对应于不同的所述执行工具中的执行内容;且当所述解析模块解析所述语音指令的特征组成与所述第三语音特征相符时,所述执行模块还包括自所述语音指令数据库中提取所述脚本信息,以令所述文书编辑软件运行所述脚本信息,而依序执行所述脚本信息中所包含的所述复数执行内容信息。
较佳地,于上述文书编辑软件的语音控制系统中,所述文书编辑软件装载并运行于一电子设备中,所述语音输入模块为装载于所述电子设备中的麦克风。
综上所述,本发明的文书编辑软件的语音控制方法及系统透过预先建立语音指令数据库,以针对文书编辑软件中的执行工具及其执行内容编辑对应的语音特征,通过解析所输入的语音指令中包含的语音特征,而实现以语音方式控制文书编辑软件执行操作的目的,以简化文书编辑操作的复杂度,并提升文书编辑软件的使用体验。
再者,透过对所述的语音指令进行语义分析以及提供用户自定义语音特征,而使语音控制更符合用户自身的操作习惯。此外,更可针对一脚本信息定义对应的语音特征,以供用户仅需输入简单的语音指令,即可令文书编辑软件依序执行多项执行内容,以提高工作效率。
附图说明
图1为显示本发明的文书编辑软件的语音控制系统的基本架构示意图;
图2至图4为显示本发明的文书编辑软件的语音控制系统的不同实施例示意图;
图5为显示本发明的文书编辑软件的语音控制方法的步骤流程图;以及
图6A至图6C为显示本发明的文书编辑软件的不同的执行工具的界面操作实施例示意图。
元件标号说明
1 语音控制系统
11 语音指令数据库
12 语音输入模块
13 解析模块
14 执行模块
15 触发模块
16 透明度调整模块
17 自定义模块
18 语料数据库
2 文书编辑软件
61 “视图”执行工具的操作界面
611~615 “视图”执行工具下的执行内容
62 “字体”执行工具的操作界面
621~624 “字体”执行工具下的执行内容
63 “段落”执行工具的操作界面
631~633 “段落”执行工具下的执行内容
S501~S5043 步骤
具体实施方式
以下内容将搭配图式,藉由特定的具体实施例说明本发明的技术内容,熟悉此技术的人士可由本说明书所揭示的内容轻易地了解本发明的其他优点与功效。本发明亦可藉由其他不同的具体实施例加以施行或应用。本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下,进行各种修饰与变更。尤其是,于图式中各个组件的比例关及相对位置仅具示范性用途,并非代表本发明实施的实际状况。
图1为本申请的文书编辑软件的语音控制系统的基本架构示意图。如图所示,本申请的语音系统1搭载于文书编辑软件2中,文书编辑软件2可为装载并运行于一电子设备(未予图标)中的应用软件,其中,电子设备例如为桌面计算机、笔记本计算机、平板计算机等,而文书编辑软件2则例如为装载并运行于笔记本计算机中的Microsoft Office应用软件(包括word、outlook、excel等),然并不以此为限,其他任何现有的文书编辑软件均可适用。以下将以文书编辑软件2为microsoft word应用软件为例,详细说明本申请的语音控制系统1。
如图1所示,语音控制系统1包括一语音指令数据库11、一语音输入模块12、一解析模块13、以及一执行模块14。
语音指令数据库11用于储存一执行工具信息及其对应的至少一第一语音特征,以及储存一执行内容信息及其对应的至少一第二语音特征,其中,所述执行工具信息可对应于文书编辑软件2的执行工具,所述执行内容信息对应于执行工具中的执行内容。于本实施例中,所述执行内容信息包括执行一浏览文文件指令或执行至少一项编辑文文件指令,当执行内容信息包括浏览文文件指令时,其可例如为microsoftword应用软件的“视图”工具选项61,而对应于“视图”执行工具下的执行内容则例如为“页面视图611”、“阅读版式视图612”、“WEB版式视图613”、“大纲视图614”、“普通视图615”等内容选项(如图6A所示),当执行内容信息包括编辑文文件指令时,其可例如为microsoftword应用软件中的“字体”工具选项62,而对应于“字体”执行工具下的执行内容则例如为“字形621”、“字号622”、“字体颜色623”、“字体的效果624”等内容选项(如图6B所示);又如,当执行工具对应于microsoftword应用软件中“段落”的工具选项63时,则执行内容63可对应于“常规631”、“缩进632”、“间距633”等内容选项(如图6C所示)。此外,与执行工具信息所对应的第一语音特征可与所述执行工具信息的名称完全吻合,抑或仅包含执行工具信息的名称中的部分关键词,而与执行内容信息所对应的第二语音特征亦是如此。例如,对应于执行工具为“页面布局“的第一语音特征,可以是完整的“页面布局”,也可以是“布局”两个关键词即可。
于本申请的一实施例中,语音指令数据库11中还可用于储存一脚本信息及其对应的至少一第三语音特征,其中,所述脚本信息可包括复数所述执行内容信息,而各所述执行内容信息对应于不同的所述执行工具中的执行内容,藉此,当文书编辑软件2需连续执行多个编辑操作时,可将所述多个编辑操作编辑为一脚本信息,并针对所述脚本信息设定对应的第三语音特征,藉此,当后续用户需令文书编辑软件2执行所述多个编辑操作时,仅需一次性输入简单的语音指令即可,而无需分批输入各编辑操作所对应的执行工具及其执行内容的语音指令,以简化用户的操作。
语音输入模块12用于提供输入一语音指令。于本实施例中,语音输入模块12例如为装载于电子设备中的麦克风。
解析模块13用于解析语音输入模块12所输入的语音指令的特征组成,而执行模块14则用以依据解析模块13的解析结果,而控制所述文书编辑软件2执行相应的操作。
具体而言,当解析模块13的解析结果为语音指令的特征组成与语音指令数据库11中储存的第一语音特征相符时,则执行模块14自语音指令数据库11中提取与第一语音特征相对应的执行工具信息,以令文书编辑软件2依据执行工具信息开启相应的执行工具。例如,当解析模块13解析出用户所输入的语音指令中包含“字体”的特征组成时,则执行模块14自语音指令数据库11中查找出与的相符合的第一语音特征,并自语音指令数据库11中提取与所述第一语音特征相对应的执行工具信息,而令文书编辑软件2据以开启“字体”的执行工具。
当解析模块13的解析结果为语音指令的特征组成与第二语音特征相符时,则执行模块14自语音指令数据库11中提取与第二语音特征相对应的执行内容信息,且当与第二语音特征对应执行内容的执行工具开启时,令文书编辑软件2依据执行内容信息择取执行工具中对应的执行选项内容,并据以执行相应的操作。例如,当解析模块13解析出用户所输入的语音指令中包含“字形”的特征组成时,执行模块14自语音指令数据库11中查找与的相吻合的第二语音特征,并提取所述第二语音特征所对应的执行内容信息,即“字形”,而后分析所述执行内容所属的执行工具是否已经开启,即判断文书编辑软件2当前是否已经开启“字体”的执行工具,且当判断结果为已开启时,令文书编辑软件2执行“字形”的编辑操作。
当解析模块13的解析结果为语音指令的特征组成同时与所述第一、第二语音特征相符时,执行模块14首先自语音指令数据库11中提取与所述第一语音特征信息相对应的执行工具信息,以令文书编辑软件2依据所述执行工具信息开启相应的执行工具,而后自语音指令数据库11中提取与所述第二语音特征信息相对应的执行内容信息,令文书编辑软件2依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。例如,当解析模块13解析出用户所输入的语音指令中同时包含有“字体”以及“字形”的特征组成时,则执行模块14首先自语音指令数据库11中提取与“字体”相吻合的第一语音特征,并调取与的相对应的执行工具信息,以令文书编辑软件2开启“字体”的执行工具,而后再从语音指令数据库11中提取与“字形”相吻合的第二语音特征,并调取与的相对应的执行内容信息,以令文书编辑软件2执行“字形”的编辑操作。
再者,当解析模块13的解析结果为语音指令的特征组成与所述第三语音特征相符时,则执行模块14自语音指令数据库11中提取与第三语音特征所对应的脚本信息,以令文书编辑软件2运行所述脚本信息,而依序执行所述脚本信息中所包含的多个执行内容信息。例如当使用者输入包含有“发邮件给小明”的特征组成的语音指令时,则执行模块14自语音指令数据库11中提取与的相吻合的第三语音特征,并调取与所述第三语音特征相对应的脚本信息,而令文书编辑软件2运行所述脚本信息,包括,首先打开“邮件”的执行工具,而后执行“编辑新邮件”的执行内容,并自联人信息中找到“小明”的联信息以自动填入“收件人”字段,并自邮件设置中找出对应的“邮件签名”(如果已有设置的话),并将所设置的“邮件签名”附于邮件正文的末端,而后执行邮件发送任务以发送邮件给小明,从而完成所述脚本信息的运行。
请配合参阅图2,于本发明的一实施例中,语音控制系统1还包括一触发模块15,其用于提供输入一语音控制开启指令,使文书编辑软件2根据所述输入的语音控制开启指令以启动语音控制应用,而藉由语音输入模块12输入所述语音指令,并依据输入的所述语音指令执行相应的操作。于本实施例中,触发模块15可例如为显示于文书编辑软件2的文书编辑界面中的一功能按钮,当用户透过例如鼠标、键盘等输入模块选中所述功能按钮时,则语音控制系统1即触发语音输入模块12启动执行语音指令的采集操作。
于一实施例中,文书编辑软件2在执行时提供有一执行窗口,其中,所述执行窗口中包含有一文书编辑界面以及一执行工具栏界面,所述文书编辑界面用于显示文书编辑的状态,而所述执行工具栏界面则用于启动所述执行工具。较佳者,在当触发模块15启动文书编辑软件2的所述语音控制应用时,可令文书编辑软件2自动关闭所述执行工具栏界面,而使所述文书编辑界面占满所述执行窗口,从而提供一更大的文书编辑界面,以利于使用者浏览。于本实施例中,触发模块15则例如为文书编辑软件2于执行时所提供的一浮动式指令触发界面,并浮动设置于所述文书编辑界面中,于被触发时,生成所述语音控制开启指令,以令文书编辑软件2启动语音控制功能而依据所输入的语音指令执行相应的编辑操作。
再者,如图3所示,为了提高使用者的文书编辑使用体验,本申请的语音控制系统1还包括一透明度调整模块16,其为文书编辑软件2执行时所提供的一透明度调整界面,用于调整所述浮动式指令触发界面于所述文书编辑界面上的透明度。例如,当用户暂时无需使用触发模块15以触发语音控制开启指令时,可利用透明度调整模块16而将所述浮动式指令触发界面调整为透明状,以不影响文书编辑界面的正常使用,即令浮动式指令触发界面不会遮挡住文书编辑界面。
请继续参阅图4,为使本申请更符合人性化的使用需求,以迎合不同用户的使用习惯,语音控制系统1还包括有一自定义模块17,提供一语音特征自定义界面,针对所述执行工具信息自定义所述第一语音特征,或者,针对所述执行内容信息自定义所述第二语音特征。也就是说,使用者可以根据自身的使用习惯,而设定带有个人属性的第一语音特征和第二语音特征,举例而言,设置不同语言版本的第一语音特征和第二语音特征,例如将执行工具为“邮件”所对应的第一语音特征设定为“email”。
请继续参阅图4,于另一实施例中,语音控制系统1还可包括一语料数据库18,其可用于储存语料数据,供解析模块13依据语料数据库18中所储存的所述语料数据而对语音输入模块12所输入的所述语音指令执行一语义解析处理,以解析所述语音指令的特征组成。例如,当用户输入的语音指令为“字太大”,则语音控制系统1可按照语料数据库18中储存的语料数据而分析出用户希望进行“调整字号”的编辑操作,则令文书编辑软件2据以开启“字体”的执行工具,并执行“字号”的编辑操作。
请配合参阅图5,其为显示本申请的文书编辑软件的语音控制方法的步骤流程图。本申请的语音控制方法用于提供以语音方式控制文书编辑软件执行操作。如图所示,所述语音控制方法的步骤流程主要包括:
步骤S501,提供一语音指令数据库,以供储存一执行工具信息及其对应的至少一第一语音特征,以及储存一执行内容信息及其对应的至少一第二语音特征,其中所述执行工具信息对应于所述文书编辑软件的执行工具,所述执行内容信息对应于所述执行工具中的执行内容。于本实施例中,所述执行内容信息包括执行一浏览文文件指令或执行至少一项编辑文文件指令,当执行内容信息包括浏览文文件指令时,其可例如为microsoftword应用软件的“视图”工具选项61,而对应于“视图”执行工具下的执行内容则例如为“页面视图611”、“阅读版式视图612”、“WEB版式视图613”、“大纲视图614”、“普通视图615”等内容选项(如图6A所示),当执行内容信息包括编辑文文件指令时,其可例如为microsoftword应用软件中的“字体”工具选项62,而对应于“字体”执行工具62下的执行内容则例如为“字形621”、“字号622”、“字体颜色623”、“字体的效果624”等内容选项(如图6B所示);又如,当执行工具对应于microsoft word应用软件中“段落”的工具选项63时,则执行内容63可对应于“常规631”、“缩进632”、“间距633”等内容选项(如图6C所示)。此外,与执行工具信息所对应的第一语音特征可与所述执行工具信息的名称完全吻合,抑或包含有执行工具信息中至少两个相同的关键词,与执行内容信息所对应的第二语音特征亦是如此。例如,对应于执行工具为“页面布局“的第一语音特征,可以是“页面布局”抑或“布局”。
于本申请的一实施例中,语音指令数据库中还可用于储存一脚本信息及其对应的至少一第三语音特征,其中,所述脚本信息可包括复数所述执行内容信息,而各所述执行内容信息对应于不同的所述执行工具中的执行内容,藉此,当文书编辑软件需连续执行多个编辑操作时,可将所述多个编辑操作编辑为一脚本信息,并针对所述脚本信息设定对应的第三语音特征,藉此,当后续用户需令文书编辑软件2执行所述多个编辑操作时,仅需一次性输入简单的语音指令即可,而无需分批输入各编辑操作所对应的执行工具及其执行内容的语音指令,以简化用户的操作。
步骤S502,输入一语音指令。于本实施例中,可例如藉由装载于电子设备中的麦克风输入所述语音指令。
步骤S503,解析所述语音指令的特征组成,例如使用语音识别技术将所述语音指令转换为对应的文字信息,以分析所述语音指令中的特征组成,接着按照解析结果,选择执行步骤S5041、S5042或S5043中的一者。
步骤S5041,当所述语音指令的特征组成与所述第一语音特征相符时,自所述语音指令数据库中提取与所述第一语音特征相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具。例如,当解析出用户所输入的语音指令中包含“字体”的特征组成时,则自语音指令数据库中查找出与的相符合的第一语音特征,并自语音指令数据库中提取与所述第一语音特征相对应的执行工具信息,而令文书编辑软件据以开启“字体”的执行工具。
步骤S5042,当所述语音指令的特征组成与所述第二语音特征相符时,自所述语音指令数据库中提取与所述第二语音特征相对应的执行内容信息,且当与所述第二语音特征对应执行内容的执行工具开启时,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。例如,当解析出用户所输入的语音指令中包含“字形”的特征组成时,自语音指令数据库11中查找与的相吻合的第二语音特征,并提取所述第二语音特征所对应的执行内容信息,即“字形”,而后分析所述执行内容所属的执行工具是否已经开启,即判断文书编辑软件当前是否已经开启“字体”的执行工具,且当判断结果为已开启时,令文书编辑软件执行“字形”的编辑操作。
步骤S5043,当所述语音指令的特征组成同时与所述第一、第二语音特征相符时,首先,自所述语音指令数据库中提取与所述第一语音特征信息相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具,而后,自所述语音指令数据库中提取与所述第二语音特征信息相对应的执行内容信息,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。例如,当解析出用户所输入的语音指令中同时包含有“字体”以及“字形”的特征组成时,则首先自语音指令数据库中提取与“字体”相吻合的第一语音特征,并调取与的相对应的执行工具信息,以令文书编辑软件开启“字体”的执行工具,而后再从语音指令数据库中提取与“字形”相吻合的第二语音特征,并调取与的相对应的执行内容信息,以令文书编辑软件执行“字形”的编辑操作。
此外,于其他实施例中,当解析结果为语音指令的特征组成与所述第三语音特征相符时,则自语音指令数据库中提取与第三语音特征所对应的脚本信息,以令文书编辑软件运行所述脚本信息,而依序执行所述脚本信息中所包含的多个执行内容信息。例如当使用者输入包含有“发邮件给小明”的特征组成的语音指令时,则自语音指令数据库中提取与的相吻合的第三语音特征,并调取与所述第三语音特征相对应的脚本信息,而令文书编辑软件运行所述脚本信息,包括,首先打开“邮件”的执行工具,而后执行“编辑新邮件”的执行内容,并自联人信息中找到“小明”的联信息以自动填入“收件人”字段,并自邮件设置中找出对应的“邮件签名”(如果已有设置的话),并将设置的“邮件签名”附于邮件正文的末端,而后执行邮件发送任务以发送邮件给小明,从而完成脚本信息的运行。
于一实施例中,所述方法还包括提供输入一语音控制开启指令,令文书编辑软件根据所输入的语音控制开启指令而启动一语音控制应用,而依据所输入的所述语音指令执行相应的操作。于本实施例中,可例如于文书编辑软件的文书编辑界面中显示一功能按钮,当用户透过例如鼠标、键盘等输入模块选中所述功能按钮时,即触发执行语音指令的采集操作。
较佳者,文书编辑软件于执行时提供有一执行窗口,所述执行窗口包含有一文书编辑界面与一执行工具栏界面,其中,文书编辑界面用于显示文书编辑的状态,而执行工具栏界面则用于启动所述执行工具,当文书编辑软件的语音控制应用启动时,文书编辑软件可自动关闭所述执行工具栏界面,而使文书编辑界面占满所述执行窗口。,从而提供使用者具有一更大的文书编辑界面,以利于编辑操作。此外,文书编辑软件于执行时还可提供一浮动式指令触发界面,其可浮动设置于文书编辑界面中,供触发生成所述语音控制开启指令。再者,当文书编辑软件在执行时,还可提供一透明度调整界面,以提供用户调整浮动式指令触发界面于所述文书编辑界面上的透明度。例如,当用户暂时无需使用语音控制开启指令时,可利用所述透明度调整界面而将所述浮动式指令触发界面调整为透明状,以不影响文书编辑界面的正常编辑使用,即浮动式指令触发界面不会遮挡住文书编辑界面。
为使本申请更符合人性化的使用需求,以迎合不同使用者的使用习惯,于另一实施例中,所述方法还包括提供一语音特征自定义界面,针对所述执行工具信息自定义所述第一语音特征,或者,针对所述执行内容信息自定义所述第二语音特征,也就是说,使用者可以根据自身的使用习惯,而设定带有个人属性的第一语音特征和第二语音特征,举例而言,设置不同语言版本的第一语音特征和第二语音特征,例如将执行工具为“邮件”所对应的第一语音特征设定为“email”。
于另一实施例中,还可提供建立一语料数据库,以储存语料数据,依据所述语料数据对所述语音指令执行一语义解析处理,以解析所述语音指令的特征组成。例如,当用户输入的语音指令为“字太大”,则语音控制系统1可按照语料数据库18中储存的语料数据而分析出用户希望进行“调整字号”的编辑操作,则令文书编辑软件2据以开启“字体”的执行工具,并执行“字号”的编辑操作。
由上可知,本发明所提供的文书编辑软件的语音控制方法及系统,透过建立语音指令数据库,以储存文书编辑软件中所包含的执行工具及其执行内容所对应的语音特征,于用户输入语音指令时,通过解析所述语音指令中的特征组成,并与语音数据库中储存的语音特征进行比对,以控制文书编辑软件调用相应的执行工具及其执行内容而执行编辑操作任务,无需用户手动查找相应的工具栏来执行编辑操作,可以简化文书编辑操作的复杂度,并提高文书编辑软件的使用体验。
再者,本发明透过提供自定义语音特征,并建立可针对语音指令执行语义解析处理的语料数据库,据以分析语音指令的特征组成,以使所输入的语音指令更符合人性化的使用需求。
此外,本申请的语音数据库还可针对脚本信息定义对应的语音特征,供用户仅需输入一简单的语音指令,即可令文书编辑软件通过运行脚本信息,而依序执行脚本信息中所包含的多个执行内容,以辅助提高工作效率。
上述实施例仅例示性说明本发明的原理及功效,而非用于限制本发明。任何熟习此项技术的人士均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如本发明申请专利范围所列。
Claims (12)
1.一种文书编辑软件的语音控制方法,其特征在于,以语音方式控制文书编辑软件执行操作,所述语音控制方法包括:
提供一语音指令数据库,以供储存一执行工具信息及其对应的至少一第一语音特征,以及储存一执行内容信息及其对应的至少一第二语音特征,其中所述执行工具信息对应于所述文书编辑软件的执行工具,所述执行内容信息对应于所述执行工具中的执行内容;
输入一语音指令;
解析所述语音指令的特征组成;
当所述语音指令的特征组成与所述第一语音特征相符时,自所述语音指令数据库中提取与所述第一语音特征相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具;
当所述语音指令的特征组成与所述第二语音特征相符时,自所述语音指令数据库中提取与所述第二语音特征相对应的执行内容信息,且当与所述第二语音特征对应执行内容的执行工具开启时,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作;以及
当所述语音指令的特征组成同时与所述第一、第二语音特征相符时,首先,自所述语音指令数据库中提取与所述第一语音特征信息相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具,而后,自所述语音指令数据库中提取与所述第二语音特征信息相对应的执行内容信息,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。
2.如权利要求1所述的语音控制方法,其特征在于,还包括提供输入一语音控制开启指令,令所述文书编辑软件根据所述输入的语音控制开启指令而启动一语音控制应用,而依据所输入的所述语音指令执行相应的操作。
3.如权利要求1所述的语音控制方法,其特征在于,还包括提供一语音特征自定义界面,针对所述执行工具信息自定义所述第一语音特征,或者,针对所述执行内容信息自定义所述第二语音特征。
4.如权利要求1所述的语音控制方法,其特征在于,所述执行内容信息包括执行一浏览文文件指令或执行至少一项编辑文文件指令。
5.如权利要求1所述的语音控制方法,其特征在于,还包括提供一语料数据库,储存语料数据,所述方法还包括依据所述语料数据对所述语音指令执行一语义解析处理,以解析所述语音指令的特征组成。
6.如权利要求1所述的语音控制方法,其特征在于,还包括:
提供所述语音指令数据库储存一脚本信息及其对应的至少一第三语音特征,其中所述脚本信息包括复数所述执行内容信息,各所述执行内容信息对应于不同的所述执行工具中的执行内容;以及
当解析所述语音指令的特征组成与所述第三语音特征相符时,自所述语音指令数据库中提取所述脚本信息,以令所述文书编辑软件运行所述脚本信息,而依序执行所述脚本信息中所包含的所述复数执行内容信息。
7.一种文书编辑软件的语音控制系统,以语音方式控制文书编辑软件执行操作,其特征在于,所述语音控制系统包括:
一语音指令数据库,用于储存一执行工具信息及其对应的至少一第一语音特征,以及储存一执行内容信息及其对应的至少一第二语音特征,其中所述执行工具信息对应于所述文书编辑软件的执行工具,所述执行内容信息对应于执行工具中的执行内容;
一语音输入模块,提供输入一语音指令;
一解析模块,用于解析所述语音指令的特征组成;以及
一执行模块,依据所述解析模块的解析结果,控制所述文书编辑软件执行相应的操作,其中,
当所述解析模块的解析结果为所述语音指令的特征组成与所述第一语音特征相符时,所述执行模块自所述语音指令数据库中提取与所述第一语音特征相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具;
当所述解析模块的解析结果为所述语音指令的特征组成与所述第二语音特征相符时,所述执行模块自所述语音指令数据库中提取与所述第二语音特征相对应的执行内容信息,且当与所述第二语音特征对应执行内容的执行工具开启时,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作;
当所述解析模块的解析结果为所述语音指令的特征组成同时与所述第一、第二语音特征相符时,所述执行模块首先自所述语音指令数据库中提取与所述第一语音特征信息相对应的执行工具信息,以令所述文书编辑软件依据所述执行工具信息开启相应的执行工具,而后自所述语音指令数据库中提取与所述第二语音特征信息相对应的执行内容信息,令所述文书编辑软件依据所述执行内容信息择取所述执行工具中对应的执行选项内容,并据以执行相应的操作。
8.如权利要求7所述的语音控制系统,其特征在于,还包括一触发模块,提供输入一语音控制开启指令,使所述文书编辑软件根据所述输入的语音控制开启指令启动语音控制应用,而藉由所述语音输入模块输入所述语音指令,并依据输入的所述语音指令执行相应的操作。
9.如权利要求7所述的语音控制系统,其特征在于,还包括一自定义模块,提供一语音特征自定义界面,针对所述执行工具信息自定义所述第一语音特征,或者,针对所述执行内容信息自定义所述第二语音特征。
10.如权利要求7所述的语音控制系统,其特征在于,所述执行内容信息包括执行一浏览文文件指令或执行至少一项编辑文文件指令。
11.如权利要求7所述的语音控制系统,其特征在于,还包括提供一语料数据库,储存语料数据,供所述解析模块依据所述语料数据对所述语音指令执行一语义解析处理,以解析所述语音指令的特征组成。
12.如权利要求7所述的语音控制系统,其特征在于,所述语音指令数据库还储存一脚本信息及其对应的至少一第三语音特征,其中所述脚本信息包括复数所述执行内容信息,各所述执行内容信息对应于不同的所述执行工具中的执行内容;且当所述解析模块解析所述语音指令的特征组成与所述第三语音特征相符时,所述执行模块还包括自所述语音指令数据库中提取所述脚本信息,以令所述文书编辑软件运行所述脚本信息,而依序执行所述脚本信息中所包含的所述复数执行内容信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106139781 | 2017-11-16 | ||
TW106139781A TWI664536B (zh) | 2017-11-16 | 2017-11-16 | 文書編輯軟體之語音控制方法及語音控制系統 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109801620A true CN109801620A (zh) | 2019-05-24 |
Family
ID=66556150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711318291.9A Pending CN109801620A (zh) | 2017-11-16 | 2017-12-12 | 文书编辑软件的语音控制方法及语音控制系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109801620A (zh) |
TW (1) | TWI664536B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291539A (zh) * | 2020-01-21 | 2020-06-16 | 深圳精匠云创科技有限公司 | 文件编辑控制方法、装置、计算机装置及存储介质 |
CN113127105A (zh) * | 2021-03-18 | 2021-07-16 | 福建马恒达信息科技有限公司 | 一种excel自动语音工具调用方法 |
CN113157351A (zh) * | 2021-03-18 | 2021-07-23 | 福建马恒达信息科技有限公司 | 一种用于表格工具快捷调用的语音插件构建方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1229216A (zh) * | 1998-03-16 | 1999-09-22 | 致伸实业股份有限公司 | 可接受语音指令的视窗显示系统 |
TW502196B (en) * | 1998-02-25 | 2002-09-11 | Primax Electronics Ltd | Window display system capable of receiving speech commands |
CN1585969A (zh) * | 2001-11-16 | 2005-02-23 | 皇家飞利浦电子股份有限公司 | 在预定窗口编辑文本的装置 |
TW201030734A (en) * | 2009-02-06 | 2010-08-16 | Aten Int Co Ltd | Voice recognition device and operating method thereof |
CN102510426A (zh) * | 2011-11-29 | 2012-06-20 | 安徽科大讯飞信息科技股份有限公司 | 个人助理应用访问方法及系统 |
CN104992709A (zh) * | 2015-06-25 | 2015-10-21 | 广州视源电子科技股份有限公司 | 一种语音指令的执行方法及语音识别设备 |
CN105551492A (zh) * | 2015-12-04 | 2016-05-04 | 青岛海信传媒网络技术有限公司 | 语音控制的方法、装置与终端 |
CN106653011A (zh) * | 2016-09-12 | 2017-05-10 | 努比亚技术有限公司 | 一种语音控制方法、装置及终端 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324406B (zh) * | 2012-03-23 | 2018-02-27 | 联想(北京)有限公司 | 一种控制方法及一种受控设备 |
CN105161099B (zh) * | 2015-08-12 | 2019-11-26 | 恬家(上海)信息科技有限公司 | 一种语音控制的遥控装置及其实现方法 |
CN107155121B (zh) * | 2017-04-26 | 2020-01-10 | 海信集团有限公司 | 语音控制文本的显示方法及装置 |
-
2017
- 2017-11-16 TW TW106139781A patent/TWI664536B/zh not_active IP Right Cessation
- 2017-12-12 CN CN201711318291.9A patent/CN109801620A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW502196B (en) * | 1998-02-25 | 2002-09-11 | Primax Electronics Ltd | Window display system capable of receiving speech commands |
CN1229216A (zh) * | 1998-03-16 | 1999-09-22 | 致伸实业股份有限公司 | 可接受语音指令的视窗显示系统 |
CN1585969A (zh) * | 2001-11-16 | 2005-02-23 | 皇家飞利浦电子股份有限公司 | 在预定窗口编辑文本的装置 |
TW201030734A (en) * | 2009-02-06 | 2010-08-16 | Aten Int Co Ltd | Voice recognition device and operating method thereof |
CN102510426A (zh) * | 2011-11-29 | 2012-06-20 | 安徽科大讯飞信息科技股份有限公司 | 个人助理应用访问方法及系统 |
CN104992709A (zh) * | 2015-06-25 | 2015-10-21 | 广州视源电子科技股份有限公司 | 一种语音指令的执行方法及语音识别设备 |
CN105551492A (zh) * | 2015-12-04 | 2016-05-04 | 青岛海信传媒网络技术有限公司 | 语音控制的方法、装置与终端 |
CN106653011A (zh) * | 2016-09-12 | 2017-05-10 | 努比亚技术有限公司 | 一种语音控制方法、装置及终端 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291539A (zh) * | 2020-01-21 | 2020-06-16 | 深圳精匠云创科技有限公司 | 文件编辑控制方法、装置、计算机装置及存储介质 |
CN111291539B (zh) * | 2020-01-21 | 2023-10-20 | 深圳富联精匠科技有限公司 | 文件编辑控制方法、装置、计算机装置及存储介质 |
CN113127105A (zh) * | 2021-03-18 | 2021-07-16 | 福建马恒达信息科技有限公司 | 一种excel自动语音工具调用方法 |
CN113157351A (zh) * | 2021-03-18 | 2021-07-23 | 福建马恒达信息科技有限公司 | 一种用于表格工具快捷调用的语音插件构建方法 |
CN113157351B (zh) * | 2021-03-18 | 2022-06-07 | 福建马恒达信息科技有限公司 | 一种用于表格工具快捷调用的语音插件构建方法 |
Also Published As
Publication number | Publication date |
---|---|
TWI664536B (zh) | 2019-07-01 |
TW201923622A (zh) | 2019-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Srinivasan et al. | Orko: Facilitating multimodal interaction for visual exploration and analysis of networks | |
US7555713B2 (en) | Writing and reading aid system | |
Yimam et al. | Automatic annotation suggestions and custom annotation layers in WebAnno | |
US8150699B2 (en) | Systems and methods of a structured grammar for a speech recognition command system | |
US10699072B2 (en) | Immersive electronic reading | |
US20090058860A1 (en) | Method for Transforming Language Into a Visual Form | |
Crasborn et al. | Sharing sign language data online: Experiences from the ECHO project | |
CN109426658B (zh) | 使用基于文本分析的智能特征建议进行文档美化 | |
JPH02297188A (ja) | 文書作成支援装置 | |
JP2013167985A (ja) | 談話要約生成システムおよび談話要約生成プログラム | |
CN109801620A (zh) | 文书编辑软件的语音控制方法及语音控制系统 | |
US20070271509A1 (en) | Methods and apparatuses for operations on selective document components | |
KR101423254B1 (ko) | 도서의 목차 암기를 위한 이미지 목차 편집 시스템 | |
MacWhinney | The childes project | |
CN112487801A (zh) | 一种面向安全关键软件的术语推荐方法及系统 | |
Curtis | Engineering Computer Look and Feel: User Interface Technology and Human Factors Engineering | |
Dimitromanolaki et al. | Learning to order facts for discourse planning in natural language generation | |
Wu et al. | FFL: A Language and Live Runtime for Styling and Labeling Typeset Math Formulas | |
de Carvalho et al. | Towards a modelling workbench with flexible interaction models for model editors operating through voice and gestures | |
JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
Dumas et al. | A graphical uidl editor for multimodal interaction design based on smuiml | |
JP2004318809A (ja) | 情報抽出規則生成装置および方法 | |
Moshagen et al. | The GiellaLT infrastructure–A Multilingual Infrastructure for Rulebased NLP | |
Hall et al. | Unsupervised ml with text data | |
Sheremetyeva | Towards Designing Natural Language Interfaces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190524 |
|
WD01 | Invention patent application deemed withdrawn after publication |