CN114611523B - 一种命令采集方法、装置和智能设备 - Google Patents
一种命令采集方法、装置和智能设备 Download PDFInfo
- Publication number
- CN114611523B CN114611523B CN202210087459.4A CN202210087459A CN114611523B CN 114611523 B CN114611523 B CN 114611523B CN 202210087459 A CN202210087459 A CN 202210087459A CN 114611523 B CN114611523 B CN 114611523B
- Authority
- CN
- China
- Prior art keywords
- command
- description
- grammar
- command description
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000006870 function Effects 0.000 claims abstract description 31
- 230000014509 gene expression Effects 0.000 claims abstract description 25
- 230000015654 memory Effects 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
本发明公开了一种命令采集方法、装置和智能设备,其中方法应用于智能设备,智能设备内置多条命令规范,命令规范用于表征智能设备支持的功能,该方法包括:将当前命令规范展示给用户;接收用户根据当前命令规范输入的命令描述;将命令描述与当前命令规范规定的语义进行比对,若命令描述与当前命令规范规定的语义匹配,则将命令描述存入当前命令规范对应的命令数据集中。本发明提供的技术方案,实现了准确采集相同语义不同表述的智能设备命令的功能。
Description
技术领域
本发明涉及数据采集领域,具体涉及一种命令采集方法、装置和智能设备。
背景技术
目前采用语音控制诸如照明、空调、电视、窗帘等智能设备时,通常基于固定的设备命令词表实现,即用户读出设备命令词表所包含的命令词,意图识别算法识别意图并执行该命令。如果用户的命令描述超出词表范围,则意图识别算法就不能识别该命令意图,也执行不了该命令。例如:词表中有“打开空调”这个命令,用户说“打开空调”即可以打开空调,但是说“开开空调”就不能打开空调。
为了避免让用户记忆命令词表,能够使用更灵活多样的命令表述形式,意图识别算法需要学习足够多的相同语义不同表述的设备命令数据集。因此,如何准确地采集相同语义不同表述的设备命令是需要解决的问题。
发明内容
有鉴于此,本发明实施方式提供了一种命令采集方法、装置和智能设备,从而实现了准确采集相同语义不同表述的智能设备命令的功能。
根据第一方面,本发明提供了一种命令采集方法,应用于智能设备,所述智能设备内置多条命令规范,所述命令规范用于表征所述智能设备支持的功能,所述方法包括:将当前命令规范展示给用户;接收所述用户根据所述当前命令规范输入的命令描述;将所述命令描述与所述当前命令规范规定的语义进行比对,若所述命令描述与所述当前命令规范规定的语义匹配,则将所述命令描述存入所述当前命令规范对应的命令数据集中。
可选地,所述方法还包括:若所述命令描述与所述当前命令规范规定的语义不匹配,则通知用户重新输入命令描述。
可选地,在所述将所述命令描述与所述当前命令规范规定的语义进行比对之前,所述方法还包括:判断所述命令描述是否在所述命令数据集中存在;若所述命令描述在所述命令数据集中不存在,则将所述命令描述存入所述命令数据集;若所述命令描述在所述命令数据集中存在,则通知用户重新输入命令描述。
可选地,所述将所述命令描述与所述当前命令规范规定的语义进行比对,包括:分别获取所述命令描述和所述当前命令规范规定的语义的向量表达;计算所述命令描述和所述当前命令规范规定的语义的向量表达的相似度,以得到所述命令描述与所述当前命令规范规定的语义的匹配程度。
可选地,在所述将所述命令描述存入所述当前命令规范对应的命令数据集中之前,所述方法还包括:计算所述命令描述的语法流畅度,所述语法流畅度用于表征所述命令描述和所述命令描述所属语言的语法匹配程度;若所述语法流畅度小于第二预设阈值,则返回将所述命令描述存入所述当前命令规范对应的命令数据集中的步骤;若所述语法流畅度大于第二预设阈值,则通知用户重新输入命令描述。
可选地,所述计算所述命令描述的语法流畅度,包括:将所述命令描述中的各个词语依次去除,并基于预设算法依次预测所述命令描述中去除的词语,得到多个预测词语;基于所述多个预测词语和对应去除的词语之间的损失参数生成所述语法流畅度,所述损失参数用于表征预测词语和对应去除的词语之间的差异程度。
可选地,所述方法还包括:若通知用户重新输入命令描述的次数达到预设次数,则跳过所述当前命令规范的命令描述采集步骤。
根据第二方面,本发明提供了一种命令采集装置,应用于智能设备,所述智能设备内置多条命令规范,所述命令规范用于表征所述智能设备支持的功能,所述装置包括:规范展示模块,用于将当前命令规范展示给用户;命令接收模块,用于接收所述用户根据所述当前命令规范输入的命令描述;语义筛选模块,用于将所述命令描述与所述当前命令规范规定的语义进行比对,若所述命令描述与所述当前命令规范规定的语义匹配,则将所述命令描述存入所述当前命令规范对应的命令数据集中。
根据第三方面,本发明实施例提供了一种智能设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机从而执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。
本申请提供的技术方案,具有如下优点:
本申请提供的技术方案,在采集用户命令时,首先将设备内部预置的命令规范逐一展示给用户,从而通过命令规范引导用户填写满足智能设备功能的命令描述,避免用户填写的命令描述是不属于当前命令词表的表述以及是当前智能设备不能实现的功能。之后,对用户填写的命令描述进行语义分析,当命令描述与当前命令规范规定的语义成功匹配时,将命令描述存入当前命令规范对应的命令数据集中。进一步避免用户输入的命令描述语义和命令规范规定的语义相差较大,从而避免用户发出命令时控制错误的功能。
此外,当用户输入的命令描述已经存在于命令数据集中时,通知用户重新输入命令,且不存储当前命令,避免产生数据冗余。在将命令描述存储到命令数据集之前,还对命令描述进行语法分析,若命令描述不符合语法习惯,则不进行存储,避免因为用户个人的不正确语法习惯产生不能够被使用的命令,进一步避免产生数据冗余。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本发明一个实施方式中一种命令采集方法的步骤示意图;
图2示出了本发明一个实施方式中一种命令采集方法的流程示意图;
图3示出了本发明一个实施方式中一个命令规范的示例图;
图4示出了本发明一个实施方式中一种命令采集装置的结构示意图;
图5示出了本发明一个实施方式中一种智能设备的结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
请参阅图1和图2,在一个实施方式中,一种命令采集方法,应用于智能设备,智能设备内置多条命令规范,命令规范用于表征智能设备支持的功能,该方法具体包括以下步骤:
步骤S101:将当前命令规范展示给用户。
步骤S102:接收用户根据当前命令规范输入的命令描述。
步骤S103:将命令描述与当前命令规范规定的语义进行比对,若命令描述与当前命令规范规定的语义匹配,则将命令描述存入当前命令规范对应的命令数据集中。
具体地,在实际应用场景,传统命令采集方法往往是多个开发者进行命令联想和搜集,然后从后台将命令置于智能设备的命令数据集中。本实施例在大范围采集用户命令时,首先将设备内部预置的命令规范逐一展示给用户,如图3所示,命令规范是对于某类具体的设备制定具体的规范,做出明确的定义和举例,便于采集人员准确理解命令。规范明确了术语定义、任务定义、设备命令类型、命令名称、命令定义、场景说明。从而通过命令规范引导用户填写满足智能设备功能的命令描述,避免用户填写的命令描述是不属于当前命令词表的表述以及是当前智能设备不能实现的功能。之后,对用户填写的命令描述进行语义分析,当命令描述与当前命令规范规定的语义成功匹配时,将命令描述存入当前命令规范对应的命令数据集中。进一步避免用户输入的命令描述语义和命令规范规定的语义相差较大,从而避免用户发出命令时控制错误的功能。在本实施例中,命令描述和规定的语义进行匹配基于文本相似度实现,在当前命令规范采集到命令后,智能设备切换到下一条命令规范,从而继续采集控制智能设备其他功能的命令描述。
若命令描述与当前命令规范规定的语义不匹配,表征当前用户输入的命令与规定语义相差较大,例如规范规定填写开启空调功能的命令,而用户输入的是关闭空调,若将该命令存入命令数据集中会导致用户说出关闭空调的命令时空调执行开启。因此该命令描述不存入命令数据集,且通知用户重新输入命令描述。
具体地,在一实施例中,在上述步骤S103之前,本发明实施例提供的一种命令采集方法,还包括如下步骤:
步骤一:判断命令描述是否在命令数据集中存在。
步骤二:若命令描述在命令数据集中不存在,则将命令描述存入命令数据集。
步骤三:若命令描述在命令数据集中存在,则通知用户重新输入命令描述。
具体地,为了避免由于大多数用户想法不可控产生一致的命令描述,从而增加智能设备中的冗余命令数量,从而将用户输入的命令描述与命令数据集中的命令描述进行逐字比对,当用户输入的命令已经存在于当前命令规范对应的命令数据集时,本次不执行命令存储操作,且告知用户重新输入命令描述。
具体地,在一实施例中,上述步骤S103,具体包括如下步骤:
步骤四:分别获取命令描述和当前命令规范规定的语义的向量表达。
步骤五:计算命令描述和当前命令规范规定的语义的向量表达的相似度,以得到命令描述与当前命令规范规定的语义的匹配程度。
具体地,在本实施例中,基于文本向量相似度从而进行命令描述和当前命令规范规定的语义匹配操作。首先计算命令描述和当前命令规范规定的语义的数字向量,当前命令规范规定的语义可采用当前命令规范中的命名名称。例如用户输入的命令描述为“开开空调”,当前命令规范中的命名名称为“打开空调”。生成文本语义向量的方法可采用基于自然语言处理的编码模型来实现,例如通过bert预训练语言模型计算出其向量表示A和B,设A和B是两个n维向量,则A是[A1,A2,...,An],B是[B1,B2,...,Bn],然后可通过包括但不限于向量距离、余弦相似度等方法得到文本相似度,例如计算A与B的夹角θ的余弦相似度得到文本相似度。通过本步骤可以准确得到两个文本的相似度,实现准确的语义匹配操作。
具体地,在一实施例中,在将命令描述存入当前命令规范对应的命令数据集中之前,本发明实施例提供的一种命令采集方法,还包括如下步骤:
步骤六:计算命令描述的语法流畅度,语法流畅度用于表征命令描述和命令描述所属语言的语法匹配程度。
步骤七:若语法流畅度小于第二预设阈值,则返回将命令描述存入当前命令规范对应的命令数据集中的步骤。
步骤八:若语法流畅度大于第二预设阈值,则通知用户重新输入命令描述。
具体地,在本实施例中,为了避免用户输入的命令描述是不符合语法的描述,导致命令几乎不可使用的问题出现(例如用户发出指令“屋里的空调打开我”),进一步对用户输入的命令描述进行语法分析。在本实施例中,基于命令描述各个词的负对数似然函数值得到语法流畅度,从而衡量命令描述和命令描述所属语言的语法匹配程度。
计算命令描述的语法流畅度的步骤如下:
1.将命令描述中的各个词语依次去除,并基于预设算法依次预测命令描述中去除的词语,得到多个预测词语。
2.基于多个预测词语和对应去除的词语之间的损失参数生成语法流畅度,损失参数用于表征预测词语和对应去除的词语之间的差异程度。
在本实施例中对于给定的句子,按顺序依次去掉一个词,去掉的词作为待预测的词,之后采用包括但不限于bert类的预训练语言模型对去掉的词进行预测,bert类的预训练语言模型是已经把人类的自然语言知识,预先进行了训练和学习,之后再代入到某个具体任务,进行优化的模型。从而通过bert预训练语言模型对去掉的词进行预测,根据预测的结果进行分析,本身就是一个判别给定句子是否符合语法的过程。之后,本实施例再计算所预测词和真实词的负对数似然函数值作为损失参数,本实施例将负对数似然函数作为损失函数表征预测词语和对应去除的词语之间的差异程度,在尽量保证损失参数准确度的情况下,降低选择损失函数的复杂度,从而提高计算速度。最后将所有的词的损失参数求和再取平均值,即可到用于表征命令描述和预设语法匹配程度的衡量标准,即语法流畅度。
由于负对数似然函数的特征是数值越小表征损失越小,因此当语法流畅度小于第二预设阈值时,判定当前命令描述是符合命令所属的语法规则的,同时存入命令数据集中。若语法流畅度大于第二预设阈值则通知用户重新输入命令。
具体地,在一实施例中,本发明实施例提供的一种命令采集方法,还包括如下步骤:
步骤九:若通知用户重新输入命令描述的次数达到预设次数,则跳过当前命令规范的命令描述采集步骤。
由于用户的思想不可控,现有技术通常由于某一用户想不到合适的命令描述,导致命令采集功能陷入了死循环,不断提示用户输入命令。因此,在本实施中,针对任意命令规范,若用户重新输入命令的次数达到预设次数,例如3次,则自动跳转到下一条命令规范的输入。从而提高命令采集效率。
具体地,在一实际应用场景中,命令采集方法所集成的系统举例说明如下所示:
系统服务端由如下单元构成:
数据库单元:系统采用sql数据库进行存储,具备依据命令规范制定的字段,主要字段如上所示。
规范读取单元:读取excel存储的设备命令采集规范。
差异性性判别单元:依据用户输入的命令表述,在数据库中检索命令表述,返回是否存在。
相似度计算单元:依据用户输入的命令表述,调用bert预训练语言模型,计算命令表述与命令名称的相似性,返回相似度。
流畅度计算单元。依据用户输入的命令表述,调用bert预训练语言模型,计算该命令表述的流畅度。
控制逻辑单元。调用规范读取单元,读取一条命令规范,并显示到客户端界面;接收用户填写的命令表述,判断是否存在差异,若不存在差异,将其存储到数据库中,并要求用户重新填写;有差异则调用相似度模块计算相似度,相似度不大于阈值,要求重新填写;相似度达到阈值的继续计算流畅度,流畅度低于阈值的存储至数据库,否则要求用户继续录入。每条命令的表述重新录入的次数不超过三次。继续上述循环直至该用户录入所有命令表述。
系统客户端由如下界面构成:
用户登陆界面:用户填写用户名和密码,登陆到系统。
命令表述填写界面:展示每条命令的规范、填写命令表述的文本框。
阈值填写界面:管理员用户可填写相似度阈值、流畅度阈值。
通过上述步骤,本申请提供的技术方案,在采集用户命令时,首先将设备内部预置的命令规范逐一展示给用户,从而通过命令规范引导用户填写满足智能设备功能的命令描述,避免用户填写的命令描述是不属于当前命令词表的表述以及是当前智能设备不能实现的功能。之后,对用户填写的命令描述进行语义分析,当命令描述与当前命令规范规定的语义成功匹配时,将命令描述存入当前命令规范对应的命令数据集中。进一步避免用户输入的命令描述语义和命令规范规定的语义相差较大,从而避免用户发出命令时控制错误的功能。
此外,当用户输入的命令描述已经存在于命令数据集中时,通知用户重新输入命令,且不存储当前命令,避免产生数据冗余。在将命令描述存储到命令数据集之前,还对命令描述进行语法分析,若命令描述不符合语法习惯,则不进行存储,避免因为用户个人的不正确语法习惯产生不能够被使用的命令,进一步避免产生数据冗余。
如图4所示,本实施例还提供了一种命令采集装置,应用于智能设备,智能设备内置多条命令规范,命令规范用于表征智能设备支持的功能,该装置包括:
规范展示模块101,用于将当前命令规范展示给用户。详细内容参见上述方法实施例中步骤S101的相关描述,在此不再进行赘述。
命令接收模块102,用于接收用户根据当前命令规范输入的命令描述。详细内容参见上述方法实施例中步骤S102的相关描述,在此不再进行赘述。
语义筛选模块103,用于将命令描述与当前命令规范规定的语义进行比对,若命令描述与当前命令规范规定的语义匹配,则将命令描述存入当前命令规范对应的命令数据集中。详细内容参见上述方法实施例中步骤S103的相关描述,在此不再进行赘述。
本发明实施例提供的命令采集装置,用于执行上述实施例提供的命令采集方法,其实现方式与原理相同,详细内容参见上述方法实施例的相关描述,不再赘述。
通过上述各个组成部分的协同合作,本申请提供的技术方案,在采集用户命令时,首先将设备内部预置的命令规范逐一展示给用户,从而通过命令规范引导用户填写满足智能设备功能的命令描述,避免用户填写的命令描述是不属于当前命令词表的表述以及是当前智能设备不能实现的功能。之后,对用户填写的命令描述进行语义分析,当命令描述与当前命令规范规定的语义成功匹配时,将命令描述存入当前命令规范对应的命令数据集中。进一步避免用户输入的命令描述语义和命令规范规定的语义相差较大,从而避免用户发出命令时控制错误的功能。
此外,当用户输入的命令描述已经存在于命令数据集中时,通知用户重新输入命令,且不存储当前命令,避免产生数据冗余。在将命令描述存储到命令数据集之前,还对命令描述进行语法分析,若命令描述不符合语法习惯,则不进行存储,避免因为用户个人的不正确语法习惯产生不能够被使用的命令,进一步避免产生数据冗余。
图5示出了本发明实施例的一种智能设备,该设备包括处理器901和存储器902,可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器901可以为中央处理器(Central Processing Unit,CPU)。处理器901还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器902作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如上述方法实施例中的方法所对应的程序指令/模块。处理器901通过运行存储在存储器902中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器901所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至处理器901。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器902中,当被处理器901执行时,执行上述方法实施例中的方法。
上述智能设备具体细节可以对应参阅上述方法实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,实现的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (8)
1.一种命令采集方法,其特征在于,应用于智能设备,所述智能设备内置多条命令规范,所述命令规范用于表征所述智能设备支持的功能,所述方法包括:
将当前命令规范展示给用户;
接收所述用户根据所述当前命令规范输入的命令描述;
将所述命令描述与所述当前命令规范规定的语义进行比对,若所述命令描述与所述当前命令规范规定的语义匹配,则将所述命令描述存入所述当前命令规范对应的命令数据集中;
在所述将所述命令描述存入所述当前命令规范对应的命令数据集中之前,所述方法还包括:计算所述命令描述的语法流畅度,所述语法流畅度用于表征所述命令描述和所述命令描述所属语言的语法匹配程度;若所述语法流畅度小于第二预设阈值,则返回将所述命令描述存入所述当前命令规范对应的命令数据集中的步骤;若所述语法流畅度大于第二预设阈值,则通知用户重新输入命令描述;
所述计算所述命令描述的语法流畅度,包括:将所述命令描述中的各个词语依次去除,并基于预设算法依次预测所述命令描述中去除的词语,得到多个预测词语;基于所述多个预测词语和对应去除的词语之间的损失参数生成所述语法流畅度,所述损失参数用于表征预测词语和对应去除的词语之间的差异程度;将所有的词的损失参数求和再取平均值,即可到用于表征命令描述和预设语法匹配程度的衡量标准,即语法流畅度。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述命令描述与所述当前命令规范规定的语义不匹配,则通知用户重新输入命令描述。
3.根据权利要求1所述的方法,其特征在于,在所述将所述命令描述与所述当前命令规范规定的语义进行比对之前,所述方法还包括:
判断所述命令描述是否在所述命令数据集中存在;
若所述命令描述在所述命令数据集中不存在,则将所述命令描述存入所述命令数据集;
若所述命令描述在所述命令数据集中存在,则通知用户重新输入命令描述。
4.根据权利要求1所述的方法,其特征在于,所述将所述命令描述与所述当前命令规范规定的语义进行比对,包括:
分别获取所述命令描述和所述当前命令规范规定的语义的向量表达;
计算所述命令描述和所述当前命令规范规定的语义的向量表达的相似度,以得到所述命令描述与所述当前命令规范规定的语义的匹配程度。
5.根据权利要求1、2和3任意一项所述的方法,其特征在于,所述方法还包括:
若通知用户重新输入命令描述的次数达到预设次数,则跳过所述当前命令规范的命令描述采集步骤。
6.一种命令采集装置,其特征在于,应用于智能设备,所述智能设备内置多条命令规范,所述命令规范用于表征所述智能设备支持的功能,所述装置包括:
规范展示模块,用于将当前命令规范展示给用户;
命令接收模块,用于接收所述用户根据所述当前命令规范输入的命令描述;
语义筛选模块,用于将所述命令描述与所述当前命令规范规定的语义进行比对,若所述命令描述与所述当前命令规范规定的语义匹配,则将所述命令描述存入所述当前命令规范对应的命令数据集中;在所述将所述命令描述存入所述当前命令规范对应的命令数据集中之前,还包括:计算所述命令描述的语法流畅度,所述语法流畅度用于表征所述命令描述和所述命令描述所属语言的语法匹配程度;若所述语法流畅度小于第二预设阈值,则返回将所述命令描述存入所述当前命令规范对应的命令数据集中的步骤;若所述语法流畅度大于第二预设阈值,则通知用户重新输入命令描述;所述计算所述命令描述的语法流畅度,包括:将所述命令描述中的各个词语依次去除,并基于预设算法依次预测所述命令描述中去除的词语,得到多个预测词语;基于所述多个预测词语和对应去除的词语之间的损失参数生成所述语法流畅度,所述损失参数用于表征预测词语和对应去除的词语之间的差异程度;将所有的词的损失参数求和再取平均值,即可到用于表征命令描述和预设语法匹配程度的衡量标准,即语法流畅度。
7.一种智能设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机从而执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210087459.4A CN114611523B (zh) | 2022-01-25 | 2022-01-25 | 一种命令采集方法、装置和智能设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210087459.4A CN114611523B (zh) | 2022-01-25 | 2022-01-25 | 一种命令采集方法、装置和智能设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114611523A CN114611523A (zh) | 2022-06-10 |
CN114611523B true CN114611523B (zh) | 2024-12-27 |
Family
ID=81857593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210087459.4A Active CN114611523B (zh) | 2022-01-25 | 2022-01-25 | 一种命令采集方法、装置和智能设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611523B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106571140A (zh) * | 2016-11-14 | 2017-04-19 | Tcl集团股份有限公司 | 一种基于语音语义的电器智能控制方法及系统 |
CN112802460A (zh) * | 2021-04-14 | 2021-05-14 | 中国科学院国家空间科学中心 | 一种基于语音处理的空间环境预报系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7249018B2 (en) * | 2001-01-12 | 2007-07-24 | International Business Machines Corporation | System and method for relating syntax and semantics for a conversational speech application |
JP2003241790A (ja) * | 2002-02-13 | 2003-08-29 | Internatl Business Mach Corp <Ibm> | 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム |
US10585911B1 (en) * | 2016-12-30 | 2020-03-10 | VCE IP Holding Company LLC | Methods, systems, and computer readable mediums for command engine execution |
CN108447471B (zh) * | 2017-02-15 | 2021-09-10 | 腾讯科技(深圳)有限公司 | 语音识别方法及语音识别装置 |
-
2022
- 2022-01-25 CN CN202210087459.4A patent/CN114611523B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106571140A (zh) * | 2016-11-14 | 2017-04-19 | Tcl集团股份有限公司 | 一种基于语音语义的电器智能控制方法及系统 |
CN112802460A (zh) * | 2021-04-14 | 2021-05-14 | 中国科学院国家空间科学中心 | 一种基于语音处理的空间环境预报系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114611523A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116737908B (zh) | 知识问答方法、装置、设备和存储介质 | |
US10332507B2 (en) | Method and device for waking up via speech based on artificial intelligence | |
CN110795532A (zh) | 一种语音信息的处理方法、装置、智能终端以及存储介质 | |
CN108764480A (zh) | 一种信息处理的系统 | |
US9606984B2 (en) | Unsupervised clustering of dialogs extracted from released application logs | |
CN113609264B (zh) | 电力系统节点的数据查询方法、装置 | |
CN114281968B (zh) | 一种模型训练及语料生成方法、装置、设备和存储介质 | |
CN117407507A (zh) | 基于大语言模型的事件处理方法、装置、设备及介质 | |
CN119493849B (zh) | 问答任务处理模型训练方法、装置、设备及存储介质 | |
CN117312521A (zh) | 用于智能客服对话的处理方法及相关产品 | |
CN113987184A (zh) | 一种基于语音识别的建筑运维工单自动填写系统及方法 | |
CN116866152A (zh) | 风险操作管控方法、装置、电子设备及存储介质 | |
CN117271811A (zh) | 一种基于人工智能的人机交互系统及设备 | |
CN119048121B (zh) | 一种电网违规行为监督方法、终端设备及存储介质 | |
CN116842143A (zh) | 基于人工智能的对话模拟方法、装置、电子设备及介质 | |
CN119646161A (zh) | 偏好学习方法、模型应用方法、装置、设备和存储介质 | |
CN119558404A (zh) | 对大模型幻觉的优化方法、装置、设备及介质 | |
CN114611523B (zh) | 一种命令采集方法、装置和智能设备 | |
CN117251559B (zh) | 基于自然语言大模型的工程标准规范获取方法及系统 | |
CN117591654A (zh) | 一种问答方法及装置 | |
CN113851150B (zh) | 一种使用信心分在多套语音识别结果中进行选择的方法 | |
CN112487811B (zh) | 基于强化学习的级联信息提取系统及方法 | |
CN117743522A (zh) | 一种医疗答复生成方法、装置、设备以及存储介质 | |
CN115689603A (zh) | 用户反馈信息收集方法、装置及用户反馈系统 | |
CN116775848B (zh) | 生成对话信息的控制方法、装置、计算设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |