WO2020187301A1

WO2020187301A1 - 节目名检索辅助装置以及节目名检索辅助方法

Info

Publication number: WO2020187301A1
Application number: PCT/CN2020/080259
Authority: WO
Inventors: 松原伸三
Original assignee: 海信视像科技股份有限公司; 东芝视频解决方案株式会社
Priority date: 2019-03-20
Filing date: 2020-03-19
Publication date: 2020-09-24
Also published as: CN112243524B; JP7202938B2; CN112243524A; JP2020155976A

Abstract

本发明提供一种能够使利用语音检索进行的节目名检索的准确度提高的节目名检索辅助装置以及节目名检索辅助方法。具有：新节目信息数据库(61)，其将广播接收装置(2)中存储的节目名的标记即第1节目名和节目名的读音成对地进行存储；文字数据通信电路(51)，其取得第2节目名，该第2节目名是对于以新节目信息数据库(61)中存储的节目名的读音为基础的语音数据实施语音识别处理而得到的文字数据；以及替换辞典(62)，其在第1节目名与第2节目名不同的情况下，将第1节目名和第2节目名成对地进行存储。

Description

节目名检索辅助装置以及节目名检索辅助方法

本申请要求在2019年3月20日提交日本专利局、申请号为2019-053657、发明名称为“节目名检索辅助装置以及节目名检索辅助方法”的日本专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本实施方式涉及节目名检索辅助装置以及节目名检索辅助方法。

背景技术

在电视等AV设备中，通常利用从广播波取得的EPG(Electronic Program Guide：电子节目指南)，进行广播节目的检索。在使用检索关键词来检索广播节目名的情况下，以往，操作遥控器的按钮来输入要检索的文字。

近年来，识别操作者的语音并基于识别结果来操作AV设备等的语音识别技术已实用化(例如，参照专利文献1)。例如，当操作者朝向搭载有麦克风的遥控器说出检索关键词时，能够基于语音识别结果来检索广播节目名。这样的语音检索与文字输入检索相比，省事而能够在短时间内进行检索，对操作者的便利性提高有较大的贡献。

但是，在语音检索中，存在如下问题：在作为语音识别结果得到的节目名(字符串)与从EPG取得的节目名不一致的情况下，无法进行节目检索。

在先技术文献

专利文献

专利文献1：日本特开2012－168349号公报

发明内容

本实施方式的目的在于提供一种能够使利用语音检索进行的节目名检索的准确度提高的、节目名检索辅助装置以及节目名检索辅助方法。

本实施方式的节目名检索辅助装置具有：节目信息存储部，其将节目名检索对象设备中存储的节目名的标记即第1节目名和所述节目名的读音成对地进行存储；文字数据取得电路，其对于以所述节目信息存储部中存储的所述节目名的读音为基础的语音数据，取得实施语音识别处理而得到的文字数据即第2节目名；以及替换辞典，在所述第1节目名与所述第2节目名不同的情况下，将所述第1节目名和所述第2节目名成对地进行存储。

附图说明

图1是表示使用了本实施方式的节目名检索辅助装置的节目名检索系统的结构的一个例子的概略图；

图2是表示实施方式的节目名检索辅助装置的一个例子的语言处理服务器的结构的框图；

图3是说明新节目信息数据的一个例子的图；

图4是说明节目名替换数据的一个例子的图；

图5是说明替换辞典制作方法的一个例子的流程图。

附图标记说明

1…语言处理服务器、2…广播接收装置、3…语音识别服务器、4…互联网线路、21…遥控器、51…文字数据通信电路、52…语言数据解析电路、53…指令输出电路、54…替换辞典登记电路、55…语音数据发送电路、56…语音转换电路、61…新节目信息数据库、62…替换辞典。

具体实施方式

以下，参照附图说明实施方式。

图1是表示使用了本实施方式的节目名检索辅助装置的节目名检索系统的结构的一个例子的概略图。节目名检索系统包括语言处理服务器1、作为节目名被检索装置的广播接收装置2、以及语音识别服务器3。语言处理服务器 1、广播接收装置2、以及语音识别服务器3经由互联网线路4而相互连接。

广播接收装置2接收由广播运营商通过在空间中传播的电波而提供的节目、由发布运营商通过线缆网、IP网等网络供给的节目等并播放。广播接收装置2经由遥控控制器(以下，表示为遥控器)21接收来自用户的操作指示。此外，广播接收装置2也可以是包含对接收到的节目进行记录的记录播放装置在内的结构。

遥控器21具备操作键(数字键、箭头键、颜色按钮等)、以及麦克风。例如，用户能够通过对作为操作键之一的麦克风按钮进行按压等针对遥控器21进行的规定的操作，从而经由遥控器21的麦克风向广播接收装置2发送语音数据。即，用户能够利用语音数据对广播接收装置2输入操作指示。

语音识别服务器3是提供基于云的语音识别服务的服务器。语音识别服务器3将从与互联网线路4连接的设备发送过来的语音数据转换成文字数据并输出。

作为节目名检索辅助装置的语言处理服务器1具有处理器11。语言处理服务器1对从广播接收装置2或语音识别服务器3输入的文字数据进行解析，提取对广播接收装置2的操作内容、参数等，转换成能够在广播接收装置2中处理的形式并输出。

图2是表示语言处理服务器1的结构的框图。语言处理服务器1具备文字数据通信电路51、语言数据解析电路52、指令输出电路53、替换辞典登记电路54、语音数据发送电路55、语音转换电路56这些电路。另外，语言处理服务器1还具备新节目信息数据库61以及替换辞典62这些存储装置。

文字数据通信电路51、语言数据解析电路52、指令输出电路53、替换辞典登记电路54、语音数据发送电路55、语音转换电路56这些电路的功能既可以由作为处理器11的CPU(Central Processing Unit：中央处理单元)通过软件来实现，也可以使用FPGA等通过硬件来实现。

作为文字数据取得电路的文字数据通信电路51控制与连接于互联网线路4的设备(例如，广播接收装置2、语音识别服务器3)之间的文字数据收发。例如，取得从语音识别服务器3输出的文字数据、或者取得从广播电台等发送的电子节目表(EPG)信息。另外，文字数据通信电路51在从未图示的其它服务器取得了新节目信息的情况下，将该信息登记到新节目信息数据库61中。此外，所谓新节目信息，是在EPG信息中具有迄今未取得的新出现的节目名的节目的信息。

图3是说明新节目信息数据的一个例子的图。图3所示的新节目信息数据被登记到新节目信息数据库61中。如图3所示，新节目信息数据对每1个节目制作1个记录，各记录例如包括“节目名”、作为读法(节目名的读法的平假名记载)的“读音”、以及“(信息)取得日”这3个项目。对于“节目名”和“读音”，设定从文字数据通信电路51所取得的新节目信息中提取的数据。对于“取得日”，设定从其它服务器接收到该记录的新节目信息的日期。

语言数据解析电路52对于在文字数据通信电路51中取得的文字数据(构成为自然语句的文本)，根据需要而执行词素解析、语法解析等自然语言解析处理，掌握文字数据的语义内容(操作内容)。例如，在输入了“想要看〇〇(节目名)”这种文字数据的情况下，被解析为“检索”“〇〇(节目名)”这种语义。此外，在解析结果中包含节目名的情况下，检索在替换辞典62中是否登记了该节目名。在已登记的情况下，将作为解析结果得到的该节目名的文字数据替换成在替换辞典62中指定的其它文字数据并输出。

指令输出电路53将语言数据解析电路52中的解析结果转换成在广播接收装置2中能够处理的形式并输出。例如，在上述的一个例子的情况下，对广播接收装置2输出操作指示信号，以使得执行以“〇〇(节目名)”作为关键词的“检索”操作。

语音转换电路56将被输入的文字数据转换成语音数据。转换后的语音数据向语音数据发送电路55输出。

语音数据发送电路55对连接于互联网线路4的设备(例如，语音识别服务器3)发送从语音转换电路56输入的语音数据。

替换辞典登记电路54制作节目名替换数据，并登记在替换辞典62中。图4是说明节目名替换数据的一个例子的图。如图4所示，节目名替换数据对每1个节目制作1个记录，各记录例如包括“输入节目名”、“替换节目名”、以及“登记日”这3个项目。“输入节目名”是与将新节目信息中的“节目名”的“读音”在语音识别服务器3中转换成文字数据而得到的节目名(文字数据)对应的项目。“替换节目名”设定有与在“输入节目名”中登记的文字数据进行替换来使用的其它文字数据(具体而言，设定新节目信息的“节目名”)。“登记日”设定有该记录被登记在替换辞典62中的日期。此外，语言数据解析电路52参照替换辞典62。

接下来，使用图5说明语言处理服务器1中的替换辞典制作方法。图5是说明替换辞典制作方法的一个例子的流程图。

首先，在文字数据通信电路51中，从外部的服务器等取得新节目信息，将该信息登记到新节目信息数据库61中(S1)。接着，替换辞典登记电路54从新节目信息数据库61提取成为替换辞典登记候选的节目名(S2)。例如，提取在最后实施了替换辞典的制作的日期以后被登记到新节目信息数据库61中的节目。在最后实施了替换辞典的制作的日期例如为2018年11月1日的情况下，提取“取得日”为2018年11月2日以后的记录，将所提取出的记录的“节目名”中登记的节目作为替换辞典登记候选。

此外，替换辞典登记候选节目的提取方法不限定于上述的方法。例如，也可以对新节目信息数据库61的各记录预先设定有能够识别是否曾作为替换辞典登记候选被提取过的标识，将在具有表示未提取的标识的记录的“节目名”中登记的节目作为替换辞典登记候选。

接下来，替换辞典登记电路54将在S2中提取出的节目名转换成语音数据并向语音识别服务器3输出(S3)。具体而言，首先，替换辞典登记电路54将所提取出的节目名(文字数据)向语音转换电路56输出。语音转换电路56将被输入的文字数据转换成语音数据，经由语音数据发送电路55向语音识别服务器3输出。此外，在S2中提取了多个节目名的情况下，从多个节目名选择一个节目名，执行上述的S3的步骤。

此外，将提取出的节目名(文字数据)转换成语音数据的处理不限定于语音转换电路56，也可以通过能够从语言处理服务器1接收文字数据且具有语音转换功能的其它服务器等来进行。例如，在广播接收装置2具有语音转换电路的情况下，也可以从替换辞典登记电路54经由文字数据通信电路51、互联网线路4将该节目名发送到广播接收装置2，通过广播接收装置2的语音转换电路将该文字数据转换成语音数据。在此情况下，被转换后的语音数据经由互联网线路4从广播接收装置2向语音识别服务器3输出。

接着，语言处理服务器1的文字数据通信电路51从语音识别服务器3取得在S3中输出的语音数据的识别结果、即从语音数据转换后的文字数据(S4)。文字数据通信电路51将所取得的文字数据向替换辞典登记电路54输出。替换辞典登记电路54将被输入的文字数据、和在S3中输出的节目名(文字数据)进行比较(S5)。在两者不一致的情况下(S5，否)，将做过比较的文字数据作为新记录登记到替换辞典62中(S6)。即，在替换辞典62中新登记一个记录，其中，该记录将在S3中向语音识别服务器3输出的节目名(文字数据)设定为“替换节目名”、将在S4中从语音识别服务器3取得的文字数据设定为“输入节目名”、将正在进行登记作业的日期设定为“登记日”。

例如，在S3中，向语音识别服务器3输出将“3年K组”这个标记的节目名(文字数据)进行了语音转换后的语音数据、即将“sanniankzu”这个读音进行了语音转换后的语音数据。在S4中输入了“三年K组”这个文字数据的情况下，两者不一致。因此，如图4所示的表的最上方的记录那样，在S6中将“3年K组”和“三年K组”的文字数据的一对登记到替换辞典62中。

另一方面，在S5中，在所输入的文字数据和在S3中输出的节目名(文字数据)一致的情况下，不进行向替换辞典62的登记，前进到S7。

在S2中提取出的替换辞典登记候选的节目名有多个的情况下，在对于所有的节目，执行完是否要向替换辞典62登记的判定的一系列的步骤(S3～S6)的情况下(S7，是)，结束图5所示的语言处理服务器1中的替换辞典制作步骤。另一方面，在存在未执行是否向替换辞典62登记的判定的一系列的步骤的节目名的情况下(S7，否)，前进到S8，从未执行的节目名中提取一个节目名，设置为下一个判定对象节目名。对于所设置的节目名，执行从S3到S6的一个例子的步骤。

这样，通过预先将利用语音识别取得的节目名的标记与电子节目表(EPG)的节目名的标记不同者作为替换辞典来登记，从而在利用广播接收装置2进行了语音检索的情况下，能够使检索精度提高。

例如，在图1所示的节目名检索系统中，特定的节目名的语音检索如以下这样进行。首先，用户使用广播接收装置2的遥控器21将想要检索特定的节目名的意图进行语音输入。例如，在想要检索“BACK STREET KIDS”这个节目的情况下，用户朝向遥控器21的麦克风发出“xiangyaokanbackstreetkids”(“xiangyaokanbackstreetkids”是用户发出的指令的读音)。

广播接收装置2将从用户输入的语音数据(例如，“xiangyaokanbackstreetkids”这个语音数据)经由互联网线路4发送到语音识别服务器3。语音识别服务器3将被输入的语音数据转换成文字数据，经由互联网线路4发送到语言处理服务器1。例如，“xiangyaokanbackstreetkids”这个语音数据被转换成“想要看BACKSTREETKIDS”这个文字数据并发送(日文的情况下转换成片假名和日文汉字的组合的文字数据)。

从语音识别服务器3输入的文字数据被从文字数据通信电路51向语言数据解析电路52输出。语言数据解析电路52对于被输入的文字数据进行自然语言解析处理，掌握文字数据的语义内容，生成解析结果。例如，在输入了“想要看BACKSTREETKIDS”这个文字数据的情况下，生成如下的解析结果：执行以“BACKSTREETKIDS”这个节目名(日文的情况下是片假名)作为关键词“进行检索”这个操作。

语言数据解析电路52检索解析结果中包含的节目名是否已被登记在替换辞典62的“输入节目名”中。在已被登记的情况下，将该记录的“替换节目名”中已登记的文字数据替换为解析结果中包含的该节目名。然后，将节目名替换后的解析结果向指令输出电路53输出。

例如，在解析结果中存在“BACKSTREETKIDS”这个节目名(日文的情况下是片假名)的情况下，语言数据解析电路52参照替换辞典62，检索“BACKSTREETKIDS”(日文的情况下是片假名)这个节目名(文字数据)是否已作为“输入节目名”被登记。在已被登记的情况下，提取在该记录的“替换节目名”中已登记的节目名(文字数据)。

如上所述，在已经进行了以EPG的标记为基础的替换辞典登记作业的情况下，“输入节目名”被设定为“BACKSTREETKIDS”(日文的情况下是片假名)、“替换节目名”被设定为“BACK STREET KIDS”的记录已被登记在替换辞典62中。因此，语言数据解析电路52参照替换辞典62，将解析结果的“BACKSTREETKIDS”这个节目名(字符串)(日文的情况下是片假名)替换成“BACK STREET KIDS”。然后，对指令输出电路53输出如下的解析结果：执行以“BACK STREET KIDS”这个节目名为关键词“进行检索”这个操作。

指令输出电路53将从语言数据解析电路52输入的解析结果转换成在广播接收装置2中能够处理的形式并输出。在上述的一个例子的情况下，对广播接收装置2输出操作指示信号，以使得在节目表(EPG)、录像数据等节目名中“检索”“BACK STREET KIDS”。

广播接收装置2从所存储的节目表(EPG)等提取“BACK STREET KIDS”这个标记的节目名，显示在检索结果画面等。在将从语音识别服务器3输出的文字数据即“BACKSTREETKIDS”这个记载原样使用，对广播接收装置2进行了检索指示的情况下，因为与节目表(EPG)中的标记(“BACK STREET KIDS”)不同，所以存在无法检索期望的节目这种问题。对此，在本实施方式中，在语言处理服务器1中，对于从语音识别服务器3输出的文字数据的记载与EPG中的标记不同的节目名，替换成EPG的标记，对广播接收装置2进行操作指示，因此，能够减少标记的不一致所导致的检索遗漏，能够使语音检索中的检索精度提高。

此外，在上文中，对于广播接收装置2将节目名进行语音检索的情况作为一个例子而进行了说明，但是，对于由发布运营商通过互联网电视等网络供给的节目等的语音检索，也能够适用。

说明了本发明的几个实施方式，但是，这些实施方式是作为一个例子而示出的，并非意图限定发明的范围。这些新的实施方式能够以其它的各种的形态来实施，在不脱离发明的主旨的范围内能够进行各种省略、替换、变更。这些实施方式、其变形包含于发明的范围、主旨，并且，包含于权利要求书所记载的技术方案及其等同的范围。

Claims

一种节目名检索辅助装置，具有：

节目信息存储部，其将节目名检索对象设备中存储的节目名的标记和所述节目名的读音成对地进行存储，其中，所述节目名检索对象设备中存储的节目名的标记为第1节目名；

文字数据取得电路，其取得第2节目名，所述第2节目名是对于以所述节目信息存储部中存储的所述节目名的读音为基础的语音数据实施语音识别处理而得到的文字数据；以及

替换辞典，在所述第1节目名和所述第2节目名不同的情况下，将所述第1节目名和所述第2节目名成对地进行存储。
根据权利要求1所述的节目名检索辅助装置，

所述节目名检索对象设备中存储的所述节目名为电子节目表中所记载的节目名。
根据权利要求1或2所述的节目名检索辅助装置，

所述节目名检索辅助装置还具有语言数据解析电路，所述语言数据解析电路执行自然语言解析处理，所述自然语言解析处理是对于为了操作所述节目名检索对象设备而输入的操作用语音数据实施语音识别处理而得到的文字数据的解析处理，在成为所述自然语言解析处理的对象的所述文字数据中存在所述第2节目名、且在所述替换辞典中存储有所述第2节目名的情况下，所述语言数据解析电路将所述第2节目名替换成在所述替换辞典中成对地存储的所述第1节目名，执行所述自然语言解析处理。
一种节目名检索辅助方法，

将节目名检索对象设备中存储的节目名的标记和所述节目名的读音成对地取得，其中，所述节目名检索对象设备中存储的节目名的标记为第1节目名，

取得对于以所述节目名的读音为基础的语音数据实施语音识别处理而得到的文字数据即第2节目名，

在所述第1节目名与所述第2节目名不同的情况下，将所述第1节目名和所述第2节目名成对地登记在替换辞典中。
根据权利要求4所述的节目名检索辅助方法，

所述节目名检索对象设备中存储的所述节目名为电子节目表所记载的节目名。