JP2021047507A - Notification system, notification control device, notification control method, and notification control program - Google Patents
Notification system, notification control device, notification control method, and notification control program Download PDFInfo
- Publication number
- JP2021047507A JP2021047507A JP2019168321A JP2019168321A JP2021047507A JP 2021047507 A JP2021047507 A JP 2021047507A JP 2019168321 A JP2019168321 A JP 2019168321A JP 2019168321 A JP2019168321 A JP 2019168321A JP 2021047507 A JP2021047507 A JP 2021047507A
- Authority
- JP
- Japan
- Prior art keywords
- content
- unit
- information
- occupant
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、通知システム、通知制御装置、通知制御方法、及び通知制御プログラムに関する。 The present invention relates to a notification system, a notification control device, a notification control method, and a notification control program.
従来、ユーザに係る情報に応じて、ユーザ好みのコンテンツを提供するコンテンツシステムを選択する技術が開示されている(例えば、特許文献1)。 Conventionally, a technique for selecting a content system that provides user-favorite content according to information relating to the user has been disclosed (for example, Patent Document 1).
ここで、ユーザの嗜好は、ユーザの周囲環境や、ユーザがいる場所に応じて変化する場合がある。しかしながら、従来の技術では、ユーザの周囲環境に応じてユーザ好みのコンテンツを提供することまでは困難であった。 Here, the user's preference may change depending on the user's surrounding environment and the place where the user is. However, with the conventional technology, it has been difficult to provide user-favorite content according to the user's surrounding environment.
本発明は、このような事情を考慮してなされたものであり、車両の乗員の周囲環境に応じて車両の乗員の好みのコンテンツを提供するようにできる通知システム、通知制御装置、通知制御方法、及び通知制御プログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and is a notification system, a notification control device, and a notification control method capable of providing favorite contents of a vehicle occupant according to the surrounding environment of the vehicle occupant. , And one of the purposes is to provide a notification control program.
この発明に係る通知システム、通知制御装置、通知制御方法、及び通知制御プログラムは、以下の構成を採用した。
(1)この発明の一態様の通知システムは、移動体に搭乗している乗員により発話された音声を示す音声データを取得する第1取得部と、前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈部と、前記乗員の周囲環境に係る周囲環境情報を取得する第2取得部と、前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力し、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する第3取得部と、前記移動体が備える出力部に、前記第3取得部により取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知制御部と、前記出力部により通知された前記レコメンド情報のうちいずれかを選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる提供部と、を備えるものである。
The notification system, the notification control device, the notification control method, and the notification control program according to the present invention have adopted the following configurations.
(1) The notification system according to one aspect of the present invention includes a first acquisition unit that acquires voice data indicating voice spoken by an occupant on a moving body, and a first acquisition unit that acquires voice data of the occupant based on the voice data. The content of the utterance and the surroundings are provided to the utterance content interpretation unit that interprets the content, the second acquisition unit that acquires the ambient environment information related to the occupant's surrounding environment, and one or more recommendation systems that recommend the content to the occupant. The third acquisition unit that outputs environmental information and acquires recommendation information indicating one or more contents from each of the recommendation systems, and the recommendation unit acquired by the third acquisition unit to the output unit included in the moving body. When the operation of selecting one of the notification control unit for notifying a plurality of the recommendation information for each system and the recommendation information notified by the output unit is accepted by the operation unit included in the moving body, it is selected. It is provided with a providing unit for outputting the content corresponding to any of the recommended information to the output unit.
(2)の態様は、上記(1)の態様に係る通知システムにおいて、前記通知制御部は、前記レコメンド情報に対応する一以上の前記コンテンツのうち、該レコメンド情報と前記乗員の嗜好を示す嗜好情報とに基づいて、当該乗員の嗜好と合致するコンテンツを前記出力部により通知させるものである。 In the notification system according to the aspect (1), the notification control unit has a preference of showing the recommendation information and the preference of the occupant among the one or more contents corresponding to the recommendation information. Based on the information, the output unit notifies the content that matches the taste of the occupant.
(3)の態様は、上記(1)または(2)の態様に係る通知システムが、前記出力部により通知された前記レコメンド情報と、前記レコメンド情報に係る前記周囲環境情報とを対応付けた履歴情報を生成する生成部と、前記第2取得部により新たに取得された前記周囲環境情報および前記生成部により生成された前記履歴情報に基づいて、前記乗員にレコメンドするための、新たにコンテンツを選択する選択部を更に備え、前記通知制御部は、前記選択部により選択された前記コンテンツを前記出力部に新たに通知させるものである。 The aspect (3) is a history in which the notification system according to the aspect (1) or (2) associates the recommendation information notified by the output unit with the ambient environment information related to the recommendation information. Based on the generation unit that generates information, the ambient environment information newly acquired by the second acquisition unit, and the history information generated by the generation unit, new content for recommending to the occupant is newly provided. The notification control unit further includes a selection unit to be selected, and causes the output unit to newly notify the content selected by the selection unit.
(4)の態様は、上記(3)の態様に係る通知システムにおいて、前記提供部は、前記出力部により通知された一以上の前記コンテンツを選択しない操作が、前記操作部により受け付けられた場合、前記レコメンド情報が示す一以上の前記コンテンツを前記出力部に提供させず、前記生成部は、該出力部が当該コンテンツを提供させなかった旨の履歴情報を生成するものである。 The aspect (4) is the case where in the notification system according to the aspect (3), the operation unit receives an operation in which the providing unit does not select one or more of the contents notified by the output unit. The output unit is not provided with one or more of the contents indicated by the recommendation information, and the generation unit generates historical information to the effect that the output unit did not provide the contents.
(5)の態様は、上記(1)から(4)のいずれかの態様に係る通知システムにおいて、前記周囲環境情報には、前記移動体の周囲の環境を対象にする情報と、前記乗員の周囲の環境を対象にする情報とが含まれ、前記移動体の周囲の環境を対象にする情報には、該移動体が存在する地点の天気、気候、温度もしくは湿度、又は、該移動体の周辺に存在する地点のPOI情報が含まれ、前記乗員の周囲の環境を対象にする情報には、発話時の日時もしくは曜日、又は、当該乗員の年代毎の人数、性別毎の人数もしくは総人数、又は、乗員の状況が含まれるものである。 The aspect (5) is the notification system according to any one of the above (1) to (4), wherein the surrounding environment information includes information targeting the environment around the moving body and the occupant. Information that targets the surrounding environment is included, and the information that targets the environment around the moving body includes the weather, climate, temperature or humidity at the point where the moving body exists, or the information of the moving body. The POI information of the points existing in the vicinity is included, and the information targeting the environment around the occupant includes the date and time or day of the speech, the number of the occupants by age group, the number of persons by gender, or the total number of persons. Or, the situation of the occupants is included.
(6)の態様は、上記(1)から(5)のいずれかの態様に係る通知システムにおいて、前記第3取得部は、前記レコメンドシステムが前記発話の内容に類似するクエリに更に基づいて前記コンテンツをレコメンドした前記レコメンド情報を取得するものである。 The aspect (6) is the notification system according to any one of the above aspects (1) to (5), wherein the third acquisition unit further bases the recommendation system on a query similar to the content of the utterance. The recommendation information that recommends the content is acquired.
(7)の態様は、上記(1)から(6)のいずれかの態様に係る通知システムにおいて、一以上の前記レコメンドシステムは、互いに異なる運営者によって運営されるシステムであるものである。 The aspect (7) is a notification system according to any one of the above aspects (1) to (6), in which one or more of the recommendation systems are operated by operators different from each other.
(8)この発明の他の態様の通知制御装置は、移動体に搭乗している乗員により発話された音声を示す音声データを取得する第1取得部と、前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈部と、前記乗員の周囲環境に係る周囲環境情報を取得する第2取得部と、前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力し、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する第3取得部と、前記移動体が備える出力部に、前記第3取得部により取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知制御部と、前記出力部により通知された前記レコメンド情報のうちいずれかの該レコメンド情報を選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる提供部と、を備えるものである。 (8) The notification control device of another aspect of the present invention includes a first acquisition unit that acquires voice data indicating voice spoken by an occupant on a moving body, and the occupant based on the voice data. The content of the utterance and the content of the utterance are added to the utterance content interpretation unit that interprets the content of the utterance, the second acquisition unit that acquires the ambient environment information related to the occupant's surrounding environment, and one or more recommendation systems that recommend the content to the occupant. The third acquisition unit acquired the surrounding environment information and acquired the recommendation information indicating one or more contents from each of the recommendation systems, and the output unit included in the moving body. The operation unit included in the moving body accepts an operation of selecting the recommendation information from the notification control unit for notifying a plurality of the recommendation information for each recommendation system and the recommendation information notified by the output unit. If so, it includes a providing unit that outputs the content corresponding to any of the selected recommendation information to the output unit.
(9)この発明の他の態様の通知制御方法は、単数または複数のコンピュータが実行する、移動体に搭乗している乗員により発話された音声を示す音声データを取得する第1取得プロセスと、前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈プロセスと、前記乗員の周囲環境に係る周囲環境情報を取得する第2取得プロセスと、前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力する出力ステップと、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する取得ステップとを含む第3取得プロセスと、前記移動体が備える出力部に、前記第3取得プロセスにより取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知プロセスと、前記出力部により通知された前記レコメンド情報のうちいずれかの該レコメンド情報を選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる出力プロセスと、を有するものである。 (9) The notification control method of another aspect of the present invention includes a first acquisition process of acquiring voice data indicating voice spoken by an occupant aboard a moving body, which is executed by one or more computers. The utterance content interpretation process that interprets the utterance content of the occupant based on the voice data, the second acquisition process that acquires the ambient environment information related to the occupant's surrounding environment, and one or more that recommends the content to the occupant. A third acquisition process including an output step of outputting the content of the utterance and the surrounding environment information to the recommendation system, and an acquisition step of acquiring recommendation information indicating one or more contents from each of the recommendation systems, and the above-mentioned. A notification process for notifying the output unit of the moving body of a plurality of the recommendation information for each of the recommendation systems acquired by the third acquisition process, and the recommendation of any one of the recommendation information notified by the output unit. When the operation of selecting information is accepted by the operation unit included in the moving body, it has an output process for outputting the content corresponding to any of the selected recommendation information to the output unit.
(10)この発明の他の態様の通知制御プログラムは、単数または複数のコンピュータにインストールされるためのプログラムであって、移動体に搭乗している乗員により発話された音声を示す音声データを取得する第1取得プロセスと、前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈プロセスと、前記乗員の周囲環境に係る周囲環境情報を取得する第2取得プロセスと、前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力する出力ステップと、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する取得ステップとを含む第3取得プロセスと、前記移動体が備える出力部に、前記第3取得プロセスにより取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知プロセスと、前記出力部により通知された前記レコメンド情報のうちいずれかの該レコメンド情報を選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる出力プロセスと、を前記コンピュータに実行させるものである。 (10) The notification control program of another aspect of the present invention is a program to be installed on one or more computers, and acquires voice data indicating voice spoken by an occupant on a moving body. The first acquisition process, the utterance content interpretation process that interprets the utterance content of the occupant based on the voice data, the second acquisition process that acquires the ambient environment information related to the occupant's surrounding environment, and the occupant Includes an output step of outputting the content of the utterance and the surrounding environment information to one or more recommendation systems that recommend the content, and an acquisition step of acquiring recommendation information indicating one or more contents from each of the recommendation systems. A notification process for notifying a third acquisition process, a plurality of the recommendation information for each recommendation system acquired by the third acquisition process, and an output unit included in the moving body, and the recommendation information notified by the output unit. When the operation of selecting one of the recommended information is accepted by the operation unit included in the moving body, the output process for outputting the content corresponding to the selected recommended information to the output unit, and the output process. Is to be executed by the computer.
(1)〜(10)によれば、車両の乗員の周囲環境に応じて車両の乗員の好みのコンテンツを提供するようにできる。 According to (1) to (10), it is possible to provide the favorite content of the vehicle occupant according to the surrounding environment of the vehicle occupant.
(2)によれば、より車両の乗員の好みのコンテンツを提供するようできる。 According to (2), it is possible to provide more favorite contents of the occupants of the vehicle.
(3)によれば、これまでの車両の乗員の好みに応じたコンテンツを提供するようにできる。 According to (3), it is possible to provide content according to the preference of the occupants of the vehicle so far.
(4)によれば、車両の乗員の好みに合わないコンテンツを提供しないようにすることができる。 According to (4), it is possible to prevent the provision of content that does not suit the tastes of the occupants of the vehicle.
(5)〜(6)によれば、車両の乗員に多くのコンテンツの選択肢を提示することができる。 According to (5) to (6), many content options can be presented to the occupants of the vehicle.
以下、図面を参照し、本発明の通知システム、通知制御装置、通知制御方法、及び通知制御プログラムの実施形態について説明する。 Hereinafter, embodiments of the notification system, the notification control device, the notification control method, and the notification control program of the present invention will be described with reference to the drawings.
<実施形態>
エージェント装置は、本実施形態の通知システムを含むエージェントシステム1の一部または全部を実現する装置である。以下では、エージェント装置の一例として、乗員(利用者の一例)が搭乗する車両(以下、車両M)に搭載され、エージェント機能を備えたエージェント装置について説明する。なお、本発明の適用上、必ずしもエージェント装置がエージェント機能を有している必要はない。また、エージェント装置は、スマートフォン等の可搬型端末装置(汎用端末)であってもよいが、以下では、車両に搭載されたエージェント機能を備えたエージェント装置を前提として説明する。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供や各種機器制御を行ったり、ネットワークサービスを仲介したりする機能である。エージェント装置が複数のエージェント機能を有する場合、エージェント機能は、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。車両Mは、「移動体」の一例である。
<Embodiment>
The agent device is a device that realizes a part or all of the agent system 1 including the notification system of the present embodiment. Hereinafter, as an example of the agent device, an agent device mounted on a vehicle (hereinafter, vehicle M) on which a occupant (an example of a user) is boarded and having an agent function will be described. For the application of the present invention, the agent device does not necessarily have to have an agent function. Further, the agent device may be a portable terminal device (general-purpose terminal) such as a smartphone, but the following description will be made on the premise of an agent device having an agent function mounted on a vehicle. The agent function is, for example, providing various information based on a request (command) included in the utterance of the occupant, controlling various devices, and mediating a network service while interacting with the occupant of the vehicle M. It is a function. When the agent device has a plurality of agent functions, the agent functions may have different functions, processing procedures, controls, and output modes / contents. In addition, some of the agent functions may have a function of controlling devices in the vehicle (for example, devices related to driving control and vehicle body control). The vehicle M is an example of a “moving body”.
エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバとが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。 Agent functions include, for example, a voice recognition function that recognizes the voice of an occupant (a function that converts voice into text), a natural language processing function (a function that understands the structure and meaning of text), a dialogue management function, and a network. It is realized by using a network search function that searches for another device or a predetermined database owned by the own device in an integrated manner. Some or all of these functions may be realized by AI (Artificial Intelligence) technology. In addition, a part of the configuration for performing these functions (particularly, the voice recognition function and the natural language processing interpretation function) is an agent server capable of communicating with the in-vehicle communication device of the vehicle M or the general-purpose communication device brought into the vehicle M. It may be mounted on (external device). In the following description, it is assumed that a part of the configuration is mounted on the agent server, and the agent device and the agent server cooperate to realize the agent system. Further, a service provider (service entity) in which an agent device and an agent server cooperate to appear virtually is called an agent.
<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、一以上のエージェントサーバ200とを備える。本実施形態におけるエージェントシステム1を提供する提供者は、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者等が挙げられ、任意の主体(法人、団体、個人等)がエージェントシステム1の提供者となり得る。なお、図1では、エージェントサーバ200が一つである場合について説明したが、これに限られず、エージェントシステム1は、二以上のエージェントサーバ200を備えるものであってもよい。この場合、各エージェントサーバ200は、互いに異なる任意の主体によって提供されてもよい。
<Overall configuration>
FIG. 1 is a configuration diagram of an agent system 1 including an
エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局等の通信網のうち一部または全部を含む。ネットワークNWには、一以上のコンテンツサーバ300(図示するコンテンツサーバ300−1〜300−3)が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介してコンテンツサーバ300からコンテンツを取得することができる。
The
以下、コンテンツサーバ300−1〜300−2がビデオコンテンツを提供するサーバ装置であり、コンテンツサーバ300−3が音楽コンテンツを提供するサーバ装置である場合について説明する。また、コンテンツサーバ300−1と、コンテンツサーバ300−2とは、互いに異なる任意の主体(運営者)によって提供されてもよい。以下、コンテンツサーバ300−1は、「〇〇Video」により運営され、コンテンツサーバ300−2は、「△△Video」により運営され、コンテンツサーバ300−3は、「〇〇Music」により運営されるものとする。コンテンツサーバ300は、「レコメンドシステム」の一例である。 Hereinafter, a case where the content servers 300-1 to 300-2 are server devices for providing video content and the content server 300-3 is a server device for providing music content will be described. Further, the content server 300-1 and the content server 300-2 may be provided by arbitrary entities (operators) different from each other. Hereinafter, the content server 300-1 is operated by "○○ Video", the content server 300-2 is operated by "△△ Video", and the content server 300-3 is operated by "○○ Music". It shall be. The content server 300 is an example of a “recommendation system”.
エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。
The
[車両]
図2は、実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、スピーカ20と、表示・操作装置30と、車載通信装置40と、エージェント装置100とが搭載される。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
[vehicle]
FIG. 2 is a diagram showing the configuration of the
マイク10は、車室内で発せられた音を収集する収音部である。スピーカ20は、例えば、車室内に配設されたスピーカ(音出力部)を含む。表示・操作装置30は、画像を表示するとともに、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置30は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置30は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。表示・操作装置30は、エージェント装置100とナビゲーション装置(不図示)とで共用されてもよい。車載通信装置40は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。表示・操作装置30のタッチパネルは、「操作部」の一例である。
The
[エージェント装置]
エージェント装置100は、管理部110と、エージェント機能部130と、車載通信部140と、記憶部150とを備える。管理部110は、例えば、音響処理部111と、周囲環境情報取得部112と、エージェントWU(Wake Up)判定部113と、通信制御部114と、出力制御部120と備える。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部130と車載通信装置40の間に管理部110が介在してもよいように、任意に改変することができる。また、以下では、エージェント機能部130とエージェントサーバ200が協働して出現させるエージェントを、単に「エージェント」と称する場合がある。
[Agent device]
The
エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。記憶部150は、HDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)により実現されてもよく、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)により実現されてもよく、ドライブ装置に装着される記憶媒体であってもよい。また、記憶部150の一部又は全部は、NASや外部のストレージサーバ等、エージェント装置100がアクセス可能な外部装置であってもよい。記憶部150には、例えば、エージェント装置100において実行されるプログラム等の他、履歴情報152等の情報が記憶される。履歴情報152の詳細は、後述する。
Each component of the
管理部110は、OS(Operating System)やミドルウェア等のプログラムが実行されることで機能する。
The
管理部110の音響処理部111は、マイク10から収集される音を受け付け、受け付けた音に対して、エージェントごとに予め設定されているウエイクアップワードを認識したり、その他の発話内容を認識するのに適した状態になるようにしたりする音響処理を行う。ウエイクアップワードとは、例えば、対象のエージェントを起動させるためのワード(単語)やフレーズ等である。ウエイクアップワードは、単体のエージェントを起動させるものでもよく、複数のエージェントを起動させるものでもよい。音響処理とは、例えば、バンドパスフィルタ等のフィルタリングによるノイズ除去や音の増幅等である。また、音響処理部111は、音響処理された音声(以下、音声ストリーム)を、エージェントWU判定部113や起動中のエージェント機能部130に出力する。音響処理部111は、「第1取得部」の一例である。音声ストリームは、「音声データ」の一例である。
The
周囲環境情報取得部112は、車載通信装置40を介してネットワークNWに接続される外部装置(不図示)から、乗員(車両M)が存在する場所に係る情報(以下、周囲環境情報)を取得する。具体的には、周囲環境情報取得部112は、例えば、車両Mが備えるGNSS(Global Navigation Satellite System)受信機(不図示)等によって特定された車両Mの位置を示す情報を外部装置に送信する。そして、外部装置は、受信した車両Mの位置を示す情報に基づいて、車両Mが存在する位置の天気、気候(季節)、温度、湿度、車両Mが存在する位置の周辺に存在するPOI(Point of Interest)情報等を示す周囲環境情報をエージェント装置100に送信する。
The surrounding environment
なお、周囲環境情報取得部112は、車両Mの外気を検出するセンサ(不図示)の検出結果に基づいて、車両Mが存在する位置の天気、気候、温度、湿度等を特定し、周囲環境情報を生成してもよい。また、周囲環境情報取得部112は、車両Mが備えるナビゲーション装置(不図示)からPOI情報を取得することにより、周囲環境情報を生成してもよい。
The surrounding environment
また、車両Mが、車両Mの周囲環境を撮像し、画像を生成するカメラを備え、周囲環境情報取得部112は、車両Mの周囲環境を示す画像を用いたディープラーニングにより学習された学習モデルを用いて、車両Mが存在する位置の天気、気候(季節)、温度、湿度、車両Mが存在する位置の周辺に存在するPOI情報等を含む周囲環境情報を導出してもよい。
Further, the vehicle M is provided with a camera that captures the surrounding environment of the vehicle M and generates an image, and the surrounding environment
また、周囲環境情報に含まれる情報は一例であってこれに限られない。周囲環境情報取得部112は、例えば、車両Mの車室内の環境に係る情報を周囲環境情報として生成してもよい。この場合、車両Mは、車両Mの車室内を撮像するカメラ(不図示)を備えてもよい。カメラは、例えば、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の固体撮像素子を利用したデジタルカメラである。カメラは、車両Mの車室内を撮像可能な任意の箇所に取り付けられる。そして、カメラは、例えば、周期的に繰り返し車両Mの周辺を撮像する。例えば、カメラは、ステレオカメラであってもよい。周囲環境情報取得部112は、カメラが車両Mの車室内を撮像し、生成した画像を画像処理し、車両Mの乗員の人数、乗員の年代、乗員の状況(盛り上がっているか、話に熱中しているか、退屈しているか、乗員の気分等)等を特定する。例えば、周囲環境情報取得部112は、画像処理によって乗員の顔を認識し、認識された顔の個数によって乗員の人数を特定し、認識された顔領域の特徴量に基づいて乗員の年代を特定する。また、周囲環境情報取得部112は、画像処理によって乗員の顔を認識し、認識された顔の表情や口の動きによって乗員の状況を特定する。そして、周囲環境情報取得部112は、特定した情報を含めた周囲環境情報を生成する。
Further, the information included in the surrounding environment information is an example and is not limited to this. The surrounding environment
また、周囲環境情報取得部112は、例えば、車両Mの車室内を示す画像を用いたディープラーニングにより学習された学習モデルを用いて、車両Mの乗員の人数、乗員の年代、乗員の状況等を含む周囲環境情報を導出してもよい。
Further, the surrounding environment
以下、周囲環境情報には、車両Mが存在する位置の天気、気候(季節)、温度、湿度、車両Mが存在する位置の周辺に存在するPOI情報、車両Mの乗員の人数、乗員の年代、乗員の状況等の情報うち、少なくとも一以上の情報が含まれるものとする。周囲環境情報取得部112は、例えば、エージェントサーバ200からの指示に応じて、周囲環境情報を取得(生成)し、車載通信装置40によってエージェントサーバ200に送信する。周囲環境情報取得部112は、「第2取得部」の一例である。
Hereinafter, the surrounding environment information includes the weather, climate (season), temperature, humidity at the position where the vehicle M exists, POI information existing around the position where the vehicle M exists, the number of occupants of the vehicle M, and the age of the occupants. , At least one or more of the information such as the situation of the occupants shall be included. The ambient environment
エージェントWU判定部113は、エージェントに予め定められているウエイクアップワードを認識する。エージェントWU判定部113は、音響処理部111によって音響処理が行われた音声ストリームから発話された音声を認識する。まず、エージェントWU判定部113は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントWU判定部113は、混合ガウス分布モデル(GMM;Gaussian mixture model)に基づくフレーム単位の音声識別、及び非音声識別に基づく区間検出を行ってもよい。
The agent
次に、エージェントWU判定部113は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントWU判定部113は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントWU判定部113は、ウエイクアップワードに対応するエージェント機能部130を起動させる。なお、エージェントWU判定部113に相当する機能が、エージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部111によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部130が起動する。また、各エージェント機能部130は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントWU判定部113を備える必要はない。
Next, the agent
また、エージェントWU判定部113は、上述した手順と同様の手順で、発話された音声に含まれる終了ワードを認識した場合であり、且つ、終了ワードに対応するエージェントが起動している状態(以下、必要に応じて「起動中」と称する)である場合、起動中のエージェント機能部を終了(停止)させる。なお、エージェントの起動、及び終了は、例えば、表示・操作装置30から所定の操作を受け付けることによって実行されてもよいが、以下では、音声による起動、及び停止の例を説明する。また、起動中のエージェントは、音声の入力を所定時間以上受け付けなかった場合に停止させてもよい。
Further, the agent
通信制御部114は、エージェント機能部130を、ネットワークNWに接続可能にするための制御を行う。例えば、通信制御部114は、エージェント機能部130がネットワークを介して外部装置(例えば、エージェントサーバ200)と通信を行う場合の接続状態等を制御する。また、通信制御部114は、通信が途切れた場合の再接続や、接続状態の切り替え等の制御を行う。
The
出力制御部120は、通信制御部114またはエージェント機能部130等からの指示に応じて表示部またはスピーカ20に応答内容等の情報を出力させることで、乗員にサービス等の提供を行う。具体的には、出力制御部120は、後述するエージェント機能部130によってコンテンツサーバ300から取得した(レコメンドされた)一以上のコンテンツを示す情報(以下、レコメンド情報)を、スピーカ20や、表示・操作装置30に通知させる。コンテンツとは、例えば、動画や音楽等である。
The
また、出力制御部120は、通知したレコメンド情報に含まれる一以上のコンテンツのうち、いずれかのコンテンツを選択する操作が表示・操作装置30のタッチパネルによって受け付けられた場合、操作に応じてエージェント機能部130が取得したコンテンツの音声をスピーカ20に出力させたり、コンテンツの画像を表示・操作装置30の表示装置に表示させたりすることにより、コンテンツを乗員に提供させる。
Further, when the operation of selecting one of the one or more contents included in the notified recommendation information is received by the touch panel of the display /
音声制御部122は、エージェント機能部130がエージェントサーバ200から取得した情報に基づいて、エージェントが車両Mの乗員の発話に応答する応答内容を、車両Mの乗員に通知するために用いられる音声をスピーカ20に出力させる。
The
表示制御部124は、エージェント機能部130がエージェントサーバ200から取得した情報に基づいて、エージェントが車両Mの乗員の発話に応答する応答内容を、車両Mの乗員に通知するために用いられる画像を表示・操作装置30のディスプレイ装置に表示させる。
The
エージェント機能部130は、エージェントサーバ200と協働して、車両の乗員の発話に応じて、音声、及び画像による応答を含むサービスを提供する。エージェント機能部130には、例えば、車両M、又は車両Mに搭載される車載機器を制御する権限が付与されており、後述する処理によりエージェントサーバ200によって認識された車両Mの発話内容が、車両Mに搭載される車両機器の動作を指示するコマンドである場合、エージェント機能部130は、コマンドに基づいてそれらの車両機器を制御する。エージェント機能部130は、通信制御部114の制御に基づいて、車載通信部140によって車載通信装置40を介してエージェントサーバ200と通信する。
The
なお、エージェント機能部130には、法律や条例、エージェントを提供する事業者同士の契約等に応じて、車両機器を制御する権限が割り振られるものであってもよい。
The
車載通信部140は、例えば、エージェント機能部130がネットワークNWに接続する場合に、車載通信装置40を介して通信させる。車載通信部140は、エージェント機能部130からの情報を、車載通信装置40を介してエージェントサーバ200やその他の外部装置に出力する。また、車載通信部140は、車載通信装置40を介して入力された情報をエージェント機能部130に出力する。
The vehicle-mounted
エージェント機能部130は、エージェントWU判定部113による起動指示に基づいて起動し、乗員の発話に対して、エージェントサーバ200を介して乗員の発話の音声に含まれる要求に対する応答内容を生成し、生成した応答内容を出力制御部120に出力する。また、エージェント機能部130は、エージェントサーバ200と通信を行う場合には、通信制御部114により制御された接続状態によって通信を行う。また、エージェント機能部130は、エージェントWU判定部113による制御に基づいて、エージェントを停止させてもよい。
The
[エージェントサーバ]
図3は、実施形態に係るエージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成とともに、エージェント機能部130等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。
[Agent server]
FIG. 3 is a diagram showing a configuration of the
エージェントサーバ200は、通信部210を備える。通信部210は、例えば、NIC(Network Interface Card)等のネットワークインターフェースである。更に、エージェントサーバ200は、例えば、音声認識部220と、自然言語処理部221と、対話管理部222と、ネットワーク検索部223と、応答内容生成部224との機能部を備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。音声認識部220と、自然言語処理部221とを組み合わせたものは、「発話内容解釈部」の一例である。
The
また、エージェントサーバ200は、記憶部250を備える。記憶部250は、上記の記憶部150を実現する各種記憶装置と同様の装置により実現される。記憶部250には、例えば、辞書DB252、パーソナルプロファイル254、知識ベースDB256、応答規則DB258等のデータやプログラムが格納される。
Further, the
エージェント装置100において、エージェント機能部130は、例えば、音響処理部111等から入力される音声ストリーム、或いは圧縮や符号化等の処理を行った音声ストリームを、エージェントサーバ200に送信する。エージェント機能部130は、ローカル処理(エージェントサーバ200を介さない処理)が可能なコマンド(要求内容)が認識できた場合には、コマンドで要求された処理を実行してもよい。ローカル処理が可能なコマンドとは、例えば、エージェント装置100が備える記憶部150を参照することで応答可能なコマンドである。より具体的には、ローカル処理が可能なコマンドとは、例えば、記憶部150内に存在する電話帳データ(不図示)から特定者の名前を検索し、合致した名前に対応付けられた電話番号に電話をかける(相手を呼び出す)コマンドである。したがって、エージェント機能部130は、エージェントサーバ200が備える機能の一部を有してもよい。
In the
音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部221が文字情報に対して辞書DB252を参照しながら意味解釈を行う。辞書DB252は、例えば、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB252は、例えば、機能辞書252Aと、汎用辞書252Bとを含む。
When the voice stream is acquired, the
機能辞書252Aは、エージェントサーバ200がエージェント機能部130と協働して実現するエージェントが提供する機能(サービス)をカバーするための辞書である。例えば、エージェントが車載エアコンを制御する機能を提供する場合、機能辞書252Aには、「エアコン」、「空調」、「つける」、「消す」、「温度」、「上げる」、「下げる」、「内気」、「外気」等の単語が、動詞、目的語等の単語種別、及び抽象化された意味と対応付けられて登録されている。また、機能辞書252Aには、同時に使用可能であることを示す単語間リンク情報が含まれてよい。
The
汎用辞書252Bは、エージェントの提供する機能に限らず、一般的な物事の事象を抽象化された意味と対応付けた辞書である。機能辞書252Aと汎用辞書252Bのそれぞれは、同義語や類義語の一覧情報を含んでもよい。機能辞書252Aと汎用辞書252Bとは、複数の言語のそれぞれに対応して用意されてよく、その場合、音声認識部220及び自然言語処理部221は、予め設定されている言語設定に応じた機能辞書252A及び汎用辞書252B、並びに文法情報(不図示)を使用する。音声認識部220の処理と、自然言語処理部221の処理は、段階が明確に分かれるものではなく、自然言語処理部221の処理結果を受けて音声認識部220が認識結果を修正する等、相互に影響し合って行われてよい。
The general-
自然言語処理部221は、音声認識部220による認識結果に基づく意味解析の一つとして、音声に含まれるサービスの要求に対応するために必要な機能に関する情報(以下、機能必要情報)を取得する。例えば、認識結果として、車両Mの車載機器の制御を指示する「窓を開けて」、「空調の温度を上げて」等のテキストが認識された場合、自然言語処理部221は、辞書DB252等を参照し、「車両機器制御」という対象機器・機能種別を取得する。そして、自然言語処理部221は、取得した機能必要情報をエージェント機能部130に出力する。自然言語処理部221は、機能必要情報に基づきサービス要求に対する実行可否の判定結果を取得する。自然言語処理部221は、要求された機能が実行可能である場合に、サービスの要求に対応できるものとして、解釈された発話内容に対応したコマンドを生成する。
The natural
また、認識結果として、コンテンツサーバ300にコンテンツの提供を求める「ポップスのコンテンツを紹介して」、「何かクラッシックのコンテンツを再生して」等の意味が認識された場合、自然言語処理部221は、辞書DB252等を参照し、「コンテンツレコメンド制御」という機能種別を取得し、対話管理部222に、「コンテンツレコメンド制御」という機能種別の情報を送信する。
In addition, when the meanings such as "introduce pop content" and "play some classic content" that request the content server 300 to provide the content are recognized as the recognition result, the natural
対話管理部222は、自然言語処理部221により生成されたコマンドに基づいて、パーソナルプロファイル254や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する応答内容(例えば、乗員への発話内容や出力部から出力する画像、音声)を決定する。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容等)を規定した情報である。対話管理部222は自然言語処理部221から、「コンテンツレコメンド制御」という機能種別の情報が送信されれば、エージェント装置100から周囲環境情報を取得し、取得した周囲環境情報をコンテンツサーバ300に出力する。コンテンツサーバ300は、後述する処理によってレコメンド情報をエージェントサーバ200に出力する。対話管理部222は、コンテンツサーバ300から取得したレコメンド情報をエージェント装置100に送信する。レコメンド情報の取得に係る処理について、対話管理部222は、「第3取得部」の一例である。
The
また、対話管理部222は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル254と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル254には、例えば、音声の特徴情報が更に応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。
Further, the
対話管理部222は、コマンドがネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部223に検索を行わせる。ネットワーク検索部223は、ネットワークNWを介してコンテンツサーバ300等の外部機器にアクセスし、所望の情報を取得する。
The
応答内容生成部224は、対話管理部222により決定された発話の内容が車両Mの乗員に理解されるように、応答文を生成し、生成した応答文をエージェント装置100に送信する。また、応答内容生成部224は、カメラが車室内を撮像した画像に基づいて車両Mの乗員を認識した認識結果をエージェント装置100から取得し、取得した認識結果によりコマンドを含む発話を行った乗員がパーソナルプロファイル254に登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にしたりした応答文を生成してもよい。本実施形態において、応答文は、例えば、「あなたにおすすめのコンテンツをご用意しました。」等の文章である。
The response
エージェント機能部130は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部122に指示する。また、エージェント機能部130は、応答文を含む画像等を表示するように表示制御部124に指示する。
When the
[コンテンツサーバ300]
図4は、コンテンツサーバ300−1の構成の一例を示す図である。コンテンツサーバ300−1〜300−3は、同様の構成を有するため、以降は、コンテンツサーバ300−1について説明し、コンテンツサーバ300−2〜300−3の説明については、省略する。
[Content Server 300]
FIG. 4 is a diagram showing an example of the configuration of the content server 300-1. Since the content servers 300-1 to 300-3 have the same configuration, the content server 300-1 will be described below, and the description of the content servers 300-2 to 300-3 will be omitted.
コンテンツサーバ300−1は、通信部310を備える。通信部310は、例えば、NIC等のネットワークインターフェースである。更に、コンテンツサーバ300−1は、取得部320と、レコメンド情報取得部322との機能部を備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
The content server 300-1 includes a
また、コンテンツサーバ300−1は、記憶部350と、コンテンツDB360とを備える。記憶部350と、コンテンツDB360とは、それぞれ、上記の記憶部150や記憶部250を実現する各種記憶装置と同様の装置により実現される。記憶部350には、例えば、学習モデル352等のデータやプログラムが格納される。また、コンテンツDB360には、コンテンツサーバ300−1が提供するコンテンツが格納される。
Further, the content server 300-1 includes a
学習モデル352は、例えば、周囲環境情報を入力データとし、レコメンド情報を出力データとした機械学習によって学習された学習済みモデルである。学習モデル352は、入力層と、隠れ層と、出力層とを有する。学習モデル352の入力層には、周囲環境情報に含まれる乗員の発話時の日時、曜日、車両Mが存在する地点の天気、気候、温度、湿度、車両Mの周辺に存在するPOI情報、車両Mの乗員の総人数、乗員の年代毎の人数、性別毎の人数、乗員の状況を示す情報が入力される。出力層からは、レコメンド情報が出力される。レコメンド情報には、コンテンツDB360におけるコンテンツの格納場所(リンク)を示す情報が一以上含まれる。隠れ層は、入力層と出力層とをつなぐ多層のニューラルネットワークを有する。隠れ層のパラメータは、入力層への入力を学習データとし、出力層から出力されるべきデータを教師データとして機械学習を行うことで最適化される。この場合、学習データは、周囲環境情報であり、教師データは、当該周囲環境情報が示す環境に存在する車両Mの乗員がレコメンド情報に応じて選択したコンテンツである。
The
なお、コンテンツサーバ300−1は、学習段階のモデルを学習させる学習部を備えてもよい。この場合、学習部は、周囲環境情報と、当該周囲環境情報が示す環境に存在する車両Mの乗員がレコメンド情報に応じて選択したコンテンツを示す情報とに基づいて、学習段階のモデルを学習させ、学習段階のモデルが適切に学習された場合、学習段階のモデルを学習モデル352として記憶部350に記憶させる。
The content server 300-1 may include a learning unit for learning the model at the learning stage. In this case, the learning unit trains the learning stage model based on the surrounding environment information and the information indicating the content selected by the occupant of the vehicle M existing in the environment indicated by the surrounding environment information according to the recommendation information. When the learning stage model is properly learned, the learning stage model is stored in the
取得部320は、通信部310によってエージェントサーバ200から周囲環境情報を取得(受信)する。レコメンド情報取得部322は、取得部320によって取得された周囲環境情報を学習モデル352に入力し、出力としてレコメンド情報を取得する。レコメンド情報取得部322は、取得したレコメンド情報をエージェントサーバ200に送信する。エージェントサーバ200は、コンテンツサーバ300からコンテンツサーバ300毎にレコメンド情報を受信し、受信したレコメンド情報をエージェント装置100に送信する。
The
[レコメンド情報の通知例]
図5は、レコメンド情報の通知に用いられる第1通知画像IMa1場面の一例を示す図である。エージェント機能部130は、エージェントサーバ200からレコメンド情報を受信し、出力制御部120によって車両Mの乗員に通知させる。出力制御部120は、例えば、レコメンド情報を含む第1通知画像IMa1を生成し、表示・操作装置30の画像に表示させて車両Mの乗員にレコメンド情報を通知させる。図5に示す通り、第1通知画像IMa1には、レコメンド情報に含まれるコンテンツをそれぞれ示す画像(以下、コンテンツ画像IMc)が一以上含まれる。また、第1通知画像IMa1には、車両Mの乗員がコンテンツ画像IMcに対応するコンテンツの提供を受けないことを選択するボタンB1が含まれる。レコメンド情報の通知に係る処理において、出力制御部120と、エージェント機能部130とを組合せたものが「通知制御部」の一例である。
[Example of notification of recommendation information]
FIG. 5 is a diagram showing an example of a first notification image IMa1 scene used for notification of recommendation information. The
図5の例の第1通知画像IMa1は、コンテンツサーバ300毎のレコメンド情報が複数通知される。具体的には、第1通知画像IMa1には、「〇〇Video」により運営されるコンテンツサーバ300−1から出力されたレコメンド情報に含まれるコンテンツを示したコンテンツ画像IMc1(図示するコンテンツ画像IMc1−1〜IMc1−3)と、「△△Video」により運営されるコンテンツサーバ300−2から出力されたレコメンド情報に含まれるコンテンツを示したコンテンツ画像IMc2(図示するコンテンツ画像IMc2−1〜IMC2−3)と、「〇〇Music」により運営されるコンテンツサーバ300−3から出力されたレコメンド情報に含まれるコンテンツを示したコンテンツ画像IMc3(図示するコンテンツ画像IMc3−1〜IMc3−3)とが含まれる。 In the first notification image IMa1 of the example of FIG. 5, a plurality of recommendation information for each content server 300 is notified. Specifically, the first notification image IMa1 is a content image IMc1 (illustrated content image IMc1-) showing the content included in the recommendation information output from the content server 300-1 operated by "OO Video". Content image IMc2 (illustrated content image IMc2-1 to IMC2-3) showing the content included in the recommendation information output from the content server 300-2 operated by 1 to IMc1-3) and "△△ Video". ) And the content image IMc3 (illustrated content images IMc3-1 to IMc3-3) indicating the content included in the recommendation information output from the content server 300-3 operated by "○○ Music". ..
エージェント機能部130は、第1通知画像IMa1が表示されたことに応じて、第1通知画像IMa1に含まれる一以上のコンテンツ画像IMcのうち、いずれかのコンテンツ画像IMcを選択する車両Mの乗員の操作(つまり、コンテンツを選択する操作)が受け付けられたか否かを判定する。エージェント機能部130は、操作が受け付けられた場合、レコメンド情報に基づいて、当該選択されたコンテンツ画像IMcに対応するコンテンツに係る情報(例えば、コンテンツDB360におけるコンテンツの格納場所)を特定する。エージェント機能部130は、特定した格納場所に格納されたコンテンツを取得し、出力制御部120によって車両Mの乗員に提供させる。具体的には、音声制御部122は、エージェント機能部130によって取得されたコンテンツの音声をスピーカ20によって出力させ、表示制御部124は、エージェント機能部130によって取得されたコンテンツの画像を表示・操作装置30の表示装置に表示させる。コンテンツの提供に係る処理において、出力制御部120と、エージェント機能部130とを組み合わせたものが「提供部」の一例である。
The
また、エージェント機能部130は、通知画像IMaが表示されたことに応じて、ボタンB1が選択する車両Mの乗員の操作が受け付けられた場合、コンテンツDB360からコンテンツを取得せず、出力制御部120によってコンテンツを提供させない。
Further, when the operation of the occupant of the vehicle M selected by the button B1 is accepted in response to the display of the notification image IMa, the
[選択されたコンテンツサーバ300からレコメンド情報を取得する場合]
なお、上述では、エージェントサーバ200の対話管理部222が、ネットワークNWに接続される一以上のコンテンツサーバ300のいずれにも周囲環境情報を出力し、一以上のコンテンツサーバ300のそれぞれからレコメンド情報を取得する場合について説明したが、これに限られない。対話管理部222は、例えば、ネットワークNWに一以上のコンテンツサーバ300が接続される場合、一以上のコンテンツサーバ300から適当なコンテンツサーバ300を(例えば、1つだけ)選択し、選択したコンテンツサーバ300に対して周囲環境情報を出力するものであってもよい。
[When acquiring recommendation information from the selected content server 300]
In the above description, the
この場合、対話管理部222は、適当なコンテンツサーバ300として、車両Mの乗員の好みに合致するコンテンツを提供するコンテンツサーバ300を選択してもよく、車両Mの乗員にコンテンツを提供した提供履歴の有るコンテンツサーバ300を選択してもよく、予め車両Mの乗員がお気に入りとして登録しているコンテンツサーバ300を選択してもよく、車両Mの乗員の発話内容に合致するコンテンツサーバ300を選択してもよい。
In this case, the
車両Mの乗員の好みと合致するコンテンツサーバ300を選択する場合、対話管理部222は、パーソナルプロファイル254を参照し、車両Mの乗員の好み(或いは、嗜好、傾向等)を特定し、特定した車両Mの乗員の好みに合致するコンテンツを多数提供しているコンテンツサーバ300を選択する。また、車両Mの乗員にコンテンツを提供した提供履歴の有るコンテンツサーバ300を選択する場合、記憶部250(或いは、記憶部150)には、コンテンツの提供を受けた車両Mの乗員を識別可能な情報と、コンテンツを提供したコンテンツサーバ300を識別可能な情報とが互いに対応付けられた提供履歴情報が記憶され、対話管理部222は、提供履歴情報を参照して、コンテンツサーバ300を選択する。また、予め車両Mの乗員がお気に入りとして登録しているコンテンツサーバ300を選択する場合、記憶部250(或いは、記憶部150)には、車両Mの乗員を識別可能な情報と、当該乗員がお気に入りのコンテンツサーバ300を識別可能な情報とが対に対応付けられたお気に入り情報が記憶され、対話管理部222は、お気に入り情報を参照して、コンテンツサーバ300を選択する。予め車両Mの乗員がお気に入りとして登録しているコンテンツサーバ300を示す情報や、パーソナルプロファイル254は、「嗜好情報」の一例である。
When selecting the content server 300 that matches the preference of the occupant of the vehicle M, the
図6は、レコメンド情報の通知に用いられる第2通知画像IMa2場面の一例を示す図である。エージェント機能部130は、学習モデル352が格納された記憶部350がある1つのコンテンツサーバ300から取得したレコメンド情報を受信し、出力制御部120によって車両Mの乗員に通知させる。図6の例では、第2通知画像IMa2には、「〇〇Video」により運営されるコンテンツサーバ300−1から出力されたレコメンド情報に含まれるコンテンツを示したコンテンツ画像IMc1(図示するコンテンツ画像IMc1−1〜IMc1−6)のみが含まれる。
FIG. 6 is a diagram showing an example of a second notification image IMa2 scene used for notification of recommendation information. The
[動作フロー]
図7〜図8は、実施形態に係るエージェントシステム1の一連の動作の一例を示すフローチャートである。本フローチャートの処理は、例えば、所定周期或いは所定のタイミングで繰り返し実行されてよい。また、図7〜図8の例では、エージェント装置100により実行される処理のうち、主にウエイクアップワードによりエージェントを起動し、乗員の発話に含まれる要求に応答する処理について説明するものとし、エージェント装置100のエージェント機能部130と協働して実行されるエージェントサーバ200の処理も含めて説明するものとする。
[Operation flow]
7 to 8 are flowcharts showing an example of a series of operations of the agent system 1 according to the embodiment. The processing of this flowchart may be repeatedly executed, for example, at a predetermined cycle or a predetermined timing. Further, in the examples of FIGS. 7 to 8, among the processes executed by the
まず、エージェントWU判定部113は、ウエイクアップワードに対応付けられたエージェント(エージェント機能部130)を起動させる(ステップS100)。次に、音響処理部111は、マイク10等により音声を受け付けたか否かを判定する(ステップS102)。音声を受け付けた場合、音響処理部111は、受け付けた音声に対して発話内容を認識するのに適した状態になるように音響処理を行う(ステップS104)。音響処理された音声は、エージェント機能部130からエージェントサーバ200に送信される。
First, the agent
エージェントサーバ200の音声認識部220は、受け付けた音声の認識を行い、音声をテキスト化する(ステップS106)。次に、自然言語処理部221は、テキスト化された文字情報に対する自然言語処理を実行し、文字情報の意味解釈を行う(ステップS108)。次に、自然言語処理部221は、意味解釈した車両Mの乗員の発話の内容が、コンテンツの提供を求める発話の内容であるか否かを判定する(ステップS110)。自然言語処理部221は、コンテンツの提供を求める発話の内容ではないと判定した場合、処理をステップS118に進める。自然言語処理部221は、コンテンツの提供を求める発話の内容であると判定した場合、対話管理部222に「コンテンツレコメンド制御」という機能種別の情報を送信し、ステップS112に進める。
The
対話管理部222は、エージェント装置100の周囲環境情報取得部112によって取得された周囲環境情報を取得する(ステップS112)。対話管理部222は、取得した周囲環境情報をコンテンツサーバ300に出力し、レコメンド情報を取得する(ステップS114)。コンテンツサーバ300の取得部320は、通信部310によってエージェントサーバ200から周囲環境情報を取得(受信)する。レコメンド情報取得部322は、取得部320によって取得された周囲環境情報を学習モデル352に入力し、出力としてレコメンド情報を取得する。レコメンド情報取得部322は、取得したレコメンド情報をエージェントサーバ200に送信する。エージェント機能部130は、エージェントサーバ200がコンテンツサーバ300から取得したレコメンド情報を出力制御部120によって車両Mの乗員に通知させる(ステップS116)。具体的には、エージェント機能部130は、レコメンド情報を示す第1通知画像IMa1や、第2通知画像IMa2を表示・操作装置30の表示装置に表示させる。
The
エージェントサーバ200の応答内容生成部224は、対話管理部222により決定された発話の内容が車両Mの乗員に理解されるように、応答内容を生成する(ステップS118)。エージェント機能部130は、エージェントサーバ200から取得した応答結果を出力部に出力させる(ステップS120)。具体的には、エージェント機能部130は、エージェントサーバ200から取得した応答内容を、音声として音声制御部122にスピーカ20から出力させ、画像として表示制御部124に表示・操作装置30の表示装置に表示させる。この場合、応答内容は、「あなたにおすすめのコンテンツをご用意しました。」等のメッセージである。
The response
次に、エージェント機能部130は、第1通知画像IMa1や、第2通知画像IMa2が表示されたことに応じて、表示・操作装置30のタッチパネルによって車両Mの乗員の操作が受け付けられたか否かを判定する(ステップS124)。エージェント機能部130は、操作が受け付けられるまでの間、待機する。エージェント機能部130は、車両Mの乗員の操作が受け付けられたと判定した場合、第1通知画像IMa1や、第2通知画像IMa2に含まれる一以上のコンテンツ画像IMcのうち、いずれかのコンテンツ画像IMcを選択する車両Mの乗員の操作(つまり、コンテンツを選択する操作)が受け付けられたか否かを判定する(ステップS126)。エージェント機能部130は、操作が受け付けられるまでの間、待機する。エージェント機能部130は、コンテンツを選択する操作が受け付けられた場合、レコメンド情報に基づいて、コンテンツ画像IMcに対応するコンテンツをコンテンツサーバ300から取得する(ステップS128)。エージェント機能部130は、取得したコンテンツを出力制御部120によって車両Mの乗員に提供させる(ステップS130)。エージェント機能部130は、コンテンツを選択する操作が受け付けられなかった場合(つまり、コンテンツの提供を受けないことを選択する操作が受け付けられた場合)、コンテンツサーバ300からコンテンツを取得せず、出力制御部120にコンテンツを提供させない(ステップS132)。
Next, the
ステップS130、又はS132の処理後、エージェント機能部130は、エージェントの処理を終了させるか否かを判定する(ステップS134)。エージェントを終了させないと判定された場合には、ステップS102の処理に戻る。また、エージェントを終了させると判定された場合、管理部110は、エージェントを終了させる(ステップS136)。エージェントを終了させる場合には、例えば、エージェントを終了させる終了ワードの音声を受け付けた場合、エージェントを終了させる車載スイッチが押された場合、マイク10が音声を受け付けない状態が所定時間以上継続した場合等が含まれる。本フローチャートの処理は、終了する。
After the processing of step S130 or S132, the
[実施形態のまとめ]
ここで、車両Mの乗員の嗜好は、車両Mの内部における乗員の周囲環境や、車両Mが存在する場所に応じて転換する場合がある。例えば、車両Mの乗員は、車両Mが海辺に存在する場合には、海に関連するコンテンツの提供を受けたくなったり、車両Mが雨の降っている地域に存在する場合には、雨に関連するコンテンツの提供を受けたくなったりする場合がある。エージェント機能部130、及び出力制御部120は、周囲環境情報に基づいて学習された学習モデル352を用いてコンテンツサーバ300により導出されたレコメンド情報を元にコンテンツのレコメンドを行う。このため、本実施形態のエージェントシステム1によれば、周囲環境情報に応じて得られたレコメンド情報を用いてコンテンツをレコメンドし、車両の乗員の周囲環境に応じて車両の乗員の好みのコンテンツを提供するようにできる。
[Summary of Embodiment]
Here, the preference of the occupant of the vehicle M may change depending on the surrounding environment of the occupant inside the vehicle M and the place where the vehicle M exists. For example, the occupant of the vehicle M may want to be provided with sea-related content when the vehicle M is located at the beach, or may be in the rain when the vehicle M is located in a rainy area. You may want to be provided with related content. The
[レコメンド情報を用いない通知例]
なお、上述では、エージェント機能部130が、自然言語処理部221から取得したレコメンド情報を用いて車両Mの乗員にコンテンツをレコメンドする場合について説明したが、これに限られない。エージェント機能部130は、例えば、履歴情報に基づいて、コンテンツを車両Mの乗員にレコメンドするコンテンツを選択してもよい。この場合、エージェント機能部130は、記憶部150に記憶される履歴情報152を参照し、レコメンドするコンテンツを決定する。
[Example of notification without recommendation information]
In the above description, the case where the
図9は、履歴情報152の内容の一例を示す図である。履歴情報152は、例えば、車両Mの乗員がコンテンツの提供を受けた際に、又は受けない場合でも、周囲環境情報取得部112によって取得された周囲環境情報と、当該コンテンツを識別可能な情報と、当該コンテンツのコンテンツDB360における格納場所を示す情報とが互いに対応付けられた情報である。エージェント機能部130は、レコメンド情報に基づいて車両Mの乗員にコンテンツが提供された場合、当該レコメンド情報に係る周囲環境情報と、当該コンテンツを識別可能な情報と、当該レコメンド情報に示される当該コンテンツの格納場所を示す情報とを互いに対応付けたレコードによって履歴情報152を生成(更新)し、記憶部150に記憶させる。
FIG. 9 is a diagram showing an example of the contents of the
また、エージェント機能部130は、自然言語処理部221により解釈された車両Mの乗員の発話の内容が、コンテンツの提供を求める内容であると認識された場合、周囲環境情報取得部112によって取得された周囲環境情報を検索キーとして履歴情報152を検索し、検索キーの周囲環境情報と合致する(或いは、合致の程度が高い)周囲環境情報に対応付けられたコンテンツを選択する。そして、エージェント機能部130は、選択したコンテンツの提供を出力制御部120に通知させる。履歴情報152に基づいてコンテンツを選択する処理において、エージェント機能部130は、「選択部」の一例である。
Further, when the
[レコメンド情報のフィルタリング]
また、エージェント機能部130は、コンテンツサーバ300から取得したレコメンド情報に含まれる一以上のコンテンツについて、いずれも出力制御部120に通知させる場合について説明したが、これに限られない。エージェント機能部130は、コンテンツサーバ300から取得したレコメンド情報に含まれる一以上のコンテンツのうち、いずれかのコンテンツを抽出して出力制御部120に通知させてもよい。この場合、エージェント機能部130は、上述した履歴情報152や、パーソナルプロファイル254、或いは車両Mの乗員の発話の内容に含まれるクエリ(問い合わせ語句)等に基づいて、レコメンド情報に含まれるコンテンツから、いずれかのコンテンツを抽出して(換言すると、車両Mの乗員の好みに合わないコンテンツを除外し)、出力制御部120に通知させる。例えば、車両Mの乗員の発話内容に「何か『音楽』をかけて」、「何か『映画』を再生して」等の『クエリ』が含まれる場合、エージェント機能部130は、レコメンド情報に含まれるコンテンツのうち、『音楽』や『映画』等の『クエリ』に合致するコンテンツを抽出して通知、及び提供する。
[Filtering recommendation information]
Further, the
また、エージェント機能部130は、コンテンツサーバ300から取得したレコメンド情報に含まれる一以上のコンテンツのうち、クエリ、及びクエリに類似するクエリのコンテンツを抽出して(換言すると、クエリ、及びクエリに類似するクエリのコンテンツ以外のコンテンツを除外した)、出力制御部120に通知させてもよい。この場合、エージェント機能部130は、クエリをエージェントサーバ200に出力する。そして、自然言語処理部221は、記憶部250に記憶される類語辞書(不図示)に基づいて特定されたクエリに類似するクエリを特定する。類語辞書とは、単語と、当該単語の類語とが互いに対応付けられた辞書である。エージェント機能部130は、クエリと、自然言語処理部221によって特定された類似するクエリとに基づいて、レコメンド情報に含まれるコンテンツのうち、クエリ、又は類似するクエリに合致するコンテンツを抽出して通知、及び提供する。
Further, the
なお、エージェント機能部130がレコメンド情報に含まれるコンテンツを除外する構成に代えて、学習モデル352が車両Mの乗員の発話の内容に含まれるクエリが入力されるものであってもよい。例えば、車両Mの乗員の発話の内容が「『歌手A』の曲をかけて」等のクエリを含むものである場合、エージェント機能部130は、周囲環境情報と、クエリを示す情報とをコンテンツサーバ300に出力する。レコメンド情報取得部322は、学習モデル352に周囲環境情報とクエリとを入力し、出力されたレコメンド情報を取得する。この時、学習モデル352は、入力データとして周囲環境情報とクエリとが入力され、レコメンド情報を出力データとした学習済みモデルである。
Instead of the configuration in which the
この場合、学習モデル352の入力層には、周囲環境情報に含まれる乗員の発話時の日時、曜日、車両Mが存在する地点の天気、気候、温度、湿度、車両Mの周辺に存在するPOI情報、車両Mの乗員の総人数、乗員の年代毎の人数、性別毎の人数、乗員の状況を示す情報と、クエリを示す情報(及び、クエリと合致するエンティティを示す情報)が入力される。出力層からは、レコメンド情報が出力される。学習モデル352の学習方法は、上述した方法と同様であるため、説明を省略する。
In this case, the input layer of the
[エージェント装置100とエージェントサーバ200とを合わせた構成]
なお、上述では、エージェント装置100と、エージェントサーバ200とが別体によって構成される場合について説明したが、これに限られない。エージェント装置100と、エージェントサーバ200とは一体に構成されていてもよい。図10は、エージェントサーバ200の機能を備えるエージェント装置100Aの構成の一例を示す図である。エージェント装置100Aは、エージェント装置100が備えるエージェント機能部130に代えて(或いは、加えて)、エージェント機能部130Aを備える。エージェント機能部130Aは、例えば、音声認識部220と、自然言語処理部221と、対話管理部222と、ネットワーク検索部223と、応答内容生成部224とをその機能部として備える。これらの機能部が実行する処理は、上述した処理と同様であるため、説明を省略する。また、エージェント装置100Aは、エージェント装置100が備える記憶部150に代えて(或いは、加えて)、記憶部150Aを備える。記憶部150Aには、例えば、エージェント装置100Aにおいて実行されるプログラムの他、履歴情報152と、辞書DB252(機能辞書252A、汎用辞書252B、及び別称辞書252Cを含む)と、パーソナルプロファイル254と、知識ベースDB256と、応答規則DB258との情報が記憶される。エージェント装置100Aによれば、ネットワークを介した通信を行わずとも、上述した処理を実行することができる。
[Configuration of
In the above description, the case where the
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.
1…エージェントシステム、10…マイク、20…スピーカ、30…表示・操作装置、40…車載通信装置、100…エージェント装置、110…管理部、111…音響処理部、112…周囲環境情報取得部、113…エージェントWU判定部、114…通信制御部、120…出力制御部、122…音声制御部、124…表示制御部、130…エージェント機能部、140…車載通信部、150…記憶部、152…履歴情報、200…エージェントサーバ、210…通信部、220…音声認識部、221…自然言語処理部、222…対話管理部、223…ネットワーク検索部、224…応答内容生成部、250…記憶部、252A…機能辞書、252B…汎用辞書、252…辞書DB、256…知識ベースDB、258…応答規則DB、254…パーソナルプロファイル、300、300−1、300−2、300−3…コンテンツサーバ、310…通信部、320…取得部、322…レコメンド情報取得部、350…記憶部、352…学習モデル、360…コンテンツDB、IMa…通知画像、IMa1…第1通知画像、IMa2…第2通知画像 1 ... Agent system, 10 ... Microphone, 20 ... Speaker, 30 ... Display / operation device, 40 ... In-vehicle communication device, 100 ... Agent device, 110 ... Management unit, 111 ... Sound processing unit, 112 ... Surrounding environment information acquisition unit, 113 ... Agent WU determination unit, 114 ... Communication control unit, 120 ... Output control unit, 122 ... Voice control unit, 124 ... Display control unit, 130 ... Agent function unit, 140 ... In-vehicle communication unit, 150 ... Storage unit, 152 ... History information, 200 ... agent server, 210 ... communication unit, 220 ... voice recognition unit, 221 ... natural language processing unit, 222 ... dialogue management unit, 223 ... network search unit, 224 ... response content generation unit, 250 ... storage unit, 252A ... Functional dictionary, 252B ... General-purpose dictionary, 252 ... Dictionary DB, 256 ... Knowledge base DB, 258 ... Response rule DB, 254 ... Personal profile, 300, 300-1, 300-2, 300-3 ... Content server, 310 ... communication unit, 320 ... acquisition unit, 322 ... recommendation information acquisition unit, 350 ... storage unit, 352 ... learning model, 360 ... content DB, IMa ... notification image, IMa1 ... first notification image, IMa2 ... second notification image
Claims (10)
前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈部と、
前記乗員の周囲環境に係る周囲環境情報を取得する第2取得部と、
前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力し、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する第3取得部と、
前記移動体が備える出力部に、前記第3取得部により取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知制御部と、
前記出力部により通知された前記レコメンド情報のうちいずれかを選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる提供部と、
を備える通知システム。 The first acquisition unit that acquires voice data indicating the voice spoken by the occupants on the moving object, and
An utterance content interpretation unit that interprets the utterance content of the occupant based on the voice data,
The second acquisition unit that acquires the surrounding environment information related to the surrounding environment of the occupant, and
With a third acquisition unit that outputs the content of the utterance and the surrounding environment information to one or more recommendation systems that recommend content to the occupant, and acquires recommendation information indicating one or more content from each of the recommendation systems. ,
A notification control unit that causes an output unit included in the mobile body to notify a plurality of the recommendation information for each recommendation system acquired by the third acquisition unit.
When the operation of selecting one of the recommended information notified by the output unit is accepted by the operation unit included in the moving body, the content corresponding to the selected recommended information is sent to the output unit. The provider to output and
Notification system with.
請求項1に記載の通知システム。 The notification control unit uses the output unit to output content that matches the occupant's preference based on the recommendation information and the preference information indicating the occupant's preference among one or more of the contents corresponding to the recommendation information. Notify me
The notification system according to claim 1.
前記第2取得部により新たに取得された前記周囲環境情報および前記生成部により生成された前記履歴情報に基づいて、前記乗員にレコメンドするための、新たにコンテンツを選択する選択部を更に備え、
前記通知制御部は、前記選択部により選択された前記コンテンツを前記出力部に新たに通知させる、
請求項1または2に記載の通知システム。 A generation unit that generates history information in which the recommendation information notified by the output unit and the surrounding environment information related to the recommendation information are associated with each other.
A selection unit for newly selecting content for recommending to the occupant based on the ambient environment information newly acquired by the second acquisition unit and the history information generated by the generation unit is further provided.
The notification control unit causes the output unit to newly notify the content selected by the selection unit.
The notification system according to claim 1 or 2.
前記生成部は、該出力部が当該コンテンツを提供させなかった旨の履歴情報を生成する、
請求項3に記載の通知システム。 When the operation unit does not select one or more of the contents notified by the output unit, the providing unit does not provide the output unit with one or more of the contents indicated by the recommendation information. ,
The generation unit generates historical information indicating that the output unit did not provide the content.
The notification system according to claim 3.
前記移動体の周囲の環境を対象にする情報には、該移動体が存在する地点の天気、気候、温度もしくは湿度、又は、該移動体の周辺に存在する地点のPOI情報が含まれ、
前記乗員の周囲の環境を対象にする情報には、発話時の日時もしくは曜日、又は、当該乗員の年代毎の人数、性別毎の人数もしくは総人数、又は、乗員の状況が含まれる、
請求項1から4のうちいずれか一項に記載の通知システム。 The surrounding environment information includes information that targets the environment around the moving body and information that targets the environment around the occupant.
The information targeting the environment around the moving body includes the weather, climate, temperature or humidity of the point where the moving body exists, or POI information of the point existing around the moving body.
The information targeting the environment around the occupant includes the date and time or day of the week at the time of utterance, the number of the occupant by age group, the number of persons by gender or the total number of persons, or the situation of the occupant.
The notification system according to any one of claims 1 to 4.
請求項1から5のうちいずれか一項に記載の通知システム。 The third acquisition unit acquires the recommendation information in which the recommendation system recommends the content based on a query similar to the content of the utterance.
The notification system according to any one of claims 1 to 5.
請求項1から6のうちいずれか一項に記載の通知システム。 One or more of the recommendation systems are systems operated by different operators.
The notification system according to any one of claims 1 to 6.
前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈部と、
前記乗員の周囲環境に係る周囲環境情報を取得する第2取得部と、
前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力し、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する第3取得部と、
前記移動体が備える出力部に、前記第3取得部により取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知制御部と、
前記出力部により通知された前記レコメンド情報のうちいずれかの該レコメンド情報を選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる提供部と、
を備える通知制御装置。 The first acquisition unit that acquires voice data indicating the voice spoken by the occupants on the moving object, and
An utterance content interpretation unit that interprets the utterance content of the occupant based on the voice data,
The second acquisition unit that acquires the surrounding environment information related to the surrounding environment of the occupant, and
With a third acquisition unit that outputs the content of the utterance and the surrounding environment information to one or more recommendation systems that recommend content to the occupant, and acquires recommendation information indicating one or more content from each of the recommendation systems. ,
A notification control unit that causes an output unit included in the mobile body to notify a plurality of the recommendation information for each recommendation system acquired by the third acquisition unit.
When the operation of selecting one of the recommended information among the recommended information notified by the output unit is accepted by the operation unit included in the moving body, the content corresponding to the selected recommended information is displayed. A providing unit that outputs to the output unit and
Notification control device.
移動体に搭乗している乗員により発話された音声を示す音声データを取得する第1取得プロセスと、
前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈プロセスと、
前記乗員の周囲環境に係る周囲環境情報を取得する第2取得プロセスと、
前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力する出力ステップと、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する取得ステップとを含む第3取得プロセスと、
前記移動体が備える出力部に、前記第3取得プロセスにより取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知プロセスと、
前記出力部により通知された前記レコメンド情報のうちいずれかの該レコメンド情報を選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる出力プロセスと、
を有する通知制御方法。 Runs by one or more computers,
The first acquisition process to acquire voice data indicating the voice spoken by the occupants on the moving object, and
An utterance content interpretation process that interprets the utterance content of the occupant based on the voice data,
The second acquisition process for acquiring the surrounding environment information related to the occupant's surrounding environment, and
An output step that outputs the content of the utterance and the surrounding environment information to one or more recommendation systems that recommend the content to the occupant, and an acquisition step that acquires recommendation information indicating one or more contents from each of the recommendation systems. And the third acquisition process, including
A notification process for causing the output unit included in the mobile body to notify a plurality of the recommendation information for each recommendation system acquired by the third acquisition process.
When the operation of selecting one of the recommended information among the recommended information notified by the output unit is accepted by the operation unit included in the moving body, the content corresponding to the selected recommended information is displayed. The output process to be output to the output unit and
Notification control method having.
移動体に搭乗している乗員により発話された音声を示す音声データを取得する第1取得プロセスと、
前記音声データに基づいて該乗員の発話の内容を解釈する発話内容解釈プロセスと、
前記乗員の周囲環境に係る周囲環境情報を取得する第2取得プロセスと、
前記乗員にコンテンツをレコメンドする一以上のレコメンドシステムに、前記発話の内容および前記周囲環境情報を出力する出力ステップと、該レコメンドシステムのそれぞれから、一以上のコンテンツを示すレコメンド情報を取得する取得ステップとを含む第3取得プロセスと、
前記移動体が備える出力部に、前記第3取得プロセスにより取得された前記レコメンドシステム毎の前記レコメンド情報を複数通知させる通知プロセスと、
前記出力部により通知された前記レコメンド情報のうちいずれかの該レコメンド情報を選択する操作が、前記移動体が備える操作部により受け付けられた場合、選択されたいずれかのレコメンド情報に対応するコンテンツを該出力部に出力させる出力プロセスと、
を前記コンピュータに実行させる通知制御プログラム。 A program to be installed on one or more computers
The first acquisition process to acquire voice data indicating the voice spoken by the occupants on the moving object, and
An utterance content interpretation process that interprets the utterance content of the occupant based on the voice data,
The second acquisition process for acquiring the surrounding environment information related to the occupant's surrounding environment, and
An output step that outputs the content of the utterance and the surrounding environment information to one or more recommendation systems that recommend the content to the occupant, and an acquisition step that acquires recommendation information indicating one or more contents from each of the recommendation systems. And the third acquisition process, including
A notification process for causing the output unit included in the mobile body to notify a plurality of the recommendation information for each recommendation system acquired by the third acquisition process.
When the operation of selecting one of the recommended information among the recommended information notified by the output unit is accepted by the operation unit included in the moving body, the content corresponding to the selected recommended information is displayed. The output process to be output to the output unit and
A notification control program that causes the computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019168321A JP2021047507A (en) | 2019-09-17 | 2019-09-17 | Notification system, notification control device, notification control method, and notification control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019168321A JP2021047507A (en) | 2019-09-17 | 2019-09-17 | Notification system, notification control device, notification control method, and notification control program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021047507A true JP2021047507A (en) | 2021-03-25 |
Family
ID=74878445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019168321A Pending JP2021047507A (en) | 2019-09-17 | 2019-09-17 | Notification system, notification control device, notification control method, and notification control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021047507A (en) |
-
2019
- 2019-09-17 JP JP2019168321A patent/JP2021047507A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11875820B1 (en) | Context driven device arbitration | |
US12125483B1 (en) | Determining device groups | |
JP7317529B2 (en) | SOUND DATA PROCESSING SYSTEM AND SYSTEM CONTROL METHOD | |
US10540970B2 (en) | Architectures and topologies for vehicle-based, voice-controlled devices | |
US10580407B1 (en) | State detection and responses for electronic devices | |
JPWO2019098038A1 (en) | Information processing device and information processing method | |
WO2019046026A1 (en) | Context-based device arbitration | |
CN109643548B (en) | System and method for routing content to associated output devices | |
KR102209092B1 (en) | Method and system for controlling artificial intelligence device using plurality wake up word | |
US11687526B1 (en) | Identifying user content | |
US11302325B2 (en) | Automatic dialogue design | |
US10629199B1 (en) | Architectures and topologies for vehicle-based, voice-controlled devices | |
US11709065B2 (en) | Information providing device, information providing method, and storage medium | |
CN111661065B (en) | Agent device, method for controlling agent device, and storage medium | |
US20200321006A1 (en) | Agent apparatus, agent apparatus control method, and storage medium | |
US20200286479A1 (en) | Agent device, method for controlling agent device, and storage medium | |
JPWO2017175442A1 (en) | Information processing apparatus and information processing method | |
US20220161131A1 (en) | Systems and devices for controlling network applications | |
US11518398B2 (en) | Agent system, agent server, method of controlling agent server, and storage medium | |
JP2021047507A (en) | Notification system, notification control device, notification control method, and notification control program | |
CN111824174B (en) | Agent device, method for controlling agent device, and storage medium | |
JP2021033929A (en) | Control system and control method | |
CN112995270B (en) | Intelligent agent system, control method for intelligent agent system, and storage medium | |
JP2020152298A (en) | Agent device, control method of agent device, and program | |
JP2020142758A (en) | Agent device, method of controlling agent device, and program |