JP5461651B2 - Service server device, service providing method, service providing program - Google Patents
Service server device, service providing method, service providing program Download PDFInfo
- Publication number
- JP5461651B2 JP5461651B2 JP2012219433A JP2012219433A JP5461651B2 JP 5461651 B2 JP5461651 B2 JP 5461651B2 JP 2012219433 A JP2012219433 A JP 2012219433A JP 2012219433 A JP2012219433 A JP 2012219433A JP 5461651 B2 JP5461651 B2 JP 5461651B2
- Authority
- JP
- Japan
- Prior art keywords
- task
- voice
- service
- mobile phone
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000004891 communication Methods 0.000 claims description 196
- 230000006870 function Effects 0.000 claims description 52
- 230000001413 cellular effect Effects 0.000 claims description 7
- 241000287463 Phalacrocorax Species 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 description 32
- 230000004913 activation Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 11
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- BOJKULTULYSRAS-OTESTREVSA-N Andrographolide Chemical compound C([C@H]1[C@]2(C)CC[C@@H](O)[C@]([C@H]2CCC1=C)(CO)C)\C=C1/[C@H](O)COC1=O BOJKULTULYSRAS-OTESTREVSA-N 0.000 description 1
- 101000615747 Homo sapiens tRNA-splicing endonuclease subunit Sen2 Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 102100021774 tRNA-splicing endonuclease subunit Sen2 Human genes 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、通信を介してサービスを提供するサービスサーバ装置、サービス提供方法、サービス提供プログラムに係り、特に、電話機による通話中に通話以外のサービスを提供するサービスサーバ装置、サービス提供方法、サービス提供プログラムに関する。 The present invention relates to a service server device, a service providing method, and a service providing program that provide a service via communication, and in particular, a service server device, a service providing method, and a service providing that provide a service other than a call during a call using a telephone. Regarding the program.
現在、話者が任意の言語を使って話した内容を自動的に他の言語に翻訳する、翻訳機や翻訳システムが実用化されている。従来の翻訳機等は、一人用型または対面会話型と呼ばれるものと、遠隔会話型と呼ばれるものがある。
図8(a)は、一人用の翻訳機を例示した図である。図8(a)において、例えば、話者が「この本はいくらですか?」と日本語で翻訳機に音声で入力する。すると、翻訳機の翻訳機能により、この日本語の音声が英訳されて「How much is this book?」の合成音声が出力される。一人用の翻訳機は、和英辞書として使用したり、対面中の他者に合成音声を聴かせることによって話者が自身の意思を他者に伝えることに使用したりすることができる。このような従来の翻訳機は、例えば、非特許文献1に記載されている。
Currently, translators and translation systems that automatically translate the content spoken by a speaker into an arbitrary language into other languages have been put into practical use. Conventional translators include a so-called single-person or face-to-face conversation type and a remote conversation type.
FIG. 8A is a diagram illustrating a translator for one person. In FIG. 8A, for example, the speaker inputs “How much is this book?” Into the translator in Japanese by voice. Then, the translation function of the translator translates this Japanese speech into English and outputs a synthesized speech of “How much is this book?”. A translator for one person can be used as a Japanese-English dictionary or used by a speaker to convey his / her intention to another person by letting others in the meeting listen to synthesized speech. Such a conventional translator is described in Non-Patent Document 1, for example.
図8(b)は、遠隔会話型の翻訳機を例示した図である。図8(b)に示した翻訳機は、電話機の音声通信機能と翻訳機能とを備えている。図8(b)において、例えば、話者である日本人が、母国語である日本語で「3名で予約を御願いします」と翻訳機に音声入力する。すると、翻訳機の翻訳機能により、この日本語の音声が英訳されて「Please make a reservation for 3 people」の合成音声が出力される。遠隔会話型の翻訳機は、話者は母国語で話しながら、この母国語を理解できない他者にも自身の意思を伝えることができる。このような従来の翻訳機は、例えば、非特許文献2に記載されている。
FIG. 8B is a diagram illustrating a remote conversation type translator. The translator shown in FIG. 8B has a telephone voice communication function and a translation function. In FIG. 8 (b), for example, a Japanese speaker is voice-inputted to the translation machine in his native language, “Please make a reservation with three people”. Then, the translation function of the translator translates this Japanese speech into English and outputs a synthesized speech of “Please make a reservation for 3 people”. A remote-conversation type translator allows a speaker to communicate in his / her own language while speaking in his / her native language. Such a conventional translator is described in Non-Patent
さらに、遠隔会話型の翻訳機としては、特許文献1に記載されたものがある。特許文献1に記載された電話システムは、電話の内容を翻訳して通話先に送信することができるのみならず、話者の通話音声をも通話先に送信することができる。このため、特許文献1記載の発明は、あたかも通訳を介して通話相手と会話しているような感覚をユーザに与えることができるようになる。 Further, as a remote conversation type translator, there is one described in Patent Document 1. The telephone system described in Patent Document 1 can not only translate the contents of the telephone and transmit it to the called party, but can also transmit the call voice of the speaker to the called party. For this reason, the invention described in Patent Document 1 can give the user a feeling as if he / she is talking to the other party via an interpreter.
しかしながら、上記非特許文献2の技術では、話者の話した内容を翻訳した音声が通話先にだけ送信されるため、話者は自身が話した内容がどのように認識され、翻訳されたかを知ることができない。また、特許文献1記載の発明であっても、話者の話した内容を翻訳した音声と話者の通話音声は相手先にだけ送信されるから、話者が自身の話した内容がシステムにどのように翻訳されたかを知ることはできない。さらに、非特許文献1記載の発明では、自身が音声によって入力した内容をテキストに変換して確認することはできるものの、そもそも一人用の翻訳機であるから、自身が音声によって入力した内容を確認しながらこの内容を送信することはできない。
However, in the technique of Non-Patent
このため、上記の特許文献1、非特許文献1、非特許文献2の技術のいずれによっても、話者の通話内容を翻訳する場合、話者が自身の話した内容がどのように翻訳されたかを認識して誤りを訂正することが難しい。
本発明は、以上の点に鑑みてなされたものであって、話者の通話内容に基づいて実行された翻訳の誤りの訂正に対応しやすいサービスを実現することのできる、サービスサーバ装置、サービス提供方法、サービス提供プログラムを提供することを目的とする。
For this reason, when the content of a speaker's call is translated according to any of the techniques of Patent Literature 1, Non-Patent Literature 1, and Non-Patent Literature 2 described above, how the content spoken by the speaker is translated. It is difficult to recognize and correct errors.
The present invention has been made in view of the above points, and is a service server device and service that can realize a service that can easily cope with correction of translation errors performed based on the content of a speaker's call An object is to provide a providing method and a service providing program.
以上の課題を解決するため、本発明のサービスサーバ装置(例えば図2に示したサービスサーバ装置200)は、音声によって互いに音声通信する複数の携帯電話機と接続され、該携帯電話機間で行われる音声通信に係るアプリケーションによって実行されるタスクとは別のアプリケーションによって実行される作業である別タスクによるサービスを提供するサービスサーバ装置であって、前記携帯電話機を特定する情報と該携帯電話機を使用するユーザに関する情報とを少なくとも含む加入者情報が登録される加入者情報蓄積部と、複数の前記携帯電話機の1つである発信側端末が、予め定められた情報が付加された複数の前記携帯電話機の少なくとも1つである着信側端末の電話番号を使って発呼した場合に、前記加入者情報蓄積部から登録されている加入者情報を取得し、取得した該加入者情報に前記発信側端末及び前記着信側端末の少なくともいずれかを特定する情報が含まれている場合には、前記音声通信の間に前記別タスクの実行を行うアプリケーションを起動する指示受付部(例えば図2に示したサービス起動部250)と、複数の前記携帯電話機間の音声通信中の、話者の音声を録音する録音部(例えば図2に示した電話/呼制御イネーブラ201)と、前記指示受付部によって前記別タスクの実行を行うアプリケーションが起動された場合、前記録音部によって録音された音声に基づいて、前記話者の携帯電話機と音声通信する他の携帯電話機の前記加入者情報に含まれる前記ユーザに関する情報を反映させて前記別タスクを実行するタスク実行部(例えば図2に示した音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202)と、前記タスク実行部によって前記別タスクが実行されたことによって得られるテキストデータと、前記タスク実行部によって前記別タスクが実行されたことによって得られる音声データと、を含むタスクデータを作成するタスクデータ作成部(例えば図2に示した音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202)と、音声通信を行っている前記話者の前記携帯電話機に、前記タスクデータを提供し、前記話者の前記携帯電話機と音声通信する前記携帯電話機に、前記話者の音声とともに前記タスクデータを提供するタスクデータ提供部(例えば図2に示した通信制御部224)と、を含むことを特徴とする。
In order to solve the above-described problems, the service server device of the present invention (for example, the
前記タスク実行部は、前記録音部に録音される音声が予め定められた意味を示す音声である場合に、前記別タスクの実行を開始することが望ましい。
また、前記タスク実行部は、前記携帯電話機の操作によって出力される信号が予め定められた信号である場合に、前記別タスクの実行を開始することが望ましい。
The task execution unit may start the execution of the separate task when the sound recorded in the recording unit is a sound having a predetermined meaning.
In addition, it is preferable that the task execution unit starts the execution of the separate task when the signal output by the operation of the mobile phone is a predetermined signal.
本発明のサービス提供方法は、音声によって互いに音声通信する複数の携帯電話機と接続され、該携帯電話機間で行われる音声通信に係るアプリケーションによって実行されるタスクとは別のアプリケーションによって実行される作業である別タスクによるサービスを提供するサービスサーバ装置において、サービスを提供するサービス提供方法であって、前記携帯電話機を特定する情報と該携帯電話機を使用するユーザに関する情報とを少なくとも含む加入者情報を登録する加入者情報蓄積ステップと、複数の前記携帯電話機の1つである発信側端末が、予め定められた情報が付加された複数の前記携帯電話機の少なくとも1つである着信側端末の電話番号を使って発呼した場合に、前記加入者情報登録ステップにおいて登録された加入者情報を取得し、取得した該加入者情報に前記発信側端末及び前記着信側端末の少なくともいずれかを特定する情報が含まれている場合には、前記音声通信の間に前記別タスクの実行を行うアプリケーションを起動する指示受付ステップと、複数の前記携帯電話機間の音声通信中の、話者の音声を録音する録音ステップと、前記指示受付ステップにおいて前記別タスクの実行を行うアプリケーションが起動された場合、前記録音ステップにおいて録音された音声に基づいて、前記話者の携帯電話機と音声通信する他の携帯電話機の前記加入者情報に含まれる前記ユーザに関する情報を反映させて前記別タスクを実行するタスク実行ステップと、前記タスク実行ステップによって前記別タスクが実行されたことによって得られるテキストデータと、前記タスク実行ステップによって前記別タスクが実行されたことによって得られる音声データと、を含むタスクデータを作成するタスクデータ作成ステップと、音声通信を行っている前記話者の前記携帯電話機に、前記タスクデータを提供し、前記話者の前記携帯電話機と音声通信する前記携帯電話機に、前記話者の音声とともに前記タスクデータを提供する提供ステップと、を含むことを特徴とする。 The service providing method of the present invention is an operation executed by an application that is connected to a plurality of mobile phones that perform voice communication with each other by voice and that is different from a task executed by an application related to voice communication performed between the mobile phones. A service providing method for providing a service in a service server device for providing a service according to another task, wherein subscriber information including at least information for identifying the mobile phone and information on a user who uses the mobile phone is registered. a subscriber information storing step of, the calling terminal is one of a plurality of the mobile phone, at least is one telephone number of the receiving terminal of the plurality of mobile phone-determined information is added in advance when a call is using, the registered in the subscriber information registration step subscriber Gets the broadcast, if the acquired information identifying at least one of said originating terminal and said destination terminal to said subscriber information is included, the execution of said other tasks during the voice communication an instruction receiving step of activating a row cormorants application, in the speech communication between a plurality of the mobile phone, and recording step for recording the voice of the speaker, application for execution of the another task in the instruction receiving step is activated If so, based on the voice recorded in the recording step, the separate task is executed by reflecting information about the user included in the subscriber information of another mobile phone that performs voice communication with the speaker's mobile phone. A task execution step, and text data obtained by executing the other task in the task execution step; The audio data obtained by the separate tasks are executed by the task execution step, the task data generating step of generating a task data including, to the mobile phone of the speaker is performing voice communication, the task providing data to said mobile telephone to the cellular telephone and the voice communication of the speaker, characterized in that it comprises a and a providing step of providing the task data together with audio of the speaker.
本発明のサービス提供プログラムは、音声によって互いに音声通信する複数の携帯電話機と接続され、該携帯電話機間で行われる音声通信に係るアプリケーションによって実行されるタスクとは別のアプリケーションによって実行される作業である別タスクによるサービスを提供するサービスサーバ装置において実行されるサービス提供プログラムであって、コンピュータに、前記携帯電話機を特定する情報と該携帯電話機を使用するユーザに関する情報とを少なくとも含む加入者情報を登録する加入者情報蓄積機能と、複数の前記携帯電話機の1つである発信側端末が、予め定められた情報が付加された複数の前記携帯電話機の少なくとも1つである着信側端末の電話番号を使って発呼した場合に、前記加入者情報登録ステップにおいて登録された加入者情報を取得し、取得した該加入者情報に前記発信側端末及び前記着信側端末の少なくともいずれかを特定する情報が含まれている場合には、前記音声通信の間に前記別タスクの実行を行うアプリケーションを起動する指示受付機能と、複数の前記携帯電話機間の音声通信中の、話者の音声を録音する録音機能と、前記指示受付機能によって前記別タスクの実行を行うアプリケーションが起動された場合、前記録音機能によって録音された音声に基づいて、前記話者の携帯電話機と音声通信する他の携帯電話機の前記加入者情報に含まれる前記ユーザに関する情報を反映させて前記別タスクを実行するタスク実行機能と、前記タスク実行機能によって前記別タスクが実行されたことによって得られるテキストデータと、前記タスク実行機能によって前記別タスクが実行されたことによって得られる音声データと、を含むタスクデータを作成するタスクデータ作成機能と、音声通信を行っている前記話者の前記携帯電話機に、前記タスクデータを提供し、前記話者の前記携帯電話機と音声通信する前記携帯電話機に、前記話者の音声とともに前記タスクデータを提供する提供機能と、を実現させることを特徴とする。 The service providing program of the present invention is an operation executed by an application that is connected to a plurality of mobile phones that communicate with each other by voice and that is different from a task executed by an application related to voice communication performed between the mobile phones. A service providing program that is executed in a service server device that provides a service according to another task, the computer including subscriber information including at least information for identifying the mobile phone and information on a user who uses the mobile phone a subscriber information storage function of registering, calling terminal is one of a plurality of the mobile phone, the telephone number of the least is one called terminal of the plurality of mobile phone-determined information is added in advance when a call is using, Noboru in the subscriber information registration step It has been acquired subscriber information, if the acquired information identifying at least one of said originating terminal and said destination terminal to said subscriber information is included, said other during the voice communication performs an instruction receiving function for starting the execution of the task line cormorants application, in the speech communication between a plurality of said portable telephone, and a recording function to record the voice of the speaker, the execution of the specific task by said instruction reception function When the application is started, based on the voice recorded by the recording function , the information about the user included in the subscriber information of another mobile phone that performs voice communication with the speaker's mobile phone is reflected, and A task execution function for executing another task, text data obtained by executing the another task by the task execution function, and the task And audio data obtained by the separate task is performed by the execution function, the task data creation function to create a task data including, to the mobile phone of the speaker is performing voice communication, the task data providing, in the mobile telephone to the cellular telephone and the voice communication of the speaker, characterized in that to realize a providing function of providing the task data together with audio of the speaker.
本発明によれば、タスクの実行によってテキスト及び音声を含むタスクデータを作成し、これを通話している音声通信端末装置の各々に送信するため、話者は翻訳音声と共にタスクの実行結果をテキストによっても受け取ることができる。このため、話者の通話内容に基づいて実行されたタスクの誤りや訂正に対応しやすくなる。
また、本発明によれば、タスクデータと、話者の音声とを通話相手に送信することができる。このため、タスクデータが翻訳音声を含む場合には、話者の翻訳音声をタスクの実行結果と共に通話相手に送信することができる。そして、本発明は、音声による通信に係るアプリケーションとは別のアプリケーションによってタスクを実行することから、既存の音声に係るアプリケーションとタスクを実行するアプリケーションとを使って話者の通話音声をタスクの実行結果と共に通話相手に送信することができる。このような本発明は、既存のアプリケーションを用いながら、遠隔地にありながら対面で会話しているような臨場感を持った通話サービスを提供することができる。
According to the present invention, task data including text and voice is created by executing the task and transmitted to each of the voice communication terminal devices that are making a call. Can also be received. For this reason, it becomes easy to deal with an error or correction of a task executed based on the content of the speaker's call.
Moreover, according to this invention, task data and a speaker's audio | voice can be transmitted to a telephone call partner. For this reason, when the task data includes translated speech, the translated speech of the speaker can be transmitted to the call partner together with the task execution result. In the present invention, since the task is executed by an application different from the application related to voice communication, the task voice is executed by using the existing voice application and the task executing application. The result can be sent to the other party. The present invention as described above can provide a call service with a sense of presence such that a user is talking face-to-face while using an existing application.
以下、図を参照して本発明に係るサービスサーバ装置、サービス提供方法、サービス提供プログラムの実施形態について説明する。以下に参照する各図において、他の図と同様の構成については、同様の符号を付して示し、その説明の一部を省略することがある。 Hereinafter, embodiments of a service server device, a service providing method, and a service providing program according to the present invention will be described with reference to the drawings. In each drawing referred to below, components similar to those in other drawings are denoted by the same reference numerals, and a part of the description may be omitted.
[コミュニケーション・コンシェルジュ]
図1は、本実施形態の前提となるサービスの概要を説明するための図である。このサービスは、通話機能を有する通信端末装置による会話(以下、通話と記す)をサポートし、直接会って会話するようなコミュニケーションを実現するよう開発されている。本実施形態の前提となるサービスを、以下、CC(コミュニケーション・コンシェルジュ)サービスとも記す。
[Communication Concierge]
FIG. 1 is a diagram for explaining an outline of a service that is a premise of the present embodiment. This service is developed to support communication (hereinafter referred to as “call”) by a communication terminal device having a call function, and to realize communication such as meeting directly. The service that is the premise of the present embodiment is hereinafter also referred to as a CC (communication concierge) service.
CCサービスは、図1に示したように、ネットワークNに接続されている通信端末装置c1〜c5に提供されるサービスである。通話機能を有する電話機、ネットワークNと接続してパケット通信によりテキストを送受信できる通信端末装置(例えば、スマートフォンなど)、または、通話音声とテキストの両方を送受信できる通信端末装置、のいずれかを、通信端末装置c1〜c5として用いることができる。また、通信端末装置c1〜c5は、テキストばかりでなく、静止画像や動画像、音楽を送受信する機能を有するものであってもよい。 The CC service is a service provided to communication terminal apparatuses c1 to c5 connected to the network N as shown in FIG. Communicate either a telephone having a call function, a communication terminal device (for example, a smartphone) that can be connected to the network N and can send and receive text by packet communication, or a communication terminal device that can send and receive both voice and text. It can be used as the terminal devices c1 to c5. The communication terminal devices c1 to c5 may have a function of transmitting / receiving not only text but also still images, moving images, and music.
本実施形態では、ネットワークNに接続されている通信端末装置c1〜c5のうちの少なくとも1つの装置のユーザと、他の少なくとも1つの装置のユーザとの間で音声通話が行われる場合を想定している。そして、電話機を使って通話中のユーザは、その通話中に、別のタスクを起動してタスクを実行させることができる。この起動されたタスクの実行によって得られた情報は、通話中の電話機またはこの電話機に対応する他の通信端末装置が受信することができる。 In the present embodiment, it is assumed that a voice call is performed between a user of at least one of the communication terminal devices c1 to c5 connected to the network N and a user of at least one other device. ing. A user who is in a call using the telephone can activate another task and execute the task during the call. Information obtained by executing the activated task can be received by the telephone in communication or another communication terminal device corresponding to the telephone.
本実施形態を実現するには、電話機を用いた通話中に、通話とは別のタスクによるサービスを提供するサービスサーバ装置が必要である。本実施形態を実現するためのサービスサーバ装置は、通話内容の翻訳、翻訳後の通話内容の合成音声化、通話音声に合成音声を挿入することによるデータ(以下、タスクデータとも記す)の生成、翻訳後の通話内容のテキスト化、及びタスクデータとテキスト化されたデータ(以下、テキストデータとも記す)を連動して通話中の電話機等に送信するタスクを実行する。 In order to realize the present embodiment, a service server device that provides a service by a task different from a call during a call using a telephone is necessary. A service server device for realizing the present embodiment includes: translation of a call content; synthesis speech of a call content after translation; generation of data (hereinafter also referred to as task data) by inserting synthesized speech into the call speech; The translated call contents are converted into text, and the task data and the text data (hereinafter also referred to as text data) are linked and transmitted to the telephone or the like during the call.
以下、本実施形態を実現するためのサービスサーバ装置について、より具体的に説明する。
[サービスサーバ装置]
(i)機能
図2は、本実施形態のサービスサーバ装置の一構成例を示すブロック図である。図2のサービスサーバ装置200は、複数のイネーブラを含むイネーブラ群261と通信可能に構成されている。なお、イネーブラとは、コンピュータを動作させるためのドライバソフ
トウェアであり、個々の目的ごとに設計されたソフトウェア(アプリケーション)を指す。
Hereinafter, the service server device for realizing the present embodiment will be described more specifically.
[Service server device]
(I) Function FIG. 2 is a block diagram illustrating a configuration example of the service server device according to the present embodiment. 2 is configured to be able to communicate with an
イネーブラ群261は、電話機能用のイネーブラ群205と、本実施形態に特有の機能である翻訳機能を実現するために付加されたイネーブラ群206とを含んでいる。イネーブラ群205は、セッション連携イネーブラ218、データお預かりイネーブラ207、デバイス管理制御イネーブラ208、プレゼンスイネーブラ209、電話帳イネーブラ210、SNS(Social Networking Service)イネーブラ211、位置情報検出イネーブラ262、電話/呼制御イネーブラ201、メッセージングイネーブラ212等を含んでいる。
The
また、イネーブラ群206は、ポイント管理イネーブラ219、コミュニティ管理イネーブラ213、アプリケーションに応じた所定の情報を管理する情報管理イネーブラ214、音声合成イネーブラ202、画像・映像合成/編集イネーブラ215、フォント変換イネーブラ216、音声認識イネーブラ203、画像・映像認識イネーブラ217、テキスト翻訳イネーブラ204等を含んでいる。
The
なお、電話機能用のイネーブラ群205は、音声による通信に係るイネーブラの集合である。また、イネーブラ群206は、音声による通信に係るアプリケーションとは別のイネーブラの集合である。すなわち、本明細書では、イネーブラ群205に含まれるイネーブラが音声による通信に係るアプリケーションによって実行されるタスクであり、イネーブラ群206に含まれるイネーブラが、音声による通信に係るアプリケーションによって実行されるタスクとは別のアプリケーションによって実行される作業である別タスクである。
The
イネーブラ群261に含まれているイネーブラ群205および206は、ネットワーク側でサービスを提供するための環境、いわゆるサービス・イネーブラ・ネットワーク(以下、SENと記す)2を構成する。SEN2は、翻訳サービスを含む複数のサービスを提供できる複数のインターネットプレイヤPと連携して様々なサービスを提供することができる。
The
本実施形態では、翻訳にかかるタスクを実行するために、サービスサーバ装置200がイネーブラ群205の電話/呼制御イネーブラ201を取得してサービスアプリ部に保存する。また、サービスサーバ装置200は、イネーブラ群206から音声合成イネーブラ202、音声認識イネーブラ203、テキスト翻訳イネーブラ204をサービスアプリ部に保存する。また、前記したように、本実施形態では、全てのサービスアプリ部がサービス起動部250を含んでいる。この結果、本実施形態ではサービスアプリ部が翻訳に係るサービスを提供するサービスアプリ部225になる。
In this embodiment, in order to execute a task related to translation, the
サービスサーバ装置200は、サービスの種別に応じたタスクの実行に必要なイネーブラを選択して取得することができる。サービスサーバ装置200によって取得されたイネーブラは、後述するサービスアプリ(サービス・アプリケーション・ソフトウェア)部としてサービスサーバ装置200にサービスごとに保存される。
このような構成により、本実施形態のサービスサーバ装置200は、既存のイネーブラを組み合わせてサービスに必要なアプリケーションを構築することができる。このため、本実施形態によれば、新たに専用のアプリケーションを開発する必要がなく、アプリケーションの開発に係る時間及びコストが発生しない。さらに、本実施形態によれば、実績がある既存のアプリケーションを使ってサービスを提供することができるため、新たなアプリケーションを開発することに比べて信頼性が高いサービスを提供することができる。
The
With such a configuration, the
本実施形態では、発通信端末装置241a、着通信端末装置241bが互いに通話しながらサービスサーバ装置200によりサービスの提供を受けるものとする。サービスサーバ装置200は、発通信端末装置241a、着通信端末装置241bにサービスを提供する場合には、タスクを実行する。本実施形態における発通信端末装置241aおよび着通信端末装置241bは、例えば、電話機の機能と、テキスト、静止画像、動画像等を送受信できる機能とを併せ持つ携帯電話機である。
In the present embodiment, it is assumed that the calling
サービスサーバ装置200は、サービスに応じたイネーブラを有するサービスアプリ部の他、電話機としての通話を制御する既存の構成を備えている。通話を制御する構成としては、CCサービスの加入者(すなわちCCサービスの提供を受けるユーザ、以下、単に「ユーザ」と記す)に関するデータを保存する加入者プロファイル蓄積部221、CCサービスの提供の要求を認証、許可する認証許可部222、通話に課せられる課金に関する処理をする課金処理部223、通話やパケット通信を制御する通信制御部224がある。通信制御部224は、発通信端末装置241aや、着通信端末装置241bに、タスクデータをそれぞれ提供する提供部としての機能も備えている。
The
加入者プロファイル蓄積部221には、ユーザの氏名や使用している電話機の電話番号と共に、ユーザが使用する言語の種類が予め登録されている。この他、加入者プロファイル蓄積部221には、電話機を特定する情報として、電話機のデータ通信セッションに含まれるMSISDN(Mobile Subscriber ISDN Number:電話機のSIMカードに登録さ
れている電話番号)が登録されている。さらに、前記したタブレットPCやフォトフレーム等の装置を電話機に対応付けるには、それらの装置の識別子を、該当する電話機の電話番号に対応付けて加入者プロファイル蓄積部221に登録すればよい。
In the subscriber
サービスサーバ装置200は、複数のサービスアプリ部225、226、227を備え得る。また、実施形態1では、複数のサービスアプリ部225、226、227を例えば複数のイネーブラを記憶できる記憶領域とすることもできる。このようにした場合、記憶されるイネーブラによってこの記憶領域をサービスアプリ部225、226、227のいずれにもなり得るようにすることができる。また、本実施形態のサービスアプリ部となる記憶領域には、サービス起動部250が記憶されている。このサービス起動部250は、例えば、発通信端末装置241aからIPネットワーク網230を介して送信される指示を受付けてサービスを提供するためイネーブラを起動する機能を有している。
The
本実施形態では、ユーザが発通信端末装置241aを操作すると、サービス起動部250が、サービスアプリ部225に保存されているイネーブラを起動する。このサービスアプリ部225に保存されているイネーブラが起動されると、タスクの実行が開始される。起動された電話/呼制御イネーブラ201は、発通信端末装置241a、着通信端末装置241b間の通信中に、話者の音声(以下、通話音声と記す)を録音する。なお、通話音声の録音は、電話/呼制御イネーブラ201が備える周知の留守番電話の録音を制御するものとし、留守番電話の通話音声録音機能を使って行われるようにしてもよい。
In the present embodiment, when the user operates the originating
音声認識イネーブラ203は、録音された音声からテキストデータを作成する。音声認識イネーブラ203は、例えば、録音された音声を形態素解析によって解析し、その音声をテキストデータに変換する。
テキスト翻訳イネーブラ204は、音声認識イネーブラ203が作成したテキストデータを、着通信端末装置241bのユーザが使用する言語に翻訳することによって、翻訳テキストデータを作成する。
The
The
音声合成イネーブラ202は、テキスト翻訳イネーブラ204によって作成された翻訳テキストデータを音声によって表される音声に変換することによって、合成音声によって読み上げるための音声データを作成する。
本実施形態では、音声合成イネーブラ202によって作成された音声データが、通話音声と共に発通信端末装置241a、着通信端末装置241bに提供される。また、本実施形態では、音声認識イネーブラ203によって作成されたテキストデータとテキスト翻訳イネーブラ204によって生成された翻訳テキストデータも、発通信端末装置241a、着通信端末装置241bに提供される。本実施形態では、音声データと、テキストデータ及び翻訳テキストデータとを併せてタスクデータとも記すものとする。
The
In the present embodiment, the voice data created by the
以上のように、音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202は、サービス起動部250によってタスク実行の指示が受付けられた場合、電話/呼制御イネーブラ201によって録音された音声に基づいてタスクを実行し、タスクの実行によってタスクデータが作成される。このタスクデータは、発通信端末装置241a及び着通信端末装置241bに提供される。
As described above, the
以上のように構成された本実施形態のサービスサーバ装置において、サービス起動部250が指示受付部として機能する。また、電話/呼制御イネーブラ201が録音部として機能し、音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202がタスク実行部及びタスクデータ作成部として機能する。
なお、本実施形態では、サービス起動部250が、発通信端末装置241a、着通信端末装置241bがサービスの提供を指示して直ちに各イネーブラを起動するものではなく、加入者プロファイル蓄積部221から予め登録されている加入者情報を取得するようにしてもよい。そして、加入者情報に発通信端末装置241a、着通信端末装置241bの少なくともいずれかを特定する情報が含まれている場合に発通信端末装置241a、着通信端末装置241bの指示を受付けるようにしてもよい。
In the service server device of the present embodiment configured as described above, the
In the present embodiment, the
また、本実施形態では、サービスの提供を指示する場合、携帯電話機が電話番号に、予め設定されている特定の番号等の情報を付加して発信するようにサービス起動部250の起動条件を設定してもよい。このように起動条件を設定した場合、サービス起動部250は、発通信端末装置241a、着通信端末装置241bの少なくともいずれかが、予め定められた情報が付加された電話番号を使って発呼した場合に発通信端末装置241a、着通信端末装置241bの指示を受付けることになる。
Further, in the present embodiment, when an instruction to provide service, the mobile phone telephone number, the start conditions of the
さらに、本実施形態は、サービス起動部250が発通信端末装置241a、着通信端末装置241bの操作によって出力される信号によって各イネーブラを起動するものに限定されるものではない。例えば、電話/呼制御イネーブラ201によって録音された通話音声が入力された場合に、サービス起動部250が各イネーブラを起動してタスクの実行を開始するようにしてもよい。このようにサービス起動部250を構成する場合、アプリケーションを特定できる文言、例えば、「翻訳開始」などの文言を予め設定しておく。そして、音声認識イネーブラ203が録音された通話音声を形態素解析した結果、予め設定された文言が通話音声に含まれている場合に限り、サービス起動部250が各イネーブラを起動してタスクを実行する。
Further, the present embodiment is not limited to the case where the
以上説明した本実施形態において、発通信端末装置241a、着通信端末装置241bは、テキストを送信可能な携帯電話機に限定されるものではない。発通信端末装置241a、着通信端末装置241bを通話機能だけを有する電話機とした場合、通話機能だけを有する電話機からの要請によってタスクの実行結果をこの電話機に予め対応付けられたタブレットPC242a、242bやフォトフレーム243a、243bに送信するようにしてもよい。
In the present embodiment described above, the calling
(ii)処理手順
図3は、図2に示したサービスサーバ装置によって行われる処理の手順を説明するための図である。
図2に示したサービスアプリ部225では、図2に示した電話/呼制御イネーブラ201によって通話音声の録音が実行される(ステップS311)。通話音声の録音は、音声が録音されない状態(以下、無音録音状態とも記す)から次の無音録音状態までの間に発せられた通話音声を1単位として行われる。次に、音声認識イネーブラ203によって音声は形態素解析され、解析される。解析は、1単位として録音された通話音声ごとに行われる。そして、解析結果にしたがって通話音声はテキストデータに変換される(ステップS312)。
(Ii) Processing Procedure FIG. 3 is a diagram for explaining a processing procedure performed by the service server apparatus shown in FIG.
In the
次に、サービスアプリ部225では、テキスト翻訳イネーブラ204により、ステップS312において変換されたテキストデータが、予め着通信端末装置241bのユーザによって加入者プロファイル蓄積部221に登録されている言語の翻訳テキストデータに翻訳される(ステップS313)。翻訳後の翻訳テキストデータは、合成音声に変換され、音声データとなる(ステップS314)。さらに、音声データが通話音声に挿入される(ステップS315)。
Next, in the
ここで、「音声データを通話音声に挿入する」とは、通話音声に合わせて音声データを送信するタイミングを決定することをいう。このように音声データの送信タイミングを決定することにより、通話音声は通常とおりCS(Circuit Switched)網を介して発通信端末装置241a、着通信端末装置241bに送信される。また、音声データも、CS網を介してデータ通信セッションにより発通信端末装置241a、着通信端末装置241bに送信されるが、PS網(Packet Switched)を経由して送信するようにすることもできる。さらに、通話音性を翻訳してテキスト化したテキストデータは、PS網を利用して送信される。なお、図3においては、CS網とPS網とに符号320を付して示すものとする。
Here, “inserting voice data into the call voice” means determining the timing of sending the voice data in accordance with the call voice. By determining the transmission timing of the voice data in this way, the call voice is transmitted to the calling
ただし、本実施形態は、通話音声をCS網で送信するものに限定されるものではない。例えば、音声データと共に通話音声がPS網を介して発通信端末装置241a、着通信端末装置241bに送信されるようにしてもよい。
本実施形態では、前記したように、無音録音状態から次の無音録音状態までの間に発話された通信音声を1単位として録音、認識、翻訳してタスクデータを作成し、その都度、発通信端末装置241a、着通信端末装置241bに送信することにより、通話音声とタスクデータとの同期をとって発通信端末装置241a、着通信端末装置241bに送信することができる。
However, the present embodiment is not limited to one that transmits call voice over the CS network. For example, the call voice and voice data may be transmitted to the calling
In the present embodiment, as described above, task data is created by recording, recognizing and translating communication speech uttered between the silent recording state and the next silent recording state as a unit, and each time the outgoing communication is performed. By transmitting to the
本実施形態では、通話の違和感を避けるため、通話音声は通常通りリアルタイムで通信先の発通信端末装置241a、着通信端末装置241bに送信される。このため、通話音声に音声データが挿入されることにより、ユーザには音声データによる音声が通話音声に重なって聞こえることがある。しかし、通訳者を介して会話する場合、一般的に人は通訳者が発話している間は自身の発話を控える傾向にあると考えられる。このため、音声データによる音声と通話音声とが重なって会話に支障をきたすことは起こり難い。
In the present embodiment, in order to avoid a sense of incongruity in the call, the call voice is transmitted to the communication
本実施形態では、発通信端末装置241a、着通信端末装置241bの両方がサービスアプリ部225にアクセスしてテキストデータ、翻訳テキストデータ及び音声データを取得する。このように、サービスアプリ部225を介して発通信端末装置241a、着通信端末装置241bを接続する方式は、ブリッジ接続と呼ばれている。
また、図1に示したサービスサーバ装置200は、発通信端末装置241aの電話回線と、着通信端末装置241bの電話回線とを、周知の方法によって識別することができる。このため、発通信端末装置241aの上り回線u1、下り回線d1、着通信端末装置241bの上り回線u2、下り回線d2を区別することができ、ユーザの発話を適切に翻訳して通話相手に送信することができる。
In the present embodiment, both the calling
Further, the
以上説明した本実施形態によれば、通話音声、合成音声の音声データ、テキストデータ、翻訳テキストデータを発通信端末装置241a、着通信端末装置241bに提供することができる。このため、ユーザは、自身の発話した内容がサービスサーバ装置200にどのように認識されたのかを容易に認識でき、誤訳等があれば速やかに訂正するなどの対応を行うことができる。また、ユーザには通話相手の通話音声と、これを翻訳した音声データとの両方が聞こえるため、あたかも間に通訳者を介して会話しているような臨場感がある会話を実現することができる。
According to the present embodiment described above, it is possible to provide call voice, synthesized voice data, text data, and translated text data to the calling
(iii)CS網及びPS網
図4は、図2、図3に示したサービスサーバ装置200と発通信端末装置241a、着通信端末装置241bとを接続するCS網404、PS網405を具体的に説明するための図である。
発通信端末装置241aは、MPN(メディア・プロセッシング・ノード)408に向けて発呼する。この発呼信号は、CS網404、既存の電話系装置401に到達する。既存の電話系装置401とは、例えば、CSN(認証装置、ハンドオーバーを実現するためのホームエージェント、DHCPサーバ等)、ASN(無線基地局等)を指す。既存の電話系装置401では、発呼に対して非課金処理や特番ルーチングの処理が実行される。なお、非課金処理とは、一般的な通話にかかる課金処理を行わないようにする処理である。また、特番ルーチングとは、予め定められた電話番号(特番)に発呼された場合に、通信経路を、本来の処理とは異なる処理が行われる通信経路に変更することをいう。
(Iii) CS Network and PS Network FIG. 4 shows a specific example of the
The calling
次に、発呼信号は既存の電話系装置401から本実施形態のサービスサーバ装置200に到達する。サービスサーバ装置200には、図1に示した電話機の通信を制御する通信制御部224、加入者プロファイル蓄積部221、認証許可部222、課金処理部223を備えているから、このような構成によって他網からのサービス制限や音声と画面の連携(音声データとテキストデータ等との連携)の処理がなされる。
音声データとテキストデータ及び翻訳テキストデータとの連携は、次のようにして実現できる。
Next, the call signal reaches the
The linkage between voice data, text data, and translated text data can be realized as follows.
すなわち、本サービスの提供を受け得る電話機が通話状態になったとき、サービスサーバ装置200の通信制御部224が、電話機の通話に係る信号に含まれるMSISDNに一致するMSISDNを含むデータ通信セッション実行の監視を開始する。そして、通話に係る信号に含まれるMSISDNに一致するデータセッションが行われた場合、この通話とデータセッションとをCCサービスにおいて連携させるべきであると判断する。このような方法によれば、通話音声と、音声データ、テキストデータ及び翻訳テキストデータを1つの通信端末装置に送信する場合、CS網404によって送信される通話音声と、PS網405によって送信されるタスクデータとの連携をとることができる。
That is, when a telephone that can receive provision of this service enters a call state, the
また、前述したように、本実施形態は、通話音声を、音声データと同様にPS網405を介して送信することができる。通話音声を音声データ等と共にPS網405を介して送信する構成を、図5に示す。
また、実施形態1では、図2に示した加入者プロファイル蓄積部221において、前記したように、通話機能だけを有する電話機と、テキスト等を送信できる通信端末装置とを対応付けて登録している。このような場合、通信制御部224が、電話機の電話番号で発呼がされると、登録されている通信端末装置のアドレスにタスクデータを取得できるURLを送信するようにしてもよい。
Further, as described above, in the present embodiment, the call voice can be transmitted through the
In the first embodiment, as described above, the subscriber
また、発呼に対応する通話音声は、MPN408において電話/呼制御イネーブラ201により録音され、サービスサーバ装置200に渡される。
サービスサーバ装置200では、アプリ部225が録音された通話音声に基づいて音声データとテキストデータ及び翻訳テキストデータとを作成する。音声データは、CS網を経由して着通信端末装置241bに送信される。なお、音声データの送信には、PS網を利用することもできる。また、テキストデータ及び翻訳テキストデータは、既存のWeb系装置402(ゲートウェイ等)やxGSN(x−GPRS Support Node)/EPC(Evolved Packet Core)よりPS網405を介して着通信端末装置241bに送信される。
The call voice corresponding to the outgoing call is recorded by the telephone /
In the
(iv)サービス提供方法
図6は、本実施形態のサービスサーバ装置200によって実現されるサービス提供方法を説明するための図である。図6では、HTTP(Hypertext Transfer Protocol)を使ったデータ通信を破線で示し、電話機による通話を実線で示している。
発通信端末装置241aにおいて、ユーザが例えば本実施形態のサービス提供方法を実現するためのアプリケーションを起動するとともに、相手の電話番号が入力される(ステップS501)。このような処理により、発通信端末装置241aから発通信端末装置241aのアドレスがサービスサーバ装置に送信される。そして、サービスサーバ装置200では、他の必要な要件が満たされたことを条件に、タスクを通信(通話)の間に実行する指示が受付けられて翻訳サービスが開始される(ステップS502)。
(Iv) Service Providing Method FIG. 6 is a diagram for explaining a service providing method realized by the
In the calling
サービスサーバ装置200は、発通信端末装置241a、着通信端末装置241bとの間の通話回線を確立する(ステップS503)。そして、サービスサーバ装置200は、発通信端末装置241aの回線から送信された通話音声を録音するとともに(ステップS504)、着通信端末装置241bの回線に送る(ステップS505)。
発通信端末装置241aの回線から通話音声が送信されてこない無音録音状態になると、サービスサーバ装置200は発通信端末装置241aの回線から送信されてくる通話音声の録音をいったん終了する(ステップS506)。そして、録音された通話音声について、図2、図3に示した音声認識イネーブラ203、テキスト翻訳イネーブラ204、音声合成イネーブラ202によって、テキスト化、翻訳、合成音声の合成が行われ(ステップS507)、音声データとテキストデータ及び翻訳テキストデータとを作成する。
The
When a silent recording state in which no call voice is transmitted from the line of the calling
そして、本実施形態のサービスサーバ装置200は、音声データを、発通信端末装置241a、241bの両方に送信するとともに、テキストデータ及び翻訳テキストデータも発通信端末装置241a、着通信端末装置241bの両方に送信する(ステップS508〜511)。次に、着通信端末装置241bのユーザが発話すると、サービスサーバ装置200は、以上の動作を着通信端末装置241bの電話回線から送信されるユーザの通話音声に対して実行する。なお、2人のユーザのうち、一方が発話している間に他方が発話した場合、本実施形態では、通話音声を録音中のユーザの通話音声について以上の処理を実行し、他方のユーザが発話した内容については処理の対象にしないようにする。
The
なお、本実施形態は、以上説明した構成に限定されるものではない。すなわち、以上説明した本実施形態では2人のユーザの間の通話を対象にして翻訳に係るCCサービスを実行している。しかしながら、本実施形態は、2人の間の通話を対象にするものに限定されず、3人以上で通話する会議電話等にも適用することができる。
さらに、本発明は、本実施形態の翻訳に係るアプリケーションに適用される構成に限定されるものではない。図7は、本発明のサービスサーバ装置、サービス制御方法、サービス制御プログラムは、ユーザのスケジュールを調整するアプリケーションに適用する例を説明した図である。
Note that the present embodiment is not limited to the configuration described above. That is, in the present embodiment described above, the CC service related to translation is executed for a call between two users. However, this embodiment is not limited to the one intended for a call between two people, and can also be applied to a conference call or the like in which three or more people make a call.
Furthermore, the present invention is not limited to the configuration applied to the application relating to translation of the present embodiment. FIG. 7 is a diagram illustrating an example in which the service server device, the service control method, and the service control program of the present invention are applied to an application that adjusts a user's schedule.
図7に示した例では、サービスサーバ装置が、発通信端末装置641a、着通信端末装置641bの通信中に、音声による通信とは別のスケジューラタスクによるサービスを提供する。このような例では、発通信端末装置641aのユーザがスケジューラタスクを通話の間に実行するように発通信端末装置641aを操作する等してサービスサーバ装置に指示する。サービスサーバ装置が指示を受付けると、発通信中に、発通信端末装置641a、着通信端末装置641bのユーザの通話音声が録音される。 In the example shown in FIG. 7, the service server device provides a service by a scheduler task different from the voice communication during the communication of the calling communication terminal device 641a and the called communication terminal device 641b. In such an example, the user of the calling communication terminal device 641a instructs the service server device by operating the calling communication terminal device 641a to execute the scheduler task during the call. When the service server device accepts the instruction, the call voice of the user of the calling communication terminal device 641a and the called communication terminal device 641b is recorded during outgoing communication.
図7に示した例では、サービスサーバ装置が発通信端末装置641a、着通信端末装置641bの電話回線から通話音声を取得してそれぞれ録音する。図2に示した音声認識部は、録音された通話音声を形態素解析する等して「スケジュール調整」を意味する音声が通話音声に含まれていることを検出する。通話音声に「スケジュール調整」が含まれていることから、発通信端末装置641a、着通信端末装置641bのユーザのスケジュールが両方とも空いている日時及びその時間帯を抽出するタスクを実行するように指示されたものと判断する。 In the example shown in FIG. 7, the service server device acquires call voices from the telephone lines of the calling communication terminal device 641a and the called communication terminal device 641b and records them respectively. The voice recognition unit shown in FIG. 2 detects that a voice meaning “schedule adjustment” is included in the call voice by performing morphological analysis on the recorded call voice. Since “schedule adjustment” is included in the call voice, the task of extracting the date and time when the user's schedules of the calling communication terminal device 641a and the called communication terminal device 641b are both free is executed. Judge that it was instructed.
そして、例えば図2に示した情報管理イネーブラ214がスケジュール情報管理部として機能して発通信端末装置641a、着通信端末装置641bに登録されているユーザのスケジュールデータを取得する。情報管理部214は、取得されたスケジュールデータから、2人のユーザの予定が登録されていない日及びその時間帯を抽出する。抽出された日時は、テキストデータを含む画像データとして発通信端末装置641a、着通信端末装置641bの両方に送信される。
このような構成によれば、発通信端末装置641a、着通信端末装置641bのユーザに対し、スケジュールを簡易かつ間違いなく調整でき、しかも直接対面してスケジュール調整するのと同様の臨場感があるコミュニケーションを提供することができる。
Then, for example, the
According to such a configuration, it is possible to easily and definitely adjust the schedule for the user of the originating communication terminal device 641a and the destination communication terminal device 641b, and to have a sense of presence similar to the case where the schedule adjustment is performed directly face-to-face. Can be provided.
(v)サービス提供プログラム
以上説明したサービスサーバ装置においては、音声によって通信可能な音声通信端末装置間の通信中に、音声による通信とは別のタスクによるサービスを提供するためのサービス提供プログラムが実行される。このサービス提供プログラムは、コンピュータに、別タスクを音声通信の間に実行する指示を受付ける指示受付機能と、複数の上記音声通信端末装置間の音声通信中に、話者の音声を録音する録音機能と、上記指示受付機能によって上記指示が受付けられた場合、上記録音機能によって録音された音声に基づいて該タスクを実行するタスク実行機能と、上記タスク実行機能においてタスクが実行されたことによって得られるテキストまたは音声を含むタスクデータを作成するタスクデータ作成機能と、音声通信を行っている音声通信端末装置、または、音声通信端末装置に対応付けられ、かつテキストによる通信が可能なテキスト通信端末装置に、タスクデータを提供する機能と、を実現させるプログラムである。
(V) Service providing program In the service server apparatus described above, a service providing program for providing a service by a task different from voice communication is executed during communication between voice communication terminal devices capable of voice communication. Is done. The service providing program includes an instruction receiving function for receiving an instruction to execute another task during voice communication on a computer, and a recording function for recording a speaker's voice during voice communication between the plurality of voice communication terminal devices. And when the instruction is received by the instruction receiving function, the task execution function for executing the task based on the voice recorded by the recording function and the task being executed by the task execution function are obtained. A task data creation function for creating task data including text or voice, and a voice communication terminal device performing voice communication, or a text communication terminal device associated with a voice communication terminal device and capable of text communication And a function for providing task data.
本発明は、スマートフォンなどを使ったコミュニケーションをサポートすることに最適なサービス提供装置、サービス提供方法及びサービス提供プログラムを提供することができる。 The present invention can provide a service providing apparatus, a service providing method, and a service providing program that are optimal for supporting communication using a smartphone or the like.
200 サービスサーバ装置
201 呼制御イネーブラ
202 音声合成イネーブラ
203 音声認識イネーブラ
204 テキスト翻訳イネーブラ
205、206、261 イネーブラ群
208 デバイス管理制御イネーブラ
209 プレゼンスイネーブラ
210 電話帳イネーブラ
211 SNSイネーブラ
212 メッセージングイネーブラ
213 コミュニティ管理イネーブラ
214 情報管理イネーブラ
215 編集イネーブラ
216 フォント変換イネーブラ
217 画像・映像認識イネーブラ
218 セッション連携イネーブラ
219 ポイント管理イネーブラ
221 加入者プロファイル蓄積部
222 認証許可部
223 課金処理部
224 通信制御部
225、226、227 サービスアプリ部
230 ネットワーク網
241a、641a 発通信端末装置
241b、641b 着通信端末装置
DESCRIPTION OF
Claims (5)
前記携帯電話機を特定する情報と該携帯電話機を使用するユーザに関する情報とを少なくとも含む加入者情報が登録される加入者情報蓄積部と、
複数の前記携帯電話機の1つである発信側端末が、予め定められた情報が付加された複数の前記携帯電話機の少なくとも1つである着信側端末の電話番号を使って発呼した場合に、前記加入者情報蓄積部から登録されている加入者情報を取得し、取得した該加入者情報に前記発信側端末及び前記着信側端末の少なくともいずれかを特定する情報が含まれている場合には、前記音声通信の間に前記別タスクの実行を行うアプリケーションを起動する指示受付部と、
複数の前記携帯電話機間の音声通信中の、話者の音声を録音する録音部と、
前記指示受付部によって前記別タスクの実行を行うアプリケーションが起動された場合、前記録音部によって録音された音声に基づいて、前記話者の携帯電話機と音声通信する他の携帯電話機の前記加入者情報に含まれる前記ユーザに関する情報を反映させて前記別タスクを実行するタスク実行部と、
前記タスク実行部によって前記別タスクが実行されたことによって得られるテキストデータと、前記タスク実行部によって前記別タスクが実行されたことによって得られる音声データと、を含むタスクデータを作成するタスクデータ作成部と、
音声通信を行っている前記話者の前記携帯電話機に、前記タスクデータを提供し、前記話者の前記携帯電話機と音声通信する前記携帯電話機に、前記話者の音声とともに前記タスクデータを提供するタスクデータ提供部と、
を含むことを特徴とするサービスサーバ装置。 Connected to a plurality of mobile phones that communicate with each other by voice, and provides a service by another task that is a task executed by an application different from a task executed by an application related to voice communication performed between the mobile phones A service server device,
A subscriber information storage unit in which subscriber information including at least information for specifying the mobile phone and information on a user who uses the mobile phone is registered;
If the calling terminal is one of a plurality of said portable telephone has a call using at least is one telephone number of the receiving terminal of the plurality of mobile phone-determined information is added in advance, When the subscriber information registered from the subscriber information storage unit is acquired, and the acquired subscriber information includes information specifying at least one of the transmitting terminal and the receiving terminal , an instruction receiving section to start the row cormorants application execution of the specific tasks during the voice communication,
A recording unit for recording a voice of a speaker during voice communication between the plurality of mobile phones;
The subscriber information of another mobile phone that performs voice communication with the speaker's mobile phone based on the voice recorded by the recording unit when an application that executes the different task is started by the instruction receiving unit. A task execution unit that executes the separate task by reflecting information about the user included in
Task data creation for creating task data including text data obtained by executing the another task by the task execution unit and voice data obtained by executing the other task by the task execution unit And
To the mobile phone of the speaker is performing voice communication, providing the task data, to the portable telephone to the cellular telephone and the voice communication of the speaker, providing the task data together with audio of the speaker A task data provider,
A service server device comprising:
前記録音部に録音される音声が予め定められた意味を示す音声である場合に、前記別タスクの実行を開始することを特徴とする請求項1に記載のサービスサーバ装置。 The task execution unit
2. The service server device according to claim 1, wherein when the voice recorded in the recording unit is a voice having a predetermined meaning, execution of the another task is started.
前記携帯電話機の操作によって出力される信号が予め定められた信号である場合に、前記別タスクの実行を開始することを特徴とする請求項1に記載のサービスサーバ装置。 The task execution unit
2. The service server device according to claim 1, wherein when the signal output by operating the mobile phone is a predetermined signal, the execution of the another task is started.
前記携帯電話機を特定する情報と該携帯電話機を使用するユーザに関する情報とを少なくとも含む加入者情報を登録する加入者情報蓄積ステップと、
複数の前記携帯電話機の1つである発信側端末が、予め定められた情報が付加された複数の前記携帯電話機の少なくとも1つである着信側端末の電話番号を使って発呼した場合に、前記加入者情報登録ステップにおいて登録された加入者情報を取得し、取得した該加入者情報に前記発信側端末及び前記着信側端末の少なくともいずれかを特定する情報が含まれている場合には、前記音声通信の間に前記別タスクの実行を行うアプリケーションを起動する指示受付ステップと、
複数の前記携帯電話機間の音声通信中の、話者の音声を録音する録音ステップと、
前記指示受付ステップにおいて前記別タスクの実行を行うアプリケーションが起動された場合、前記録音ステップにおいて録音された音声に基づいて、前記話者の携帯電話機と音声通信する他の携帯電話機の前記加入者情報に含まれる前記ユーザに関する情報を反映させて前記別タスクを実行するタスク実行ステップと、
前記タスク実行ステップによって前記別タスクが実行されたことによって得られるテキストデータと、前記タスク実行ステップによって前記別タスクが実行されたことによって得られる音声データと、を含むタスクデータを作成するタスクデータ作成ステップと、
音声通信を行っている前記話者の前記携帯電話機に、前記タスクデータを提供し、前記話者の前記携帯電話機と音声通信する前記携帯電話機に、前記話者の音声とともに前記タスクデータを提供する提供ステップと、
を含むことを特徴とするサービス提供方法。 Connected to a plurality of mobile phones that communicate with each other by voice, and provides a service by another task that is a task executed by an application different from a task executed by an application related to voice communication performed between the mobile phones A service providing method for providing a service in a service server device, comprising:
A subscriber information accumulating step for registering subscriber information including at least information for specifying the mobile phone and information on a user who uses the mobile phone;
If the calling terminal is one of a plurality of said portable telephone has a call using at least is one telephone number of the receiving terminal of the plurality of mobile phone-determined information is added in advance, When the subscriber information registered in the subscriber information registration step is acquired, and the acquired subscriber information includes information specifying at least one of the calling terminal and the receiving terminal, an instruction receiving step of activating a row cormorants application execution of the specific tasks during the voice communication,
A recording step of recording the voice of the speaker during voice communication between the plurality of mobile phones;
When an application for executing the other task is started in the instruction receiving step, the subscriber information of another mobile phone that performs voice communication with the speaker's mobile phone based on the voice recorded in the recording step A task execution step of executing the separate task by reflecting information on the user included in
Task data creation for creating task data including text data obtained by executing the another task in the task execution step and voice data obtained by executing the other task in the task execution step Steps,
To the mobile phone of the speaker is performing voice communication, providing the task data, to the portable telephone to the cellular telephone and the voice communication of the speaker, providing the task data together with audio of the speaker Providing step;
A service providing method comprising:
コンピュータに、
前記携帯電話機を特定する情報と該携帯電話機を使用するユーザに関する情報とを少なくとも含む加入者情報を登録する加入者情報蓄積機能と、
複数の前記携帯電話機の1つである発信側端末が、予め定められた情報が付加された複数の前記携帯電話機の少なくとも1つである着信側端末の電話番号を使って発呼した場合に、前記加入者情報登録ステップにおいて登録された加入者情報を取得し、取得した該加入者情報に前記発信側端末及び前記着信側端末の少なくともいずれかを特定する情報が含まれている場合には、前記音声通信の間に前記別タスクの実行を行うアプリケーションを起動する指示受付機能と、
複数の前記携帯電話機間の音声通信中の、話者の音声を録音する録音機能と、
前記指示受付機能によって前記別タスクの実行を行うアプリケーションが起動された場合、前記録音機能によって録音された音声に基づいて、前記話者の携帯電話機と音声通信する他の携帯電話機の前記加入者情報に含まれる前記ユーザに関する情報を反映させて前記別タスクを実行するタスク実行機能と、
前記タスク実行機能によって前記別タスクが実行されたことによって得られるテキストデータと、前記タスク実行機能によって前記別タスクが実行されたことによって得られる音声データと、を含むタスクデータを作成するタスクデータ作成機能と、
音声通信を行っている前記話者の前記携帯電話機に、前記タスクデータを提供し、前記話者の前記携帯電話機と音声通信する前記携帯電話機に、前記話者の音声とともに前記タスクデータを提供する提供機能と、
を実現させることを特徴とするサービス提供プログラム。 Connected to a plurality of mobile phones that communicate with each other by voice, and provides a service by another task that is a task executed by an application different from a task executed by an application related to voice communication performed between the mobile phones A service providing program executed in the service server device,
On the computer,
A subscriber information storage function for registering subscriber information including at least information specifying the mobile phone and information on a user who uses the mobile phone;
If the calling terminal is one of a plurality of said portable telephone has a call using at least is one telephone number of the receiving terminal of the plurality of mobile phone-determined information is added in advance, When the subscriber information registered in the subscriber information registration step is acquired, and the acquired subscriber information includes information specifying at least one of the calling terminal and the receiving terminal, an instruction receiving function for starting the line cormorants application execution of the specific tasks during the voice communication,
A recording function for recording the voice of the speaker during voice communication between the plurality of mobile phones;
The subscriber information of another mobile phone that performs voice communication with the speaker's mobile phone based on the voice recorded by the recording function when an application that executes the different task is started by the instruction receiving function. A task execution function for executing the different task by reflecting information on the user included in
Task data creation for creating task data including text data obtained by executing the another task by the task execution function and voice data obtained by executing the other task by the task execution function Function and
To the mobile phone of the speaker is performing voice communication, providing the task data, to the portable telephone to the cellular telephone and the voice communication of the speaker, providing the task data together with audio of the speaker Provided functions,
A service providing program characterized by realizing the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012219433A JP5461651B2 (en) | 2011-05-24 | 2012-10-01 | Service server device, service providing method, service providing program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011116400 | 2011-05-24 | ||
JP2011116400 | 2011-05-24 | ||
JP2012219433A JP5461651B2 (en) | 2011-05-24 | 2012-10-01 | Service server device, service providing method, service providing program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012117544A Division JP5243645B2 (en) | 2011-05-24 | 2012-05-23 | Service server device, service providing method, service providing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013009432A JP2013009432A (en) | 2013-01-10 |
JP5461651B2 true JP5461651B2 (en) | 2014-04-02 |
Family
ID=47676315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012219433A Active JP5461651B2 (en) | 2011-05-24 | 2012-10-01 | Service server device, service providing method, service providing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5461651B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018008227A1 (en) * | 2016-07-08 | 2018-01-11 | パナソニックIpマネジメント株式会社 | Translation device and translation method |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6488875A (en) * | 1987-09-30 | 1989-04-03 | Toshiba Corp | Voice translation device |
JP2002152387A (en) * | 2000-11-08 | 2002-05-24 | Nippon Telegr & Teleph Corp <Ntt> | Information conversion communication method, information conversion communication system, conversion server and program record medium |
JP3741025B2 (en) * | 2001-10-30 | 2006-02-01 | 株式会社デンソー | Telephone system, telephone and computer program |
US8179822B2 (en) * | 2004-08-31 | 2012-05-15 | Kunihiro Shiina | Push-type telecommunications accompanied by a telephone call |
JP4348270B2 (en) * | 2004-10-05 | 2009-10-21 | パナソニック株式会社 | SIP server |
JP3142002U (en) * | 2008-03-17 | 2008-05-29 | 隆司 内山 | Translation call system |
JP2010050693A (en) * | 2008-08-21 | 2010-03-04 | Nec Corp | Real-time voice translation call system, method, application server, and method of establishing resource session |
JP5163682B2 (en) * | 2010-04-05 | 2013-03-13 | ソニー株式会社 | Interpreter call system |
-
2012
- 2012-10-01 JP JP2012219433A patent/JP5461651B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013009432A (en) | 2013-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5243646B2 (en) | Service server device, service providing method, service providing program | |
US20210366471A1 (en) | Method and system for processing audio communications over a network | |
US8351581B2 (en) | Systems and methods for intelligent call transcription | |
US8179822B2 (en) | Push-type telecommunications accompanied by a telephone call | |
US20120330643A1 (en) | System and method for translation | |
JP5374629B2 (en) | Service server device, service providing method, service providing program | |
JP2009535906A (en) | Language translation service for text message communication | |
US20210243298A1 (en) | Method and System to Enhance Communication Between Multiple Parties | |
KR20150091406A (en) | Method and devices for language determination for voice to text transcription of phone calls | |
JP5243645B2 (en) | Service server device, service providing method, service providing program | |
WO2011074180A1 (en) | Voice input system and voice input program | |
JP5461651B2 (en) | Service server device, service providing method, service providing program | |
CN103718168A (en) | Systems and methods for activating mobile devices to initiate communications | |
KR20050101924A (en) | System and method for converting the multimedia message as the supportting language of mobile terminal | |
KR20160097406A (en) | Telephone service system and method supporting interpreting and translation | |
CN104135579B (en) | A kind of implementation method of the mobile phone speech message-leaving function based on IVR | |
JP2003141116A (en) | Translation system, translation method and translation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121001 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5461651 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |