JP2002044258A - Telephone voice response device for activating program - Google Patents
Telephone voice response device for activating programInfo
- Publication number
- JP2002044258A JP2002044258A JP2000256470A JP2000256470A JP2002044258A JP 2002044258 A JP2002044258 A JP 2002044258A JP 2000256470 A JP2000256470 A JP 2000256470A JP 2000256470 A JP2000256470 A JP 2000256470A JP 2002044258 A JP2002044258 A JP 2002044258A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- external program
- voice response
- telephone
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、相手先から着信を
受けて応答する電話機能を備えるコンピュータにかか
り、特に、相手先のDTMF入力もしくは音声入力によ
り外部プログラムを操作し結果を音声で受け取ることが
出来る汎用コンピューターをベースとした電話音声応答
装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a computer having a telephone function for receiving an incoming call from a partner and answering the call. And a telephone voice response device based on a general-purpose computer.
【0002】[0002]
【従来の技術】従来、テキストベースのデータから情報
提供することを目的とした電話音声応答サービスを構築
する場合、電話音声ハードウェアを操作し、データーベ
ース等から情報を取得の操作をし、テキストから音声変
換をするプログラムを作って実現している。2. Description of the Related Art Conventionally, when constructing a telephone voice response service for providing information from text-based data, a telephone voice hardware is operated, information is obtained from a database or the like, and text data is obtained. It is realized by making a program that converts voice from.
【0003】[0003]
【発明が解決しようとする課題】上述した従来の環境で
は、構築するシステムに対しデーターベース等から情報
を取得し、テキスト整形の処理に加え、電話音声ハード
ウェアの処理、テキストから音声への変換処理等をプロ
グラムに盛り込まなければならないという問題点があっ
た。In the conventional environment described above, information is acquired from a database or the like for a system to be constructed, and in addition to text shaping processing, telephone voice hardware processing, text-to-speech conversion. There was a problem that processing had to be included in the program.
【0004】また、データーベース等の情報を処理する
目的のプログラムはテキスト入力し、テキスト出力する
ことを前提としたプログラムが多く、これらを電話音声
サービスに利用できれば、電話音声応答サービスの実現
が容易になる。In addition, many programs for processing information such as a database are premised on text input and text output. If these programs can be used for telephone voice services, it is easy to realize a telephone voice response service. become.
【0005】本発明の目的はデーターベース等から情報
を取得し、テキスト整形の処理をするプログラムを作成
することで音声応答サービスを実現する装置を提供する
ことにある。An object of the present invention is to provide an apparatus for realizing a voice response service by acquiring information from a database or the like and creating a program for performing text shaping processing.
【0006】[0006]
【課題を解決する手段】本発明は上記課題を解決するた
めに、音声応答代理ソフトウェア(2)と外部プログラ
ム(3)との通信手段を、外部プログラム(3)起動時
の引数と、外部プログラム(3)のテキスト出力と、終
了時のシグナルにする手段を用いた。上記手段により、
外部プログラム(3)はテキスト入出力に重点をおいて
プログラムを作成できる。In order to solve the above-mentioned problems, the present invention provides a communication means between the voice response proxy software (2) and the external program (3) by using an argument when starting the external program (3), Means (3) for outputting text and making a signal at the end is used. By the above means,
The external program (3) can create a program with emphasis on text input / output.
【0007】図1に沿って、音声応答代理ソフトウェア
(2)の処理の流れを説明する。音声応答代理ソフトウ
ェア(2)が開始され(S1)、電話音声ハードウェア
(1)を操作し、電話着信があるかを監視する。(S
2) 呼が接続されると、1つの呼接続に対してユニークな呼
IDを生成する。(S3) キー基礎情報の入力促す音声ガイダンスを送出する。
(S4) 具体的には「社員データーベースです。社員コードを入
力してください。」 「株価検索データーベースです。会社名を発声してくだ
さい。」等である。キー基礎情報を取得する。キー基礎
情報とは、DTMF信号もしくは発声である。(S5) キー基礎情報をキー情報に変換する。キー基礎情報がD
TMF信号の場合はDTMF検出して得られた数値をキ
ー情報とし、キー基礎情報が音声の場合は音声認識によ
って得られた文字をキー情報として変換する。(S6) キー情報と呼IDを引数として外部プログラム(3)を
起動する。(S7) 外部プログラムが終了するまで待ち、テキスト出力結果
もしくは決められた切断シグナルを受け取とる。(S
8、S9) 切断シグナルを受けた場合は呼を切断し終了する。(S
12) 出力結果を受け取った場合はテキスト出力結果を音声波
形情報に変換する。(S10) 電話回線に音声を出力する。(S11) S5に戻り以上を繰り返す。The flow of processing of the voice response proxy software (2) will be described with reference to FIG. The voice response proxy software (2) is started (S1), and the telephone voice hardware (1) is operated to monitor whether there is an incoming call. (S
2) When a call is connected, a unique call ID is generated for one call connection. (S3) The voice guidance prompting the input of the key basic information is transmitted.
(S4) Specifically, "It is an employee database. Please enter an employee code.""It is a stock price search database. Please say your company name." Get key basic information. The key basic information is a DTMF signal or utterance. (S5) The key basic information is converted into key information. Key basic information is D
In the case of a TMF signal, a numerical value obtained by DTMF detection is used as key information, and when the key basic information is voice, a character obtained by voice recognition is converted as key information. (S6) The external program (3) is started using the key information and the call ID as arguments. (S7) Wait until the external program ends, and receive a text output result or a predetermined disconnection signal. (S
8, S9) If a disconnect signal is received, the call is disconnected and terminated. (S
12) When receiving the output result, convert the text output result into audio waveform information. (S10) Output voice to the telephone line. (S11) Return to S5 and repeat the above.
【0008】外部プログラムはテキストで出力されるこ
とになっている。ここでキー情報を外部プログラムに引
数として渡す理由は、キー情報を外部プログラムがデー
ターベース等から情報を取得する際や利用者の操作意思
決定の手段として利用する。ここで呼IDを外部プログ
ラムに引数として渡す理由は、外部プログラムがテキス
ト出力した後終了するため、同じ呼接続のなかで何度も
外部プログラムが起動される場合、以前どのような操作
をした等の情報を外部プログラムが管理するために使用
する。[0008] The external program is to be output as text. Here, the reason why the key information is passed to the external program as an argument is that the key information is used when the external program acquires information from a database or the like or as a means for determining a user's operation decision. Here, the reason for passing the call ID as an argument to the external program is that the external program terminates after outputting the text, so if the external program is started many times in the same call connection, what operation has been performed before? This information is used by external programs to manage this information.
【0009】また、キー基礎情報が音声の場合、音声認
識してキー情報を作成するが、この音声認識とは、音声
波形を分析して、音声波形のパターンからテキスト情報
を生成する技術一般を指す。また、テキスト情報から音
声波形情報を生成するが、このためにテキストを分析し
て表音文字に直し、その表音文字に相当する音声波形を
合成し、音声波形情報を生成する技術一般を用いる。When the key basic information is voice, the key information is created by voice recognition. The voice recognition refers to a general technique of analyzing a voice waveform and generating text information from a voice waveform pattern. Point. In addition, speech waveform information is generated from text information. For this purpose, a general technique is used in which text is analyzed and converted into phonograms, a speech waveform corresponding to the phonogram is synthesized, and speech waveform information is generated. .
【0010】外部プログラムとの通信は起動時の引数と
終了時のテキスト出力、終了のシグナルのみで構成され
るため、音声アプリケーションを意識することなくテキ
スト処理のみの外部プログラムを作成するだけで音声サ
ービスを開始できる。[0010] Since communication with an external program is made up of only an argument at the time of startup, a text output at the time of termination, and a signal of termination, a voice service can be created simply by creating an external program only for text processing without being aware of a voice application. Can start.
【0011】また、請求項2に記載の当該装置は着信時
に、呼処理を制御する信号の中から発信先番号を取得
し、電話番号とプログラムが関連付けられた記憶部
(5)に対し、前記発信者先番号と前記記憶部上の電話
番号を比較し、一致した電話番号に対応したプログラム
を音声応答代理ソフトウェア(2)が起動する外部プロ
グラム(3)として決定する。In addition, the apparatus according to claim 2 obtains a destination number from a signal for controlling call processing when receiving a call, and stores the destination number in a storage unit (5) in which a telephone number is associated with a program. The caller's number is compared with the telephone number in the storage unit, and a program corresponding to the matched telephone number is determined as an external program (3) to be activated by the voice response proxy software (2).
【0012】[0012]
【発明実施の形態】当該装置(4)の構成は、コンピュ
ータハードウェアに電話音声ハードウェア(1)を取り
付け、音声代理ソフトウェア(2)で制御する形をと
る。ここでいう電話音声ハードウェア(1)とは電話回
線につなぐインターフェイスを持ち、呼接続に関する手
順を行い音声をデジタル処理するハードウェアのことを
指す。また、当該装置は電話回線のインターフェイスと
IP接続するためのインターフェイスを持つ。コンピュ
ータハードウェアには汎用OSが乗っており、音声代理
ソフトウェアはこのOS上で動作する。DESCRIPTION OF THE PREFERRED EMBODIMENTS The configuration of the apparatus (4) is such that telephone voice hardware (1) is attached to computer hardware and controlled by voice proxy software (2). The telephone voice hardware (1) here refers to hardware that has an interface connected to a telephone line, performs a call connection procedure, and digitally processes voice. The device has an interface for IP connection with a telephone line interface. A general-purpose OS is mounted on the computer hardware, and the voice proxy software operates on the OS.
【0013】当該装置にて音声サービスを具現化するに
は、まず外部プログラム(3)を作成する必要がある。
外部プログラム(3)はシステム管理者により作成さ
れ、これも同様に上記OS上で動作する。外部プログラ
ム(3)は情報キーと呼IDを引数に起動され、電子情
報データーベースから情報を取得し、文章を整形しテキ
スト出力されるように設計される事を想定している。In order to implement a voice service in the device, it is necessary to first create an external program (3).
The external program (3) is created by a system administrator, and also operates on the OS. It is assumed that the external program (3) is designed to be activated by using the information key and the call ID as arguments, acquire information from the electronic information database, format the text, and output the text.
【0014】請求項2の当該装置において記憶部(5)
は使用される。上記記憶部(5)は当該装置の中におい
ても外においてもよい。A storage unit (5) in the apparatus according to claim 2
Is used. The storage unit (5) may be inside or outside the device.
【0015】以下上記実施例において外部プログラムに
ついても具体例をあげて、図4を用いて説明する。あら
かじめ外部プログラム(3)を、会社名を引数に起動す
ると会社名の株価を教えるテキスト出力するように、作
成しておく。利用者は電話(8)から、電話回線を介し
て、当該装置(4)に発信する。当該装置が応答し、
「株価検索データーベースです。会社名を発声してくだ
さい」と返す。上記利用者は「A商事」と発声する。す
ると当該装置は「A商事」と受け取った音声波形から音
声認識し、“エーショウジ”という文字を生成する。こ
の“エーショウジ”という言葉をキー情報として認識
し、引数“エーショウジ”にて外部プログラム(3)を
起動する。外部プログラム(3)からは結果として“A
商事の株価は100円です。会社名を発声してくださ
い”とテキスト出力される。上記テキスト出力を取得
し、音声波形に変換し、前記利用者に「A商事の株価は
100円です。会社名を発声してください。」と音声で
送出する。以上この動作を繰り返す。外部プログラム
(3)で意図的に呼を切りたいときは、異常終了シグナ
ルで外部プログラム(3)を終了し、呼を切断する。In the above embodiment, a specific example of the external program will be described with reference to FIG. The external program (3) is created in advance so as to output a text indicating the stock price of the company name when the external program (3) is started with the company name as an argument. The user makes a call from the telephone (8) to the device (4) via the telephone line. The device responds,
"This is a stock search database. Please say your company name." The user utters “A trading”. Then, the device recognizes the voice from the voice waveform received as “A Shoji” and generates characters “Ashoji”. The word "Ashoji" is recognized as key information, and the external program (3) is started with the argument "Ashoji". From the external program (3), "A
The trading price of Shoji is 100 yen. Please say the name of the company. "The text output is obtained. The above text output is obtained, converted into an audio waveform, and the user is told," The stock price of A Shoji is 100 yen. Please say the company name. " And send it out by voice. This operation is repeated as described above. When the external program (3) wants to disconnect the call intentionally, the external program (3) is terminated by an abnormal end signal and the call is disconnected.
【0016】上記使用例では呼IDを表記していない理
由は、情報キーを用いて外部プログラム(3)を起動す
る例を端的に表現するためである。通常、呼IDも一緒
に起動時に引数として渡されて、起動回数、認証、前回
の結果の参照等に外部プログラムが利用する。これによ
り柔軟な音声サービスを提供できる。また、上記使用例
は請求項2の実装については説明していない。The reason why the call ID is not described in the above-mentioned use example is to simply represent an example in which the external program (3) is started using the information key. Usually, the call ID is also passed as an argument at the time of startup, and is used by the external program for the number of startups, authentication, reference to the previous result, and the like. As a result, a flexible voice service can be provided. Further, the above-mentioned use example does not describe the implementation of claim 2.
【0017】[0017]
【発明の効果】図3のようにPCクライアント端末
(7)と電子情報データーベースサーバ(6)を利用し
て、予定表や在庫管理などのシステムを既に構築してい
る場合、当該装置(4)をLAN上に設置し、PCクラ
イアント端末(7)で使用されるクライアントプログラ
ムを利用して、外部プログラム(3)を作成することで
音声応答サービスを付加できる。また上記クライアント
プログラムがOS等の違いにより、当該装置上で動作し
なかったとしても、電子情報データーベースサーバ
(6)が汎用的で、当該装置上で動作する汎用的なクラ
イアントプログラムがあるならばそれを利用して容易に
音声応答サービスを開始することができる。これらのよ
うに容易に音声応答サービスを付加できることが本発明
の効果である。As shown in FIG. 3, when a system such as a schedule table or inventory management is already constructed using a PC client terminal (7) and an electronic information database server (6), the device (4) is used. ) Is installed on a LAN, and a voice response service can be added by creating an external program (3) using a client program used in the PC client terminal (7). Even if the client program does not operate on the device due to a difference in OS or the like, if the electronic information database server (6) is general-purpose and there is a general-purpose client program operating on the device, Using this, a voice response service can be easily started. It is an advantage of the present invention that the voice response service can be easily added as described above.
【図1】本実施例における、全体処理を司どる音声代理
ソフトウェアのフロチャートである。FIG. 1 is a flowchart of voice proxy software that performs overall processing according to an embodiment.
【図2】本実施例の電話音声応答装置のブロック図であ
る。FIG. 2 is a block diagram of the telephone voice response apparatus according to the embodiment.
【図3】本実施例におけるネットワーク構成図である。FIG. 3 is a diagram illustrating a network configuration according to the embodiment;
【図4】本実施例における、外部プログラムの動作例も
含めた全体処理をあらわす図FIG. 4 is a diagram showing an entire process including an operation example of an external program in the embodiment;
1は電話音声ハードウェア、2は音声応答代理ソフトウ
ェア、3は外部プログラム、4は当該装置、5は記憶
部、6は電子情報データーベースサーバ、7はPCクラ
イアント、8は利用者が使用する電話端末、S1からS
12はフロチャートの過程ブロック。1 is telephone voice hardware, 2 is voice response proxy software, 3 is an external program, 4 is the device concerned, 5 is a storage unit, 6 is an electronic information database server, 7 is a PC client, and 8 is a telephone used by a user. Terminal, S1 to S
12 is a process block of the flowchart.
Claims (2)
との音声応答のやり取りをする、汎用コンピューターを
ベースとした電話音声応答装置において、 一つの呼に対しそれぞれユニークな値を生成する手段
と、 電話回線を介してDTMF信号入力を受け付け、DTM
F信号を検知してキー情報に変換する手段もしくは、電
話回線を介して音声の入力を受け付け、音声を認識しキ
ー情報に変換する手段と、 前記キーワードと前記ユニークな値を引数として当該装
置内の外部プログラムを起動する手段と、 前記外部プログラムのテキスト出力を得て、そのテキス
ト出力を音声波形に変換し、前記相手先に送出する手段
と、 前記外部プログラムの異常終了シグナルを検知し、呼を
切断する手段と、 を備えたことを特徴とする電話音声応答装置。1. A general-purpose computer-based telephone voice response apparatus for receiving an incoming call from a destination and exchanging a voice response with the destination, generating a unique value for each call. And accepts a DTMF signal input via a telephone line,
Means for detecting the F signal and converting it to key information, or means for receiving an input of voice via a telephone line, recognizing the voice and converting it to key information, and using the keyword and the unique value as arguments in the apparatus. Means for activating the external program, obtaining a text output of the external program, converting the text output into an audio waveform, and sending the voice output to the destination, detecting an abnormal termination signal of the external program, and A telephone voice response device, comprising:
の信号から発信先番号を検知する手段と、あらかじめ定
めた電話番号と起動する外部プログラムとを対応させて
記憶する記憶部と、前記発信先番号から前記記憶部を検
索し、発信先番号によって起動する前記外部プログラム
を変更する手段と、を備えたことを特徴とする電話音声
応答装置。2. A storage device according to claim 1, further comprising: means for detecting a destination number from a call processing control signal at the time of an incoming call; and a storage unit for storing a predetermined telephone number and an external program to be started in association with each other. Means for retrieving the storage unit from the destination number and changing the external program activated by the destination number.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000256470A JP2002044258A (en) | 2000-07-24 | 2000-07-24 | Telephone voice response device for activating program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000256470A JP2002044258A (en) | 2000-07-24 | 2000-07-24 | Telephone voice response device for activating program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002044258A true JP2002044258A (en) | 2002-02-08 |
Family
ID=18745076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000256470A Pending JP2002044258A (en) | 2000-07-24 | 2000-07-24 | Telephone voice response device for activating program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002044258A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110798566A (en) * | 2019-11-07 | 2020-02-14 | 浙江同花顺智能科技有限公司 | Call information recording method and device and related equipment |
US11019207B1 (en) | 2019-11-07 | 2021-05-25 | Hithink Royalflush Information Network Co., Ltd. | Systems and methods for smart dialogue communication |
-
2000
- 2000-07-24 JP JP2000256470A patent/JP2002044258A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110798566A (en) * | 2019-11-07 | 2020-02-14 | 浙江同花顺智能科技有限公司 | Call information recording method and device and related equipment |
US11019207B1 (en) | 2019-11-07 | 2021-05-25 | Hithink Royalflush Information Network Co., Ltd. | Systems and methods for smart dialogue communication |
US11323566B2 (en) | 2019-11-07 | 2022-05-03 | Hithink Royalflush Information Network Co., Ltd. | Systems and methods for smart dialogue communication |
US11758047B2 (en) | 2019-11-07 | 2023-09-12 | Hithink Royalflush Information Network Co., Ltd. | Systems and methods for smart dialogue communication |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1125279B1 (en) | System and method for providing network coordinated conversational services | |
EP2193653B1 (en) | Method and apparatus for mapping of conference call participants using positional presence | |
US7519536B2 (en) | System and method for providing network coordinated conversational services | |
JP3868423B2 (en) | Automatic voice connection service method using personal telephone directory database constructed through voice recognition | |
US20020065657A1 (en) | Methods and apparatus for performing speech recognition and using speech recognition results | |
EP1394771A1 (en) | Speech recognition conversation selection device, speech recognition conversation system, speech recognition conversation selection method, and program | |
KR19990067916A (en) | System and methods for automatic call and data transfer processing | |
JP6254209B2 (en) | Telnet interface for voice | |
EP2206329A2 (en) | Method and apparatus for identification of conference call participants | |
EP1139335B1 (en) | Voice browser system | |
JP2017535852A (en) | Computer-based translation system and method | |
US20010008555A1 (en) | System and method for inputting a web-page input data into a web page by employing a wire/wireless telephone | |
KR101251697B1 (en) | Dialog authoring and execution framework | |
KR100826778B1 (en) | Browser-based wireless terminal for multi-modal, Browser-based multi-modal server and system for wireless terminal and its operation method | |
JP2002374356A (en) | Automatic information system | |
JP2002044258A (en) | Telephone voice response device for activating program | |
JP2005151553A (en) | Voice portal | |
JP6669374B1 (en) | Setting device, setting method and setting program | |
JPH10164249A (en) | Information processor | |
KR20020048669A (en) | The Development of VoiceXML Telegateway System for Voice Portal | |
JP4813798B2 (en) | Method for processing network audio data and apparatus for performing the method | |
KR100462588B1 (en) | Selective mail retrieval device and method using wireless communication device | |
KR20040026935A (en) | System and Method for Managering Switch using of VXML | |
JPH11234451A (en) | Information acquisition system | |
KR20030006837A (en) | Method for Information Searching using Voice in Wire/Wireless Network |