KR20020097081A - Playing sysytem and method of voice book, and storage media thereof - Google Patents
Playing sysytem and method of voice book, and storage media thereof Download PDFInfo
- Publication number
- KR20020097081A KR20020097081A KR1020020064269A KR20020064269A KR20020097081A KR 20020097081 A KR20020097081 A KR 20020097081A KR 1020020064269 A KR1020020064269 A KR 1020020064269A KR 20020064269 A KR20020064269 A KR 20020064269A KR 20020097081 A KR20020097081 A KR 20020097081A
- Authority
- KR
- South Korea
- Prior art keywords
- voicebook
- voice data
- output
- voice
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 보이스북 플레잉 시스템 및 방법, 그 프로그램 소스를 기록한 기록매체에 관한 것이다.The present invention relates to a voicebook playing system and method, and a recording medium having recorded thereon a program source.
보다 상세하게는 보이스북 플레잉 시스템을 이용하여 보이스북 편집기에서 작성된 보이스북 파일을 이용하여 보이스데이터가 출력되도록 하되, 상기 보이스 데이터가 텍스트데이터와 연관하여 출력 가능하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그 프로그램 소스를 기록한 기록매체에 관한 것이다.More specifically, a voicebook playing system and method for outputting voice data using a voicebook file created in a voicebook editor using a voicebook playing system, and supporting the voice data in association with text data; A recording medium recording the program source.
일반적으로 보이스 컨텐츠의 제공은 보이스데이터가 카세트 자기테이프나 CD등에 직접기록되어 있고, 사용자에 의해 플레이 되며, 앞으로 감거나 뒤로 감도록 하는 기능이 내장된 시스템을 통해 사용자에게 제한적 범위에서 엑세스가 가능하도록 하여 보이스 정보를 제공하고 있다.In general, the provision of voice content is such that voice data is recorded directly on a cassette magnetic tape or CD, played by the user, and has a built-in system for forwarding and rewinding, so that the user can access a limited range. Voice information is provided.
또한 보이스데이터가 일정한 디지털 포맷인 WAV 파일이나 MP3 파일과 같은 형태로 제작되어 컴퓨터나 전용 플레이어를 통하여 보이스 컨텐츠 정보를 제공하기도 한다.In addition, voice data is produced in the form of a WAV file or MP3 file, which is a digital format, and provides voice content information through a computer or a dedicated player.
상기와 같이 보이스 컨텐츠 정보 제공 시스템 및 방법에는 대부분 정보의 제공은, 그 출력이 일방향이고 방향이 직선적이어서 사용자가 듣고자 하는 위치를 변경해야 할 경우, 별도의 위치 정보가 없으므로 정확하고 세밀한 위치로의 이동이 용이하지 않은 단점이 있다.As described above, in the voice content information providing system and method, most of the information is provided when the output is one-way and the direction is straight so that the user needs to change the position. There is a disadvantage that it is not easy to move.
또한 상기 포맷 형식의 파일을 이용하여 보이스테이터를 출력하는 경우에도 단지 타이틀 단위의 엑세스 외에는 파일 전체 데이터에 에 대한 엑세스를 정확하고 세부적으로 할 수 없는 구조로 되어 있다. 뿐만 아니라 컨텐츠 본문을 검색할 수없는 단점이 있다.In addition, even when outputting a voice stator using a file of the above format, the structure is such that access to the entire data of the file cannot be precisely and precisely, except for title-based access. In addition, there is a disadvantage that can not search the content body.
즉, 기존 편집 및 플레잉 시스템이나 방법으로는 랜덤 엑세스가 가능한 구조의 파일을 제공하거나 플레이 하는 데에는 근본적 제약이 따르는 문제점이 있었다.In other words, there is a problem that the existing editing and playing system or method has a fundamental limitation in providing or playing a file having a structure that can be randomly accessed.
따라서, 본 발명의 목적은 전술한 문제점을 해결할 수 있도록 보이스북 플레잉 시스템을 이용하여 보이스데이터에 대하여 그 기준을 상호 연결되어 있는 텍스트데이터에 기반하여 정확하고 세밀하게 새로운 위치로의 이동이 가능하도록 함과 동시에 현재 보이스데이터의 출력 위치에 대한 텍스트데이터의 시각적 식별이 가능하도록 하고, 텍스트데이터에 기반한 보이스데이터 검색을 지원하는 보이스북 플레잉 시스템 및 방법, 그 프로그램 소스를 기록한 기록매체를 제공함에 있다.Accordingly, an object of the present invention is to use the voicebook playing system to solve the above-mentioned problems, and to accurately and precisely move to a new location based on text data interconnecting the criteria for voice data. In addition, the present invention provides a voicebook playing system and method for enabling visual identification of text data on an output location of current voice data, and supports voice data retrieval based on text data, and a recording medium recording the program source thereof.
또한, 본 발명은 보이스데이터의 출력을 일정 단위별 즉 단어, 문장, 문단 단위로 구분하여 출력하되, 이미 상기 보이스데이터와 텍스트데이터간의 연결 정보가 저장되어 있는 인덱싱테이블을 이용하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.In addition, the present invention divides the output of the voice data by a predetermined unit, that is, word, sentence, paragraph unit output, but voicebook playing that supports to use the indexing table that already stores the connection information between the voice data and text data A system and method, and a recording medium recording the program source.
또한, 본 발명은 보이스데이터의 출력을 보이스북 파일의 본문외에 각종 메세지나 검색결과 리스트등 모든 텍스트 형태의 출력도 보이스 형태로 변환하여 출력하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.In addition, the present invention records a voicebook playing system and method for converting and outputting the output of voice data in the form of all texts such as a message or a search result list in addition to the body of the voicebook file, and outputting the voice form. In providing a recording medium.
또한, 본 발명은 상기 텍스트데이터의 보이스데이터로의 변환과정에서 해당 보이스데이터가 보이스북 파일상에 존재하지 않을 경우 자동 텍스트-음성 변환기인 TTS 모듈(Text to Speech Module-텍스트를 이미 정해진 음성으로 변환하는 모듈)을이용하여 변환하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.In addition, the present invention converts the text to speech module (TTS), which is an automatic text-to-speech converter, when the voice data does not exist on the voicebook file during the conversion of the text data into voice data. The present invention provides a voicebook playing system and method for supporting conversion using a module, and a recording medium recording the program source thereof.
또한, 본 발명은 상기 보이스북 플레이어 프로세서가 내장되어 있는 사용자 단말기가 표시부를 구비하고 있을 경우에는 보이스데이터와 병행하여 상기 텍스트데이터를 상기 표시부 화면상에 출력하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.In addition, the present invention provides a voicebook playing system and method for supporting the text data output on the screen of the display unit in parallel with the voice data when the user terminal in which the voicebook player processor is embedded has a display unit. The present invention provides a recording medium recording a program source.
또한, 본 발명은 상기 보이스북 플레이어의 제어에 있어서 음성인식모듈을 통하여 음성을 텍스트로 변환하여 사용자의 명령 및 입력 사항을 수행할 수 있도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.The present invention also provides a voicebook playing system and method for converting a voice into a text through a voice recognition module in a control of the voicebook player and performing a user command and input, and recording a program source thereof. In providing a medium.
또한, 본 발명은 상기 보이스북 플레이어의 제어에 있어서 음성인식모듈이외의 장치에 포함된 키 입력을 통하여 사용자의 명령이나 입력사항을 수행할 수 있록하며, 사용자 단말기에 터치스크린패드가 장착되어 있을 경우에는 상기 터치스크린패드를 통하여 사용자의 입력 및 명령을 수행할 수 있도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.In addition, the present invention is to control the voicebook player to perform a user command or input through a key input included in the device other than the voice recognition module, when the user terminal is equipped with a touch screen pad The present invention provides a voicebook playing system and method for supporting a user input and a command through the touch screen pad, and a recording medium recording the program source.
또한, 본 발명은 상기 보이스북 플레이어의 출력은 사용자가 선택한 텍스트데이터에 대해서만 부분적으로 보이스데이터의 출력이 가능하도록 하고, 경우에 따라서 해당 보이스데이터를 반복하여 출력하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.The present invention also provides a voicebook playing system and method for outputting the voicebook player to partially output only the text data selected by the user, and to repeatedly output the corresponding voice data in some cases; The present invention provides a recording medium recording the program source.
또한, 본 발명은 상기 보이스북 플레이어의 출력은 사용자가 선택한 텍스트데이터에 대해서만 부분적으로 보이스데이터의 출력이 가능하도록 하고, 경우에 따라서 해당 보이스데이터를 반복하여 출력하도록 지원하는 보이스북 플레잉 시스템 및 방법, 그프로그램 소스를 기록한 기록매체를 제공함에 있다.The present invention also provides a voicebook playing system and method for outputting the voicebook player to partially output only the text data selected by the user, and to repeatedly output the corresponding voice data in some cases; The present invention provides a recording medium recording the program source.
도 1은 본 발명인 보이스북 플레잉 시스템을 설명하기 위한 개략적인 블록도,1 is a schematic block diagram for explaining a voicebook playing system according to the present invention;
도 2는 본 발명인 보이스북 플레이 방법을 설명하기 위한 루틴 블록도,2 is a routine block diagram for explaining a voicebook playing method of the present invention;
도 3는 본 발명인 보이스북 파일구조를 설명하기 위한 블록도,3 is a block diagram for explaining the voicebook file structure of the present invention;
*도면의 주요부분에 대한 부호설명** Description of Signs of Main Parts of Drawings *
110 : 보이스북 플레이어110: voicebook player
110a: 음성인식모듈110a: voice recognition module
110b: TTS 모듈(Text to Speech Module)110b: TTS Module (Text to Speech Module)
111 : 키입력부111: key input unit
112 : 표시부112: display unit
113 : 마이크 입력부113: microphone input unit
114 : 스피커 출력부114: speaker output
115 : 터치스크린 패드 입력부115: touch screen pad input unit
A1: 사용자 단말기A1: user terminal
이와 같은 목적을 달성하기 위한 본 발명의 실시 예로서, 본 발명은,As an embodiment of the present invention for achieving the above object, the present invention,
사용자에게 보이스북 파일을 플레이 할 수 있는 장치의 인터페이스를 제공하고 상기 인터페이스를 통하여 보이스데이터 정보를 입수하도록 하되 경우에 따라서 상기 보이스데이터와 이미 연결되어 있는 텍스트데이터를 동시에 시각적으로 입수하도록 하며, 새로운 위치로 이동을 원할 경우 이미 저장되어 있는 텍스트데이터를 엑세스하도록 하여 해당 보이스데이터로의 이동을 수행하며, 검색을 원할 경우 이미포함되어 있는 텍스트데이터의 검색인덱스테이블을 참조하여 검색을 수행하고 그 결과를 출력하도록 지원하는 보이스북 플레이어를 포함하는 보이스북 플레잉 시스템으로서, 상술한 과제를 해결한다.Provide a user with an interface of a device capable of playing a voicebook file and obtain voice data information through the interface, but in some cases visually obtain text data already connected to the voice data, and at a new location. If you want to move it, access the text data that is already stored and move to the corresponding voice data.If you want to search, refer to the search index table of the text data already included and perform the search and output the result. A voicebook playing system that includes a voicebook player that supports to solve the above problem is solved.
또한, 본 발명은 상기 텍스트데이터와 보이스데이터를,In addition, the present invention, the text data and voice data,
일정 단위로 구분하여 출력하되 이미 파일에 포함되어 있는 인덱싱 테이블을 참조하여 출력하고, 그 일정단위는 단어, 문장, 문단 단위로 취급하도록 구성하여, 상술한 과제를 해결한다.The above-described problem is solved by dividing the output into a predetermined unit and outputting the index by referring to the indexing table already included in the file, and treating the predetermined unit as a word, sentence, or paragraph unit.
또한, 본 발명은 상기 보이스북 플레이어에서 사용자에게 제공하는 컨텐츠 내용이나 각종 메세지, 검색 결과등의 모든 텍스트 형식의 출력에 대하여 보이스데이터로 변환하여 출력하되, 이미 상기 텍스트데이터에 대해 보이스데이터가 파일에 저장되어 있는 경우에는 해당 보이스데이터를 출력하도록 구성하여, 상술한 과제를 해결한다.Also, the present invention converts and outputs voice data for all text formats such as content contents, various messages, search results, etc. provided to the user by the voicebook player, but voice data is already stored in a file for the text data. If it is stored, the voice data is configured to be output, thereby solving the above-described problems.
한편, 본 발명은 상기 모든 텍스트 형식의 출력에 대하여 보이스데이터로 변환하여 출력함에 있어서, 해당 보이스데이터가 파일에 저장되어 있지 않을 경우에는 상기 텍스트 형식의 데이터를 TTS 모듈(Text to Speech Module-텍스트를 이미 정해진 음성으로 변환하는 모듈)을 이용하여 변환하여 출력하도록 구성하여, 상술한 과제를 해결한다.Meanwhile, in the present invention, when the voice data is not stored in the file, the text data is converted into TTS module (Text to Speech Module-text) when the voice data is not stored in the file. The above-described problem is solved by converting and outputting using a predetermined voice conversion module).
또한, 본 발명은 상기 보이스북 플레이어에서 사용자에게 보이스데이터를 출력함에 있어서 사용자 단말기에 표시부 화면이 구비되어 있는 경우에는 상기 보이스데이터에 해당하는 텍스트데이터를 상기 표시부 화면에 출력하도록 구성하여, 상술한 과제를 해결한다.In addition, the present invention is configured to output the text data corresponding to the voice data on the display unit screen when the display unit screen is provided in the user terminal in outputting the voice data to the user in the voicebook player, the above-mentioned problem Solve it.
또한, 본 발명은 상기 보이스북 플레이어를 제어함에 있어서 음성인식 시스템을 이용하여 사용자의 음성입력을 텍스트로 변환하고 그 명령을 수행하도록 구성하여, 상술한 과제를 해결한다.In addition, the present invention is configured to convert the user's voice input to text and perform the command in the voicebook player to control the voicebook player, to solve the above problems.
또한, 본 발명은 상기 보이스북 플레이어를 제어함에 있어서 장치에 포함되어 있는 키입력을 통하여 사용자의 명령을 수행하도록 구성하여, 상술한 과제를 해결한다.In addition, the present invention is configured to perform a user's command through a key input included in the device in controlling the voicebook player, to solve the above problems.
또한, 본 발명은 상기 보이스북 플레이어에서 보이스데이터를 출력함에 있어서 사용자가 선택한 텍스트에 대하여만 부분 출력하도록 하고, 경우에 따라서 해당 보이스데이터를 반복적으로 출력하도록 구성하여, 상술한 과제를 해결한다.In addition, the present invention solves the above-described problem by configuring the voicebook player to partially output only the text selected by the user in outputting voice data, and repeatedly outputting the voice data in some cases.
본 발명의 다른 실시 예로서, 본 발명은 사용자에게 보이스북 파일을 출력할 수 있는 환경을 제공하고, 상기 환경을 통하여 보이스데이터를 텍스트데이터에 기준하여 출력하고, 동시에 해당 텍스트데이터를 표시부 화면에 병행하여 출력하며,보이스데이터가 없는 텍스트데이터를 보이스 형태로 출력하고자 할경우, TTS 모듈(Text to Speech Module-텍스트를 이미 정해진 음성으로 변환하는 모듈)을 이용하여 출력하고, 사용자가 출력 위치를 이동하고자 하거나 하여 사용자 입력 및 제어가 필요한 경우, 음성인식모듈, 키입력, 터치스크린을 통하여 사용자의 입력사항을 입력받아 그명령을 수행하도록 하고, 보이스데이터의 정확한 검색을 사용자가 원할 경우 텍스트데이터의 검색인텍스테이블을 참조하여 검색을 수행하고, 그결과을 출력하도록 하는 과정으로 이루어진 것을 포함하는 보이스북 플레잉 방법으로서, 상술한 과제를 해결한다.According to another embodiment of the present invention, the present invention provides an environment for outputting a voicebook file to a user, outputs voice data based on text data through the environment, and simultaneously displays the text data on the display unit screen. If you want to output text data without voice data in the form of voice, output it using TTS module (Text to Speech Module). If user input and control is required, the user inputs the user's input through voice recognition module, key input, and touch screen, and executes the command. If the user wants accurate search of voice data, search index of text data is required. Performing a search by referring to the table and outputting the result A voice playing drum method including comprising, solves the above problems.
본 발명의 다른 실시 예로서, 본 발명은 사용자에게 보이스북 파일을 플레이 할 수 있는 인터페이스를 제공하고, 상기 인터페이스를 통해 보이스데이터를 출력하되,텍스트데이터에 기준하여 출력하도록 지원하고, 사용자 단말기에 표시부가 있을 경우 해당 텍스트데이터를 표시부 화면에 병행출력하도록 하며, 출력하고자 하는 텍스트에 보이스데이터가 없는 경우 TTS 모듈(Text to Speech Module-텍스트를 이미 정해진 음성으로 변환하는 모듈)을 이용하여 텍스트를 보이스로 변환하여 출력하도록 지원하며 사용자가 위치이동을 자유롭게 하도록 타이틀 리스트 등을 두어 엑세스하도록 지원하고, 상기 위치이동은 텍스트데이터의 기준하여 수행하며, 사용자의 입력및 제어는 음성인식시스테, 키입력, 터치스크린입력을 통하여 사용자의 입력정보를 획득하거나 명령을 수행하도록 지원하며, 사용자가 보이스데이터의 검색을 원할 경우 이미 보이스북 파일에 포함되어 있는 텍스트데이터의 검색인덱스테이블을 이용하여 검색하고, 그 결과를 출력하도록 지원하는 보이스북 출력 프로세스로 이루어진 것을 포함하는 보이스북 플레이어 프로그램 소스를 기록한 기록매체로서, 상술한 과제를 해결한다.As another embodiment of the present invention, the present invention provides a user interface to play a voicebook file, and outputs the voice data through the interface, and supports to output based on the text data, the display unit on the user terminal If there is, the corresponding text data is output in parallel on the display unit. If there is no voice data in the text to be output, the text is converted into voice using a TTS module (Text to Speech Module). It supports converting and outputting and supports access by setting a title list and so on so that the user can freely move the position, and the position movement is performed based on the text data, and the user's input and control are voice recognition system, key input, and touch. Acquire user input information through screen input It consists of a voicebook output process that supports the execution of commands and supports the user to search the voice data using the search index table of text data already included in the voicebook file and output the results. The above-described problem is solved by a recording medium on which a voicebook player program source is included.
이하, 첨부한 도면들을 참조하여 본 발명의 바람직한 실시 예를 상세히 기술하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명인 보이스북 플레잉 시스템을 설명하기 위한 개략적인 블록도이다.1 is a schematic block diagram for explaining a voicebook playing system according to the present invention.
첨부 도면 도 1에 도시된 바와 같이, 본 발명은 음성인식모듈(110a) 및 TTS 모듈(Text to Speech Module-텍스트를 이미 정해진 음성으로 변환하는 모듈)(110b)과 연결된 보이스북 플레이어(110)를 탑재하고 있는 사용자 단말기(A1)와, 상기 사용자 단말기(A1)에 연결된 키신호 입력부(111)와, 상기 사용자 단말기(A1)에 연결된 터치스크린(115)과 함께 구성되어 있는 포함하는 표시부(112)와, 상기 사용자 단말기(A1)에 연결된 마이크부(113)와, 상기 사용자 단말기(A1)에 연결된 스피커부(114)로 구성된다. 상기 사용자 단말기(A1)는 PC, 노트북 컴퓨터, PDA 등을 포함하며, 키신호 입력부(111)는 키보드, 마우스, 전자펜 등을 포함하며, 표시부(112)는 음극선관 모니터, LCD 모니터 등을 포함하며, 마이크부(113)은 음성을 입력할 수 있는마이크 및 마이크 제어 장비등을 포함하며, 스피커부(114)는 음성을 출력할 수 있는 스피커 및 스피커 장비등을 포함하며, 사용자 직접 입력장치로는 입력용 터치스크린(115) 등을 포함한다.As shown in FIG. 1, the present invention provides a voicebook player 110 connected to a voice recognition module 110a and a TTS module (Text to Speech Module 110b). The display unit 112 includes a mounted user terminal A1, a key signal input unit 111 connected to the user terminal A1, and a touch screen 115 connected to the user terminal A1. And a microphone 113 connected to the user terminal A1 and a speaker unit 114 connected to the user terminal A1. The user terminal A1 includes a PC, a notebook computer, a PDA, and the like, the key signal input unit 111 includes a keyboard, a mouse, an electronic pen, and the like, and the display unit 112 includes a cathode ray tube monitor and an LCD monitor. The microphone unit 113 includes a microphone and a microphone control device for inputting voice, and the speaker unit 114 includes a speaker and a speaker device for outputting voice and the user directly inputs the device. Includes an input touch screen 115 and the like.
상기 사용자 단말기(A1)에 탑재된 보이스북 플레이어(110)는 사용자에게 보이스북 파일을 플레이할 수 있는 인터페이스를 제공하고, 상기 인터페이스를 통하여 통하여 보이스데이터(C110)를 출력하되, 상기 보이스데이터(C110)와 해당 텍스트데이터(C100)와의 연결 정보를 이미 적재하고 있는 인덱스테이블을 참조하여 출력하며, 보이스데이터의 음성출력 이외에 표시부(112)를 통하여 해당 텍스트데이터를 함께 출력하도록 지원하고, 각종 텍스트 형태의 출력은 해당 보이스 데이터가 파일상에 존재하지 않을 경우 TTS 모듈(110b)을 이용하여 변환을 수행하며, 사용자가 플레이어를 제어하고자 할 경우의 사용자 제어는 키입력부(111)이나 터치스크린(115)의 입력외에도 직접 사용자의 음성을 텍스트로 변환하여 입력을 대행할 수 있는 음성인식모듈(110a)의 사용을 포함하며, 사용자가 보이스데이터의 검색을 하고자 할 경우에는 이미 보이스북 파일에 포함되어 있는 텍스트데이터의 검색인덱스테이블을 참조하도록 지원한다.The voicebook player 110 mounted in the user terminal A1 provides an interface for playing a voicebook file to the user, and outputs voice data C110 through the interface, but the voice data C110 ) And outputs by referring to the index table which already loads the connection information between the corresponding text data (C100) and the corresponding text data through the display unit 112 in addition to the voice output of the voice data. The output is converted using the TTS module 110b when the corresponding voice data does not exist in the file, and the user control when the user wants to control the player is performed by the key input unit 111 or the touch screen 115. In addition to the input, using the voice recognition module 110a that can directly convert the user's voice to text on behalf of the input Also, supporting users if you want to search the voice data it is already included in the Voice book file to reference the table in the text search index data.
상기 보이스북 플레이어(110)에 대한 설명을 첨부 도면 도 2를 참조하여 그 기능 및 작용을 좀더 상세히 기술하면 다음과 같다.The function and operation of the voicebook player 110 will be described in more detail with reference to FIG. 2 as follows.
먼저, 상기 보이스북 플레이어(110)는 사용자의 요청에 응하여 실행되면(B100), 사용자가 보이스데이터(C110) 정보를 입수하고 제어하는 환경을 제공하되, 정보 제공 모드에 있어서는 크게 듣기모드(Hearing Mode)(B102)와 읽기모드(Reading Mode)(B103)와 검색모드(Searching Mode)(B104)로 구분하여 제공한다.First, when the voicebook player 110 is executed in response to a user's request (B100), the voicebook player 110 provides an environment in which the user obtains and controls voice data (C110) information, but the listening mode (Hearing Mode) in the information providing mode. B102, a reading mode B103 and a search mode B104 are provided.
제어 루틴(B110)Control routine (B110)
그러면, 상기 보이스북 플레이어(110)는 상기 모드에 따라 사용자가 원하는 정보를 입력하거나 명령할 수 있도록 입력환경을 제공한다.Then, the voicebook player 110 provides an input environment for the user to input or command the desired information according to the mode.
이때, 상기 입력은 기본적으로 키제어(B111)를 통한 입력으로서 사용자 단말기(A1)에 부착되어 있는 키입력부(111)를 통하여 입력하거나, 터치스크린(115)을통하여 입력하는 것을 들 수 있다. 이와 같은 경우에 사용자는 표시부(112)를 통하여 프로세서의 상태를 입수하고 상기 키제어(B111)를 통해 새로운 명령을 지정할 수 있다.In this case, the input may be input through the key input unit 111 attached to the user terminal A1 as an input through the key control B111, or input through the touch screen 115. In this case, the user may obtain the state of the processor through the display unit 112 and designate a new command through the key control B111.
한편, 상기 입력의 또다른 방법은 음성제어(B112)로서 사용자가 직접 마이크부(113)를 통하여 음성정보를 입력하면 음성인식모듈(110a)에 의해 음성을 텍스트로 변환한 다음 입력이 이루어지도록 하는 것을 들 수 있다. 예를 들면, 사용자가 정보를 입수하고자 하는 모드가 듣기모드(B102)이고, 듣기를 희망하는 보이스 컨텐츠의 타이틀이 "컴퓨터 입문"이라고 할 때, 사용자는 마이크를 통하여 "타이틀", "컴퓨터 입문"이라고 음성으로 발성하면 상기 보이스북 플레이어(110)는 해당 보이스북 파일을 읽어들여(로딩하여) 스피커부(114)를 통해 보이스데이터(C110)를 순차적으로 출력하도록 할 수 있다.On the other hand, another method of the input is the voice control (B112) when the user directly inputs the voice information through the microphone unit 113 to convert the voice to text by the voice recognition module (110a) so that the input is made It can be mentioned. For example, when the mode in which the user wants to obtain information is the listening mode (B102), and the title of the voice content desired to be listened to is "introduction to the computer", the user can enter "title", "introduction to the computer" through a microphone. When the voice is spoken by the voicebook player 110, the voicebook file may be read (loaded) and output the voice data C110 sequentially through the speaker unit 114.
또한, 보이스데이터(C110)의 출력 위치를 새로운 곳으로 이동하고자 하거나 어떤 범위의 보이스데이터를 반복하여 정보를 입수하고자 할 경우에는 터치스크린패드(115)나 음성으로 반복 명령을 지시하거나 새로운 위치를 명령할 수 있으며, 이때, 보이스북 플레이어(110)는 사용자의 명령에 따라 새로운 위치로의 이동이나 반복 출력을 수행할 수 있다.In addition, when the user wants to move the output position of the voice data C110 to a new place or to obtain information by repeating a certain range of voice data, the touch screen pad 115 or a voice commands a repeat command or a new position command. In this case, the voicebook player 110 may move to a new position or repeat output according to a user's command.
출력루틴(B120)Output routine (B120)
그러면, 상기 보이스북 플레이어(110)의 출력은 스피커부(114)를 통해 사용자에게 음성정보를 전달하되, 그 순차는 텍스트데이터(C100)에 기준하여 출력하도록 하며, 또한 상기 보이스데이터(C110)와 텍스트데이터(C100)간의 연결 정보가 이미 인덱싱 되어 있는 데이터베이스 테이블을 참조하여 출력하도록 한다.Then, the output of the voicebook player 110 transmits the voice information to the user through the speaker unit 114, the sequence is output based on the text data (C100), and also the voice data (C110) The connection information between the text data C100 is output by referring to a database table that is already indexed.
이때, 순차적으로 텍스트데이터(C100)에 기준하여 보이스데이터(C110)를 출력할 경우, 만약 현재 출력하고자하는 텍스트데이터(C100)에 대하여 해당 보이스데이터(C110)가 없을 경우에는 TTS 모듈(Text to Speech Module-텍스트를 이미 정해진 음성으로 변환하는 모듈)(110b)을 이용하여 상기 텍스트데이터(C100)를 보이스 형태로 변환하여 출력하도록 한다. 예를 들면, 사용자가 보이스 데이터 검색을 위한 검색모드(B104)가 선택되어 있고, 사용자가 어느 단어를 입력하여 보이스북 플레이어(110)가 검색을 수행하였을 때 그 해당 결과가 하나도 없어서 사용자에게 메세지로 "해당 단어를 찾을 수 없습니다" 라고 보이스 형태로 출력하고자 하나, 해당 메세지에 대한 보이스데이터(C110)가 존재하지 않을 경우에는 상기 TTS 모듈(110b)을 이용하여 해당 메세지를 음성으로 변환한 다음 출력을 수행할 수 있다.At this time, when the voice data (C110) is sequentially output based on the text data (C100), if there is no corresponding voice data (C110) for the text data (C100) to be currently output, the TTS module (Text to Speech) Module-module 110b for converting text into a predetermined voice to convert the text data C100 into a voice form and output it. For example, when the user selects a search mode B104 for voice data search and the user inputs a word and the voicebook player 110 performs a search, there is no corresponding result. If the voice data (C110) for the message is not present, but the voice data (C110) for the message does not exist, the corresponding message is converted to voice using the TTS module (110b) and then outputted. Can be done.
또한, 상기 사용자 단말기(A1)가 표시부(112)를 포함하고 있을 경우에는 스피커부(114)를 통한 보이스데이터(C110) 출력과 동시에 해당 텍스트를 표시부(112)를 통해 병행하여 출력하여 줌으로 사용자에게 시각적인 정보도 함께 제공할 수 있다.In addition, when the user terminal A1 includes the display unit 112, the user outputs the voice data C110 through the speaker unit 114 and simultaneously outputs the corresponding text through the display unit 112. You can also provide them with visual information.
또한, 사용자가 어떤 부분의 텍스트데이터(C100)를 선택한 후 해당 보이스데이터를 반복하여 듣고자 할 경우, 상기 보이스북 플레이어(110)는 해당 보이스데이터를 반복하여 출력하도록 지원할 수 있다.In addition, when the user selects a portion of the text data C100 and wants to repeatedly listen to the voice data, the voicebook player 110 may support to repeatedly output the voice data.
상기와 같이 사용자가 보이스북 플레이어(110)을 이용하여 보이스데이터(C110)와 텍스트데이터(C100)를 상호 연관하여 정보를 입수할 수 있게된다.As described above, the user may obtain information by correlating voice data C110 and text data C100 using voicebook player 110.
상술한 바와 같이 본 발명은 보이스북 플레잉 시스템을 이용하여 보이스 데이터뿐만 아니라 보이스데이터와 연결된 텍스트 데이터 소스에 접근할 수 있도록 함으로서 사용자가 텍스트컨텐츠와 보이스컨텐츠를 함께 참고하여 정보 습득을 심층적이고 세부적으로 할 수 있다는 효과를 제공한다.As described above, the present invention provides access to text data sources connected to voice data as well as voice data using the voicebook playing system so that a user can refer to text content and voice content together to deepen and acquire information. Can provide the effect.
또한, 본 발명은 보이스북 보이스북 파일에 검색 인텍싱 정보를 포함하므로 상기 보이스북 플레이어에서 사용자가 보이스데이터와 연결된 텍스트데이터의 단어별 검색을 하여 원하는 위치의 보이스데이터 정보를 신속하게 습득할 수 있는 효과를 제공한다.In addition, since the present invention includes search indexing information in a voicebook voicebook file, a user can quickly acquire voice data information of a desired position by searching a text data associated with voice data in the voicebook player. Provide effect.
또한, 본 발명은 텍스트 컨텐츠에 대하여 실제적 보이스데이터를 제공함으로 사용자로 하여금 편리하게 청취하게 하고, 기계적 음성의 거부감 없이 보이스북 파일의 정보를 입수하도록 할 수 있는 효과를 제공한다.In addition, the present invention provides the effect that the user can conveniently listen to the text content by providing the actual voice data, and obtain the information of the voicebook file without the rejection of the mechanical voice.
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020064269A KR20020097081A (en) | 2002-10-21 | 2002-10-21 | Playing sysytem and method of voice book, and storage media thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020064269A KR20020097081A (en) | 2002-10-21 | 2002-10-21 | Playing sysytem and method of voice book, and storage media thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20020097081A true KR20020097081A (en) | 2002-12-31 |
Family
ID=27728896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020020064269A Ceased KR20020097081A (en) | 2002-10-21 | 2002-10-21 | Playing sysytem and method of voice book, and storage media thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20020097081A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012030020A1 (en) * | 2010-08-31 | 2012-03-08 | (주) 에스엔아이솔라 | Touch screen apparatus for the blind, and method for recognizing electronic documents using a skip navigation method therefor |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129620A (en) * | 1993-10-29 | 1995-05-19 | Hiuka Sangyo Kk | Voice electronic book |
KR19980015989A (en) * | 1996-08-24 | 1998-05-25 | 김광호 | Portable read-only electronic reading device and control method thereof |
KR20010076136A (en) * | 2000-01-13 | 2001-08-11 | 최원용 | portable reading apparatus |
KR20010106844A (en) * | 2000-05-23 | 2001-12-07 | 김준철 | Apparatus and method for regenerating audiobook |
KR20020048357A (en) * | 2002-05-29 | 2002-06-22 | 양덕준 | Method and apparatus for providing text-to-speech and auto speech recognition on audio player |
KR20040034034A (en) * | 2002-10-17 | 2004-04-28 | 김신호 | Editting sysytem and method of voice book, and storage media thereof |
-
2002
- 2002-10-21 KR KR1020020064269A patent/KR20020097081A/en not_active Ceased
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129620A (en) * | 1993-10-29 | 1995-05-19 | Hiuka Sangyo Kk | Voice electronic book |
KR19980015989A (en) * | 1996-08-24 | 1998-05-25 | 김광호 | Portable read-only electronic reading device and control method thereof |
KR20010076136A (en) * | 2000-01-13 | 2001-08-11 | 최원용 | portable reading apparatus |
KR20010106844A (en) * | 2000-05-23 | 2001-12-07 | 김준철 | Apparatus and method for regenerating audiobook |
KR20020048357A (en) * | 2002-05-29 | 2002-06-22 | 양덕준 | Method and apparatus for providing text-to-speech and auto speech recognition on audio player |
KR20040034034A (en) * | 2002-10-17 | 2004-04-28 | 김신호 | Editting sysytem and method of voice book, and storage media thereof |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012030020A1 (en) * | 2010-08-31 | 2012-03-08 | (주) 에스엔아이솔라 | Touch screen apparatus for the blind, and method for recognizing electronic documents using a skip navigation method therefor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7735012B2 (en) | Audio user interface for computing devices | |
US8150687B2 (en) | Recognizing speech, and processing data | |
US20090177300A1 (en) | Methods and apparatus for altering audio output signals | |
US20060106618A1 (en) | System and method for converting text to speech | |
JPH0651941A (en) | Handheld computer with voice annotations | |
JPH0528790A (en) | Recording and reproducing device | |
JP2015026069A (en) | Program for implementing display recording method for recording audio correspondingly to display contents, the display recording method and display recording device | |
JPH0973461A (en) | Sentence information reproducing device using voice | |
EP3292480A1 (en) | Techniques to automatically generate bookmarks for media files | |
JP2006171579A (en) | Audio reproduction program, recording medium therefor, audio reproduction apparatus, and audio reproduction method | |
JP2020154057A (en) | Text editing device of voice data and text editing method of voice data | |
JP2010002787A (en) | Learning system, learning terminal, and learning program | |
JP7229296B2 (en) | Related information provision method and system | |
US20070005565A1 (en) | Database searching method and apparatus | |
KR20020097081A (en) | Playing sysytem and method of voice book, and storage media thereof | |
JP2012058877A (en) | Play list creation device | |
JP2005148727A (en) | Learning support device | |
KR100329589B1 (en) | Method and apparatus for playing back of digital audio by syllables | |
KR100695268B1 (en) | Data playback device and playback method with batch automatic review function | |
JP2011150169A (en) | Speech recognition device | |
KR20040062317A (en) | Method for guiding additional information for audio data file | |
KR100912118B1 (en) | Learning system linked to contents and learning method using the same | |
KR100470105B1 (en) | Portable Digital Language Study Device for Creation of Repeat Function | |
JP2005107617A (en) | Voice data retrieval apparatus | |
CN1225737C (en) | Speech playing method able to report song name in advance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20021021 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050217 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20050726 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20050217 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |