JP5093966B2 - 編集中における音声カーソルとテキストカーソルの位置合わせ - Google Patents
編集中における音声カーソルとテキストカーソルの位置合わせ Download PDFInfo
- Publication number
- JP5093966B2 JP5093966B2 JP2002578284A JP2002578284A JP5093966B2 JP 5093966 B2 JP5093966 B2 JP 5093966B2 JP 2002578284 A JP2002578284 A JP 2002578284A JP 2002578284 A JP2002578284 A JP 2002578284A JP 5093966 B2 JP5093966 B2 JP 5093966B2
- Authority
- JP
- Japan
- Prior art keywords
- cursor
- information
- text
- word
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 10
- 230000008929 regeneration Effects 0.000 claims 1
- 238000011069 regeneration method Methods 0.000 claims 1
- 230000001360 synchronised effect Effects 0.000 abstract description 50
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 241000607479 Yersinia pestis Species 0.000 description 5
- 230000035484 reaction time Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 101100460719 Mus musculus Noto gene Proteins 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Document Processing Apparatus (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Machine Translation (AREA)
Description
Claims (15)
- 音声情報から音声認識装置によって認識された認識テキスト情報の誤ったワードを訂正する訂正装置であって、
前記音声認識装置は、前記認識テキスト情報の各ワードにおいて、該ワードが前記音声認識装置により認識された前記音声情報の部分をマークするリンク情報を構成し、
当該訂正装置は、前記音声情報と、前記係る認識テキスト情報と、前記リンク情報とを受信するよう構成され、
当該訂正装置は、
表示手段に表示される前記認識テキスト情報の誤ったワードにテキストカーソルを配置及び表示し、ユーザにより入力された編集情報に従って前記誤ったワードを編集するテキスト編集手段と、
前記音声情報の音声再生が実行され、該音声再生中にちょうど再生されているワードに対応し、前記リンク情報によりマークされている前記認識テキスト情報のワードが該ワードにおいて音声カーソルを表示することにより連動してマークされる当該訂正装置の連動再生モードを実行する連動再生手段と、
前記テキストカーソルと前記音声カーソルとを同じ位置又は所定の距離だけ離間した位置に配置するため、前記表示されたテキストカーソルを前記表示された音声カーソルに、あるいは前記表示された音声カーソルを前記表示されたテキストカーソルに連動させるカーソル連動手段と、
からなることを特徴とする訂正装置。 - 請求項1記載の訂正装置であって、前記カーソル連動手段は、該訂正装置の前記連動再生モードにおいて、前記テキストカーソル及び音声カーソルを連動させるよう構成されていることを特徴とする訂正装置。
- 請求項1又は2記載の訂正装置であって、前記カーソル連動手段はキーボードを備え、前記テキストカーソル及び音声カーソルを少なくとも1つのキーを手動操作することにより連動させるよう構成されることを特徴とする訂正装置。
- 請求項3記載の訂正装置であって、前記キーボードは「→」キーと「←」キーとを含み、前記「→」キーが操作されるとき、他方のカーソルに対して前記認識テキスト情報の開始地点により近く示されているカーソルが前記他方のカーソルと連動可能であり、前記「←」キーが操作されるとき、他方のカーソルに対して前記認識テキスト情報の終了地点により近く示されているカーソルが前記他方のカーソルと連動可能であることを特徴とする訂正装置。
- 請求項1乃至4何れか一項記載の訂正装置であって、前記カーソル連動手段は、当該訂正装置の前記連動再生モードがアクティブ状態のとき、前記認識テキスト情報の前記テキストカーソルを前記音声カーソルより所定のワード数Nだけ先行して置くことを特徴とする訂正装置。
- 請求項5記載の訂正装置であって、前記所定のワード数Nは、ユーザ情報に従って設定されることを特徴とする訂正装置。
- 請求項2又は3記載の訂正装置であって、前記カーソル連動手段は、当該訂正装置の連動再生モードにおいて互いに連続的に前記テキストカーソル及び音声カーソルを自動的に連動させるよう構成され、誤ったワードの編集のため、前記テキストカーソルは少なくとも1つのキーの手動操作により、さらなる少なくとも1つのキーの操作により前記テキストカーソルが前記音声カーソルに再び連動するまで、該音声カーソルから切り離されることを特徴とする訂正装置。
- 音声情報から音声認識装置によって認識された認識テキスト情報の誤ったワードを訂正する訂正方法であって、
前記音声認識装置は、前記認識テキスト情報の各ワードにおいて、該ワードが前記音声認識装置により認識された前記音声情報の部分をマークするリンク情報を構成し、
当該方法は、
訂正装置において、前記音声情報と、前記係る認識テキスト情報と、前記リンク情報とを受信するステップと、
前記音声情報の音声再生中、ちょうど再生されているワードに対応し、前記リンク情報によりマークされている前記認識テキスト情報のワードが表示手段上の該ワードに音声カーソルを配置及び表示することにより連動してマークされる連動再生モードを実行するステップと、
ユーザにより入力された編集情報に従って前記表示手段に表示されるテキストカーソルによる編集手段により前記誤ったワードを編集するステップと、
前記テキストカーソルと前記音声カーソルとを同じ位置又は所定の距離だけ離間した位置に配置するため、前記入力された編集情報に応じて、前記表示されたテキストカーソルを前記表示された音声カーソルに、あるいは前記表示された音声カーソルを前記表示されたテキストカーソルに連動させるステップと、
からなることを特徴とする訂正方法。 - 請求項8記載の訂正方法であって、前記誤ったワードを編集するステップと、前記テキストカーソルと前記音声カーソルとに連動させるステップとは、前記訂正装置の連動再生モード中に実行されることを特徴とする訂正方法。
- 請求項8又は9記載の訂正方法であって、前記テキストカーソルと前記音声カーソルとに連動させるステップは、前記編集手段に係るキーボードの少なくとも1つのキーを手動操作することにより開始されることを特徴とする訂正方法。
- 請求項8乃至10何れか一項記載の訂正方法であって、前記テキストカーソルは前記認識テキスト情報において、前記音声カーソルより所定のワード数Nだけ先行して置くことを特徴とする訂正方法。
- 請求項11記載の訂正方法であって、前記所定のワード数Nは、ユーザ情報に従って設定されることを特徴とする訂正方法。
- 受信された音声情報においてテキスト情報を認識し、音声情報を受信するよう構成される音声認識装置であって、
受信された前記音声情報に割り当てられる認識テキスト情報及びリンク情報を認識する音声認識手段であって、前記認識テキスト情報の各ワードに対して、前記リンク情報は該ワードが該音声認識手段により認識された前記音声情報の部分を示す音声認識手段と、
前記認識テキスト情報に含まれた誤ったワードを訂正するための請求項1乃至7何れか一項記載の訂正装置と、
からなることを特徴とする音声認識装置。 - デジタルコンピュータの内部メモリに直接ロード可能であって、ソフトウェアコードセクションを有するコンピュータプログラムであって、
該コンピュータプログラムが前記デジタルコンピュータ上で実行されれば、請求項8乃至12何れか一項記載の訂正方法の各ステップが実行されることを特徴とするコンピュータプログラム。 - 請求項14記載のコンピュータプログラムが格納されるコンピュータ読み出し可能な媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01890104.1 | 2001-03-29 | ||
EP01890104 | 2001-03-29 | ||
PCT/IB2002/001062 WO2002080143A1 (en) | 2001-03-29 | 2002-03-25 | Synchronise an audio cursor and a text cursor during editing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004530205A JP2004530205A (ja) | 2004-09-30 |
JP5093966B2 true JP5093966B2 (ja) | 2012-12-12 |
Family
ID=8185105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002578284A Expired - Fee Related JP5093966B2 (ja) | 2001-03-29 | 2002-03-25 | 編集中における音声カーソルとテキストカーソルの位置合わせ |
Country Status (7)
Country | Link |
---|---|
US (3) | US8117034B2 (ja) |
EP (1) | EP1374225B1 (ja) |
JP (1) | JP5093966B2 (ja) |
CN (1) | CN1225721C (ja) |
AT (1) | ATE286294T1 (ja) |
DE (1) | DE60202453T2 (ja) |
WO (1) | WO2002080143A1 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7263484B1 (en) | 2000-03-04 | 2007-08-28 | Georgia Tech Research Corporation | Phonetic searching |
JP5093966B2 (ja) | 2001-03-29 | 2012-12-12 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 編集中における音声カーソルとテキストカーソルの位置合わせ |
US7231351B1 (en) | 2002-05-10 | 2007-06-12 | Nexidia, Inc. | Transcript alignment |
US7380203B2 (en) * | 2002-05-14 | 2008-05-27 | Microsoft Corporation | Natural input recognition tool |
JP2006508448A (ja) | 2002-11-28 | 2006-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ワードクラス情報を割り当てる方法 |
US7774694B2 (en) * | 2002-12-06 | 2010-08-10 | 3M Innovation Properties Company | Method and system for server-based sequential insertion processing of speech recognition results |
US20050096910A1 (en) * | 2002-12-06 | 2005-05-05 | Watson Kirk L. | Formed document templates and related methods and systems for automated sequential insertion of speech recognition results |
US7444285B2 (en) * | 2002-12-06 | 2008-10-28 | 3M Innovative Properties Company | Method and system for sequential insertion of speech recognition results to facilitate deferred transcription services |
KR100668297B1 (ko) * | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US7263483B2 (en) * | 2003-04-28 | 2007-08-28 | Dictaphone Corporation | USB dictation device |
US7346506B2 (en) | 2003-10-08 | 2008-03-18 | Agfa Inc. | System and method for synchronized text display and audio playback |
US20050144015A1 (en) * | 2003-12-08 | 2005-06-30 | International Business Machines Corporation | Automatic identification of optimal audio segments for speech applications |
US7629989B2 (en) * | 2004-04-02 | 2009-12-08 | K-Nfb Reading Technology, Inc. | Reducing processing latency in optical character recognition for portable reading machine |
US8504369B1 (en) | 2004-06-02 | 2013-08-06 | Nuance Communications, Inc. | Multi-cursor transcription editing |
US7836412B1 (en) | 2004-12-03 | 2010-11-16 | Escription, Inc. | Transcription editing |
JP2007133033A (ja) | 2005-11-08 | 2007-05-31 | Nec Corp | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム |
US8521510B2 (en) | 2006-08-31 | 2013-08-27 | At&T Intellectual Property Ii, L.P. | Method and system for providing an automated web transcription service |
US8959433B2 (en) * | 2007-08-19 | 2015-02-17 | Multimodal Technologies, Llc | Document editing using anchors |
US20100324895A1 (en) * | 2009-01-15 | 2010-12-23 | K-Nfb Reading Technology, Inc. | Synchronization for document narration |
US20100299131A1 (en) * | 2009-05-21 | 2010-11-25 | Nexidia Inc. | Transcript alignment |
US20100332225A1 (en) * | 2009-06-29 | 2010-12-30 | Nexidia Inc. | Transcript alignment |
US9292161B2 (en) * | 2010-03-24 | 2016-03-22 | Microsoft Technology Licensing, Llc | Pointer tool with touch-enabled precise placement |
US8392186B2 (en) | 2010-05-18 | 2013-03-05 | K-Nfb Reading Technology, Inc. | Audio synchronization for document narration with user-selected playback |
CN101887346A (zh) * | 2010-06-22 | 2010-11-17 | 宇龙计算机通信科技(深圳)有限公司 | 一种信息输入控制方法、装置及通信终端 |
CN102314874A (zh) * | 2010-06-29 | 2012-01-11 | 鸿富锦精密工业(深圳)有限公司 | 文本到语音转换系统与方法 |
US10032127B2 (en) | 2011-02-18 | 2018-07-24 | Nuance Communications, Inc. | Methods and apparatus for determining a clinician's intent to order an item |
US10460288B2 (en) | 2011-02-18 | 2019-10-29 | Nuance Communications, Inc. | Methods and apparatus for identifying unspecified diagnoses in clinical documentation |
US9904768B2 (en) | 2011-02-18 | 2018-02-27 | Nuance Communications, Inc. | Methods and apparatus for presenting alternative hypotheses for medical facts |
US8768723B2 (en) | 2011-02-18 | 2014-07-01 | Nuance Communications, Inc. | Methods and apparatus for formatting text for clinical fact extraction |
CN102682763B (zh) * | 2011-03-10 | 2014-07-16 | 北京三星通信技术研究有限公司 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
US9361282B2 (en) * | 2011-05-24 | 2016-06-07 | Lg Electronics Inc. | Method and device for user interface |
JP2013025299A (ja) * | 2011-07-26 | 2013-02-04 | Toshiba Corp | 書き起こし支援システムおよび書き起こし支援方法 |
US20130035936A1 (en) * | 2011-08-02 | 2013-02-07 | Nexidia Inc. | Language transcription |
US9317196B2 (en) | 2011-08-10 | 2016-04-19 | Microsoft Technology Licensing, Llc | Automatic zooming for text selection/cursor placement |
US9318110B2 (en) * | 2011-09-09 | 2016-04-19 | Roe Mobile Development Llc | Audio transcription generator and editor |
KR101921203B1 (ko) * | 2012-03-02 | 2018-11-22 | 삼성전자 주식회사 | 녹음 기능이 연동된 메모 기능 운용 방법 및 장치 |
US9569594B2 (en) | 2012-03-08 | 2017-02-14 | Nuance Communications, Inc. | Methods and apparatus for generating clinical reports |
US9805118B2 (en) | 2012-06-29 | 2017-10-31 | Change Healthcare Llc | Transcription method, apparatus and computer program product |
US9064492B2 (en) | 2012-07-09 | 2015-06-23 | Nuance Communications, Inc. | Detecting potential significant errors in speech recognition results |
KR20140008835A (ko) * | 2012-07-12 | 2014-01-22 | 삼성전자주식회사 | 음성 인식 오류 수정 방법 및 이를 적용한 방송 수신 장치 |
JP2014142501A (ja) * | 2013-01-24 | 2014-08-07 | Toshiba Corp | テキスト再生装置、方法、及びプログラム |
US11024406B2 (en) | 2013-03-12 | 2021-06-01 | Nuance Communications, Inc. | Systems and methods for identifying errors and/or critical results in medical reports |
US10496743B2 (en) | 2013-06-26 | 2019-12-03 | Nuance Communications, Inc. | Methods and apparatus for extracting facts from a medical text |
CN103885596B (zh) * | 2014-03-24 | 2017-05-24 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9940929B2 (en) * | 2015-12-09 | 2018-04-10 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
CN106098060B (zh) * | 2016-05-19 | 2020-01-31 | 北京搜狗科技发展有限公司 | 语音的纠错处理方法和装置、用于语音的纠错处理的装置 |
CN106448675B (zh) * | 2016-10-21 | 2020-05-01 | 科大讯飞股份有限公司 | 识别文本修正方法及系统 |
US10529330B2 (en) * | 2017-11-24 | 2020-01-07 | Sorizava Co., Ltd. | Speech recognition apparatus and system |
CN108366182B (zh) * | 2018-02-13 | 2020-07-07 | 京东方科技集团股份有限公司 | 文字语音同步播报的校准方法及装置、计算机存储介质 |
CN110265031A (zh) * | 2019-07-25 | 2019-09-20 | 秒针信息技术有限公司 | 一种语音处理方法及装置 |
CN111079760B (zh) * | 2019-08-02 | 2023-11-28 | 广东小天才科技有限公司 | 一种文字识别方法及电子设备 |
CN110534112B (zh) * | 2019-08-23 | 2021-09-10 | 王晓佳 | 基于位置与时间的分布式语音识别纠错方法 |
KR102153668B1 (ko) | 2019-10-29 | 2020-09-09 | 주식회사 퍼즐에이아이 | 키보드 매크로 기능을 활용한 자동 음성 인식기 및 음성 인식 방법 |
CN113936699B (zh) * | 2020-06-29 | 2023-05-26 | 腾讯科技(深圳)有限公司 | 音频处理方法、装置、设备及存储介质 |
US11947894B2 (en) | 2021-04-28 | 2024-04-02 | International Business Machines Corporation | Contextual real-time content highlighting on shared screens |
Family Cites Families (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3676856A (en) * | 1970-08-11 | 1972-07-11 | Ron Manly | Automatic editing system and method |
US3648249A (en) | 1970-12-08 | 1972-03-07 | Ibm | Audio-responsive visual display system incorporating audio and digital information segmentation and coordination |
JPS6184771A (ja) | 1984-10-03 | 1986-04-30 | Hitachi Ltd | 音声入力装置 |
US4637797A (en) | 1985-01-11 | 1987-01-20 | Access Learning Technology Corporation | Software training system |
US4701130A (en) | 1985-01-11 | 1987-10-20 | Access Learning Technology Corporation | Software training system |
JPS62212870A (ja) | 1986-03-14 | 1987-09-18 | Fujitsu Ltd | 文章読み上げ校正装置 |
AT390685B (de) | 1988-10-25 | 1990-06-11 | Philips Nv | System zur textverarbeitung |
US5146439A (en) | 1989-01-04 | 1992-09-08 | Pitney Bowes Inc. | Records management system having dictation/transcription capability |
JPH05108608A (ja) | 1991-10-18 | 1993-04-30 | Olympus Optical Co Ltd | 情報信号処理装置 |
US5553289A (en) * | 1991-12-26 | 1996-09-03 | International Business Machines Corporation | System for automatically assigning attributes to objects of multimedia distribution when the objects being within a predetermined relationship |
US5519808A (en) | 1993-03-10 | 1996-05-21 | Lanier Worldwide, Inc. | Transcription interface for a word processing station |
US5369704A (en) | 1993-03-24 | 1994-11-29 | Engate Incorporated | Down-line transcription system for manipulating real-time testimony |
US5602982A (en) | 1994-09-23 | 1997-02-11 | Kelly Properties, Inc. | Universal automated training and testing software system |
US5664227A (en) * | 1994-10-14 | 1997-09-02 | Carnegie Mellon University | System and method for skimming digital audio/video data |
US5812882A (en) | 1994-10-18 | 1998-09-22 | Lanier Worldwide, Inc. | Digital dictation system having a central station that includes component cards for interfacing to dictation stations and transcription stations and for processing and storing digitized dictation segments |
US5616876A (en) * | 1995-04-19 | 1997-04-01 | Microsoft Corporation | System and methods for selecting music on the basis of subjective content |
US5857212A (en) | 1995-07-06 | 1999-01-05 | Sun Microsystems, Inc. | System and method for horizontal alignment of tokens in a structural representation program editor |
US5960447A (en) * | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
JP3416007B2 (ja) * | 1995-12-06 | 2003-06-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | オーディオビジュアル・マテリアルをスクリーニングする装置及び方法 |
US5911485A (en) | 1995-12-11 | 1999-06-15 | Unwired Planet, Inc. | Predictive data entry method for a keypad |
US5898830A (en) | 1996-10-17 | 1999-04-27 | Network Engineering Software | Firewall providing enhanced network security and user transparency |
US5983176A (en) * | 1996-05-24 | 1999-11-09 | Magnifi, Inc. | Evaluation of media content in media files |
US5748888A (en) | 1996-05-29 | 1998-05-05 | Compaq Computer Corporation | Method and apparatus for providing secure and private keyboard communications in computer systems |
EP0811906B1 (en) * | 1996-06-07 | 2003-08-27 | Hewlett-Packard Company, A Delaware Corporation | Speech segmentation |
US5664896A (en) | 1996-08-29 | 1997-09-09 | Blumberg; Marvin R. | Speed typing apparatus and method |
GB2303955B (en) * | 1996-09-24 | 1997-05-14 | Allvoice Computing Plc | Data processing method and apparatus |
US5875448A (en) | 1996-10-08 | 1999-02-23 | Boys; Donald R. | Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator |
EP0840287A3 (en) * | 1996-10-31 | 1999-04-07 | Microsoft Corporation | Method and system for selecting recognized words when correcting recognized speech |
US6173259B1 (en) | 1997-03-27 | 2001-01-09 | Speech Machines Plc | Speech to text conversion |
US5875429A (en) | 1997-05-20 | 1999-02-23 | Applied Voice Recognition, Inc. | Method and apparatus for editing documents through voice recognition |
US5974413A (en) | 1997-07-03 | 1999-10-26 | Activeword Systems, Inc. | Semantic user interface |
US6141011A (en) | 1997-08-04 | 2000-10-31 | Starfish Software, Inc. | User interface methodology supporting light data entry for microprocessor device having limited user input |
US6076059A (en) | 1997-08-29 | 2000-06-13 | Digital Equipment Corporation | Method for aligning text with audio signals |
BR9814032A (pt) | 1997-09-25 | 2001-11-20 | Tegic Communications Inc | Sistema de retirada de ambiguidade com tecladoreduzido |
US6363380B1 (en) * | 1998-01-13 | 2002-03-26 | U.S. Philips Corporation | Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser |
US6195637B1 (en) * | 1998-03-25 | 2001-02-27 | International Business Machines Corp. | Marking and deferring correction of misrecognition errors |
US6338038B1 (en) * | 1998-09-02 | 2002-01-08 | International Business Machines Corp. | Variable speed audio playback in speech recognition proofreader |
US6064965A (en) * | 1998-09-02 | 2000-05-16 | International Business Machines Corporation | Combined audio playback in speech recognition proofreader |
US6457031B1 (en) * | 1998-09-02 | 2002-09-24 | International Business Machines Corp. | Method of marking previously dictated text for deferred correction in a speech recognition proofreader |
US6374225B1 (en) | 1998-10-09 | 2002-04-16 | Enounce, Incorporated | Method and apparatus to prepare listener-interest-filtered works |
US6122614A (en) | 1998-11-20 | 2000-09-19 | Custom Speech Usa, Inc. | System and method for automating transcription services |
US6363342B2 (en) | 1998-12-18 | 2002-03-26 | Matsushita Electric Industrial Co., Ltd. | System for developing word-pronunciation pairs |
US6802041B1 (en) | 1999-01-20 | 2004-10-05 | Perfectnotes Corporation | Multimedia word processor |
US20030004724A1 (en) | 1999-02-05 | 2003-01-02 | Jonathan Kahn | Speech recognition program mapping tool to align an audio file to verbatim text |
US6434523B1 (en) | 1999-04-23 | 2002-08-13 | Nuance Communications | Creating and editing grammars for speech recognition graphically |
US6611802B2 (en) * | 1999-06-11 | 2003-08-26 | International Business Machines Corporation | Method and system for proofreading and correcting dictated text |
US6370503B1 (en) | 1999-06-30 | 2002-04-09 | International Business Machines Corp. | Method and apparatus for improving speech recognition accuracy |
JP2001043062A (ja) | 1999-07-27 | 2001-02-16 | Nec Corp | パーソナルコンピュータ、その音量調整方法及び記録媒体 |
US6865258B1 (en) | 1999-08-13 | 2005-03-08 | Intervoice Limited Partnership | Method and system for enhanced transcription |
US6542091B1 (en) | 1999-10-01 | 2003-04-01 | Wayne Allen Rasanen | Method for encoding key assignments for a data input device |
WO2001046853A1 (en) * | 1999-12-20 | 2001-06-28 | Koninklijke Philips Electronics N.V. | Audio playback for text edition in a speech recognition system |
US7082615B1 (en) | 2000-03-31 | 2006-07-25 | Intel Corporation | Protecting software environment in isolated execution |
AU2001259446A1 (en) | 2000-05-02 | 2001-11-12 | Dragon Systems, Inc. | Error correction in speech recognition |
GB2379312A (en) | 2000-06-09 | 2003-03-05 | British Broadcasting Corp | Generation subtitles or captions for moving pictures |
US7624356B1 (en) | 2000-06-21 | 2009-11-24 | Microsoft Corporation | Task-sensitive methods and systems for displaying command sets |
US6950994B2 (en) | 2000-08-31 | 2005-09-27 | Yahoo! Inc. | Data list transmutation and input mapping |
US6993246B1 (en) * | 2000-09-15 | 2006-01-31 | Hewlett-Packard Development Company, L.P. | Method and system for correlating data streams |
US6975985B2 (en) | 2000-11-29 | 2005-12-13 | International Business Machines Corporation | Method and system for the automatic amendment of speech recognition vocabularies |
CA2328566A1 (en) | 2000-12-15 | 2002-06-15 | Ibm Canada Limited - Ibm Canada Limitee | System and method for providing language-specific extensions to the compare facility in an edit system |
US7735021B2 (en) | 2001-02-16 | 2010-06-08 | Microsoft Corporation | Shortcut system for use in a mobile electronic device and method thereof |
JP5093966B2 (ja) | 2001-03-29 | 2012-12-12 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 編集中における音声カーソルとテキストカーソルの位置合わせ |
DE60209103T2 (de) * | 2001-03-29 | 2006-09-14 | Koninklijke Philips Electronics N.V. | Texteditierung von erkannter sprache bei gleichzeitiger wiedergabe |
US20030007018A1 (en) | 2001-07-09 | 2003-01-09 | Giovanni Seni | Handwriting user interface for personal digital assistants and the like |
US7152213B2 (en) | 2001-10-04 | 2006-12-19 | Infogation Corporation | System and method for dynamic key assignment in enhanced user interface |
JP4145796B2 (ja) * | 2001-10-31 | 2008-09-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム |
US7196691B1 (en) | 2001-11-14 | 2007-03-27 | Bruce Martin Zweig | Multi-key macros to speed data input |
US7292975B2 (en) | 2002-05-01 | 2007-11-06 | Nuance Communications, Inc. | Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription |
US7236931B2 (en) | 2002-05-01 | 2007-06-26 | Usb Ag, Stamford Branch | Systems and methods for automatic acoustic speaker adaptation in computer-assisted transcription systems |
US6986106B2 (en) | 2002-05-13 | 2006-01-10 | Microsoft Corporation | Correction widget |
WO2003100746A2 (en) | 2002-05-24 | 2003-12-04 | Smtm Technologies Llc | Method and system for skills-based testing and training |
US7260529B1 (en) | 2002-06-25 | 2007-08-21 | Lengen Nicholas D | Command insertion system and method for voice recognition applications |
US7137076B2 (en) | 2002-07-30 | 2006-11-14 | Microsoft Corporation | Correcting recognition results associated with user input |
US6763320B2 (en) | 2002-08-15 | 2004-07-13 | International Business Machines Corporation | Data input device for individuals with limited hand function |
WO2004028121A2 (en) * | 2002-09-23 | 2004-04-01 | Wimetrics Corporation | System and method for wireless local area network monitoring and intrusion detection |
US7206938B2 (en) | 2002-09-24 | 2007-04-17 | Imagic Software, Inc. | Key sequence rhythm recognition system and method |
US20080034218A1 (en) | 2002-09-24 | 2008-02-07 | Bender Steven L | Key sequence rhythm guidance recognition system and method |
US7016844B2 (en) | 2002-09-26 | 2006-03-21 | Core Mobility, Inc. | System and method for online transcription services |
US7515903B1 (en) | 2002-10-28 | 2009-04-07 | At&T Mobility Ii Llc | Speech to message processing |
EP1422692A3 (en) | 2002-11-22 | 2004-07-14 | ScanSoft, Inc. | Automatic insertion of non-verbalized punctuation in speech recognition |
US7107397B2 (en) | 2003-05-29 | 2006-09-12 | International Business Machines Corporation | Magnetic tape data storage system buffer management |
GB2405728A (en) | 2003-09-03 | 2005-03-09 | Business Integrity Ltd | Punctuation of automated documents |
US8397026B2 (en) | 2004-03-05 | 2013-03-12 | Secure Systems Limited | Partition access control system and method for controlling partition access |
US7382359B2 (en) | 2004-06-07 | 2008-06-03 | Research In Motion Limited | Smart multi-tap text input |
US7508324B2 (en) | 2004-08-06 | 2009-03-24 | Daniel Suraqui | Finger activated reduced keyboard and a method for performing text input |
US20060176283A1 (en) | 2004-08-06 | 2006-08-10 | Daniel Suraqui | Finger activated reduced keyboard and a method for performing text input |
KR100713128B1 (ko) | 2004-11-08 | 2007-05-02 | 주식회사 비젯 | 바이러스 방역 장치 및 시스템 |
EP1864455A2 (en) | 2005-03-29 | 2007-12-12 | Glowpoint, Inc. | Video communication call authorization |
FI20050561A0 (fi) | 2005-05-26 | 2005-05-26 | Nokia Corp | Pakettidatan käsittely viestintäjärjestelmässä |
US20070143857A1 (en) | 2005-12-19 | 2007-06-21 | Hazim Ansari | Method and System for Enabling Computer Systems to Be Responsive to Environmental Changes |
US9904809B2 (en) | 2006-02-27 | 2018-02-27 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Method and system for multi-level security initialization and configuration |
-
2002
- 2002-03-25 JP JP2002578284A patent/JP5093966B2/ja not_active Expired - Fee Related
- 2002-03-25 WO PCT/IB2002/001062 patent/WO2002080143A1/en active IP Right Grant
- 2002-03-25 CN CNB028008294A patent/CN1225721C/zh not_active Expired - Fee Related
- 2002-03-25 DE DE60202453T patent/DE60202453T2/de not_active Expired - Lifetime
- 2002-03-25 AT AT02713150T patent/ATE286294T1/de not_active IP Right Cessation
- 2002-03-25 EP EP02713150A patent/EP1374225B1/en not_active Expired - Lifetime
- 2002-03-26 US US10/106,981 patent/US8117034B2/en not_active Expired - Fee Related
-
2012
- 2012-02-13 US US13/371,523 patent/US8380509B2/en not_active Expired - Fee Related
-
2013
- 2013-01-17 US US13/743,575 patent/US8706495B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US8380509B2 (en) | 2013-02-19 |
US20120158405A1 (en) | 2012-06-21 |
US8706495B2 (en) | 2014-04-22 |
WO2002080143A1 (en) | 2002-10-10 |
CN1225721C (zh) | 2005-11-02 |
DE60202453D1 (de) | 2005-02-03 |
CN1460245A (zh) | 2003-12-03 |
DE60202453T2 (de) | 2006-01-19 |
ATE286294T1 (de) | 2005-01-15 |
EP1374225A1 (en) | 2004-01-02 |
JP2004530205A (ja) | 2004-09-30 |
EP1374225B1 (en) | 2004-12-29 |
US20020143544A1 (en) | 2002-10-03 |
US20130166304A1 (en) | 2013-06-27 |
US8117034B2 (en) | 2012-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5093966B2 (ja) | 編集中における音声カーソルとテキストカーソルの位置合わせ | |
JP4463861B2 (ja) | 認識音声に対する同期再生中の文字編集 | |
JP6605995B2 (ja) | 音声認識誤り修正装置、方法及びプログラム | |
TWI249729B (en) | Voice browser dialog enabler for a communication system | |
US8612231B2 (en) | Method and system for speech based document history tracking | |
US20060195318A1 (en) | System for correction of speech recognition results with confidence level indication | |
JP2013152365A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP6865701B2 (ja) | 音声認識誤り修正支援装置およびそのプログラム | |
CN110782899B (zh) | 信息处理装置、存储介质及信息处理方法 | |
JP2009104047A (ja) | 情報処理方法及び情報処理装置 | |
JP6499228B2 (ja) | テキスト生成装置、方法、及びプログラム | |
JP7117228B2 (ja) | カラオケシステム、カラオケ装置 | |
WO2016151761A1 (ja) | 音訳支援装置、音訳支援方法及び音訳支援プログラム | |
KR101694365B1 (ko) | 피아노 연주 보조 방법 및 이를 실행하는 피아노 연주 보조 장치 | |
JP2021140084A (ja) | 音声認識誤り修正支援装置、プログラムおよび方法、ならびに、音声認識装置 | |
JP6337723B2 (ja) | カラオケ装置、およびカラオケ装置の制御方法 | |
JPH1152983A (ja) | 音声認識装置 | |
JP4737212B2 (ja) | メロディ作成装置、方法、プログラム、及び、携帯端末装置 | |
JP2019056746A (ja) | データ変換装置 | |
JP2016177311A (ja) | テキスト処理装置、テキスト処理方法およびテキスト処理プログラム | |
JP2015187733A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2005055920A (ja) | 情報処理装置及びその方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071106 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080205 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080507 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080617 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090715 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120918 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |