JP7332518B2 - 会話支援装置、会話支援システム、会話支援方法およびプログラム - Google Patents
会話支援装置、会話支援システム、会話支援方法およびプログラム Download PDFInfo
- Publication number
- JP7332518B2 JP7332518B2 JP2020059868A JP2020059868A JP7332518B2 JP 7332518 B2 JP7332518 B2 JP 7332518B2 JP 2020059868 A JP2020059868 A JP 2020059868A JP 2020059868 A JP2020059868 A JP 2020059868A JP 7332518 B2 JP7332518 B2 JP 7332518B2
- Authority
- JP
- Japan
- Prior art keywords
- display
- text
- unit
- conversation support
- fixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1827—Network arrangements for conference optimisation or adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
Description
次に、本実施形態に係る会話支援装置100の構成例について説明する。会話支援装置100は、制御部110と、記憶部130と、入出力部150と、を含んで構成される。制御部110は、各種の演算処理を行うことにより、会話支援装置100の機能を実現し、その機能を制御する。制御部110は、専用の部材により実現されてもよいが、プロセッサと、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶媒体を備えてもよい。プロセッサは、予めROMに記憶された所定のプログラムを読み出し、読み出したプログラムをRAMに展開して、RAMの記憶領域を作業領域として用いる。プロセッサは、読み出したプログラムで記述された各種の命令で指示される処理を実行して制御部110の機能を実現する。実現される機能には、後述する各部の機能が含まれうる。以下の説明では、プログラムに記述された命令で指示される処理を実行することを、「プログラムを実行する」、「プログラムの実行」などと呼ぶことがある。プロセッサは、例えば、CPU(Central Processing Unit)などである。
次に、本実施形態に係る端末装置200の構成例について説明する。端末装置200は、制御部210と、記憶部230と、通信部240と、入出力部250と、操作部270と、表示部280と、を含んで構成される。
次に、本実施形態に係る表示画面の例について説明する。図2は、本実施形態に係る表示画面の一例を示す図である。図2に例示される表示画面は端末装置200の表示部280に表示されうる。さらに操作領域(後述)を含む表示画面は、会話支援装置100の表示部180に表示されうる。図2に例示される表示画面には発言ごとの表示テキストがそれぞれ表示枠(吹き出し)内に表示される。但し、図2に例示される表示画面には固定テキストは表示されていない。
次に、本実施形態に係る会話支援処理の例について説明する。図4は、本実施形態に係る会話支援処理の例を示すフローチャートである。但し、端末装置200からテキスト入力が行われ、入力されたテキストが表示テキストとしてスクロールの対象となり、さらに固定テキストとしてピン留め表示およびピン留め解除の対象となる場合を例にする。なお、次の説明では、特に断らない限り、取得元識別表示、時刻表示、削除ボタンおよびピンマークは、それぞれ対応する表示枠に従って表示または消去されることを仮定し、その説明を省略する。
Claims (9)
- 音声データに対して音声認識を行い、発言内容を示すテキストである発話テキストを生成する音声認識部と、
表示部に表示させた表示テキストの位置を移動させ、前記発話テキストを前記移動により生じる空き領域に表示テキストとして表示させ、
操作に応じて表示位置の固定が指示される区間における前記表示テキストを固定テキストとして所定の表示位置に固定して前記表示部に表示させる表示処理部と、
を備える会話支援装置。 - 前記表示処理部は、
前記固定テキストを他の前記表示テキストよりも優先して表示させる
請求項1に記載の会話支援装置。 - 前記音声データの特性を示す特性パラメータをフレームごとに算出し、前記特性パラメータに基づいて無音区間と音声区間を定め、前記無音区間が所定時間以上継続した後に、開始した音声区間から、次に前記所定時間以上継続する無音区間の開始までの区間を発話区間として定める音声分析部を備え、
前記表示処理部は、前記発話区間ごとに前記発話テキストを前記表示部に表示させ、
前記表示部に表示させた前記発話区間のいずれかの区間における表示テキストを前記固定テキストとして特定する
請求項1または請求項2に記載の会話支援装置。 - 前記表示処理部は、前記音声データを取得した収音部を示す表示を前記発話テキストと対応付けて表示させる
請求項3に記載の会話支援装置。 - 前記表示処理部は、
操作に応じて前記固定テキストが指示されるとき、前記固定テキストの表示位置の固定を解除する
請求項1から請求項4のいずれか一項に記載の会話支援装置。 - 前記表示処理部は、
操作に応じて表示位置の固定が指示される区間における表示テキストを前記固定テキストとして複製し、
前記固定テキストの表示位置の固定を解除するとき、当該固定テキストを消去する
請求項5に記載の会話支援装置。 - 請求項1から請求項6のいずれか一項に記載の会話支援装置と、端末装置を備える会話支援システムであって、
前記端末装置は、
前記操作を受け付ける操作部と、
前記操作を前記会話支援装置に送信する通信部と、を備える
会話支援システム。 - 会話支援装置における会話支援方法であって、
音声データに対して音声認識を行い、発言内容を示すテキストである発話テキストを生成する音声認識ステップと、
表示部に表示させた表示テキストの位置を移動させ、前記発話テキストを前記移動により生じる空き領域に表示テキストとして表示させ、
操作に応じて表示位置の固定が指示される区間における前記表示テキストを固定テキストとして所定の表示位置に固定して前記表示部に表示させる表示処理ステップと、
を有する会話支援方法。 - 会話支援装置のコンピュータに、
音声データに対して音声認識を行い、発言内容を示すテキストである発話テキストを生成する音声認識手順と、
表示部に表示させた表示テキストの位置を移動させ、前記発話テキストを前記移動により生じる空き領域に表示テキストとして表示させ、
操作に応じて表示位置の固定が指示される区間における前記表示テキストを固定テキストとして所定の表示位置に固定して前記表示部に表示させる表示処理手順と、
を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020059868A JP7332518B2 (ja) | 2020-03-30 | 2020-03-30 | 会話支援装置、会話支援システム、会話支援方法およびプログラム |
US17/216,656 US20210304755A1 (en) | 2020-03-30 | 2021-03-29 | Conversation support device, conversation support system, conversation support method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020059868A JP7332518B2 (ja) | 2020-03-30 | 2020-03-30 | 会話支援装置、会話支援システム、会話支援方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021157138A JP2021157138A (ja) | 2021-10-07 |
JP7332518B2 true JP7332518B2 (ja) | 2023-08-23 |
Family
ID=77856328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020059868A Active JP7332518B2 (ja) | 2020-03-30 | 2020-03-30 | 会話支援装置、会話支援システム、会話支援方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210304755A1 (ja) |
JP (1) | JP7332518B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002101204A (ja) | 2000-09-22 | 2002-04-05 | Katsuyuki Adachi | 通話仲介システム及び聴覚障害者用電話機 |
JP2017161850A (ja) | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 会議支援装置、会議支援方法、及び会議支援プログラム |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765874A (en) * | 1995-05-09 | 1998-06-16 | Custom Creative Insights Corporation | Method for mass customization of printed materials |
JP2006502426A (ja) * | 2002-10-11 | 2006-01-19 | ノキア コーポレイション | ソース制御された可変ビットレート広帯域音声の符号化方法および装置 |
US7536304B2 (en) * | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
WO2007119368A1 (ja) * | 2006-03-17 | 2007-10-25 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
JP5179537B2 (ja) * | 2010-04-09 | 2013-04-10 | 株式会社ソニー・コンピュータエンタテインメント | 情報処理装置 |
US20190331914A1 (en) * | 2011-07-20 | 2019-10-31 | Google Llc | Experience Sharing with Region-Of-Interest Selection |
JP5781418B2 (ja) * | 2011-10-18 | 2015-09-24 | 株式会社ドワンゴ | コンテンツ視聴装置、コメント配信サーバ装置、コンテンツ視聴装置の動作方法、およびプログラム |
AU2012376152A1 (en) * | 2012-04-07 | 2014-10-23 | Motorola Mobility Llc | Text select and enter |
US20180034961A1 (en) * | 2014-02-28 | 2018-02-01 | Ultratec, Inc. | Semiautomated Relay Method and Apparatus |
US10203762B2 (en) * | 2014-03-11 | 2019-02-12 | Magic Leap, Inc. | Methods and systems for creating virtual and augmented reality |
US20150319114A1 (en) * | 2014-04-30 | 2015-11-05 | Vonage Network Llc | Method and system for message conversation view customization |
US9648062B2 (en) * | 2014-06-12 | 2017-05-09 | Apple Inc. | Systems and methods for multitasking on an electronic device with a touch-sensitive display |
US9607610B2 (en) * | 2014-07-03 | 2017-03-28 | Google Inc. | Devices and methods for noise modulation in a universal vocoder synthesizer |
CN105336344B (zh) * | 2014-07-10 | 2019-08-20 | 华为技术有限公司 | 杂音检测方法和装置 |
US9665645B2 (en) * | 2015-01-09 | 2017-05-30 | Garmin International, Inc. | System for managing an avionic communications log |
KR20160126354A (ko) * | 2015-04-23 | 2016-11-02 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서 메시지 표시 방법 |
KR101685288B1 (ko) * | 2015-05-11 | 2016-12-09 | 주식회사 카카오 | 컨텐츠 표시 제어 방법 및 컨텐츠 표시 제어 방법을 수행하는 사용자 단말 |
US9996505B2 (en) * | 2015-08-31 | 2018-06-12 | Konica Minolta Laboratory U.S.A., Inc. | Managing the display of electronic documents having embedded graphical elements |
WO2017062961A1 (en) * | 2015-10-09 | 2017-04-13 | Plugg Music Inc. | Methods and systems for interactive multimedia creation |
US20170140750A1 (en) * | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
US10768773B2 (en) * | 2015-11-24 | 2020-09-08 | International Business Machines Corporation | Dynamic text scroll control in a user interface |
KR20170066050A (ko) * | 2015-12-04 | 2017-06-14 | 삼성전자주식회사 | 객체 알림 방법 및 이를 지원하는 전자 장치 |
US10852935B2 (en) * | 2016-05-18 | 2020-12-01 | Apple Inc. | Devices, methods, and graphical user interfaces for messaging |
WO2017201326A1 (en) * | 2016-05-18 | 2017-11-23 | Apple Inc. | Applying acknowledgement options in a graphical messaging user interface |
DK180169B1 (en) * | 2016-05-18 | 2020-07-13 | Apple Inc | Devices, procedures, and graphical messaging user interfaces |
DK179411B1 (en) * | 2016-09-06 | 2018-06-06 | Apple Inc | Devices and methods for processing and rendering touch inputs unambiguous using intensity thresholds based on a prior input intensity |
DK201670720A1 (en) * | 2016-09-06 | 2018-03-26 | Apple Inc | Devices, Methods, and Graphical User Interfaces for Generating Tactile Outputs |
CN107844377B (zh) * | 2016-09-18 | 2021-08-24 | 钉钉控股(开曼)有限公司 | 通讯方法及装置 |
JP2018170743A (ja) * | 2017-03-30 | 2018-11-01 | 本田技研工業株式会社 | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム |
JP2018174439A (ja) * | 2017-03-31 | 2018-11-08 | 本田技研工業株式会社 | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム |
KR102309031B1 (ko) * | 2017-04-27 | 2021-10-06 | 삼성전자 주식회사 | 지능형 에이전트 관리 방법 및 장치 |
US10924605B2 (en) * | 2017-06-09 | 2021-02-16 | Onvocal, Inc. | System and method for asynchronous multi-mode messaging |
US10437243B2 (en) * | 2017-06-19 | 2019-10-08 | Deere & Company | Combine harvester control interface for operator and/or remote user |
US11048406B2 (en) * | 2017-07-11 | 2021-06-29 | Facebook, Inc. | Methods and systems for defining and transmitting a drawing stroke |
US10742572B2 (en) * | 2017-11-09 | 2020-08-11 | International Business Machines Corporation | Chatbot orchestration |
KR102443993B1 (ko) * | 2017-11-17 | 2022-09-19 | 삼성전자주식회사 | 시구간을 나타내는 콘텐츠와 연관된 정보를 시각적으로 제공하기 위한 장치 및 방법 |
US11113027B2 (en) * | 2017-12-28 | 2021-09-07 | Sharp Kabushiki Kaisha | Apparatus, system, and method that support operation to switch to input terminal to be activated among input terminals included in display apparatus |
US10455029B2 (en) * | 2017-12-29 | 2019-10-22 | Dish Network L.L.C. | Internet of things (IOT) device discovery platform |
GB201804073D0 (en) * | 2018-03-14 | 2018-04-25 | Papercup Tech Limited | A speech processing system and a method of processing a speech signal |
US12236798B2 (en) * | 2018-10-03 | 2025-02-25 | Bongo Learn, Inc. | Presentation assessment and valuation system |
US11488229B2 (en) * | 2018-12-25 | 2022-11-01 | Rakuraku Ltd. | Information processing device for content recommendation |
US11048301B2 (en) * | 2019-01-11 | 2021-06-29 | Datalogic Ip Tech S.R.L. | Multiple displays management in barcode reading applications |
KR102734793B1 (ko) * | 2019-04-03 | 2024-11-27 | 삼성전자주식회사 | 메시지를 표시하는 전자 장치 및 그의 동작 방법 |
US11176944B2 (en) * | 2019-05-10 | 2021-11-16 | Sorenson Ip Holdings, Llc | Transcription summary presentation |
US10969876B1 (en) * | 2019-06-03 | 2021-04-06 | Zachary Michaels | Dynamic view user interface system and method |
EP3886005B1 (en) * | 2020-03-23 | 2025-01-01 | Ricoh Company, Ltd. | Information processing system, user terminal, method of processing information, and carrier means |
-
2020
- 2020-03-30 JP JP2020059868A patent/JP7332518B2/ja active Active
-
2021
- 2021-03-29 US US17/216,656 patent/US20210304755A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002101204A (ja) | 2000-09-22 | 2002-04-05 | Katsuyuki Adachi | 通話仲介システム及び聴覚障害者用電話機 |
JP2017161850A (ja) | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 会議支援装置、会議支援方法、及び会議支援プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021157138A (ja) | 2021-10-07 |
US20210304755A1 (en) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gósy | BEA-A multifunctional Hungarian spoken language database | |
Ives et al. | Discrimination of speaker size from syllable phrases | |
CN105940446B (zh) | 机器与人类的对话方法、计算机存储介质和仿人机器人 | |
US20150348538A1 (en) | Speech summary and action item generation | |
Eidsheim | Voice as action: Towards a model for analyzing the dynamic construction of racialized voice | |
CN103959751A (zh) | 自动调整用户界面以用于免提交互 | |
JP2019091387A (ja) | 情報処理装置及びプログラム | |
Lee et al. | On the rhythm of infant-versus adult-directed speech in Australian English | |
CN112805734A (zh) | 用于唤起对发言禁止用语的注意的演讲辅助装置 | |
JP2019045867A (ja) | 音声制御方法、音声制御装置およびプログラム | |
JP7369110B2 (ja) | 会話支援装置、会話支援システム、会話支援方法およびプログラム | |
JP7332518B2 (ja) | 会話支援装置、会話支援システム、会話支援方法およびプログラム | |
JP7332519B2 (ja) | 会話支援装置、会話支援システム、会話支援方法およびプログラム | |
JP6950708B2 (ja) | 情報処理装置、情報処理方法、および情報処理システム | |
LaBelle | Raw orality: Sound poetry and live bodies | |
JP7341111B2 (ja) | 会話支援装置、会話支援システム、会話支援方法およびプログラム | |
Morales et al. | Speech-based human and service robot interaction: An application for Mexican dysarthric people | |
US11790913B2 (en) | Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal | |
Wang et al. | Talk like me: Exploring the feedback speech rate regulation strategy of the voice user interface for elderly people | |
Cooper | Syntactic control of timing in speech production. | |
JP7258686B2 (ja) | 情報処理システム、情報処理方法、及びプログラム | |
Marino et al. | Conversing using WhatsHap: A phoneme based vibrotactile messaging platform | |
JP2005189846A (ja) | 音声制御スクリーンシステム | |
Hạ | Prosody of Vietnamese from an interactional perspective: ờ, ừ and vâng in backchannels and requests for information | |
JP2017134201A (ja) | 管理装置、情報処理装置、情報提供システム、管理方法、および情報提供方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20220601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221011 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7332518 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |