[go: up one dir, main page]

JP2024500481A - ビデオ通話方法及び装置 - Google Patents

ビデオ通話方法及び装置 Download PDF

Info

Publication number
JP2024500481A
JP2024500481A JP2023538824A JP2023538824A JP2024500481A JP 2024500481 A JP2024500481 A JP 2024500481A JP 2023538824 A JP2023538824 A JP 2023538824A JP 2023538824 A JP2023538824 A JP 2023538824A JP 2024500481 A JP2024500481 A JP 2024500481A
Authority
JP
Japan
Prior art keywords
audio information
priority
unread
target
playing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2023538824A
Other languages
English (en)
Other versions
JP7628615B2 (ja
Inventor
方圓 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Publication of JP2024500481A publication Critical patent/JP2024500481A/ja
Application granted granted Critical
Publication of JP7628615B2 publication Critical patent/JP7628615B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53366Message disposing or creating aspects
    • H04M3/53375Message broadcasting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/226Delivery according to priorities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53333Message receiving aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53333Message receiving aspects
    • H04M3/5335Message type or catagory, e.g. priority, indication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/50Telephonic communication in combination with video communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephone Function (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本出願は、ビデオ通話方法及び装置を提供し、前記方法は、ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識することと、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定することと、前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定することと、ターゲットサウンドチャネルで前記ターゲット音声情報を再生することとを含む。【選択図】図1

Description

(関連出願の相互参照)
本出願は、2020年12月25日に中国で提出された中国特許出願No.202011558968.8の優先権を主張しており、同出願の内容のすべては、ここに参照として取り込まれる。
本出願は、通信技術分野に関し、特にビデオ通話方法及び装置に関する。
電子機器の普及とともに、電子機器の機能は、ますます進んでおり、ユーザは、電子機器を使用してビデオ通話を行うことができる。本出願を実現する過程で、発明者は、従来の技術において少なくとも、従来の技術ではユーザが電子機器を使用してビデオ通話を行う場合、受信した音声情報を無視しやすくなることによって、重要な情報を見逃す可能性があるという問題があることを発見した。
本出願の実施例は、ユーザが電子機器を使用してビデオ通話を行う場合、受信した音声情報を無視しやすくなることによって、重要な情報を見逃す可能性があるという従来の技術における問題を解決できるビデオ通話方法及び装置を提供する。
上記技術問題を解決するために、本発明は、以下のように実現される。
第一の態様によれば、本出願の実施例は、ビデオ通話方法を提供し、前記方法は、
ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識することと、
前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定することと、
前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定することと、
ターゲットサウンドチャネルで前記ターゲット音声情報を再生することとを含む。
第二の態様によれば、本出願の実施例は、ビデオ通話装置を提供し、前記装置は、
ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識するための認識モジュールと、
前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定するための第一の決定モジュールと、
前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定するための第二の決定モジュールと、
ターゲットサウンドチャネルで前記ターゲット音声情報を再生するための再生モジュールとを含む。
第三の態様によれば、本出願の実施例は、電子機器を提供し、この電子機器は、プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるプログラム又は命令とを含み、前記プログラム又は命令が前記プロセッサにより実行される時、第一の態様に記載のビデオ通話方法におけるステップを実現する。
第四の態様によれば、本出願の実施例は、可読記憶媒体を提供し、前記可読記憶媒体には、プログラム又は命令が記憶されており、前記プログラム又は命令がプロセッサにより実行される時、第一の態様に記載のビデオ通話方法におけるステップを実現する。
第五の態様によれば、本出願の実施例は、チップを提供し、前記チップは、プロセッサと、通信インターフェースとを含み、前記通信インターフェースは、前記プロセッサと結合され、前記プロセッサは、プログラム又は命令を運行し、第一の態様に記載の方法を実現するために用いられる。
第六の態様によれば、コンピュータプログラム製品を提供し、前記コンピュータプログラム製品は、非一時的記憶媒体に記憶されており、前記コンピュータプログラム製品が少なくとも一つのプロセッサにより実行されて、第一の態様に記載の方法を実現する。
第七の態様によれば、第一の態様に記載の方法を実行するように構成される電子機器を提供する。
本出願の実施例では、ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識し、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定し、前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定し、ターゲットサウンドチャネルで前記ターゲット音声情報を再生する。このように、ビデオ通話中にターゲットサウンドチャネルでターゲット音声情報を再生することで、ビデオ通話に影響を与えることなく、ビデオ通話中に受信した重要な音声情報の無視を回避することができる。
本出願の実施例によるビデオ通話方法のフローチャートである。 本出願の実施例による電子機器のインターフェース表示概略図のその一である。 本出願の実施例による電子機器のインターフェース表示概略図のその二である。 本出願の実施例による電子機器のインターフェース表示概略図のその三である。 本出願の実施例によるビデオ通話装置の構造概略図のその一である。 本出願の実施例によるビデオ通話装置の構造概略図のその二である。 本出願の実施例によるビデオ通話装置の構造概略図のその三である。 本出願の実施例による電子機器の構造概略図のその一である。 本出願の実施例による電子機器の構造概略図のその二である。
以下は、本出願の実施例における図面を結び付けながら、本出願の実施例における技術案を明瞭且つ完全に記述し、明らかに、記述された実施例は、本出願の一部の実施例であり、すべての実施例ではない。本出願における実施例に基づき、当業者が創造的な労力を払わない前提で得られたすべての他の実施例は、いずれも本出願の保護範囲に属する。
本出願の明細書と特許請求の範囲における用語である「第一」、「第二」などは、類似している対象を区別するものであり、特定の順序又は前後手順を記述するためのものではない。理解すべきこととして、このように使用されるデータは、適切な場合に交換可能であり、それにより本出願の実施例は、ここで図示又は記述されたもの以外の順序で実施されることが可能であり、且つ「第一」、「第二」などによって区別される対象は、一般的には同一種類であり、対象の個数を限定せず、例えば第一の対象は、一つであってもよく、複数であってもよい。なお、明細書及び請求項における「及び/又は」は、接続される対象のうちの少なくとも一つを表し、文字である「/」は、一般的には前後関連対象が「又は」の関係であることを表す。
以下では、図面を結び付けながら、具体的な実施例及びその応用シナリオによって本出願の実施例によるビデオ通話方法を詳細に説明する。
図1を参照すると、図1は、本出願の実施例によるビデオ通話方法のフローチャートであり、図1に示すように、以下のステップを含む。
ステップ101、ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識する。
ここで、前記インスタントメッセージング内容は、インスタントメッセージングアプリケーションプログラムによって受信された通信内容であってもよい。前記ビデオ通話を開始するアプリケーションプログラムと前記少なくとも一つの未読音声情報を受信するアプリケーションプログラムは、同一のアプリケーションプログラムであってもよく、又は、異なるアプリケーションプログラムであってもよい。例えば、Aチャットツールによってビデオ通話を行い、ビデオ通話を行う過程で、Aチャットツールによって少なくとも一つの未読音声情報を受信してもよい。さらに、Aチャットツールによって対象Bとビデオ通話を行う過程で、Aチャットツールによってチャット対象Cにより送信された音声情報を受信してもよい。
ステップ102、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定する。
ここで、未読音声情報の優先度は、第一の優先度、第二の優先度及び第三の優先度などを含んでもよく、第一の優先度の優先度は、最も高く、又は、高優先度、中優先度及び低優先度などをさらに含んでもよく、高優先度の優先度は、最も高く、本実施例は、優先度の表現形式を限定しない。
また、前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換し、前記テキスト情報におけるキー情報を抽出し、前記キー情報に基づいて前記各未読音声情報の優先度を決定してもよく、又は、未読音声情報の送信対象に基づいて各未読音声情報の優先度を決定してもよく、例えば、リーダーにより送信された未読音声情報の優先度を第一の優先度とし、又は、未読音声情報の送信頻度に基づいて未読音声情報の優先度を決定してもよく、例えば、短期間では同一の送信対象が複数の音声情報を送信した場合、この複数の未読音声情報の優先度を第一の優先度とし、又は、未読音声情報の時間長に基づいて未読音声情報の優先度を決定してもよく、例えば、未読音声情報の時間長が予め設定される時間長を超えた未読音声情報の優先度を第一の優先度として決定してもよい。本実施例は、未読音声情報の優先度を決定する方式を限定しない。
ステップ103、前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定する。
ここで、未読音声情報の優先度が第一の優先度と、第二の優先度と、第三の優先度とを含むことを例にして、ターゲット音声情報は、優先度が第一の優先度である未読音声情報であってもよく、未読音声情報の優先度が高優先度と、中優先度と、低優先度とを含むことを例にして、ターゲット音声情報は、優先度が高優先度である未読音声情報であってもよい。
ステップ104、ターゲットサウンドチャネルで前記ターゲット音声情報を再生する。
ここで、前記ターゲットサウンドチャネルは、左サウンドチャネル、又は右サウンドチャネルであってもよく、現在の再生モードが第一の再生モードである場合、右サウンドチャネルで前記ターゲット音声情報を再生し、左サウンドチャネルで前記ビデオ通話の音声内容を再生することによって、前記ビデオ通話の音声内容を再生すると同時に前記ターゲット音声情報を再生することを実現することができ、現在の再生モードが第二の再生モードである場合、前記ビデオ通話の音声内容の再生を停止し、左サウンドチャネルで又は右サウンドチャネルで前記ターゲット音声情報を再生し、前記ターゲット音声情報の再生が終了した場合、第一のサウンドチャネルで前記ビデオ通話の音声内容を再生することを回復することができる。
例示的に、現在の再生モードを決定することができ、現在の再生モードが第一の再生モードである場合、右サウンドチャネルで前記ビデオ通話の音声内容を再生し、左サウンドチャネルで前記ターゲット音声情報を再生する。現在の再生モードが第二の再生モードである場合、右サウンドチャネルで前記ビデオ通話の音声内容の再生を停止し、左サウンドチャネルで前記ターゲット音声情報を再生し、前記ターゲット音声情報の再生が終了した場合、前記ビデオ通話の音声内容の再生を回復する。
ここで、前記第一の再生モードは、ビデオサウンドチャネルと音声サウンドチャネルを同期再生するための同期サウンドチャネル再生モードであってもよい。前記第二の再生モードは、ビデオサウンドチャネルを一時停止し、音声サウンドチャネルを再生するための切り替えサウンドチャネル再生モードであってもよい。図2に示すように、設定インターフェースで「サウンドチャネル再生モード」オプションを設定し、「サウンドチャネル再生モード」をクリックした後に、再生モード選択インターフェースに入り、図3に示すように、再生モード選択インターフェースで「ビデオサウンドチャネルと音声サウンドチャネルを同期再生する」、及び「ビデオ通話サウンドチャネルを一時停止し、音声サウンドチャネルを再生する」を表示し、ユーザによる再生モードの選択に供することができる。
また、前記ビデオ通話の音声内容を再生すると同時に前記ターゲット音声情報を再生することで、ビデオ通話の音声内容を左サウンドチャネルで再生し、ターゲット音声情報を右サウンドチャネルで再生することができ、又は、ビデオ通話の音声内容を右サウンドチャネルで再生し、ターゲット音声情報を左サウンドチャネルで再生することができる。
説明すべきこととして、同期サウンドチャネル再生モードで複数の音源の音声を同時に再生することができ、例えば、ビデオ通話の音声内容を再生すると同時に、ターゲット音声情報を再生することができ、切り替えサウンドチャネル再生モードで複数の音源の間で切り替え再生を行い、複数の音源がある場合、そのうちの一つの音源を一時的にオフにし、別の音源を再生し、例えば、ターゲット音声情報を再生する場合、ビデオ通話サウンドチャネルを一時的にオフにし、音声サウンドチャネルに切り替え、ターゲット音声情報の再生が終了した後に、ビデオ通話サウンドチャネルに切り替えて再生することができる。
このように、異なる再生モードで異なる再生方式を設定することで、ユーザは、前記ビデオ通話の音声内容を再生すると同時に前記ターゲット音声情報を再生するように選択することができ、又はユーザは、前記ビデオ通話の音声内容の再生を停止し、前記ターゲット音声情報を再生するように選択することができ、それによってユーザがビデオ通話中に音声情報を再生することができないことにより重要な音声情報を見逃すという問題を回避することができるとともに、ユーザはさらに、自身の好み又は習慣に応じて再生モードを設定することで、ビデオ通話中に比較的に適切な方式で音声情報を再生することができ、ビデオ通話の効果を向上させることができる。
説明すべきこととして、各未読音声情報の優先度を決定し、前記ビデオ通話を維持すると同時に優先度が比較的に高い音声情報をターゲット音声情報として再生することによって、電子機器は、受信した音声情報を自動的に選別し、受信した音声情報から重要である可能性のある音声情報を選別し、ビデオ通話中に重要である可能性のあるこの音声情報を再生することができ、それによってビデオ通話中に受信した音声情報の無視を回避し、ユーザが重要な音声情報を見逃す可能性を低減することができる。
従来の技術では、ユーザがビデオ通話を行っている場合、ビデオ通話中に音声情報を受信すると、ユーザが受信した音声情報をクリックする時、「ビデオ通話中、この機能を使用できません」が表示されることによって、ユーザは、ビデオ通話中に音声情報を再生することができない。ユーザが、この受信した音声情報が比較的に重要な音声情報であることを発見し、タイムリーに確認し、返信する必要がある場合、ユーザは、ビデオ通話をオフにして音声情報を再生することを選択することしかできず、ユーザのインタラクション体験に大きく影響を与えている。
本実施例では、少なくとも一つの未読音声情報からターゲット音声情報を選択し、前記ビデオ通話を維持すると同時に前記ターゲット音声情報を再生することができ、それによってビデオ通話時に音声情報の重要性に応じて比較的に重要な音声情報を選択的に再生し、比較的に重要且つ緊急な音声情報を見逃すことがないことを実現することができる。
本出願の実施例では、ビデオ通話中、少なくとも一つの未読音声情報を受信し、前記少なくとも一つの未読音声情報からターゲット音声情報を決定し、前記ビデオ通話を維持すると同時に前記ターゲット音声情報を再生する。このように、ビデオ通話中にターゲット音声情報を再生することで、ビデオ通話中に受信した重要な音声情報の無視を回避し、重要である可能性のある音声情報を再生し、ビデオ通話効果を向上させることができる。
選択的に、前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生することは、
前記ビデオ通話の優先度と前記ターゲット音声情報の優先度に基づいて、前記ターゲット音声情報を再生する第一のボリューム値を決定することと、
ターゲットサウンドチャネルで前記第一のボリューム値で前記ターゲット音声情報を再生することと、
前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも高い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも小さくすることと、
前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも低い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも大きくすることとを含む。
ここで、前記ビデオ通話の優先度が前記ターゲット音声情報の優先度に等しい場合、前記第一のボリューム値は、前記ビデオ通話の第二のボリューム値に等しくてもよい。前記ビデオ通話の音声内容を再生する第二のボリューム値を決定する前に、ビデオ通話の優先度を決定することができる。ビデオ通話の優先度は、第一の優先度、第二の優先度及び第三の優先度などを含んでもよく、又は、高優先度、中優先度及び低優先度などをさらに含んでもよく、ビデオ通話の優先度と未読音声情報の優先度とは、表現形式が同じであってもよい。
また、ビデオ通話の対象に基づいてビデオ通話の優先度を決定することができ、例えば、ビデオ通話の対象がリーダーである場合、ビデオ通話の優先度は、高優先度であってもよく、ビデオ通話の対象が家族である場合、ビデオ通話の優先度は、中優先度であってもよく、又はビデオ通話の内容に基づいてビデオ通話の優先度を決定することもでき、例えば、ビデオ通話の内容を認識してもよく、ビデオ通話の内容が仕事に関連する内容である場合、ビデオ通話の優先度は、高優先度であってもよく、ビデオ通話の内容が仕事に関連する内容でない場合、ビデオ通話の優先度は、低優先度であってもよい。
この実施の形態では、前記ビデオ通話の優先度と前記ターゲット音声情報の優先度に基づいて、優先度が比較的に高い内容を比較的に大きいボリュームで再生することによって、前記ビデオ通話の音声内容と前記ターゲット音声情報を同時に再生する場合、前記ビデオ通話の音声内容を再生するボリュームと前記ターゲット音声情報を再生するボリュームを自動的に調節することによって、ユーザは、電子機器が現在再生している内容のうちの比較的に重要な内容に効果的に注目することができ、ユーザ体験は、比較的に良い。
選択的に、前記の、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定することは、
前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換することと、
前記テキスト情報におけるキー情報を抽出することと、
前記キー情報に基づいて前記各未読音声情報の優先度を決定することとを含む。
ここで、前記キー情報は、時間情報、例えば明日、午後、10分後などを含んでもよく、又は、対象情報、例えばリーダー、上司、父、祖母などを含んでもよく、又はさらに、動作情報、例えば会議、買い物、外出などを含んでもよい。テキスト情報を予め設定されるキーワードとマッチングし、テキスト情報に含まれるキー情報を決定してもよく、又は、キー情報抽出モデルによってキー情報を抽出してもよく、前記キー情報抽出モデルは、ニューラルネットワークモデルであってもよく、ビッグデータによって前記キー情報抽出モデルを訓練することで、テキスト情報におけるキー情報を抽出してもよい。例えば、予め設定されるキーワードは、直ちに、すぐに、会議及びリーダーなどを含んでもよく、マッチングした予め設定されるキーワードをテキスト情報のキー情報としてもよい。
また、異なるキー情報にとって、優先度は、異なってもよい。例えば、時間情報に対し、「直ちに」とマッチングした場合、優先度は、高くてもよく、「明日」とマッチングした場合、優先度は、低くてもよく、「午後」とマッチングした場合、優先度は、「中」であってもよく、対象情報に対し、「リーダー」とマッチングした場合、優先度は、高くてもよく、「父」とマッチングした場合、優先度は、低くてもよい。テキスト情報に複数の予め設定されるキーワードが含まれる場合、含まれる予め設定されるキーワードに対応する最も高い優先度をテキスト情報の優先度としてもよい。
この実施の形態では、前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換し、前記テキスト情報におけるキー情報を抽出し、前記キー情報に基づいて前記各未読音声情報の優先度を決定し、このように、テキスト情報におけるキー情報によって各未読音声情報の優先度を決定することによって、未読音声情報に運ばれる内容を認識して未読音声情報の優先度を決定することができ、重要な音声情報を比較的正確に決定することができ、さらにユーザが重要な音声情報を見逃す可能性を低減することができる。
選択的に、前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生した後に、前記方法は、
前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するためのボリューム調節識別子を表示することと、
前記ボリューム調節識別子に対する第一の入力を受信することと、
前記第一の入力に応答し、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整することとをさらに含む。
ここで、前記ボリューム調節識別子は、スライドブロックと、スライドブロックとマッチングするスライドバーとを含んでもよく、スライドブロックは、スライドバーの両端の間を移動でき、前記第一の入力は、前記スライドブロックをスライドさせる操作、例えば、スライドブロックを左にスライドさせ、又はスライドブロックを右にスライドさせるなどの操作であってもよい。スライドバーの左端が音声サウンドチャネルを表し、スライドバーの右端がビデオサウンドチャネルを表し、且つビデオ通話の音声内容を右サウンドチャネルで再生し、ターゲット音声情報を左サウンドチャネルで再生することを例にして、スライドブロックがスライドバーの左端に移動すると、左サウンドチャネルのボリュームは、大きくなり、即ちターゲット音声情報の再生ボリュームは、大きくなり、スライドブロックがスライドバーの右端に移動すると、右サウンドチャネルのボリュームは、大きくなり、即ちビデオ通話の音声内容の再生ボリュームは、大きくなる。デフォルトでは、スライドブロックは、1/3の位置に設定されてもよく、即ちターゲット音声情報の再生ボリュームは、ビデオ通話の音声内容の再生ボリュームの2倍である。
説明すべきこととして、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するための調節識別子は、いずれも前記ボリューム調節識別子としてもよく、本実施例は、前記ボリューム調節識別子の具体的な表現形式を限定しない。ビデオ通話の音声内容及び前記ターゲット音声情報の同時再生を認識した場合、前記ボリューム調節識別子を表示することができる。ターゲット音声情報の実際のボリュームの大きさ及び個人の需要に応じて、ユーザは、音声とビデオサウンドチャネルのボリュームを適切に調節することができる。音声サウンドチャネルのボリュームが小さすぎ、ひいてはビデオサウンドチャネルに埋もれてしまう場合、スライドブロックを左へ適当な位置にスライドさせることができ、音声サウンドチャネルのボリュームが大き過ぎる場合、スライドブロックを右へ適当な位置にスライドさせることができる。
実際の応用において、ビデオ通話中、前記少なくとも一つの未読音声情報からターゲット音声情報を決定した後に、ターゲット音声情報に対応する提示情報を表示し、ユーザによるこの提示情報のクリックを受信した場合、ビデオ通話の通話インターフェースを縮小表示し、そしてターゲット音声情報のチャットインターフェースに入り、図4に示すように、ターゲット音声情報のチャットインターフェースで前記ボリューム調節識別子201を表示することができる。
説明すべきこととして、設定インターフェースで「サウンドチャネル設定」オプションを設定し、「サウンドチャネル設定」オプションをクリックした後に、サウンドチャネル設定インターフェースに入り、サウンドチャネル設定インターフェースで「ビデオ音声ボリューム調節モードをオンにする」ボタンを表示することができ、それによって「ビデオ音声ボリューム調節モードをオンにする」ボタンがオンになっている場合、前記ボリューム調節識別子を表示し、「ビデオ音声ボリューム調節モードをオンにする」ボタンがオフになっている場合、前記ボリューム調節識別子の表示をキャンセルすることができる。
この実施の形態では、ボリューム調節識別子を設定することによって、前記ビデオ通話の音声内容を再生し、且つ前記ターゲット音声情報を再生する場合、ユーザは、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を手動で調整することができ、それによってユーザは、実際の需要に応じてボリューム調節識別子を調節することができ、ユーザ体験は、比較的に良い。
選択的に、前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生する前に、前記方法は、
前記ターゲット音声情報を表示し、前記ターゲット音声情報の再生識別子を表示することをさらに含み、前記再生識別子は、前記ターゲット音声情報の再生進捗を表すために用いられ、
前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生した後に、前記方法は、
前記ターゲット音声情報を再生する過程で、前記ターゲット音声情報の再生進捗に基づいて前記再生識別子を更新することと、
前記再生識別子に対する第二の入力を受信することと、
前記第二の入力に応答し、前記ターゲット音声情報の再生進捗を調整することとをさらに含む。
ここで、前記ビデオ通話の通話インターフェースを縮小表示し、ターゲット音声情報のチャットインターフェースを表示し、ターゲット音声情報のチャットインターフェースで前記ターゲット音声情報を表示することができる。前記再生識別子は、再生プログレズバーを含んでもよく、前記再生プログレズバーの位置によって前記ターゲット音声情報の再生進捗を決定することができる。前記第二の入力は、前記再生識別子における再生プログレズバーを移動させる入力であってもよく、例えば、再生プログレズバーを1/2の位置に移動させる操作であってもよく、又は、再生プログレズバーを1/4の位置に移動させる操作などであってもよい。前記の、前記ターゲット音声情報の再生進捗を調整した後に、調整後の再生進捗でターゲット音声情報を再生することができる。
この実施の形態では、再生識別子を設定することによって、ターゲット音声情報の再生進捗をリアルタイムーに表示することができ、且つユーザは、再生識別子によってターゲット音声情報の再生進捗を調整することができ、それによってユーザがターゲット音声情報における重要な内容を再度確認しようとする場合、ユーザが再生識別子をドラッグして重要な内容を探すことを容易にし、ターゲット音声情報に運ばれる音声内容が比較的に多いため、ターゲット音声情報を繰り返し再生することによりビデオ通話効果に影響を与えるという問題を回避することによって、さらにビデオ通話効果を向上させることができる。
説明すべきこととして、本出願の実施例によるビデオ通話方法では、実行本体は、ビデオ通話装置、又はこのビデオ通話装置におけるビデオ通話方法を実行してロードするための制御モジュールであってもよい。本出願の実施例において、ビデオ通話装置がビデオ通話方法を実行してロードすることを例にして、本出願の実施例によるビデオ通話装置を説明する。
図5を参照すると、図5は、本出願の実施例によるビデオ通話装置の構造概略図であり、図5に示すように、前記ビデオ通話装置300は、
ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識するための認識モジュール301と、
前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定するための第一の決定モジュール302と、
前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定するための第二の決定モジュール303と、
ターゲットサウンドチャネルで前記ターゲット音声情報を再生するための再生モジュール304とを含む。
本出願の実施例では、認識モジュールは、ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識し、第一の決定モジュールは、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定し、第二の決定モジュールは、前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定し、再生モジュールは、ターゲットサウンドチャネルで前記ターゲット音声情報を再生する。このように、ビデオ通話中にターゲット音声情報を再生することで、ビデオ通話に影響を与えることなく、ビデオ通話中に受信した重要な音声情報の無視を回避することができる。
選択的に、前記再生モジュール304は、具体的に、
前記ビデオ通話の優先度と前記ターゲット音声情報の優先度に基づいて、前記ターゲット音声情報を再生する第一のボリューム値を決定し、
ターゲットサウンドチャネルで前記第一のボリューム値で前記ターゲット音声情報を再生し、
前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも高い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも小さくし、
前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも低い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも大きくするために用いられる。
選択的に、前記第一の決定モジュール302は、具体的に、
前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換し、
前記テキスト情報におけるキー情報を抽出し、
前記キー情報に基づいて前記各未読音声情報の優先度を決定するために用いられる。
選択的に、図6に示すように、前記ビデオ通話装置300は、
前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するためのボリューム調節識別子を表示するための第一の表示モジュール305と、
前記ボリューム調節識別子に対する第一の入力を受信するための第一の受信モジュール306と、
前記第一の入力に応答し、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するための第一の調整モジュール307とをさらに含む。
選択的に、図7に示すように、前記ビデオ通話装置300は、
前記ターゲット音声情報を表示し、前記ターゲット音声情報の再生識別子を表示するための第二の表示モジュール308であって、前記再生識別子が、前記ターゲット音声情報の再生進捗を表すために用いられる第二の表示モジュール308と、
前記ターゲット音声情報を再生する過程で、前記ターゲット音声情報の再生進捗に基づいて前記再生識別子を更新するための更新モジュール309と、
前記再生識別子に対する第二の入力を受信するための第二の受信モジュール310と、
前記第二の入力に応答し、前記ターゲット音声情報の再生進捗を調整するための第二の調整モジュール311とをさらに含む。
本出願の実施例におけるビデオ通話装置は、装置であってもよく、端末における部材、集積回路、又はチップであってもよい。この装置は、移動電子機器であってもよく、非移動電子機器であってもよい。例示的には、移動電子機器は、携帯電話、タブレットパソコン、ノートパソコン、パームトップコンピュータ、車載電子機器、ウェアラブルデバイス、ウルトラモバイルパーソナルコンピュータ(ultra-mobile personal computer、UMPC)、ネットブック又はパーソナルデジタルアシスタント(personal digital assistant、PDA)などであってもよく、非移動電子機器は、サーバ、ネットワーク接続型ストレージ(Network Attached Storage、NAS)、パーソナルコンピュータ(personal computer、PC)、テレビ(television、TV)、預入支払機又はセルフサービス機などであってもよく、本出願の実施例は、具体的に限定しない。
本出願の実施例におけるビデオ通話装置は、オペレーティングシステムを有する装置であってもよい。このオペレーティングシステムは、アンドロイド(登録商標)(Android(登録商標))オペレーティングシステムであってもよく、iOSオペレーティングシステムであってもよく、他の可能なオペレーティングシステムであってもよく、本出願の実施例は、具体的に限定しない。
本出願の実施例によるビデオ通話装置は、図1の方法の実施例により実現される各プロセスを実現することができ、説明の繰り返しを回避するために、ここでこれ以上説明しない。
選択的に、図8に示すように、本出願の実施例は、電子機器400をさらに提供し、プロセッサ401と、メモリ402と、メモリ402に記憶され、且つ前記プロセッサ401上で運行できるプログラム又は命令とを含み、このプログラム又は命令がプロセッサ401により実行される時、上記ビデオ通話方法の実施例の各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
説明すべきこととして、本出願の実施例における電子機器は、以上に記載の移動電子機器と非移動電子機器を含む。
図9は、本出願の実施例を実現する電子機器のハードウェア構造概略図である。
この電子機器500は、無線周波数ユニット501、ネットワークモジュール502、オーディオ出力ユニット503、入力ユニット504、センサ505、表示ユニット506、ユーザ入力ユニット507、インターフェースユニット508、メモリ509、及びプロセッサ510などの部材を含むが、それらに限らない。
当業者であれば理解できるように、電子機器500は、各部材に給電する電源(例えば、電池)をさらに含んでもよく、電源は、電源管理システムによってプロセッサ510にロジック的に接続されてもよく、それにより電源管理システムによって充放電管理及び消費電力管理などの機能を実現することができる。図9に示す電子機器構造は、電子機器に対する限定を構成せず、電子機器は、図示された部材の数よりも多く又は少ない部材、又はいくつかの部材の組み合わせ、又は異なる部材の配置を含んでもよく、ここでこれ以上説明しない。
ここで、プロセッサ510は、ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識するために用いられ、
プロセッサ510はさらに、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定するために用いられ、
プロセッサ510はさらに、前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定するために用いられ、
オーディオ出力ユニット503は、ターゲットサウンドチャネルで前記ターゲット音声情報を再生するために用いられる。
本出願の実施例では、プロセッサ510は、ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識し、プロセッサ510は、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定し、プロセッサ510は、前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定し、オーディオ出力ユニット503は、ターゲットサウンドチャネルで前記ターゲット音声情報を再生する。このように、ビデオ通話中にターゲット音声情報を再生することで、ビデオ通話に影響を与えることなく、ビデオ通話中に受信した重要な音声情報の無視を回避することができる。
選択的に、プロセッサ510はさらに、前記ビデオ通話の優先度と前記ターゲット音声情報の優先度に基づいて、前記ターゲット音声情報を再生する第一のボリューム値を決定するために用いられ、
オーディオ出力ユニット503は、ターゲットサウンドチャネルで前記第一のボリューム値で前記ターゲット音声情報を再生し、
前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも高い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも小さくし、
前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも低い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも大きくするために用いられる。
選択的に、プロセッサ510はさらに、
前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換し、
前記テキスト情報におけるキー情報を抽出し、
前記キー情報に基づいて前記各未読音声情報の優先度を決定するために用いられる。
選択的に、表示ユニット506は、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するためのボリューム調節識別子を表示するために用いられ、
ユーザ入力ユニット507は、前記ボリューム調節識別子に対する第一の入力を受信するために用いられ、
プロセッサ510はさらに、前記第一の入力に応答し、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するために用いられる。
選択的に、表示ユニット506はさらに、前記ターゲット音声情報を表示し、前記ターゲット音声情報の再生識別子を表示するために用いられ、前記再生識別子は、前記ターゲット音声情報の再生進捗を表すために用いられ、
プロセッサ510はさらに、前記ターゲット音声情報を再生する過程で、前記ターゲット音声情報の再生進捗に基づいて前記再生識別子を更新するために用いられ、
ユーザ入力ユニット507はさらに、前記再生識別子に対する第二の入力を受信するために用いられ、
プロセッサ510はさらに、前記第二の入力に応答し、前記ターゲット音声情報の再生進捗を調整するために用いられる。
理解すべきこととして、本出願の実施例では、入力ユニット504は、グラフィックスプロセッサ(Graphics Processing Unit、GPU)5041とマイクロホン5042を含んでもよく、グラフィックスプロセッサ5041は、ビデオキャプチャモード又は画像キャプチャモードにおいて画像キャプチャ装置(例えば、カメラ)によって得られた静止画像又はビデオの画像データを処理する。表示ユニット506は、表示パネル5061を含んでもよく、液晶ディスプレイ、有機発光ダイオードなどの形式で表示パネル5061が配置されてもよい。ユーザ入力ユニット507は、タッチパネル5071及び他の入力機器5072を含む。タッチパネル5071は、タッチスクリーンとも呼ばれる。タッチパネル5071は、タッチ検出装置とタッチコントローラという二つの部分を含んでもよい。他の入力機器5072は、物理的キーボード、機能キー(例えば、ボリューム制御ボタン、スイッチボタンなど)、トラックボール、マウス、操作レバーを含んでもよいが、それらに限らず、ここでこれ以上説明しない。メモリ509は、ソフトウェアプログラム及び様々なデータを記憶するために用いられてもよく、アプリケーションプログラムとオペレーティングシステムとを含むが、それらに限らない。プロセッサ510は、アプリケーションプロセッサとモデムプロセッサを統合してもよい。ここで、アプリケーションプロセッサは、主にオペレーティングシステム、ユーザインターフェース及びアプリケーションプログラムなどを処理するためのものであり、モデムプロセッサは、主に無線通信を処理するためのものである。理解できるように、上記モデムプロセッサは、プロセッサ510に統合されなくてもよい。
本出願の実施例は、可読記憶媒体をさらに提供し、前記可読記憶媒体は、非揮発性であってもよく、揮発性であってもよく、前記可読記憶媒体上にはプログラム又は命令が記憶されており、このプログラム又は命令がプロセッサにより実行される時、上記ビデオ通話方法の実施例の各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
ここで、前記プロセッサは、上記実施例に記載の電子機器におけるプロセッサである。前記可読記憶媒体は、コンピュータ可読記憶媒体、例えばコンピュータリードオンリーメモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク又は光ディスクなどを含む。
本出願の実施例は、チップをさらに提供し、前記チップは、プロセッサと通信インターフェースを含み、前記通信インターフェースは、前記プロセッサと結合され、前記プロセッサは、プログラム又は命令を運行し、上記ビデオ通話方法の実施例の各プロセスを実現するために用いられ、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
理解すべきこととして、本出願の実施例に言及されたチップは、システムレベルチップ、システムチップ、チップシステム又はシステムオンチップなどと呼ばれてもよい。
本出願の実施例は、コンピュータプログラム製品をさらに提供し、ここで、前記コンピュータプログラム製品が非一時的可読記憶媒体に記憶されており、前記コンピュータプログラム製品が少なくとも一つのプロセッサにより実行されて、上記ビデオ通話方法の実施例における各プロセスを実現し、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここでこれ以上説明しない。
説明すべきこととして、本明細書では、用語である「含む」、「包含」又はその他の任意の変形は、非排他的な「含む」を意図的にカバーするものであり、それによって一連の要素を含むプロセス、方法、物品又は装置は、それらの要素を含むだけではなく、明確にリストアップされていない他の要素も含み、又はこのようなプロセス、方法、物品又は装置に固有の要素も含む。それ以上の制限がない場合に、「……を1つ含む」という文章で限定された要素について、この要素を含むプロセス、方法、物品又は装置には他の同じ要素も存在することが排除されるものではない。なお、指摘すべきこととして、本出願の実施の形態における方法と装置の範囲は、図示又は討論された順序で機能を実行することに限らず、関わる機能に基づいて基本的に同時である方式又は逆の順序で機能を実行することを含んでもよく、例えば記述されたものとは異なる手順で記述された方法を実行することができるとともに、様々なステップを追加、省略又は組み合わせることができる。また、いくつかの例を参照して記述された特徴は、他の例で組み合わせられることができる。
以上の実施の形態の記述によって、当業者であればはっきりと分かるように上記実施例の方法は、ソフトウェアと必要な汎用ハードウェアプラットフォームの形態によって実現されることができる。無論、ハードウェアによって実現されてもよいが、多くの場合、前者は、より好適な実施の形態である。このような理解を踏まえて、本出願の技術案は、実質には又は従来の技術に寄与した部分がソフトウェア製品の形式によって具現化されてもよい。このコンピュータソフトウェア製品は、一つの記憶媒体(例えばROM/RAM、磁気ディスク、光ディスク)に記憶され、一台の端末(携帯電話、コンピュータ、サーバ、エアコン、又はネットワーク機器などであってもよい)に本出願の各実施例に記載の方法を実行させるための若干の命令を含む。
以上は、図面を結び付けながら、本出願の実施例を記述したが、本出願は、上記の具体的な実施の形態に限らない。上記の具体的な実施の形態は、例示的なものに過ぎず、制限性のあるものではない。当業者は、本出願の示唆で、本出願の趣旨と特許請求の範囲から逸脱しない限り、多くの形式を行うこともでき、いずれも本出願の保護範囲に属する。

Claims (15)

  1. ビデオ通話方法であって、
    ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識することと、
    前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定することと、
    前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定することと、
    ターゲットサウンドチャネルで前記ターゲット音声情報を再生することとを含む、ビデオ通話方法。
  2. 前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生することは、
    前記ビデオ通話の優先度と前記ターゲット音声情報の優先度に基づいて、前記ターゲット音声情報を再生する第一のボリューム値を決定することと、
    ターゲットサウンドチャネルで前記第一のボリューム値で前記ターゲット音声情報を再生することと、
    前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも高い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも小さくすることと、
    前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも低い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも大きくすることとを含む、請求項1に記載の方法。
  3. 前記の、前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定することは、
    前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換することと、
    前記テキスト情報におけるキー情報を抽出することと、
    前記キー情報に基づいて前記各未読音声情報の優先度を決定することとを含む、請求項1に記載の方法。
  4. 前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生した後に、前記方法は、
    前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するためのボリューム調節識別子を表示することと、
    前記ボリューム調節識別子に対する第一の入力を受信することと、
    前記第一の入力に応答し、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整することとをさらに含む、請求項1に記載の方法。
  5. 前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生する前に、前記方法は、
    前記ターゲット音声情報を表示し、前記ターゲット音声情報の再生識別子を表示するをさらに含み、前記再生識別子は、前記ターゲット音声情報の再生進捗を表すために用いられ、
    前記の、ターゲットサウンドチャネルで前記ターゲット音声情報を再生した後に、前記方法は、
    前記ターゲット音声情報を再生する過程で、前記ターゲット音声情報の再生進捗に基づいて前記再生識別子を更新することと、
    前記再生識別子に対する第二の入力を受信することと、
    前記第二の入力に応答し、前記ターゲット音声情報の再生進捗を調整することとをさらに含む、請求項1に記載の方法。
  6. ビデオ通話装置であって、
    ビデオ通話を行う過程で、インスタントメッセージング内容における少なくとも一つの未読音声情報を認識するための認識モジュールと、
    前記少なくとも一つの未読音声情報のうちの各未読音声情報の優先度を決定するための第一の決定モジュールと、
    前記各未読音声情報の優先度に基づいて前記少なくとも一つの未読音声情報のうちの優先度が最も高い未読音声情報であるターゲット音声情報を決定するための第二の決定モジュールと、
    ターゲットサウンドチャネルで前記ターゲット音声情報を再生するための再生モジュールとを含む、ビデオ通話装置。
  7. 前記再生モジュールは、具体的に、
    前記ビデオ通話の優先度と前記ターゲット音声情報の優先度に基づいて、前記ターゲット音声情報を再生する第一のボリューム値を決定し、
    ターゲットサウンドチャネルで前記第一のボリューム値で前記ターゲット音声情報を再生し、
    前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも高い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも小さくし、
    前記ビデオ通話の優先度が前記ターゲット音声情報の優先度よりも低い場合、前記第一のボリューム値を、前記ビデオ通話の第二のボリューム値よりも大きくするために用いられる、請求項6に記載のビデオ通話装置。
  8. 前記第一の決定モジュールは、具体的に、
    前記少なくとも一つの未読音声情報のうちの各未読音声情報をテキスト情報に変換し、
    前記テキスト情報におけるキー情報を抽出し、
    前記キー情報に基づいて前記各未読音声情報の優先度を決定するために用いられる、請求項6に記載のビデオ通話装置。
  9. 前記ビデオ通話装置は、
    前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するためのボリューム調節識別子を表示するための第一の表示モジュールと、
    前記ボリューム調節識別子に対する第一の入力を受信するための第一の受信モジュールと、
    前記第一の入力に応答し、前記ビデオ通話の音声内容を再生するボリューム値及び前記ターゲット音声情報を再生するボリューム値を調整するための第一の調整モジュールとをさらに含む、請求項6に記載のビデオ通話装置。
  10. 前記ビデオ通話装置は、
    前記ターゲット音声情報を表示し、前記ターゲット音声情報の再生識別子を表示するための第二の表示モジュールであって、前記再生識別子が、前記ターゲット音声情報の再生進捗を表すために用いられる第二の表示モジュールと、
    前記ターゲット音声情報を再生する過程で、前記ターゲット音声情報の再生進捗に基づいて前記再生識別子を更新するための更新モジュールと、
    前記再生識別子に対する第二の入力を受信するための第二の受信モジュールと、
    前記第二の入力に応答し、前記ターゲット音声情報の再生進捗を調整するための第二の調整モジュールとをさらに含む、請求項6に記載のビデオ通話装置。
  11. プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるプログラム又は命令とを含み、ここで、前記プログラム又は命令が前記プロセッサにより実行される時、請求項1から5のいずれか1項に記載のビデオ通話方法におけるステップを実現する、電子機器。
  12. プログラム又は命令が記憶されており、ここで、前記プログラム又は命令がプロセッサにより実行される時、請求項1から5のいずれか1項に記載のビデオ通話方法におけるステップを実現する、可読記憶媒体。
  13. プロセッサと、通信インターフェースとを含み、ここで、前記通信インターフェースは、前記プロセッサと結合され、前記プロセッサは、プログラム又は命令を運行し、請求項1から5のいずれか1項に記載のビデオ通話方法におけるステップを実現するために用いられる、チップ。
  14. 非一時的記憶媒体に記憶されており、少なくとも一つのプロセッサにより実行されて、請求項1から5のいずれか1項に記載のビデオ通話方法におけるステップを実現する、コンピュータプログラム製品。
  15. 請求項1から5のいずれか1項に記載のビデオ通話方法におけるステップを実行するように構成される、電子機器。
JP2023538824A 2020-12-25 2021-12-21 ビデオ通話方法及び装置 Active JP7628615B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011558968.8A CN112672088A (zh) 2020-12-25 2020-12-25 视频通话方法及装置
CN202011558968.8 2020-12-25
PCT/CN2021/140151 WO2022135411A1 (zh) 2020-12-25 2021-12-21 视频通话方法及装置

Publications (2)

Publication Number Publication Date
JP2024500481A true JP2024500481A (ja) 2024-01-09
JP7628615B2 JP7628615B2 (ja) 2025-02-10

Family

ID=75408838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023538824A Active JP7628615B2 (ja) 2020-12-25 2021-12-21 ビデオ通話方法及び装置

Country Status (6)

Country Link
US (1) US12363227B2 (ja)
EP (1) EP4270938A4 (ja)
JP (1) JP7628615B2 (ja)
KR (1) KR102857196B1 (ja)
CN (1) CN112672088A (ja)
WO (1) WO2022135411A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112672088A (zh) 2020-12-25 2021-04-16 维沃移动通信有限公司 视频通话方法及装置
CN116229934B (zh) * 2023-02-01 2026-02-03 岚图汽车科技股份有限公司 车载语音播报方法及相关设备
CN119788121A (zh) * 2025-03-07 2025-04-08 深圳聚瑞云控科技有限公司 语音通话管理方法、装置、设备、存储介质及产品

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6661886B1 (en) * 2000-10-31 2003-12-09 Cisco Technology, Inc. Method and system for real-time monitoring of voice mail during active call
US20050248437A1 (en) * 1999-08-31 2005-11-10 At&T Wireless Services, Inc. Filtered in-box for voice mail, e-mail, pages, web-based information, and faxes
US20090010403A1 (en) * 2006-03-03 2009-01-08 Motorola, Inc. Method for Minimizing Message Collision in a Device
US20090177617A1 (en) * 2008-01-03 2009-07-09 Apple Inc. Systems, methods and apparatus for providing unread message alerts
JP2010534955A (ja) * 2007-06-28 2010-11-11 レベルヴォックス,エルエルシー マルチメディア通信方法
JP2013513320A (ja) * 2009-12-10 2013-04-18 アルカテル−ルーセント ユーザ機器にボイス・メッセージを供給する方法および装置
CN104123324A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种未读消息的定位获取方法及装置
JP2015015728A (ja) * 2014-08-13 2015-01-22 ソニー株式会社 制御装置、および制御方法
CN107104887A (zh) * 2017-06-01 2017-08-29 珠海格力电器股份有限公司 一种即时消息提醒方法、装置及其用户终端
JP2018533088A (ja) * 2016-08-30 2018-11-08 北京小米移動軟件有限公司Beijing Xiaomi Mobile Software Co.,Ltd. メッセージのプッシュ方法、装置及び端末ディバイス
CN110278402A (zh) * 2019-06-24 2019-09-24 努比亚技术有限公司 一种双声道音频处理方法、设备及计算机可读存储介质
CN111491058A (zh) * 2020-03-31 2020-08-04 维沃移动通信有限公司 工作模式的控制方法、电子设备和存储介质
CN111835922A (zh) * 2019-04-19 2020-10-27 海能达通信股份有限公司 一种多路通话语音控制方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6147977A (en) * 1997-12-12 2000-11-14 Motorola, Inc. Method and apparatus for processing messages based on originator and recipient priorities
US8533611B2 (en) * 2009-08-10 2013-09-10 Voxer Ip Llc Browser enabled communication device for conducting conversations in either a real-time mode, a time-shifted mode, and with the ability to seamlessly shift the conversation between the two modes
KR101369982B1 (ko) * 2012-08-01 2014-03-06 김용진 안내 서비스 방법 및 이에 적용되는 장치
DK201670616A1 (en) * 2016-06-12 2018-01-22 Apple Inc Devices and Methods for Accessing Prevalent Device Functions
CN107835299A (zh) * 2017-10-19 2018-03-23 广东欧珀移动通信有限公司 通话请求处理方法、装置、存储介质及移动终端
CN109274831B (zh) * 2018-11-01 2021-08-13 科大讯飞股份有限公司 一种语音通话方法、装置、设备及可读存储介质
CN109379497B (zh) * 2018-12-28 2023-07-07 深圳市欣易辰信息科技有限公司 语音信息播放方法、移动终端及计算机可读存储介质
CN111555960A (zh) * 2020-04-24 2020-08-18 上海盛付通电子支付服务有限公司 信息生成的方法
CN112672088A (zh) * 2020-12-25 2021-04-16 维沃移动通信有限公司 视频通话方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050248437A1 (en) * 1999-08-31 2005-11-10 At&T Wireless Services, Inc. Filtered in-box for voice mail, e-mail, pages, web-based information, and faxes
US6661886B1 (en) * 2000-10-31 2003-12-09 Cisco Technology, Inc. Method and system for real-time monitoring of voice mail during active call
US20090010403A1 (en) * 2006-03-03 2009-01-08 Motorola, Inc. Method for Minimizing Message Collision in a Device
JP2010534955A (ja) * 2007-06-28 2010-11-11 レベルヴォックス,エルエルシー マルチメディア通信方法
US20090177617A1 (en) * 2008-01-03 2009-07-09 Apple Inc. Systems, methods and apparatus for providing unread message alerts
JP2013513320A (ja) * 2009-12-10 2013-04-18 アルカテル−ルーセント ユーザ機器にボイス・メッセージを供給する方法および装置
CN104123324A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种未读消息的定位获取方法及装置
JP2015015728A (ja) * 2014-08-13 2015-01-22 ソニー株式会社 制御装置、および制御方法
JP2018533088A (ja) * 2016-08-30 2018-11-08 北京小米移動軟件有限公司Beijing Xiaomi Mobile Software Co.,Ltd. メッセージのプッシュ方法、装置及び端末ディバイス
CN107104887A (zh) * 2017-06-01 2017-08-29 珠海格力电器股份有限公司 一种即时消息提醒方法、装置及其用户终端
CN111835922A (zh) * 2019-04-19 2020-10-27 海能达通信股份有限公司 一种多路通话语音控制方法及装置
CN110278402A (zh) * 2019-06-24 2019-09-24 努比亚技术有限公司 一种双声道音频处理方法、设备及计算机可读存储介质
CN111491058A (zh) * 2020-03-31 2020-08-04 维沃移动通信有限公司 工作模式的控制方法、电子设备和存储介质

Also Published As

Publication number Publication date
CN112672088A (zh) 2021-04-16
KR20230120668A (ko) 2023-08-17
KR102857196B1 (ko) 2025-09-08
EP4270938A4 (en) 2024-06-12
JP7628615B2 (ja) 2025-02-10
EP4270938A1 (en) 2023-11-01
US12363227B2 (en) 2025-07-15
WO2022135411A1 (zh) 2022-06-30
US20230328181A1 (en) 2023-10-12

Similar Documents

Publication Publication Date Title
US10754532B2 (en) Method and apparatus for operating function in touch device
CN113360238A (zh) 消息处理方法、装置、电子设备和存储介质
CN112751744B (zh) 一种控制视频播放的方法、装置、计算设备及存储介质
US12363227B2 (en) Video call method and apparatus
CN108984256A (zh) 界面显示方法、装置、存储介质及电子设备
CN110830813B (zh) 一种视频切换的方法、装置、电子设备及存储介质
CN117289831A (zh) 一种页面交互方法、装置、电子设备和存储介质
WO2023155776A1 (zh) 交互方法、交互装置和电子设备
CN112269509B (zh) 信息处理方法、装置及电子设备
US20150052211A1 (en) Message based conversation function execution method and electronic device supporting the same
WO2023030130A1 (zh) 会话处理方法、装置及电子设备
CN112752160A (zh) 一种控制视频播放的方法、装置、计算设备及存储介质
CN113873082A (zh) 媒体文件播放方法及装置
CN111324262B (zh) 一种应用界面控制方法、装置、终端及介质
WO2024193371A1 (zh) 程序处理方法、装置及电子设备
WO2023131134A1 (zh) 会话方法及其装置
WO2023030292A1 (zh) 多媒体文件的播放方法和装置
CN118741249B (zh) 信息交互方法、装置、设备及存储介质
HK40073949B (en) A method, device, computing equipment and storage medium for controlling video playing
CN115242739A (zh) 信息处理方法、装置和电子设备
CN117130512A (zh) 显示方法、装置、电子设备及存储介质
HK40073949A (en) A method, device, computing equipment and storage medium for controlling video playing
CN118474412A (zh) 视频播放方法、装置、终端设备和存储介质
HK40044209A (en) Method and apparatus for controlling video playback, computing device and storage medium
HK40044209B (en) Method and apparatus for controlling video playback, computing device and storage medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230622

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250129

R150 Certificate of patent or registration of utility model

Ref document number: 7628615

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150