[go: up one dir, main page]

JP7807460B2 - Improved virtual meeting user experience based on augmented intelligence - Google Patents

Improved virtual meeting user experience based on augmented intelligence

Info

Publication number
JP7807460B2
JP7807460B2 JP2023558790A JP2023558790A JP7807460B2 JP 7807460 B2 JP7807460 B2 JP 7807460B2 JP 2023558790 A JP2023558790 A JP 2023558790A JP 2023558790 A JP2023558790 A JP 2023558790A JP 7807460 B2 JP7807460 B2 JP 7807460B2
Authority
JP
Japan
Prior art keywords
user
processors
participants
program
conference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023558790A
Other languages
Japanese (ja)
Other versions
JP2024514062A (en
JPWO2022218062A5 (en
Inventor
ソード、シッダールタ
ジェイン、サンケット
クマール シャーマ、アジャイ
カフィー ウディン、ムハンマド
クマール ジョシ、マノジュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2024514062A publication Critical patent/JP2024514062A/en
Publication of JPWO2022218062A5 publication Critical patent/JPWO2022218062A5/ja
Application granted granted Critical
Publication of JP7807460B2 publication Critical patent/JP7807460B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1831Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、一般に、データ処理の分野に関し、より詳細には、仮想会議ユーザ・エクスペリエンスを改善するための拡張インテリジェンスに基づくシステムおよび方法に関する。 The present invention relates generally to the field of data processing, and more particularly to a system and method based on augmented intelligence for improving virtual meeting user experience.

拡張インテリジェンスは、人間の能力を高めることにおけるAIの支援の役割に重点を置く人工知能(AI:artificial intelligence)の代替の概念化である。拡張インテリジェンスは、機械学習および深層学習を使用して、人間のインテリジェンスを置き換えるのではなく、強化する。拡張インテリジェンスは、人間の意思決定を改善することによって、人間のインテリジェンスを強化し、延いては、改善された決定に応答して行動が取られる。 Augmented intelligence is an alternative conceptualization of artificial intelligence (AI) that emphasizes the supporting role of AI in enhancing human capabilities. Augmented intelligence uses machine learning and deep learning to enhance, rather than replace, human intelligence. Augmented intelligence enhances human intelligence by improving human decision-making, which in turn allows actions to be taken in response to the improved decisions.

機械学習は、追加のプログラミングなしで経験から学習して改善するAIの能力を表す。コンピュータが人間の言語を識別できるようにする自然言語処理は、機械学習の例である。深層学習は、データを処理してパターンを調べる人間の脳の能力を模倣するAIのプロセスを表す。 Machine learning describes AI's ability to learn and improve from experience without additional programming. Natural language processing, which enables computers to identify human language, is an example of machine learning. Deep learning describes AI processes that mimic the human brain's ability to process data and examine patterns.

拡張インテリジェンスとAIの間の重要な違いは、自律性の違いである。拡張インテリジェンスは、他の方法では人間の意思決定者を圧倒する大量のデータを処理し、先入観、疲労、または注意散漫などの、データがゆがめられるか、または間違って解釈されることを引き起こす要因を取り除く。拡張インテリジェンスは、データを分析し、パターンを識別し、それらのパターンをユーザに報告し、その後、人間のインテリジェンスが引き継ぐことができるようにする。拡張インテリジェンスは、システムがユーザの個別の嗜好および期待についてユーザから学習することを可能にし、好みに合わせて調整されて個人化された経験を提供する。 A key difference between augmented intelligence and AI is the difference in autonomy. Augmented intelligence processes large amounts of data that would otherwise overwhelm a human decision maker, eliminating factors such as bias, fatigue, or distraction that would cause the data to be distorted or misinterpreted. Augmented intelligence analyzes the data, identifies patterns, and reports those patterns to the user, after which human intelligence can take over. Augmented intelligence enables the system to learn from the user about their individual preferences and expectations, providing a personalized experience tailored to their preferences.

拡張インテリジェンスの例は、ストリーミング・ビデオ・サービスによって提供された推奨の視聴である。拡張インテリジェンス・アルゴリズムは、ユーザの視聴習慣を分析し、それらの習慣に基づいて追加の視聴を推奨する。その後、推奨に従って行動するかどうかの判断は、ユーザに任される。拡張インテリジェンスには、任意の産業においてパターンおよび予測指標についてビッグ・データをマイニングする応用もある。例としては、顧客の嗜好を予測するためにデータ分析を使用するオンライン・ストア、自然言語処理に基づく仮想的顧客サービス支援、浮動票を有する人々を識別するためにビッグ・データ分析を使用する政治シンク・タンク、効率的な治療選択肢を識別するためのケース・ファイルの医学分析、人間の従業員によって監視される工場自動化、過去のデータに基づく工場の機器の予知保全、周囲の環境およびデータを使用して拡張現実のイベントを作成し、コンピュータによって生成された画像をスマートフォンのカメラ画面に重ね合わせる、モバイル・ビデオ・ゲーム、飛行機およびドローンのオートパイロット・システム、株式市場のパターンを監視および識別する投資および金融アプリケーションが挙げられるが、これらに限定されない。 An example of augmented intelligence is viewing recommendations provided by a streaming video service. Augmented intelligence algorithms analyze a user's viewing habits and recommend additional viewings based on those habits. The user is then left to decide whether to act on the recommendations. Augmented intelligence also has applications in mining big data for patterns and predictive indicators in any industry. Examples include, but are not limited to, online stores using data analytics to predict customer preferences, virtual customer service assistants based on natural language processing, political think tanks using big data analytics to identify swing voters, medical analysis of case files to identify efficient treatment options, factory automation overseen by human employees, predictive maintenance of factory equipment based on historical data, mobile video games that use the surrounding environment and data to create augmented reality events and overlay computer-generated images on a smartphone camera screen, autopilot systems for airplanes and drones, and investment and finance applications that monitor and identify stock market patterns.

一方、AIは、どのような人間の支援もなしで動作する。AIの例は、電子メール・スパム・フィルタまたはAIを利用する検索提案である。 AI, on the other hand, operates without any human assistance. Examples of AI are email spam filters or AI-powered search suggestions.

本発明の実施形態の態様は、仮想会議ユーザ・エクスペリエンスを改善するための方法、コンピュータ・プログラム製品、およびコンピュータ・システムを開示する。プロセッサは、事前設定された期間の間、または事前にスケジュールされた仮想会議の割り当てられた合計時間の事前設定された割合の間、少なくとも2人以上の参加者を含んでいる仮想会議から離れているユーザを検出する。プロセッサは、ユーザに関するデータの第1のセット、仮想会議の少なくとも2人の参加者に関するデータの第2のセット、およびユーザと仮想会議の少なくとも2人の参加者の間の関係に関するデータの第3のセットをデータベースから取り出す。プロセッサは、ユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の仮想会議の一部を対象にする、要約を準備する。プロセッサは、ユーザが仮想会議に再接続することを検出する。プロセッサは、事前設定されたユーザの嗜好、ユーザによって行われた決定、または機械駆動の推奨に基づいて、ユーザが仮想会議に再び参加する前に要約をレビュー(review)するかどうかを判定する。ユーザが仮想会議に再び参加する前に要約をレビューするということを決定することに応答して、プロセッサは、デフォルトのユーザの嗜好のセットを使用して、要約をレビューするようユーザに促す。プロセッサは、要約をユーザに出力する。 Aspects of an embodiment of the present invention disclose a method, computer program product, and computer system for improving a virtual conference user experience. A processor detects a user who has been absent from a virtual conference including at least two or more participants for a preset period of time or a preset percentage of the pre-scheduled virtual conference's allotted total time. The processor retrieves from a database a first set of data regarding the user, a second set of data regarding at least two participants of the virtual conference, and a third set of data regarding relationships between the user and the at least two participants of the virtual conference. The processor prepares a summary tailored to the user's profile and covering the portion of the virtual conference during which the user was absent. The processor detects that the user reconnects to the virtual conference. The processor determines whether the user will review the summary before rejoining the virtual conference based on preset user preferences, a user-made decision, or a machine-driven recommendation. In response to determining that the user will review the summary before rejoining the virtual conference, the processor prompts the user to review the summary using a default set of user preferences. The processor outputs the summary to the user.

本発明の実施形態の一部の態様では、要約をユーザに出力した後に、プロセッサは、要約を仮想会議の完全な記録の再生と比較する。プロセッサは、ユーザに対してフィードバックを要求する。プロセッサは、ユーザからフィードバックを受信する。プロセッサは、強化学習を使用して、準備される複数の未来の要約の精度を改善する。プロセッサは、ユーザからのフィードバックをデータベースに格納する。 In some aspects of embodiments of the present invention, after outputting the summary to the user, the processor compares the summary to a playback of the full recording of the virtual meeting. The processor requests feedback from the user. The processor receives feedback from the user. The processor uses reinforcement learning to improve the accuracy of multiple future summaries that are prepared. The processor stores the user feedback in a database.

本発明の実施形態の一部の態様では、プロセッサは、仮想会議の2人以上の参加者を識別する。プロセッサは、要因の第1のセットに基づいて、重み付けを仮想会議の2人以上の参加者に割り当てる。プロセッサは、2人以上の参加者に割り当てられた重み付けに基づいて、仮想会議の2人以上の参加者をランク付けする。 In some aspects of embodiments of the present invention, a processor identifies two or more participants in a virtual conference. The processor assigns weights to the two or more participants in the virtual conference based on a first set of factors. The processor ranks the two or more participants in the virtual conference based on the weights assigned to the two or more participants.

本発明の実施形態の一部の態様では、プロセッサは、少なくとも2人の参加者に割り当てられた重み付けに基づいて仮想会議の少なくとも2人の参加者をランク付けした後に、複数の音声フレーム、複数のビデオ・フレーム、ならびに複数の音声およびビデオ・フレームを、ユーザが切り離されていた間の仮想会議の一部から抽出する。プロセッサは、仮想会議の1つまたは複数のトピックを理解するために、複数の音声フレーム、複数のビデオ・フレーム、ならびに複数の音声およびビデオ・フレームの文脈を識別する。 In some aspects of embodiments of the present invention, a processor ranks at least two participants of the virtual conference based on weights assigned to the at least two participants, and then extracts a plurality of audio frames, a plurality of video frames, and a plurality of audio and video frames from a portion of the virtual conference during which the users were disconnected. The processor identifies context for the plurality of audio frames, the plurality of video frames, and the plurality of audio and video frames to understand one or more topics of the virtual conference.

本発明の実施形態の一部の態様では、プロセッサは、仮想会議の1つまたは複数のトピックを理解するために複数の音声フレーム、複数のビデオ・フレーム、ならびに複数の音声およびビデオ・フレームの文脈を識別した後に、複数の音声フレーム、複数のビデオ・フレーム、ならびに複数の音声およびビデオ・フレームがユーザのプロフィールに関連するかどうかに基づいて、複数の音声フレームのサブセット、複数のビデオ・フレームのサブセット、ならびに複数の音声およびビデオ・フレームのサブセットを選択する。プロセッサは、アルゴリズム法または要因の第2のセットを使用して、複数の音声フレームのサブセット、複数のビデオ・フレームのサブセット、ならびに複数の音声およびビデオ・フレームのサブセットをランク付けする。プロセッサは、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームのサブセット、複数のビデオ・フレームのサブセット、ならびに複数の音声およびビデオ・フレームのサブセットをマージする。プロセッサは、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームのサブセットの統合された要約、アルゴリズムで決定されたしきい値より上にランク付けされた複数のビデオ・フレームのサブセットの統合された要約、ならびにアルゴリズムで決定されたしきい値より上にランク付けされた複数の音声およびビデオ・フレームのサブセットの統合された要約を準備する。 In some aspects of embodiments of the present invention, after identifying the context of the plurality of audio frames, the plurality of video frames, and the plurality of audio and video frames to understand one or more topics of the virtual conference, the processor selects a subset of the plurality of audio frames, a subset of the plurality of video frames, and a subset of the plurality of audio and video frames based on whether the plurality of audio frames, the plurality of video frames, and the plurality of audio and video frames are relevant to a user's profile. The processor ranks the subset of the plurality of audio frames, the subset of the plurality of video frames, and the subset of the plurality of audio and video frames using an algorithmic method or a second set of factors. The processor merges the subset of the plurality of audio frames, the subset of the plurality of video frames, and the subset of the plurality of audio and video frames ranked above an algorithmically determined threshold. The processor prepares a unified summary of a subset of the plurality of audio frames ranked above an algorithmically determined threshold, a unified summary of a subset of the plurality of video frames ranked above an algorithmically determined threshold, and a unified summary of a subset of the plurality of audio and video frames ranked above an algorithmically determined threshold.

本発明の実施形態の一部の態様では、プロセッサは、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームのサブセットの統合された要約、アルゴリズムで決定されたしきい値より上にランク付けされた複数のビデオ・フレームのサブセットの統合された要約、ならびにアルゴリズムで決定されたしきい値より上にランク付けされた複数の音声およびビデオ・フレームのサブセットの統合された要約を準備した後に、抽出テキスト要約アルゴリズムを使用して統合された要約を1つまたは複数の文に変換する。プロセッサは、話者ダイアライゼーション(diarisation)を適用する。プロセッサは、要因の第3のセットに基づいて1つまたは複数の文をランク付けする。プロセッサは、第2の事前設定されたユーザの嗜好または第2の機械駆動の推奨に基づく第2のしきい値より上にランク付けされた1つまたは複数の文のサブセットを保持する。 In some aspects of embodiments of the present invention, the processor prepares an integrated summary of a subset of the plurality of audio frames ranked above an algorithmically determined threshold, an integrated summary of a subset of the plurality of video frames ranked above an algorithmically determined threshold, and an integrated summary of a subset of the plurality of audio and video frames ranked above an algorithmically determined threshold, and then converts the integrated summary into one or more sentences using an extractive text summarization algorithm. The processor applies speaker diarization. The processor ranks the one or more sentences based on a third set of factors. The processor retains a subset of the one or more sentences ranked above a second threshold based on a second preset user preference or a second machine-driven recommendation.

本発明の実施形態の一部の態様では、プロセッサは、第2の事前設定されたユーザの嗜好または第2の機械駆動の推奨に基づく第2のしきい値より上にランク付けされた1つまたは複数の文のサブセットを保持した後に、1つまたは複数の文のサブセット内の1つまたは複数のキーワードを識別する。プロセッサは、仮想会議の1つまたは複数のトピックとの1つまたは複数のキーワードの関連性に基づいて、および仮想会議の少なくとも2人の参加者との1つまたは複数のキーワードの関連性に基づいて、重み付けを1つまたは複数の文のサブセット内の1つまたは複数のキーワードに割り当てる。プロセッサは、1つまたは複数のキーワードを使用して1つまたは複数の文のサブセットをタグ付けする。 In some aspects of embodiments of the present invention, the processor identifies one or more keywords within the subset of one or more sentences after retaining the subset of one or more sentences ranked above a second threshold based on a second preset user preference or a second machine-driven recommendation. The processor assigns weights to one or more keywords within the subset of one or more sentences based on the relevance of the one or more keywords to one or more topics of the virtual conference and based on the relevance of the one or more keywords to at least two participants of the virtual conference. The processor tags the subset of one or more sentences with the one or more keywords.

本発明の実施形態の一部の態様では、プロセッサは、1つまたは複数のキーワードを使用して1つまたは複数の文のサブセットをタグ付けした後に、少なくとも2人の参加者、1つまたは複数のキーワード、および1つまたは複数の文のサブセットを組み込むグローバルなランク付けを準備する。プロセッサは、グローバルなランク付けに基づいて、ユーザのプロフィールに合わせて調整された要約を準備する。 In some aspects of embodiments of the present invention, the processor tags the one or more subsets of sentences with one or more keywords and then prepares a global ranking incorporating at least two participants, the one or more keywords, and the one or more subsets of sentences. The processor prepares a summary tailored to the user's profile based on the global ranking.

本発明の実施形態の一部の態様では、データベースから収集された、ユーザに関するデータの第1のセット、仮想会議の少なくとも2人の参加者に関するデータの第2のセット、ユーザと仮想会議の少なくとも2人の参加者の間の関係に関するデータの第3のセットは、ユーザによって作成されたプロフィール、ユーザの企業プロフィール、ユーザのカレンダー、仮想会議の少なくとも2人の参加者によって作成された1つまたは複数のプロフィール、仮想会議の少なくとも2人の参加者の企業プロフィール、仮想会議の少なくとも2人の参加者のカレンダー、仮想会議の少なくとも2人の参加者によって使用される1つまたは複数のプレゼンテーション・ツール、およびユーザがホストしたか、参加したか、または出席した1つまたは複数の以前の仮想会議からのデータを含む。 In some aspects of embodiments of the present invention, the first set of data regarding the user, the second set of data regarding at least two participants in the virtual conference, and the third set of data regarding relationships between the user and the at least two participants in the virtual conference collected from the database include a profile created by the user, a company profile for the user, the user's calendar, one or more profiles created by the at least two participants in the virtual conference, company profiles for the at least two participants in the virtual conference, calendars for the at least two participants in the virtual conference, one or more presentation tools used by the at least two participants in the virtual conference, and data from one or more previous virtual conferences hosted, participated in, or attended by the user.

本発明の実施形態の一部の態様では、プロセッサは、ユーザが再接続したときの仮想会議中の時間を捕捉する。プロセッサは、ユーザが仮想会議から切り離されていた時間の全持続時間を計算する。 In some aspects of embodiments of the present invention, the processor captures the time during the virtual conference when the user reconnects. The processor calculates the total duration of time the user was disconnected from the virtual conference.

本発明の実施形態の一部の態様では、要約をレビューするためのデフォルトのユーザの嗜好のセットは、言語の嗜好、視聴モードの嗜好、音声の嗜好、およびサブタイトルの嗜好を含む。 In some aspects of embodiments of the present invention, the set of default user preferences for reviewing summaries includes language preferences, viewing mode preferences, audio preferences, and subtitle preferences.

本発明の実施形態の一部の態様では、プロセッサは、1つまたは複数の主要な実体(key entities)の第1のセットを要約から抽出し、1つまたは複数の主要な実体の第2のセットを仮想会議の完全な記録から抽出する。プロセッサは、要約からの1つまたは複数の主要な実体の第1のセットを、仮想会議の完全な記録からの1つまたは複数の主要な実体の第2のセットと照合する。 In some aspects of embodiments of the present invention, a processor extracts a first set of one or more key entities from the summary and a second set of one or more key entities from the full recording of the virtual conference. The processor matches the first set of one or more key entities from the summary with the second set of one or more key entities from the full recording of the virtual conference.

本発明の実施形態の一部の態様では、プロセッサは、ユーザの満足度を表す3つ以上の選択をユーザに提供し、3つ以上の選択は、不満足、中立、および満足を含む。 In some aspects of embodiments of the present invention, the processor provides the user with three or more choices representing the user's satisfaction level, the three or more choices including dissatisfied, neutral, and satisfied.

本発明の実施形態の一部の態様では、要因の第1のセットは、仮想会議における少なくとも2人の参加者の役割、企業における少なくとも2人の参加者の役割、および仮想会議から離れたユーザとの少なくとも2人の参加者の関連性を含む。 In some aspects of embodiments of the present invention, the first set of factors includes the roles of the at least two participants in the virtual conference, the roles of the at least two participants in the enterprise, and the association of the at least two participants with a user remote from the virtual conference.

本発明の実施形態の一部の態様では、アルゴリズムで決定されたしきい値は、動的であり、トレーニング・データ・セットに合わせて設定される。 In some aspects of embodiments of the present invention, the algorithmically determined threshold is dynamic and tailored to the training data set.

本発明の実施形態の一部の態様では、要因の第2のセットは、フレームが、仮想会議から切り離されたユーザの名前を含んでいるかどうか、少なくとも2人の参加者のランク付け、ユーザの技術に関する関心に基づくか、ユーザの専門知識に基づくか、または過去の分析に基づく、仮想会議から離れたユーザとの少なくとも2人の参加者の関連性を含む。 In some aspects of embodiments of the present invention, the second set of factors includes whether the frame includes the name of a user who has disconnected from the virtual conference, a ranking of at least two participants, and the association of at least two participants with the user who has disconnected from the virtual conference based on the user's technology interests, the user's expertise, or past analysis.

本発明の実施形態の一部の態様では、プロセッサは、複数の音声フレーム内の少なくとも2人の参加者間の変更点を検出する。プロセッサは、少なくとも2人の参加者の特性に基づいて、音声のセグメントを一緒にグループ化する。 In some aspects of embodiments of the present invention, a processor detects changes between at least two participants in a plurality of frames of audio. The processor groups segments of audio together based on characteristics of the at least two participants.

本発明の実施形態の一部の態様では、要因の第3のセットは、仮想会議の少なくとも2人の参加者の役割および仮想会議の1つまたは複数のトピックとの1つまたは複数の文の関連性を含む。 In some aspects of embodiments of the present invention, the third set of factors includes the roles of at least two participants in the virtual meeting and the relevance of the one or more statements to one or more topics of the virtual meeting.

本発明の実施形態に従って、分散データ処理環境を示す機能ブロック図である。1 is a functional block diagram illustrating a distributed data processing environment in accordance with an embodiment of the present invention. 本発明の実施形態に従って、図1に示された分散データ処理環境などの分散データ処理環境内のユーザ固有の要約プログラムの設定コンポーネントの動作ステップを示すフローチャートである。2 is a flowchart illustrating the operational steps of a configuration component of a user-specific abstraction program in a distributed data processing environment, such as the distributed data processing environment illustrated in FIG. 1, in accordance with an embodiment of the present invention. 本発明の実施形態に従って、図1に示された分散データ処理環境などの分散データ処理環境内のユーザ固有の要約プログラムの動作ステップを示すフローチャートである。2 is a flowchart illustrating the operational steps of a user-specific summary program in a distributed data processing environment, such as the distributed data processing environment shown in FIG. 1, in accordance with an embodiment of the present invention. 本発明の実施形態に従って、図1に示された分散データ処理環境などの分散データ処理環境内のユーザ固有の要約プログラムの機械学習コンポーネントの動作ステップを示すフローチャートである。2 is a flowchart illustrating the operational steps of a machine learning component of a user-specific summarization program in a distributed data processing environment, such as the distributed data processing environment shown in FIG. 1, according to an embodiment of the present invention. 本発明の実施形態に従う、図1に示された分散データ処理環境などの分散データ処理環境内のコンピューティング・デバイスのコンポーネントのブロック図である。2 is a block diagram of components of a computing device in a distributed data processing environment, such as the distributed data processing environment shown in FIG. 1, according to an embodiment of the present invention.

本発明の実施形態は、仮想コラボレーション・サーバ・ツール(virtual collaboration server tool)上の会議中に問題が発生する可能性があるということを認識している。例えば、技術的問題が、ユーザが会議から切断されることを引き起こすことがある。この切断に起因して、ユーザは、問題またはトピックに関するホストまたは別の参加者の情報提供、別の参加者の質問または懸念に対するホストの応答、参加者によって取られた行動の経過、あるいは会議から切断されたユーザに向けられている期待される重要点および要処置事項などの、重要な情報を聞きもらすことがある。 Embodiments of the present invention recognize that problems may occur during a conference on a virtual collaboration server tool. For example, technical issues may cause a user to be disconnected from the conference. Due to this disconnection, the user may miss important information, such as a host's or another participant's information about an issue or topic, a host's response to another participant's question or concern, a progress report of actions taken by a participant, or expected takeaways and action items directed to the user who was disconnected from the conference.

本発明の実施形態は、仮想会議ユーザ・エクスペリエンスを改善するための拡張インテリジェンスに基づくシステムおよび方法を提供する。本発明の実施形態は、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の会議の一部を対象にする、要約を準備することを提案する。 Embodiments of the present invention provide an augmented intelligence-based system and method for improving the virtual conference user experience. Embodiments of the present invention propose preparing a summary tailored to the profile of a user who is away from a conference on a virtual collaboration server tool, covering the portion of the conference during which the user was disconnected.

本発明の実施形態は、ユーザが明示的にまたは暗黙的に会議から離れたときを検出する。ユーザの離脱を検出した後に、本発明の実施形態は、(1)マージおよび(2)抽出テキスト要約アルゴリズムを使用する音声テキスト要約(speech-to-text summarization)の概念を、ユーザが切り離されていた間の会議の一部から抽出された音声フレームまたはビデオ・フレームあるいはその両方に適用する。 Embodiments of the present invention detect when a user leaves a conference, either explicitly or implicitly. After detecting the user's departure, embodiments of the present invention apply the concepts of speech-to-text summarization using (1) merging and (2) extracted text summarization algorithms to the audio and/or video frames extracted from the portion of the conference during which the user was disconnected.

本発明の実施形態は、話者ダイアライゼーションを使用して、参加者の識別情報に従って文を同質のセグメントに分割し、参加者の文からキーワードを識別する。本発明の実施形態は、重み付けを参加者およびキーワードに割り当てる。本発明の実施形態は、識別されて重み付けされた参加者、識別されて重み付けされたキーワード、ならびにランク付けされた文を組み込むグローバルなランク付けを準備する。 Embodiments of the present invention use speaker diarization to divide sentences into homogeneous segments according to participant identification information and identify keywords from the participants' sentences. Embodiments of the present invention assign weights to participants and keywords. Embodiments of the present invention prepare a global ranking that incorporates the identified and weighted participants, the identified and weighted keywords, and the ranked sentences.

本発明の実施形態は、30秒のビデオまたは1ページの長さのテキストのどちらかの形態で、文を短い要約に減らす。本発明の実施形態は、各ユーザの企業プロフィール、ユーザの企業の階層、企業の階層内のユーザの地位、ユーザの企業内のユーザの年功序列、ユーザの主要な仕事、ユーザの主要な仕事の職務、ユーザの技術に関する関心、ユーザの専門知識、およびユーザがホストしたか、参加したか、または出席した会議への関与のユーザの履歴などの要因を使用して、仮想コラボレーション・サーバ・ツール上で会議から離れているユーザのプロフィールに合わせて要約を調整する。本発明の実施形態は、要約プロセスの一部として、計算された音声認識信頼度スコアおよび意図信頼度スコアも考慮する。 Embodiments of the present invention reduce sentences to short summaries in the form of either a 30-second video or a page of text. Embodiments of the present invention tailor summaries to the profile of users away from the conference on the virtual collaboration server tool using factors such as each user's company profile, the user's company hierarchy, the user's position within the company hierarchy, the user's seniority within the user's company, the user's primary job, the user's primary job function, the user's technology interests, the user's expertise, and the user's history of involvement in conferences the user has hosted, participated in, or attended. Embodiments of the present invention also consider calculated speech recognition confidence scores and intent confidence scores as part of the summarization process.

本発明の実施形態は、他の参加者とのユーザの関係の重みを活用して、ユーザが会議に再接続した後に、ユーザにいつ要約の使用を促すかを決定する。本発明の実施形態は、会議中または会議後に要約を再生するための選択肢をユーザに提供する。本発明の実施形態は、音声、ビデオ、字幕、またはこれら3つの形式の任意の組合せを含む要約を再生するための選択肢もユーザに提供する。 Embodiments of the present invention leverage the weight of a user's relationships with other participants to determine when to prompt the user to use the summary after the user reconnects to the conference. Embodiments of the present invention provide the user with the option to play the summary during or after the conference. Embodiments of the present invention also provide the user with the option to play a summary that includes audio, video, subtitles, or any combination of these three formats.

本発明の実施形態は、要約の未来の準備を改善するために、ユーザからフィードバックを収集する。 Embodiments of the present invention collect feedback from users to improve future preparation of summaries.

本発明の実施形態の実装は、さまざまな形態をとってよく、以下では、各図を参照して例示的な実装の詳細が説明される。 Implementations of embodiments of the present invention may take a variety of forms, and exemplary implementation details are described below with reference to the figures.

図1は、本発明の1つの実施形態に従って、分散データ処理環境(概して100と指定される)を示す機能ブロック図である。示された実施形態では、分散データ処理環境100は、ネットワーク110を経由して相互接続されたサーバ120およびユーザ・コンピューティング・デバイス130を含んでいる。分散データ処理環境100は、図に示されていない追加のサーバ、コンピュータ、コンピューティング・デバイス、IoTセンサ、および他のデバイスを含んでよい。図1は、単に本発明の1つの実施形態の例を提供しており、さまざまな実施形態が実装され得る環境に関して、どのような制限も意味していない。特許請求の範囲に列挙されている本発明の範囲から逸脱することなく、当業者によって、示された環境に対する多くの変更が行われてよい。 FIG. 1 is a functional block diagram illustrating a distributed data processing environment (generally designated 100) in accordance with one embodiment of the present invention. In the illustrated embodiment, distributed data processing environment 100 includes servers 120 and user computing devices 130 interconnected via network 110. Distributed data processing environment 100 may include additional servers, computers, computing devices, IoT sensors, and other devices not shown. FIG. 1 provides merely an example of one embodiment of the present invention and is not intended to imply any limitations with regard to the environments in which various embodiments may be implemented. Many modifications to the illustrated environment may be made by those skilled in the art without departing from the scope of the present invention, as set forth in the claims.

ネットワーク110は、例えば、電気通信ネットワーク、ローカル・エリア・ネットワーク、インターネットなどの広域ネットワーク、またはこれらの3つの組合せであることができ、有線接続、ワイヤレス接続、または光ファイバ接続を含むことができる、コンピューティング・ネットワークとして動作する。ネットワーク110は、データ情報、音声情報、およびビデオ情報を含んでいるマルチメディア信号を含むデータ信号、音声信号、またはビデオ信号、あるいはその組合せを受信および送信できる1つまたは複数の有線ネットワークまたはワイヤレス・ネットワークあるいはその両方を含むことができる。一般に、ネットワーク110は、分散データ処理環境100内のサーバ120、ユーザ・コンピューティング・デバイス130、および他のコンピューティング・デバイス(図示されていない)の間の通信をサポートする接続およびプロトコルの任意の組合せであることができる。 Network 110 operates as a computing network, which may be, for example, a telecommunications network, a local area network, a wide area network such as the Internet, or a combination of the three, and may include wired, wireless, or fiber optic connections. Network 110 may include one or more wired and/or wireless networks capable of receiving and transmitting data, audio, and/or video signals, including multimedia signals containing data, audio, and video information. In general, network 110 may be any combination of connections and protocols supporting communication between server 120, user computing devices 130, and other computing devices (not shown) in distributed data processing environment 100.

サーバ120は、ユーザ固有の要約プログラム122を実行し、データをデータベース126に送信するか、または格納するか、あるいはその両方を実行するように動作する。実施形態では、サーバ120は、データをデータベース126からユーザ・コンピューティング・デバイス130に送信することができる。実施形態では、サーバ120は、データベース126内のデータをユーザ・コンピューティング・デバイス130から受信することができる。1つまたは複数の実施形態では、サーバ120は、スタンドアロン・コンピューティング・デバイス、管理サーバ、Webサーバ、モバイル・コンピューティング・デバイス、またはデータを受信、送信、および処理することができる任意の他の電子デバイスもしくはコンピューティング・システムであることができる。1つまたは複数の実施形態では、サーバ120は、クラウド・コンピューティング環境内などの分散データ処理環境100内でアクセスされたときにシームレスなリソースの単一のプールとして機能するクラスタ化されたコンピュータおよびコンポーネント(例えば、データベース・サーバ・コンピュータ、アプリケーション・サーバ・コンピュータなど)を利用する、コンピューティング・システムであることができる。1つまたは複数の実施形態では、サーバ120は、ラップトップ・コンピュータ、タブレット・コンピュータ、ネットブック・コンピュータ、パーソナル・コンピュータ、デスクトップ・コンピュータ、パーソナル・デジタル・アシスタント、スマートフォン、またはネットワーク110を介して分散データ処理環境100内のユーザ・コンピューティング・デバイス130および他のコンピューティング・デバイス(図示されていない)と通信できる任意のプログラム可能な電子デバイスであることができる。サーバ120は、図5さらに詳細に示され、説明されるように、内部および外部のハードウェア・コンポーネントを含んでよい。 The server 120 operates to execute a user-specific summarization program 122 and transmit and/or store data in a database 126. In an embodiment, the server 120 may transmit data from the database 126 to a user computing device 130. In an embodiment, the server 120 may receive data in the database 126 from a user computing device 130. In one or more embodiments, the server 120 may be a standalone computing device, an administrative server, a web server, a mobile computing device, or any other electronic device or computing system capable of receiving, transmitting, and processing data. In one or more embodiments, the server 120 may be a computing system utilizing clustered computers and components (e.g., database server computers, application server computers, etc.) that function as a single pool of seamless resources when accessed within a distributed data processing environment 100, such as within a cloud computing environment. In one or more embodiments, server 120 may be a laptop computer, tablet computer, netbook computer, personal computer, desktop computer, personal digital assistant, smartphone, or any programmable electronic device capable of communicating with user computing devices 130 and other computing devices (not shown) in distributed data processing environment 100 via network 110. Server 120 may include internal and external hardware components, as shown and described in more detail in FIG. 5.

ユーザ固有の要約プログラム122は、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の会議の一部を対象にする、要約を準備するように動作する。 The user-specific summary program 122 operates to prepare a summary tailored to the profile of a user who is away from a conference on the virtual collaboration server tool, covering the portion of the conference while the user was disconnected.

示された実施形態では、ユーザ固有の要約プログラム122は、機械学習コンポーネント124を含む。示された実施形態では、ユーザ固有の要約プログラム122は、スタンドアロン・プログラムである。別の実施形態では、ユーザ固有の要約プログラム122は、仮想会議ソフトウェア・パッケージなどの別のソフトウェア製品に統合されてよい。示された実施形態では、ユーザ固有の要約プログラム122はサーバ120に存在する。他の実施形態では、ユーザ固有の要約プログラム122は、ユーザ固有の要約プログラム122がネットワーク110にアクセスできるということを条件として、ユーザ・コンピューティング・デバイス130または別のコンピューティング・デバイス(図示されていない)に存在してよい。 In the illustrated embodiment, the user-specific summarization program 122 includes a machine learning component 124. In the illustrated embodiment, the user-specific summarization program 122 is a standalone program. In another embodiment, the user-specific summarization program 122 may be integrated into another software product, such as a virtual conferencing software package. In the illustrated embodiment, the user-specific summarization program 122 resides on the server 120. In other embodiments, the user-specific summarization program 122 may reside on the user computing device 130 or another computing device (not shown), provided that the user-specific summarization program 122 has access to the network 110.

実施形態では、ユーザは、ユーザ固有の要約プログラム122にオプトインし、ユーザ固有の要約プログラム122を使用してユーザ・プロフィールを設定する。ユーザ固有の要約プログラム122の設定コンポーネントが、図2に関してさらに詳細に示され、説明される。ユーザ固有の要約プログラム122の動作ステップが、図3に関してさらに詳細に示され、説明される。ユーザ固有の要約プログラム122の機械学習コンポーネント124の動作ステップが、図4に関してさらに詳細に示され、説明される。 In an embodiment, a user opts in to the user-specific summarization program 122 and configures a user profile using the user-specific summarization program 122. The configuration components of the user-specific summarization program 122 are shown and described in further detail with respect to FIG. 2. The operational steps of the user-specific summarization program 122 are shown and described in further detail with respect to FIG. 3. The operational steps of the machine learning component 124 of the user-specific summarization program 122 are shown and described in further detail with respect to FIG. 4.

データベース126は、ユーザ固有の要約プログラム122によって受信されたデータ、使用されたデータ、または生成されたデータ、あるいはその組合せのリポジトリとして動作する。データベースは、データの構造化された集合である。データは、各ユーザの企業プロフィール、ユーザの企業の階層、企業の階層内のユーザの地位、ユーザの企業内のユーザの年功序列、ユーザの主要な仕事、ユーザの主要な仕事の職務、ユーザの技術に関する関心、およびユーザの専門知識に関する設定中にユーザによって入力された情報を含む複数のユーザ・プロフィール、仮想コラボレーション・サーバ・ツール上の現在の会議からのデータ、またはユーザがホストしたか、参加したか、または出席した仮想コラボレーション・サーバ・ツール上の以前の会議からのデータ、あるいはその両方(すなわち、音声フレーム、ビデオ・フレーム、または音声およびビデオ・フレーム)、ユーザの嗜好、警告通知の嗜好、ならびにユーザ固有の要約プログラム122によって受信されたか、使用されたか、または生成されたか、あるいはその組合せである任意の他のデータを含むが、これらに限定されない。 The database 126 acts as a repository of data received, used, and/or generated by the user-specific summarization program 122. The database is a structured collection of data. The data includes, but is not limited to, a plurality of user profiles including information entered by the user during setup regarding each user's company profile, the user's company hierarchy, the user's position within the company hierarchy, the user's seniority within the user's company, the user's primary job, the user's primary job function, the user's technology interests, and the user's expertise; data from a current meeting on the virtual collaboration server tool and/or data from previous meetings on the virtual collaboration server tool that the user hosted, participated in, or attended; user preferences; alert notification preferences; and any other data received, used, and/or generated by the user-specific summarization program 122.

データベース126は、ハード・ディスク・ドライブ、データベース・サーバ、またはフラッシュ・メモリなどの、サーバ120によってアクセスされて利用され得るデータおよび構成ファイルを格納できる任意の種類のデバイスを使用して実装され得る。実施形態では、データベース126は、データを格納するか、またはデータにアクセスするか、あるいはその両方のために、ユーザ固有の要約プログラム122によってアクセスされる。示された実施形態では、データベース126はサーバ120に存在する。別の実施形態では、データベース126は、ユーザ固有の要約プログラム122がデータベース126にアクセスできるということを条件として、別のコンピューティング・デバイス、サーバ、クラウド・サーバに存在するか、または分散データ処理環境100内のどこかの複数のデバイス(図示されていない)にわたって分散されてよい。 Database 126 may be implemented using any type of device capable of storing data and configuration files that can be accessed and utilized by server 120, such as a hard disk drive, database server, or flash memory. In an embodiment, database 126 is accessed by user-specific summary program 122 to store data, access data, or both. In the illustrated embodiment, database 126 resides on server 120. In another embodiment, database 126 may reside on another computing device, server, cloud server, or be distributed across multiple devices (not shown) anywhere in distributed data processing environment 100, provided that user-specific summary program 122 has access to database 126.

本発明は、ユーザが処理されないことを望む個人または企業の機密あるいはその両方のデータ、コンテンツ、または情報を含み得る、データベース126などの、さまざまなアクセス可能なデータ・ソースを含んでよい。処理とは、任意の自動化されたか、または自動化されない動作、あるいは一連の動作のことを指し、そのような動作としては、個人データまたは企業機密データあるいはその両方の収集、記録、編成、構造化、格納、適応、変更、検索、参照、使用、送信、配布、または他の方法で使用可能にすることによる開示、結合、制限、消去、あるいは破壊などがある。ユーザ固有の要約プログラム122は、個人データの許可された安全な処理を可能にする。データベース126内のデータのすべての格納は、現地法および取得された適切な許可に従って実行されなければならない。 The present invention may involve a variety of accessible data sources, such as database 126, which may contain personal and/or business-sensitive data, content, or information that a user desires not to be processed. Processing refers to any automated or non-automated action or set of actions, such as collecting, recording, organizing, structuring, storing, adapting, altering, retrieving, consulting, using, disclosing by transmitting, disseminating, or otherwise making available, combining, restricting, erasing, or destroying personal and/or business-sensitive data. The user-specific abstraction program 122 enables authorized and secure processing of personal data. All storage of data in database 126 must be performed in accordance with local law and any appropriate authorizations obtained.

ユーザ固有の要約プログラム122は、個人データまたは企業機密データあるいはその両方の収集の通知と共に、情報に基づく同意(informed consent)を提供し、ユーザが、個人データまたは企業機密データあるいはその両方を処理することをオプトインまたはオプトアウトできるようにする。同意は、複数の形態をとることができる。オプトインの同意は、個人データまたは企業機密データあるいはその両方が処理される前に、積極的行動(affirmative action)を取ることをユーザに強制することができる。代替として、オプトアウトの同意は、個人データまたは企業機密データあるいはその両方が処理される前に、個人データまたは企業機密データあるいはその両方の処理を防ぐための積極的行動を取ることをユーザに強制することができる。ユーザ固有の要約プログラム122は、個人データまたは企業機密データあるいはその両方および処理の性質(例えば、種類、範囲、目的、持続時間など)に関する情報を提供する。ユーザ固有の要約プログラム122は、格納された個人データまたは企業機密データあるいはその両方のコピーをユーザに提供する。ユーザ固有の要約プログラム122は、正しくないか、または不完全な個人データまたは企業機密データあるいはその両方の修正または完成を可能にする。ユーザ固有の要約プログラム122は、個人データまたは企業機密データあるいはその両方の即時の削除を可能にする。 The user-specific summary program 122 provides informed consent along with notice of the collection of personal data and/or confidential business data, allowing the user to opt in or out of processing the personal data and/or confidential business data. Consent can take multiple forms. Opt-in consent can force the user to take affirmative action before the personal data and/or confidential business data are processed. Alternatively, opt-out consent can force the user to take affirmative action to prevent the processing of the personal data and/or confidential business data before the personal data and/or confidential business data are processed. The user-specific summary program 122 provides information about the personal data and/or confidential business data and the nature of the processing (e.g., type, scope, purpose, duration, etc.). The user-specific summary program 122 provides the user with a copy of the stored personal data and/or confidential business data. The user-specific summarization program 122 allows for the correction or completion of incorrect or incomplete personal data and/or confidential business data. The user-specific summarization program 122 allows for the immediate deletion of personal data and/or confidential business data.

ユーザ・コンピューティング・デバイス130は、ユーザ・インターフェイス132を実行するように動作し、ユーザに関連付けられる。実施形態では、ユーザ・コンピューティング・デバイス130は、ラップトップ・コンピュータ、タブレット・コンピュータ、ネットブック・コンピュータ、パーソナル・コンピュータ、デスクトップ・コンピュータ、スマートフォン、またはユーザ・インターフェイス132を実行し、ネットワーク110を介してユーザ固有の要約プログラム122と通信する(すなわち、データを送信し、データを受信する)ことができる任意のプログラム可能な電子デバイスなどの、電子デバイスであってよい。示された実施形態では、ユーザ・コンピューティング・デバイス130は、ユーザ・インターフェイス132のインスタンスを含む。図5でさらに詳細に説明されるように、ユーザ・コンピューティング・デバイス130はコンポーネントを含んでよい。 The user computing device 130 operates to execute the user interface 132 and is associated with a user. In an embodiment, the user computing device 130 may be an electronic device such as a laptop computer, a tablet computer, a netbook computer, a personal computer, a desktop computer, a smartphone, or any programmable electronic device capable of executing the user interface 132 and communicating (i.e., sending data to and receiving data from) the user-specific summary program 122 over the network 110. In the illustrated embodiment, the user computing device 130 includes an instance of the user interface 132. The user computing device 130 may include components as described in further detail in FIG. 5.

ユーザ・インターフェイス132は、サーバ120上のユーザ固有の要約プログラム122とユーザ・コンピューティング・デバイス130のユーザの間のローカル・ユーザ・インターフェイスとして動作する。一部の実施形態では、ユーザ・インターフェイス132は、グラフィカル・ユーザ・インターフェイス(GUI:graphical user interface)、Webユーザ・インターフェイス(WUI:web user interface)、または音声ユーザ・インターフェイス(VUI:voice user interface)、あるいはその組合せであり、ネットワーク110を介してユーザ固有の要約プログラム122からユーザに送信されたテキスト、文書、Webブラウザのウィンドウ、ユーザの選択肢、アプリケーション・インターフェイス、および動作のための命令を、表示する(すなわち、視覚的に表示する)か、または提示する(すなわち、聞こえるように提示する)ことができる。ユーザ・インターフェイス132は、ネットワーク110を介してユーザ固有の要約プログラム122からユーザに送信された情報(例えば、グラフィックス、テキスト、または音、あるいはその組合せ)を含んでいる警告通知を表示または提示することもできる。実施形態では、ユーザ・インターフェイス132は、データを送信および受信する(すなわち、ネットワーク110を介してユーザ固有の要約プログラム122との間でそれぞれ送信および受信する)ことができる。 The user interface 132 acts as a local user interface between the user-specific summary program 122 on the server 120 and the user of the user computing device 130. In some embodiments, the user interface 132 is a graphical user interface (GUI), a web user interface (WUI), or a voice user interface (VUI), or a combination thereof, and can display (i.e., visually display) or present (i.e., audibly present) text, documents, web browser windows, user options, application interfaces, and instructions for operation sent to the user from the user-specific summary program 122 over the network 110. The user interface 132 can also display or present alert notifications containing information (e.g., graphics, text, and/or sound) sent to the user from the user-specific summary program 122 over the network 110. In an embodiment, the user interface 132 is capable of transmitting and receiving data (i.e., to and from, respectively, the user-specific summary program 122 over the network 110).

ユーザ・インターフェイス132を介して、ユーザはユーザ固有の要約プログラム122にオプトインし、ユーザ・プロフィールを作成し、各ユーザの企業プロフィール、ユーザの企業の階層、企業の階層内のユーザの地位、ユーザの企業内のユーザの年功序列、ユーザの主要な仕事、ユーザの主要な仕事の職務、ユーザの技術に関する関心、およびユーザの専門知識に関する情報を入力し、ユーザの嗜好および警告通知の嗜好を設定することができる。 Through the user interface 132, users can opt in to the user-specific summary program 122, create a user profile, enter information about each user's company profile, the user's company hierarchy, the user's position within the company hierarchy, the user's seniority within the user's company, the user's primary job, the user's primary job function, the user's technology interests, and the user's expertise, and set user preferences and alert notification preferences.

ユーザの嗜好は、特定のユーザ用にカスタマイズされ得る設定である。デフォルトのユーザの嗜好のセットは、ユーザ固有の要約プログラム122の各ユーザに割り当てられる。デフォルトのユーザの嗜好を変更するように値を更新するために、ユーザ嗜好エディタ(user preference editor)が使用され得る。カスタマイズされ得るユーザの嗜好は、一般的なユーザ・システム設定、ユーザ固有の要約プログラム122に関する特定のユーザ・プロフィール設定、警告通知設定、および機械学習されるデータの収集/格納設定を含むが、これらに限定されない。機械学習されるデータは、ユーザ固有の要約プログラム122の反復の過去の結果、およびユーザ固有の要約プログラム122によって送信された警告通知に対するユーザの以前の応答に関するデータを含むが、これらに限定されない。機械学習されるデータは、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが離れていた間の会議の一部を対象にする、要約を準備する方法、および会議に再び参加する前に要約をレビューするようユーザに促すかどうかを自己学習する、ユーザ固有の要約プログラム122から来る。ユーザ固有の要約プログラム122は、ユーザの活動を追跡することによって自己学習し、ユーザ固有の要約プログラム122の各反復と共に改善する。 User preferences are settings that can be customized for a particular user. A set of default user preferences is assigned to each user of the user-specific summarization program 122. A user preference editor can be used to update values to change the default user preferences. User preferences that can be customized include, but are not limited to, general user system settings, specific user profile settings for the user-specific summarization program 122, alert notification settings, and machine-learned data collection/storage settings. Machine-learned data includes, but is not limited to, past results of iterations of the user-specific summarization program 122 and data regarding the user's previous responses to alert notifications sent by the user-specific summarization program 122. The machine-learned data comes from the user-specific summarization program 122, which is tailored to the user's profile when away from a meeting on the virtual collaboration server tool, self-learns how to prepare a summary covering the portion of the meeting while the user was away, and whether to prompt the user to review the summary before rejoining the meeting. The user-specific summarization program 122 self-learns by tracking the user's activity and improves with each iteration of the user-specific summarization program 122.

図2は、本発明の実施形態に従って、図1の分散データ処理環境100内のユーザ固有の要約プログラム122の設定コンポーネントの動作ステップを示す、概して200と指定されたフローチャートである。実施形態では、ユーザ固有の要約プログラム122は、仮想コラボレーション・サーバ・ツール上の会議をホストするか、会議に参加するか、または会議に出席するユーザとの1回限りの設定を完了する。1回限りの設定は、ユーザ固有の要約プログラム122がユーザに関する関連情報を捕捉してユーザ・プロフィールを作成することを可能にする。実施形態では、ユーザ固有の要約プログラム122は、オプトインするための要求をユーザから受信する。実施形態では、ユーザ固有の要約プログラム122はユーザに対して情報を要求する。実施形態では、ユーザ固有の要約プログラム122は、要求された情報をユーザから受信する。実施形態では、ユーザ固有の要約プログラム122はユーザ・プロフィールを作成する。実施形態では、ユーザ固有の要約プログラム122はユーザ・プロフィールを格納する。図2に示されたプロセスがユーザ固有の要約プログラム122の1つの可能な反復を示しているということが理解されるべきであり、このプロセスは、ユーザ固有の要約プログラム122によって受信されたオプトイン要求ごとに繰り返されてよい。 2 is a flowchart generally designated 200 illustrating operational steps of a setup component of a user-specific summary program 122 in the distributed data processing environment 100 of FIG. 1 in accordance with an embodiment of the present invention. In an embodiment, the user-specific summary program 122 completes a one-time setup with a user who will host, participate in, or attend a conference on the virtual collaboration server tool. The one-time setup enables the user-specific summary program 122 to capture relevant information about the user to create a user profile. In an embodiment, the user-specific summary program 122 receives a request to opt in from the user. In an embodiment, the user-specific summary program 122 requests information from the user. In an embodiment, the user-specific summary program 122 receives the requested information from the user. In an embodiment, the user-specific summary program 122 creates a user profile. In an embodiment, the user-specific summary program 122 stores the user profile. It should be understood that the process illustrated in FIG. 2 represents one possible iteration of the user-specific summary program 122, and that this process may be repeated for each opt-in request received by the user-specific summary program 122.

ステップ210で、ユーザ固有の要約プログラム122は、オプトインするための要求をユーザから受信する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ固有の要約プログラム122にオプトインするための要求をユーザから受信する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介して、ユーザ固有の要約プログラム122にオプトインするための要求をユーザから受信する。ユーザは、オプトインすることによって、データベース126とデータを共有することに同意する。 At step 210, the user-specific summary program 122 receives a request to opt in from the user. In an embodiment, the user-specific summary program 122 receives a request from the user to opt in to the user-specific summary program 122. In an embodiment, the user-specific summary program 122 receives a request from the user to opt in to the user-specific summary program 122 via the user interface 132 of the user computing device 130. By opting in, the user agrees to share their data with the database 126.

ステップ220で、ユーザ固有の要約プログラム122はユーザに対して情報を要求する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介してユーザに対して情報を要求する。ユーザから要求される情報は、ユーザの嗜好に関する情報(例えば、ユーザ・コンピューティング・デバイス130に関する警告通知などの一般的なユーザ・システム設定)、警告通知の嗜好に関する情報(例えば、ユーザが離れていた会議に再接続するときに警告通知が送信される、または、ユーザが離れていた会議が完了するときに警告通知が送信される)、およびユーザ・プロフィールを作成するために必要な情報(例えば、各ユーザの企業プロフィール、ユーザの企業の階層、企業の階層内のユーザの地位、ユーザの企業内のユーザの年功序列、ユーザの主要な仕事、ユーザの主要な仕事の職務、ユーザの技術に関する関心、およびユーザの専門知識に関する情報)を含むが、これらに限定されない。実施形態では、ユーザ固有の要約プログラム122がオプトインするための要求をユーザから受信することに応答して、ユーザ固有の要約プログラム122はユーザに対して情報を要求する。 In step 220, the user-specific summarization program 122 requests information from the user. In an embodiment, the user-specific summarization program 122 requests information from the user via the user interface 132 of the user computing device 130. The information requested from the user includes, but is not limited to, information about the user's preferences (e.g., general user system settings, such as alert notifications, for the user computing device 130), information about alert notification preferences (e.g., alert notifications are sent when the user reconnects to a conference they left or alert notifications are sent when a conference they left completes), and information necessary to create a user profile (e.g., information about each user's company profile, the user's company hierarchy, the user's position within the company hierarchy, the user's seniority within the user's company, the user's primary job, the user's primary job function, the user's technology interests, and the user's expertise). In an embodiment, in response to the user-specific summarization program 122 receiving a request to opt in from the user, the user-specific summarization program 122 requests information from the user.

ステップ230で、ユーザ固有の要約プログラム122は、要求された情報をユーザから受信する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介して、要求された情報をユーザから受信する。実施形態では、ユーザ固有の要約プログラム122がユーザに対して情報を要求することに応答して、ユーザ固有の要約プログラム122は要求された情報をユーザから受信する。 In step 230, the user-specific summary program 122 receives the requested information from the user. In an embodiment, the user-specific summary program 122 receives the requested information from the user via the user interface 132 of the user computing device 130. In an embodiment, the user-specific summary program 122 receives the requested information from the user in response to the user-specific summary program 122 requesting information from the user.

ステップ240で、ユーザ固有の要約プログラム122はユーザ・プロフィールを作成する。実施形態では、ユーザ固有の要約プログラム122はユーザのユーザ・プロフィールを作成する。実施形態では、ユーザ固有の要約プログラム122は、ユーザに関する設定の間にユーザによって入力された情報に加えて、ユーザの嗜好およびユーザの警告通知の嗜好を含むユーザ・プロフィールを作成する。実施形態では、ユーザ固有の要約プログラム122が要求された情報をユーザから受信することに応答して、ユーザ固有の要約プログラム122はユーザ・プロフィールを作成する。 In step 240, the user-specific summary program 122 creates a user profile. In an embodiment, the user-specific summary program 122 creates a user profile for the user. In an embodiment, the user-specific summary program 122 creates a user profile that includes the user's preferences and the user's alert notification preferences in addition to information entered by the user during setup for the user. In an embodiment, in response to the user-specific summary program 122 receiving the requested information from the user, the user-specific summary program 122 creates the user profile.

ステップ250で、ユーザ固有の要約プログラム122はユーザ・プロフィールを格納する。実施形態では、ユーザ固有の要約プログラム122はユーザ・プロフィールをデータベース(例えば、データベース126)に格納する。実施形態では、ユーザ固有の要約プログラム122がユーザ・プロフィールを作成することに応答して、ユーザ固有の要約プログラム122はユーザ・プロフィールを格納する。 In step 250, the user-specific summary program 122 stores the user profile. In an embodiment, the user-specific summary program 122 stores the user profile in a database (e.g., database 126). In an embodiment, in response to the user-specific summary program 122 creating the user profile, the user-specific summary program 122 stores the user profile.

図3は、本発明の実施形態に従って、図1の分散データ処理環境100内のユーザ固有の要約プログラム122の動作ステップを示す、概して300と指定されたフローチャートである。実施形態では、ユーザ固有の要約プログラム122は、ユーザが仮想コラボレーション・サーバ・ツール上の会議から離れたときを検出することと、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の会議の一部を対象にする、要約を準備することと、ユーザが会議に再接続するときにユーザに要約を提供することと、未来の反復でより調整された要約を準備することにおいてユーザ固有の要約プログラム122を支援するために、ユーザからフィードバックを収集することとを実行するように動作する。図3に示されたプロセスがプロセス・フローの1つの可能な反復を示しているということが理解されるべきであり、このプロセスは、ユーザが仮想コラボレーション・サーバ・ツール上でホストするか、参加するか、または出席する会議ごとに繰り返され得る。 FIG. 3 is a flowchart generally designated 300 illustrating operational steps of the user-specific summarization program 122 in the distributed data processing environment 100 of FIG. 1 in accordance with an embodiment of the present invention. In an embodiment, the user-specific summarization program 122 operates to detect when a user disconnects from a conference on the virtual collaboration server tool, prepare a summary tailored to the user's profile while disconnected from the conference on the virtual collaboration server tool and covering the portion of the conference while the user was disconnected, provide the summary to the user when the user reconnects to the conference, and collect feedback from the user to assist the user-specific summarization program 122 in preparing more tailored summaries in future iterations. It should be understood that the process depicted in FIG. 3 illustrates one possible iteration of the process flow, and this process may be repeated for each conference the user hosts, participates in, or attends on the virtual collaboration server tool.

ステップ305で、ユーザ固有の要約プログラム122は、ユーザが仮想コラボレーション・サーバ・ツール(例えば、Cisco Webex(R)、Zoom(R)、Google Meet(R)、Microsoft(R)Teamsなど)上の会議から離れたときを検出する。実施形態では、ユーザ固有の要約プログラム122は、ユーザが、1人または複数のホストおよび2人以上の参加者が存在する仮想コラボレーション・サーバ・ツール上の会議から離れたときを検出する。実施形態では、ユーザ固有の要約プログラム122は、ユーザが、ホストまたは参加者あるいはその両方が1つまたは複数のプレゼンテーション・ツール(例えば、Microsoft(R)PowerPointスライド、Microsoft(R)Excelファイル、スプレッドシート、Webページ、ダイアグラム、フローチャートなど)を利用している仮想コラボレーション・サーバ・ツール上の会議から離れたときを検出する。 In step 305, the user-specific summarizing program 122 detects when the user leaves a conference on a virtual collaboration server tool (e.g., Cisco Webex®, Zoom®, Google Meet®, Microsoft® Teams, etc.). In an embodiment, the user-specific summarizing program 122 detects when the user leaves a conference on a virtual collaboration server tool in which one or more hosts and two or more participants are present. In an embodiment, the user-specific summarizing program 122 detects when the user leaves a conference on a virtual collaboration server tool in which the host and/or participants are utilizing one or more presentation tools (e.g., Microsoft® PowerPoint slides, Microsoft® Excel files, spreadsheets, web pages, diagrams, flowcharts, etc.).

実施形態では、ユーザ固有の要約プログラム122は、ユーザによって開始されたユーザの明示的な離脱(例えば、ユーザが状態を不在に変更する、ユーザが会議からサインアウトするなど)を検出する。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、技術的問題(例えば、ネットワーク接続の問題、デバイスの故障、停電など)によって引き起こされたユーザの暗黙的な離脱を検出する。 In an embodiment, the user-specific summary program 122 detects explicit user departures initiated by the user (e.g., the user changes their status to Away, the user signs out of the meeting, etc.). In one or more embodiments, the user-specific summary program 122 detects implicit user departures caused by technical issues (e.g., network connection issues, device failure, power outage, etc.).

第1の例では、コンピュータ科学の学生であるユーザAが、仮想コラボレーション・サーバ・ツール上のユーザAのオンライン仮想クラスに出席する。ある日、クラスに出席している間に、ユーザAはネットワーク接続の問題を経験する。ユーザAが経験するネットワーク接続の問題のため、ユーザAは、ユーザAのオンライン仮想クラスから切断される。ユーザ固有の要約プログラム122は、ユーザAのオンライン仮想クラスからのユーザAの暗黙的な離脱を検出する。 In a first example, User A, a computer science student, attends User A's online virtual class on a virtual collaboration server tool. One day, while attending class, User A experiences network connection problems. Due to the network connection problems experienced by User A, User A is disconnected from User A's online virtual class. The user-specific summary program 122 detects User A's implicit withdrawal from User A's online virtual class.

第2の例では、技術企業の従業員であるユーザBが、自宅から作業する。ユーザBは、仮想コラボレーション・サーバ・ツール上でユーザBのチームと頻繁にチーム会議を開く。ユーザBのチーム会議のうちの1つの間に、ユーザBは、個人的な緊急事態に対処するためにチーム会議との接続を切る。ユーザ固有の要約プログラム122は、ユーザBのチーム会議からのユーザBの明示的な離脱を検出する。 In a second example, User B, an employee of a technology company, works from home. User B frequently holds team meetings with User B's team on a virtual collaboration server tool. During one of User B's team meetings, User B disconnects from the team meeting to attend to a personal emergency. The user-specific summary program 122 detects User B's explicit withdrawal from User B's team meeting.

第3の例では、都市Xの納税者であるユーザCが、仮想コラボレーション・サーバ・ツール上の都市Xのオンライン市議会に出席する。ユーザCが出席していた都市Xのオンライン市議会のうちの1つの間に、ユーザCは、休憩するために会議との接続を切る。ユーザ固有の要約プログラム122は、都市Xのオンライン市議会からのユーザCの明示的な離脱を検出する。 In a third example, User C, a taxpayer for City X, attends City X's online city council meetings on the virtual collaboration server tool. During one of the City X online city council meetings that User C is attending, User C disconnects from the meeting to take a break. The user-specific summary program 122 detects User C's explicit departure from City X's online city council meeting.

実施形態では、ユーザ固有の要約プログラム122は、ユーザが、10分より長いが30分より短い事前設定された期間の間、仮想コラボレーション・サーバ・ツール上の会議から離れたときを検出する。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、ユーザが、事前にスケジュールされた会議の割り当てられた合計時間の事前設定された割合の間、仮想コラボレーション・サーバ・ツール上の会議から離れたとき(例えば、ユーザが、事前にスケジュールされた会議の割り当てられた合計時間(例えば、60分)の10パーセント~25パーセント(例えば、6~15分)の間、離れた)かを検出する。 In an embodiment, the user-specific summary program 122 detects when a user has been away from a meeting on the virtual collaboration server tool for a preset period of time greater than 10 minutes but less than 30 minutes. In one or more embodiments, the user-specific summary program 122 detects when a user has been away from a meeting on the virtual collaboration server tool for a preset percentage of the pre-scheduled meeting's total allotted time (e.g., the user has been away for 10 to 25 percent (e.g., 6 to 15 minutes) of the pre-scheduled meeting's total allotted time (e.g., 60 minutes)).

実施形態では、ユーザ固有の要約プログラム122は、仮想コラボレーション・サーバ・ツール上の会議の開始時間を捕捉する。実施形態では、ユーザ固有の要約プログラム122は、ユーザの離脱の開始時間(すなわち、ユーザが明示的または暗黙的に切断したときの会議中の時間)を捕捉する。 In an embodiment, the user-specific summary program 122 captures the start time of a conference on the virtual collaboration server tool. In an embodiment, the user-specific summary program 122 captures the start time of the user's departure (i.e., the time during the conference when the user explicitly or implicitly disconnects).

ステップ310で、ユーザ固有の要約プログラム122はデータを取り出す。実施形態では、ユーザ固有の要約プログラム122は、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の会議の一部を対象にする要約を準備する目的で、データを取り出す。 In step 310, the user-specific summarization program 122 retrieves the data. In an embodiment, the user-specific summarization program 122 retrieves the data for the purpose of preparing a summary tailored to the profile of the user away from the conference on the virtual collaboration server tool, covering the portion of the conference while the user was disconnected.

実施形態では、ユーザ固有の要約プログラム122は、ユーザに関するデータを取り出す。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、会議の他の参加者に関するデータを取り出す。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、ユーザと会議の他の参加者の間の接続に関するデータを取り出す。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、参加者の特定の呼び出し、参加者によって尋ねられた質問、および参加者によって尋ねられた質問に対して提供された回答を含む、参加者間の対話に関するデータを取り出す。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、会議のトピックに関するデータを取り出す。 In embodiments, the user-specific summarization program 122 retrieves data about the user. In one or more embodiments, the user-specific summarization program 122 retrieves data about other participants in the conference. In one or more embodiments, the user-specific summarization program 122 retrieves data about connections between the user and other participants in the conference. In one or more embodiments, the user-specific summarization program 122 retrieves data about interactions between participants, including specific calls of participants, questions asked by participants, and answers provided to questions asked by participants. In one or more embodiments, the user-specific summarization program 122 retrieves data about the topic of the conference.

実施形態では、ユーザ固有の要約プログラム122は、ステップ240で作成されたユーザ・プロフィール、ユーザの企業プロフィール、ユーザのカレンダー、他の参加者のユーザ・プロフィール、他の参加者の企業プロフィール、他の参加者のカレンダー、ホストまたは参加者あるいはその両方によって使用される1つまたは複数のプレゼンテーション・ツール(例えば、Microsoft(R)PowerPointスライド、Microsoft(R)Excelファイル、スプレッドシート、Webページ、ダイアグラム、フローチャートなど)、およびユーザがホストしたか、参加したか、または出席した以前の会議からデータベース(例えば、データベース126)に格納されたデータを含むが、これらに限定されないソースから、データを取り出す。データを取り出すユーザ固有の要約プログラム122の例は、本明細書では個別の方法を使用して説明されるが、ユーザ固有の要約プログラム122が上記の実施形態の1つまたは複数の組合せを介してデータを取り出してよいということに、注意するべきである。実施形態では、ユーザ固有の要約プログラム122が、ユーザが仮想コラボレーション・サーバ・ツール上の会議から離れたときを検出することに応答して、ユーザ固有の要約プログラム122はデータを取り出す。 In an embodiment, the user-specific summarization program 122 retrieves data from sources including, but not limited to, the user profile created in step 240, the user's company profile, the user's calendar, other participants' user profiles, other participants' company profiles, other participants' calendars, one or more presentation tools (e.g., Microsoft® PowerPoint slides, Microsoft® Excel files, spreadsheets, web pages, diagrams, flowcharts, etc.) used by the host and/or participants, and data stored in a database (e.g., database 126) from previous meetings hosted, participated in, or attended by the user. While examples of the user-specific summarization program 122 retrieving data are described herein using individual methods, it should be noted that the user-specific summarization program 122 may retrieve data via one or more combinations of the above embodiments. In an embodiment, the user-specific summarization program 122 retrieves data in response to the user-specific summarization program 122 detecting when the user has left the meeting on the virtual collaboration server tool.

ステップ315で、ユーザ固有の要約プログラム122は要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の会議の一部を対象にする要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、(1)マージおよび(2)抽出テキスト要約アルゴリズムを使用する音声テキスト要約の概念を適用することによって、要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、ユーザの離脱を検出した後に、本発明の実施形態は、(1)マージおよび(2)抽出テキスト要約アルゴリズムを使用する音声テキスト要約の概念を、ユーザが切り離されていた間の会議の一部から抽出された音声フレームまたはビデオ・フレームあるいはその両方に適用することによって、要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、(1)マージおよび(2)抽出テキスト要約アルゴリズムを使用する音声テキスト要約の概念を、ホストまたは参加者あるいはその両方によって使用される1つまたは複数のプレゼンテーション・ツール(例えば、Microsoft(R)PowerPointスライド、Microsoft(R)Excelファイル、スプレッドシート、Webページ、ダイアグラム、フローチャートなど)に適用することによって、要約を準備する。 In step 315, the user-specific summarization program 122 prepares a summary. In an embodiment, the user-specific summarization program 122 prepares a summary tailored to the profile of the user who is away from the conference on the virtual collaboration server tool, covering the portion of the conference while the user was disconnected. In an embodiment, the user-specific summarization program 122 prepares the summary by applying concepts of speech-to-text summarization using (1) merging and (2) extracting text summarization algorithms. In an embodiment, after the user-specific summarization program 122 detects the user's departure, an embodiment of the present invention prepares the summary by applying concepts of speech-to-text summarization using (1) merging and (2) extracting text summarization algorithms to audio frames and/or video frames extracted from the portion of the conference while the user was disconnected. In an embodiment, the user-specific summarization program 122 prepares the summary by applying the concepts of speech-to-text summarization using (1) merging and (2) extractive text summarization algorithms to one or more presentation tools (e.g., Microsoft® PowerPoint slides, Microsoft® Excel files, spreadsheets, web pages, diagrams, flowcharts, etc.) used by the host and/or participants.

抽出テキスト要約アルゴリズムは、重要な文および他の際立った情報を特定の音声、ビデオ、またはテキスト・ファイル、あるいはその組合せから識別して抽出することによって適用される。テキスト・ファイルから抽出された文に重みが割り当てられ、文の特定の重みに基づいて文がランク付けされる。高くランク付けされた文が一緒にグループ化されて、簡潔な要約を形成する。別の方法で表すと、抽出テキスト要約アルゴリズムは、テキストの重要なセクションを識別して逐語的に生成し、元のテキストから文のサブセットを要約として生成することによって、適用される。 Extractive text summarization algorithms are applied by identifying and extracting important sentences and other salient information from a particular audio, video, or text file, or a combination thereof. Weights are assigned to the sentences extracted from the text file, and the sentences are ranked based on their particular weight. Highly ranked sentences are grouped together to form a concise summary. Stated another way, extractive text summarization algorithms are applied by identifying and generating verbatim important sections of text, and generating a subset of sentences from the original text as a summary.

ステップ315は、図4のフローチャート400に関してさらに詳細に説明される。実施形態では、ユーザ固有の要約プログラム122がデータを取り出すことに応答して、ユーザ固有の要約プログラム122は要約を準備する。 Step 315 is described in further detail with respect to flowchart 400 of FIG. 4. In an embodiment, in response to the user-specific summary program 122 retrieving the data, the user-specific summary program 122 prepares a summary.

ステップ320で、ユーザ固有の要約プログラム122は、ユーザが仮想コラボレーション・サーバ・ツール上の会議に再接続するとき検出する。実施形態では、ユーザ固有の要約プログラム122は、ユーザの再関与時間(すなわち、ユーザが再接続したときの会議中の時間)を捕捉する。実施形態では、ユーザ固有の要約プログラム122は、ユーザの離脱期間の全持続時間(すなわち、ユーザが会議から切り離されていた時間の全持続時間)を計算する。ユーザ固有の要約プログラム122が、ユーザの離脱期間の全持続時間が、事前設定された期間、または事前にスケジュールされた会議の割り当てられた合計時間の事前設定された割合より長いということを決定した場合、ユーザ固有の要約プログラム122は要約をユーザに出力しない。実施形態では、ユーザ固有の要約プログラム122が要約を準備することに応答して、ユーザ固有の要約プログラム122は、ユーザが仮想コラボレーション・サーバ・ツール上の会議に再接続するとき検出する。 In step 320, the user-specific summary program 122 detects when the user reconnects to the conference on the virtual collaboration server tool. In an embodiment, the user-specific summary program 122 captures the user's re-engagement time (i.e., the time during the conference when the user reconnects). In an embodiment, the user-specific summary program 122 calculates the total duration of the user's disengagement period (i.e., the total duration of time the user was disconnected from the conference). If the user-specific summary program 122 determines that the total duration of the user's disengagement period is longer than a preset period or a preset percentage of the pre-scheduled conference's total allotted time, the user-specific summary program 122 does not output a summary to the user. In an embodiment, in response to the user-specific summary program 122 preparing a summary, the user-specific summary program 122 detects when the user reconnects to the conference on the virtual collaboration server tool.

第1の例では、ユーザAは、ユーザAのネットワーク接続の問題を解決した後に、切断から10分以内にユーザAのオンライン仮想クラスに再接続する。ユーザ固有の要約プログラム122は、再接続しているユーザAを検出し、ユーザAの再関与時間を捕捉し、ユーザAのオンライン仮想クラスからのユーザAの離脱期間の全持続時間を、10分であると計算する。 In a first example, User A reconnects to User A's online virtual class within 10 minutes of disconnection after resolving User A's network connection issues. The user-specific summary program 122 detects User A reconnecting, captures User A's re-engagement time, and calculates the total duration of User A's disengagement period from User A's online virtual class to be 10 minutes.

第2の例では、ユーザBは、ユーザBの個人的な緊急事態に対処した後に、切断から15分以内にユーザBのチーム会議に再接続する。ユーザ固有の要約プログラム122は、再接続しているユーザBを検出し、ユーザBの再関与時間を捕捉し、ユーザBのチーム会議からのユーザBの離脱期間の全持続時間を、15分であると計算する。 In a second example, User B reconnects to User B's team conference within 15 minutes of disconnection after attending to User B's personal emergency. The user-specific summary program 122 detects User B reconnecting, captures User B's re-engagement time, and calculates the total duration of User B's withdrawal period from User B's team conference to be 15 minutes.

第3の例では、ユーザCは、休憩した後に、切断から10分以内に都市Xのオンライン市議会に再接続する。ユーザ固有の要約プログラム122は、再接続しているユーザCを検出し、ユーザCの再関与時間を捕捉し、都市Xのオンライン市議会からのユーザCの離脱の全持続時間を、10分であると計算する。 In a third example, User C takes a break and then reconnects to City X's online city council within 10 minutes of disconnection. The user-specific summary program 122 detects User C reconnecting, captures User C's re-engagement time, and calculates the total duration of User C's withdrawal from City X's online city council to be 10 minutes.

判定325で、ユーザ固有の要約プログラム122は、ユーザが会議に再び参加する前に要約をレビューするかどうかを判定する。実施形態では、ユーザ固有の要約プログラム122は、ステップ220でユーザが設定したユーザの嗜好に基づいて、ユーザが会議に再び参加する前に要約をレビューするかどうかを判定する。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、ユーザの決定に基づいて、ユーザが会議に再び参加する前に要約をレビューするかどうかを判定する。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、機械駆動の推奨に基づいて、ユーザが会議に再び参加する前に要約をレビューするかどうかを判定する。例えば、再び参加する前に、ユーザの離脱期間中にユーザが聞きもらした情報は、再び参加する前に知る必要があるため、ユーザ固有の要約プログラム122は、ユーザが再び参加する前に要約を読むことを推奨する。ユーザが会議に再び参加する前に要約をレビューするかどうかを判定するユーザ固有の要約プログラム122の例は、本明細書では個別の方法を使用して説明されるが、ユーザ固有の要約プログラム122が上記の実施形態の1つまたは複数の組合せを介してユーザが会議に再び参加する前に要約をレビューするかどうかを判定してよいということに、注意するべきである。実施形態では、ユーザ固有の要約プログラム122が、ユーザが仮想コラボレーション・サーバ・ツール上の会議に再接続するとき検出することに応答して、ユーザ固有の要約プログラム122は、ユーザが会議に再び参加する前に要約をレビューするかどうかを判定する。 At decision 325, the user-specific summarizing program 122 determines whether the user will review the summary before rejoining the conference. In embodiments, the user-specific summarizing program 122 determines whether the user will review the summary before rejoining the conference based on the user preferences set by the user in step 220. In one or more embodiments, the user-specific summarizing program 122 determines whether the user will review the summary before rejoining the conference based on a user decision. In one or more embodiments, the user-specific summarizing program 122 determines whether the user will review the summary before rejoining the conference based on a machine-driven recommendation. For example, the user-specific summarizing program 122 recommends that the user read the summary before rejoining because any information the user missed during the user's absence needs to be known before rejoining. Although examples of the user-specific summarizing program 122 determining whether the user will review the summary before rejoining the conference are described herein using individual methods, it should be noted that the user-specific summarizing program 122 may determine whether the user will review the summary before rejoining the conference via one or more combinations of the above embodiments. In an embodiment, in response to the user-specific summary program 122 detecting when the user reconnects to the conference on the virtual collaboration server tool, the user-specific summary program 122 determines whether the user should review the summary before rejoining the conference.

ユーザ固有の要約プログラム122が、ユーザが会議に再び参加する前に要約をレビューするということを決定した場合(判定325の「はい」の分岐)、ユーザ固有の要約プログラム122は、ユーザが要約をレビューすることをどの程度好むか(すなわち、ユーザの嗜好)を選択するようユーザに促す(ステップ330)。ユーザ固有の要約プログラム122が、ユーザが会議に再び参加する前に要約をレビューしないということを決定した場合(判定325の「いいえ」の分岐)、ユーザ固有の要約プログラム122は、ユーザが要約をレビューすることをどの程度好むかを選択するようユーザに促す前に、会議が完了したかどうかを判定する(判定360)。 If the user-specific summarization program 122 determines that the user will review the summary before rejoining the conference (the "Yes" branch of decision 325), the user-specific summarization program 122 prompts the user to select how much the user prefers to review the summary (i.e., the user's preference) (step 330). If the user-specific summarization program 122 determines that the user will not review the summary before rejoining the conference (the "No" branch of decision 325), the user-specific summarization program 122 determines whether the conference has completed before prompting the user to select how much the user prefers to review the summary (decision 360).

判定360で、ユーザ固有の要約プログラム122は、会議が完了したかどうかを判定する。実施形態では、ユーザ固有の要約プログラム122は、ホストが会議を終わらせたときに、会議が完了したということを決定する。実施形態では、ユーザ固有の要約プログラム122が、ユーザが会議に再び参加する前に要約をレビューしないということを決定することに応答して、ユーザ固有の要約プログラム122は、会議が完了したかどうかを判定する。 At decision 360, the user-specific summary program 122 determines whether the conference is complete. In an embodiment, the user-specific summary program 122 determines that the conference is complete when the host ends the conference. In an embodiment, in response to the user-specific summary program 122 determining that the user will not review the summary before rejoining the conference, the user-specific summary program 122 determines whether the conference is complete.

ユーザ固有の要約プログラム122が、会議が完了したということを決定した場合(判定360の「はい」の分岐)、ユーザ固有の要約プログラム122は、ユーザが要約をレビューすることをどの程度好むかを選択するようユーザに促す(ステップ330)。ユーザ固有の要約プログラム122が、会議が完了していないということを決定した場合(判定360の「いいえ」の分岐)、ユーザ固有の要約プログラム122は、ステップ330に進む前に、会議が完了するまで待機する。 If the user-specific summary program 122 determines that the conference is complete (the "Yes" branch of decision 360), the user-specific summary program 122 prompts the user to select how much the user prefers to review the summary (step 330). If the user-specific summary program 122 determines that the conference is not complete (the "No" branch of decision 360), the user-specific summary program 122 waits until the conference is complete before proceeding to step 330.

例では、仮想コラボレーション・サーバ・ツール上の都市Xのオンライン市議会に出席している、都市Xの納税者であるユーザCが、都市Xのオンライン市議会に再接続する。ユーザ固有の要約プログラム122は、再接続しているユーザCを検出する。ユーザ固有の要約プログラム122は、会議に再び参加することからユーザCを遅延させる代わりに、ユーザCが、都市Xのオンライン市議会が完了するまで待機して、要約をレビューするという、機械駆動の推奨を作成する。ユーザ固有の要約プログラム122は、会議が完了するまで、ユーザCが要約をレビューすることをどの程度好むかを選択するようユーザCに促さない。 In the example, User C, a taxpayer for City X who is attending an online city council meeting for City X on the virtual collaboration server tool, reconnects to the online city council meeting for City X. The user-specific summarizing program 122 detects the reconnecting User C. Instead of delaying User C from rejoining the meeting, the user-specific summarizing program 122 makes a machine-driven recommendation that User C wait until the online city council meeting for City X is complete to review the summary. The user-specific summarizing program 122 does not prompt User C to select how much User C prefers to review the summary until the meeting is complete.

判定325に戻り、ユーザ固有の要約プログラム122が、ユーザが会議に再び参加する前に要約をレビューするということを決定した場合(判定325の「はい」の分岐)、ユーザ固有の要約プログラム122は、ステップ330に進み、ユーザがどのように要約をレビューすることを好むかを選択するようユーザに促す。ステップ330で、ユーザ固有の要約プログラム122は、ユーザがどのように要約をレビューすることを好むかを選択するようユーザに促す。実施形態では、ユーザ固有の要約プログラム122は、言語、視聴モード、音声、およびサブタイトルを含むが、これに限定されない設定のデフォルトの選択をユーザに促す。デフォルトの選択は、推奨される経験(例えば、英語(米語)、高帯域ビデオ視聴モード、音声のオン、およびサブタイトルのオフ)をユーザに提供し、ステップ220でユーザによって設定されたユーザの嗜好に基づく。実施形態では、ユーザ固有の要約プログラム122は、ユーザの作業環境により適した選択肢を選択するために、デフォルトの選択を変更するようユーザに促す。例えば、ユーザは、デフォルトの言語設定を代替の言語(例えば、ドイツ語、英語(米語)、スペイン語(ラテンアメリカ)、フランス語、フランス語(カナダ)、イタリア語、ポーランド語、ポルトガル語、ポルトガル語(ブラジル)など)に変更するか、デフォルトの視聴モードを代替の視聴モード(例えば、高帯域ビデオ、低帯域ビデオ、テキスト、およびグラフィックス)に変更するか、デフォルトの音声設定(例えば、オンまたはオフ)を変更するか、またはデフォルトのサブタイトル設定(例えば、オンまたはオフ)を変更するか、あるいはその組合せを実行してよい。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介して、ユーザがどのように要約をレビューすることを好むかを選択するようユーザに促す。実施形態では、ユーザ固有の要約プログラム122が、ユーザが要約をレビューするということを決定することに応答して、ユーザ固有の要約プログラム122は、ユーザがどのように要約をレビューすることを好むかを選択するようユーザに促す。 Returning to decision 325, if the user-specific summarization program 122 determines that the user will review the summary before rejoining the conference (the "Yes" branch of decision 325), the user-specific summarization program 122 proceeds to step 330 and prompts the user to select how the user prefers to review the summary. In step 330, the user-specific summarization program 122 prompts the user to select how the user prefers to review the summary. In an embodiment, the user-specific summarization program 122 prompts the user for default selections of settings, including, but not limited to, language, viewing mode, audio, and subtitles. The default selections provide the user with a recommended experience (e.g., English (American), high-bandwidth video viewing mode, audio on, and subtitles off) and are based on the user preferences set by the user in step 220. In an embodiment, the user-specific summarization program 122 prompts the user to change the default selections to select options that are more suitable for the user's work environment. For example, the user may change the default language setting to an alternate language (e.g., German, English (US), Spanish (Latin America), French, French (Canadian), Italian, Polish, Portuguese, Portuguese (Brazilian), etc.), change the default viewing mode to an alternate viewing mode (e.g., high bandwidth video, low bandwidth video, text, and graphics), change the default audio setting (e.g., on or off), or change the default subtitle setting (e.g., on or off), or any combination thereof. In an embodiment, user-specific summarization program 122 prompts the user, via user interface 132 of user computing device 130, to select how the user prefers to review the summary. In an embodiment, in response to user-specific summarization program 122 determining that the user will review the summary, user-specific summarization program 122 prompts the user to select how the user prefers to review the summary.

ステップ335で、ユーザ固有の要約プログラム122は要約を出力する。実施形態では、ユーザ固有の要約プログラム122は、ステップ330でユーザによって選択された形式で要約を出力する。実施形態では、ユーザ固有の要約プログラム122は、要約を警告通知として出力する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介して、要約をユーザに出力する。実施形態では、ユーザ固有の要約プログラム122が、ユーザがどのように要約をレビューすることを好むかを選択するようユーザに促すことに応答して、ユーザ固有の要約プログラム122は要約を出力する。 In step 335, the user-specific summary program 122 outputs the summary. In an embodiment, the user-specific summary program 122 outputs the summary in the format selected by the user in step 330. In an embodiment, the user-specific summary program 122 outputs the summary as an alert notification. In an embodiment, the user-specific summary program 122 outputs the summary to the user via the user interface 132 of the user computing device 130. In an embodiment, the user-specific summary program 122 outputs the summary in response to the user-specific summary program 122 prompting the user to select how the user prefers to review the summary.

第1の例では、仮想コラボレーション・サーバ・ツール上のオンライン仮想クラスに出席し、ネットワーク接続の問題を経験していたコンピュータ科学の学生であるユーザAが、ユーザAのオンライン仮想クラスに再接続する。ユーザ固有の要約プログラム122は、再接続しているユーザAを検出し、ユーザAがクラスに再び参加する前に要約をレビューすることを好むか、またはクラスが完了するまで待機して、要約をレビューするかを尋ねる。ユーザAは、ユーザAのオンライン仮想クラスに再び参加する前に要約をレビューすることを選択する。ユーザAは、デフォルトの選択を使用して要約をレビューすることを選択し、小会議室に移動される。ユーザAは、音声付きの30秒のビデオを受信して、見る。このときユーザAは、ユーザAが切り離されていた間に聞きもらしたことに関する最新情報を取得し、ユーザAのオンライン仮想クラスに再び参加する準備ができる。 In a first example, User A, a computer science student who was attending an online virtual class on a virtual collaboration server tool and experiencing network connection issues, reconnects to User A's online virtual class. The user-specific summary program 122 detects User A reconnecting and asks whether User A would prefer to review the summary before rejoining the class or to wait until the class is complete to review the summary. User A chooses to review the summary before rejoining User A's online virtual class. User A chooses to review the summary using the default selection and is taken to a breakout room. User A receives and views a 30-second video with audio. User A now has an update on what User A missed while disconnected and is ready to rejoin User A's online virtual class.

第2の例では、自宅から作業し、仮想コラボレーション・サーバ・ツール上でユーザBのチームとのチーム会議に参加していた、技術企業の従業員であるユーザBが、ユーザBのチーム会議に再接続する。ユーザ固有の要約プログラム122は、再接続しているユーザBを検出し、ユーザBがチーム会議に再び参加する前に要約をレビューすることを好むか、またはチーム会議が完了するまで待機して、要約をレビューするかを尋ねる。ユーザBは、チーム会議に再び参加する前に要約をレビューすることを選択する。ユーザBは、デフォルトの音声設定を「オフ」に変更し、デフォルトのサブタイトル設定を「オン」に変更する。ユーザBは、現在の会議室にとどまって要約をレビューする。ユーザBは、サブタイトル付きの30秒のビデオを受信して、見る。このときユーザBは、ユーザBが切り離されていた間に聞きもらしたことに関する最新情報を取得し、ユーザBのチーム会議に再び参加する準備ができる。 In a second example, User B, an employee of a technology company who works from home and was participating in a team conference with User B's team on a virtual collaboration server tool, reconnects to User B's team conference. The user-specific summarization program 122 detects User B reconnecting and asks if User B prefers to review the summary before rejoining the team conference or waits until the team conference is complete to review the summary. User B chooses to review the summary before rejoining the team conference. User B changes the default audio setting to "off" and the default subtitle setting to "on." User B remains in the current conference room and reviews the summary. User B receives and watches a 30-second video with subtitles. User B now has an update on what he missed while he was disconnected and is ready to rejoin User B's team conference.

第3の例では、都市Xのオンライン市議会が完了する。ユーザ固有の要約プログラム122は、要約をユーザCに出力する。ユーザCは、音声付きの30秒のビデオを受信して、見る。このときユーザCは、ユーザCが都市Xのオンライン市議会から切り離されていた間に聞きもらしたことに関する最新情報を取得する。 In a third example, an online city meeting for City X is completed. The user-specific summary program 122 outputs a summary to User C, who receives and views a 30-second video with audio. User C now has an update on what he missed while he was disconnected from City X's online city meeting.

ステップ340で、ユーザ固有の要約プログラム122は、要約を会議の完全な記録の再生と比較する。実施形態では、ユーザ固有の要約プログラム122は、主要な実体を、要約から、および会議の完全な記録の再生から抽出する。実施形態では、ユーザ固有の要約プログラム122は、要約から、および会議の完全な記録の再生から抽出された、類似している主要な実体を照合する。実施形態では、ユーザ固有の要約プログラム122は、要約および会議の意味が同じであることを保証するために、要約を、会議の完全な記録の再生と比較する。実施形態では、ユーザ固有の要約プログラム122が要約を出力することに応答して、ユーザ固有の要約プログラム122は、要約を会議の完全な記録の再生と比較する。 In step 340, the user-specific summarization program 122 compares the summary with a playback of the full recording of the meeting. In an embodiment, the user-specific summarization program 122 extracts key entities from the summary and from a playback of the full recording of the meeting. In an embodiment, the user-specific summarization program 122 matches similar key entities extracted from the summary and from a playback of the full recording of the meeting. In an embodiment, the user-specific summarization program 122 compares the summary with a playback of the full recording of the meeting to ensure that the meaning of the summary and the meeting are the same. In an embodiment, in response to the user-specific summarization program 122 outputting the summary, the user-specific summarization program 122 compares the summary with a playback of the full recording of the meeting.

ステップ345で、ユーザ固有の要約プログラム122はユーザに対してフィードバックを要求する。実施形態では、ユーザ固有の要約プログラム122は、ステップ335での要約の出力に関して、ユーザに対してフィードバックを要求する。実施形態では、ユーザ固有の要約プログラム122は、ユーザが1つのみを選択できる3つの選択肢(すなわち、-1、0、+1)をユーザに提供する。ユーザに提供される3つの選択肢は、ユーザのあり得る満足度(すなわち、それぞれ不満足、中立、満足)を表す。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介してユーザに対してフィードバックを要求する。実施形態では、要約を会議の完全な記録の再生と比較することに応答して、ユーザ固有の要約プログラム122はユーザに対してフィードバックを要求する。 In step 345, the user-specific summarization program 122 requests feedback from the user. In an embodiment, the user-specific summarization program 122 requests feedback from the user regarding the output of the summary in step 335. In an embodiment, the user-specific summarization program 122 provides the user with three options (i.e., -1, 0, +1) from which the user can select only one. The three options provided to the user represent the user's possible satisfaction levels (i.e., dissatisfied, neutral, and satisfied, respectively). In an embodiment, the user-specific summarization program 122 requests feedback from the user via the user interface 132 of the user computing device 130. In an embodiment, in response to comparing the summary with a playback of the full recording of the conference, the user-specific summarization program 122 requests feedback from the user.

ステップ350で、ユーザ固有の要約プログラム122はユーザからフィードバックを受信する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介してユーザからフィードバックを受信する。実施形態では、ユーザ固有の要約プログラム122は、フィードバックを使用して、プロセスの未来の反復でより調整された要約を準備することにおいてユーザ固有の要約プログラム122を改良する。実施形態では、ユーザ固有の要約プログラム122は、強化学習を使用してユーザ固有の要約プログラム122を改良する。実施形態では、ユーザ固有の要約プログラム122は、ReLUまたはリーキーReLUを活性化関数として使用して、精度を向上させる。実施形態では、ユーザ固有の要約プログラム122は、音声フレームまたはビデオ・フレームあるいはその両方に対して音声テキスト(STT:speech-to-text)認識を実行して、三つ組(triples)を準備する。実施形態では、ユーザ固有の要約プログラム122は、上位N個のランク付けされ文をエンド・ユーザに勧める。実施形態では、ユーザ固有の要約プログラム122は、会議サマライザ(meeting summarizer)を強化学習エージェントとして使用し、協調プロセスの間のマルコフ決定プロセスの後に、反復プロセスをモデル化する。実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムの実行時間を加速するために、状態とアクション(S-A:State-Action)の対に対してQ学習技術を実行する。Q学習技術は、強化学習(RL:reinforcement learning)エージェントのカンニング・ペーパー(crib sheet)として機能する。Q学習技術は、RLエージェントが環境からのフィードバックを使用して、さまざまな環境内で実行できる最良のアクションを学習することを可能にする。Q学習技術は、Q値も使用して、RLエージェントの性能を追跡し、改善する。最初に、Q値は任意の値に設定される。しかし、RLエージェントがさまざまなアクションを実行し、アクションに対するフィードバック(すなわち、不満足、中立、満足)を受信するときに、Q値が更新される。実施形態では、ユーザ固有の要約プログラム122は、時間が増加するにつれて報酬が増えるように、強化学習システムを設計する。エピソードごとの報酬の最大値は、総報酬を最大化することによってRLエージェントが正しいアクションを実行することを学習したことを示す。実施形態では、ユーザ固有の要約プログラム122がユーザに対してフィードバックを要求することに応答して、ユーザ固有の要約プログラム122はフィードバックをユーザから受信する。 In step 350, the user-specific summarization program 122 receives feedback from the user. In an embodiment, the user-specific summarization program 122 receives feedback from the user via the user interface 132 of the user computing device 130. In an embodiment, the user-specific summarization program 122 uses the feedback to improve the user-specific summarization program 122 in preparing more tailored summaries in future iterations of the process. In an embodiment, the user-specific summarization program 122 uses reinforcement learning to improve the user-specific summarization program 122. In an embodiment, the user-specific summarization program 122 uses ReLU or leaky ReLU as an activation function to improve accuracy. In an embodiment, the user-specific summarization program 122 performs speech-to-text (STT) recognition on the audio frames and/or video frames to prepare triplets. In an embodiment, the user-specific summarization program 122 recommends the top N ranked sentences to the end user. In an embodiment, the user-specific summarizer 122 uses a meeting summarizer as a reinforcement learning agent to model an iterative process after a Markov decision process during a collaboration process. In an embodiment, the user-specific summarizer 122 performs Q-learning techniques on state-action (SA) pairs to accelerate the execution time of the algorithm. The Q-learning technique serves as a crib sheet for the reinforcement learning (RL) agent. The Q-learning technique allows the RL agent to use feedback from the environment to learn the best actions it can perform in various environments. The Q-learning technique also uses a Q-value to track and improve the performance of the RL agent. Initially, the Q-value is set to an arbitrary value. However, as the RL agent performs various actions and receives feedback on the actions (i.e., dissatisfied, neutral, satisfied), the Q-value is updated. In an embodiment, the user-specific summarizer 122 designs the reinforcement learning system so that rewards increase over time. The maximum per-episode reward indicates that the RL agent has learned to perform the correct action by maximizing the total reward. In an embodiment, in response to the user-specific summary program 122 requesting feedback from the user, the user-specific summary program 122 receives feedback from the user.

ステップ355で、ユーザ固有の要約プログラム122はフィードバックを格納する。実施形態では、ユーザ固有の要約プログラム122は、ユーザから受信されたフィードバックを格納する。実施形態では、ユーザ固有の要約プログラム122は、ユーザから受信されたフィードバックをデータベース(例えば、データベース126)に格納する。実施形態では、ユーザ固有の要約プログラム122がフィードバックをユーザから受信することに応答して、ユーザ固有の要約プログラム122はフィードバックを格納する。 In step 355, the user-specific summary program 122 stores the feedback. In an embodiment, the user-specific summary program 122 stores the feedback received from the user. In an embodiment, the user-specific summary program 122 stores the feedback received from the user in a database (e.g., database 126). In an embodiment, in response to the user-specific summary program 122 receiving the feedback from the user, the user-specific summary program 122 stores the feedback.

一部の実施形態では、ユーザ固有の要約プログラム122は、任意選択的なステップとして、ステップ345、350、および355を実行してよい。 In some embodiments, the user-specific summary program 122 may perform steps 345, 350, and 355 as optional steps.

図4は、本発明の実施形態に従って、図1の分散データ処理環境100内のユーザ固有の要約プログラム122の機械学習コンポーネント124の動作ステップを示す、概して400と指定されたフローチャートである。実施形態では、ユーザ固有の要約プログラム122は、マージ、抽出要約、話者ダイアライゼーション、および機械学習の概念を適用することによって、仮想コラボレーション・サーバ・ツール上の会議から離れているユーザのプロフィールに合わせて調整された、ユーザが切り離されていた間の会議の一部を対象にする要約を準備するように動作する。実施形態では、ユーザ固有の要約プログラム122の機械学習コンポーネント124は、ユーザが仮想コラボレーション・サーバ・ツール上でホストするか、参加するか、または出席する会議の全持続時間の間、継続的に稼働する。図4に示されたプロセスがプロセス・フローの1つの可能な反復を示しているということが理解されるべきである。 FIG. 4 is a flowchart generally designated 400 illustrating operational steps of the machine learning component 124 of the user-specific summarization program 122 in the distributed data processing environment 100 of FIG. 1 in accordance with an embodiment of the present invention. In an embodiment, the user-specific summarization program 122 operates to prepare summaries tailored to the profile of a user away from a conference on a virtual collaboration server tool, covering the portion of the conference while the user was disconnected, by applying concepts of merging, extractive summarization, speaker diarization, and machine learning. In an embodiment, the machine learning component 124 of the user-specific summarization program 122 runs continuously for the entire duration of a conference that the user hosts, participates in, or attends on the virtual collaboration server tool. It should be understood that the process illustrated in FIG. 4 illustrates one possible iteration of the process flow.

ステップ405で、ユーザ固有の要約プログラム122は、会議の2人以上の参加者を識別する。実施形態では、ユーザ固有の要約プログラム122は、仮想コラボレーション・サーバ・ツールから(例えば、参加者リストから、または出席報告から)収集された情報を介して、会議の2人以上の参加者を識別する。実施形態では、ユーザ固有の要約プログラム122は、重み付けを会議の2人以上の参加者に割り当てる。実施形態では、ユーザ固有の要約プログラム122は、要因のセットに基づいて、重み付けを会議の2人以上の参加者に割り当てる。要因のセットは、会議における参加者の役割(すなわち、会議の主催者、会議の要求された出席者、会議の任意選択的な出席者など)、参加者の企業における参加者の役割、および会議から離れたユーザとの参加者の関連性を含むが、これらに限定されない。実施形態では、ユーザ固有の要約プログラム122は、参加者の割り当てられた重み付けに基づいて、会議の2人以上の参加者をランク付けする(すなわち、ユーザに最も関連する参加者からユーザに最も関連しない参加者まで、参加者をランク付けする)。実施形態では、ユーザ固有の要約プログラム122は、2人以上の参加者のそのようなランク付けをくつがえす(override)能力をユーザに提供する。実施形態では、ユーザ固有の要約プログラム122は、ユーザ・コンピューティング・デバイス130のユーザ・インターフェイス132を介して、そのようなランク付けをくつがえす能力をユーザに提供する。 In step 405, the user-specific summarization program 122 identifies two or more participants of the conference. In an embodiment, the user-specific summarization program 122 identifies two or more participants of the conference via information collected from the virtual collaboration server tool (e.g., from a participant list or from an attendance report). In an embodiment, the user-specific summarization program 122 assigns weights to two or more participants of the conference. In an embodiment, the user-specific summarization program 122 assigns weights to two or more participants of the conference based on a set of factors. The set of factors includes, but is not limited to, the participant's role in the conference (i.e., the conference organizer, the requested attendee of the conference, the optional attendee of the conference, etc.), the participant's role in the participant's enterprise, and the participant's relevance to the user away from the conference. In an embodiment, the user-specific summarization program 122 ranks the two or more participants of the conference based on the participants' assigned weights (i.e., ranks the participants from most relevant to the user to least relevant to the user). In an embodiment, the user-specific summarization program 122 provides the user with the ability to override such rankings of two or more participants. In an embodiment, the user-specific summarization program 122 provides the user with the ability to override such rankings via the user interface 132 of the user computing device 130.

ステップ410で、ユーザ固有の要約プログラム122は、複数の音声フレームまたはビデオ・フレームあるいはその両方を抽出する。実施形態では、ユーザ固有の要約プログラム122は、ユーザが切り離されていた会議の一部から、複数の音声フレームまたはビデオ・フレームあるいはその両方を抽出する。実施形態では、ユーザ固有の要約プログラム122は、要約が準備されて、会議から離れていたユーザに出力されるまで、複数の音声フレームまたはビデオ・フレームあるいはその両方を継続的に抽出する。 In step 410, the user-specific summary program 122 extracts multiple audio and/or video frames. In an embodiment, the user-specific summary program 122 extracts multiple audio and/or video frames from the portion of the conference from which the user was disconnected. In an embodiment, the user-specific summary program 122 continuously extracts multiple audio and/or video frames until a summary is prepared and output to the user who was disconnected from the conference.

実施形態では、ユーザ固有の要約プログラム122は、ユーザが切り離されていた会議の一部から抽出された音声フレームまたはビデオ・フレームあるいはその両方の数を数える。実施形態では、ユーザ固有の要約プログラム122は、ユーザの名前を含んでいる音声フレームまたはビデオ・フレームあるいはその両方(例えば、ユーザが話すことまたは質問に回答することが期待されたため、会議のホストによってユーザの名前が言及されていた間の音声フレームもしくはビデオ・フレームまたはその両方、あるいは小規模なブレークアウトグループに参加するように会議のホストによってユーザの名前が呼ばれていた間の音声フレームもしくはビデオ・フレームまたはその両方)の数を数える。実施形態では、ユーザ固有の要約プログラム122が会議の2人以上の参加者を識別することに応答して、ユーザ固有の要約プログラム122は、複数の音声フレームまたはビデオ・フレームあるいはその両方を抽出する。 In an embodiment, the user-specific summarization program 122 counts the number of audio and/or video frames extracted from the portion of the conference from which the user was disconnected. In an embodiment, the user-specific summarization program 122 counts the number of audio and/or video frames containing the user's name (e.g., audio and/or video frames during which the user's name was mentioned by the conference host because the user was expected to speak or answer a question, or audio and/or video frames during which the user's name was called by the conference host to join a smaller breakout group). In an embodiment, in response to the user-specific summarization program 122 identifying two or more participants in the conference, the user-specific summarization program 122 extracts multiple audio and/or video frames.

ステップ415で、ユーザ固有の要約プログラム122は、複数の音声フレームまたはビデオ・フレームあるいはその両方の文脈を識別する。実施形態では、ユーザ固有の要約プログラム122は、ユーザが切り離されていた会議の一部から抽出された複数の音声フレームまたはビデオ・フレームあるいはその両方の文脈を識別する。実施形態では、ユーザ固有の要約プログラム122は、会議の意図またはトピックあるいはその両方を理解するために、複数の音声フレームまたはビデオ・フレームあるいはその両方の文脈を識別する。実施形態では、ユーザ固有の要約プログラム122が複数の音声フレームまたはビデオ・フレームあるいはその両方を抽出することに応答して、ユーザ固有の要約プログラム122は、複数の音声フレームまたはビデオ・フレームあるいはその両方の文脈を識別する。 In step 415, the user-specific summarization program 122 identifies the context of the multiple audio frames and/or video frames. In an embodiment, the user-specific summarization program 122 identifies the context of the multiple audio frames and/or video frames extracted from a portion of the conference from which the user was detached. In an embodiment, the user-specific summarization program 122 identifies the context of the multiple audio frames and/or video frames to understand the intent and/or topic of the conference. In an embodiment, in response to the user-specific summarization program 122 extracting the multiple audio frames and/or video frames, the user-specific summarization program 122 identifies the context of the multiple audio frames and/or video frames.

ステップ420で、ユーザ固有の要約プログラム122は、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットを選択する。実施形態では、ユーザ固有の要約プログラム122は、音声フレームまたはビデオ・フレームあるいはその両方が、会議から離れていたユーザのための要約の準備に寄与するかどうかに基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットを選択する。実施形態では、ユーザ固有の要約プログラム122が複数の音声フレームまたはビデオ・フレームあるいはその両方の文脈を識別することに応答して、ユーザ固有の要約プログラム122は、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットを選択する。 In step 420, the user-specific summarization program 122 selects a subset of the plurality of audio frames and/or video frames. In an embodiment, the user-specific summarization program 122 selects a subset of the plurality of audio frames and/or video frames based on whether the audio frames and/or video frames contribute to preparing a summary for a user who was away from the conference. In an embodiment, in response to the user-specific summarization program 122 identifying the context of the plurality of audio frames and/or video frames, the user-specific summarization program 122 selects a subset of the plurality of audio frames and/or video frames.

ステップ425で、ユーザ固有の要約プログラム122は、ステップ420で選択された複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。実施形態では、ユーザ固有の要約プログラム122は、複数の音声フレームのサブセットをランク付けする。別の実施形態では、ユーザ固有の要約プログラム122は、複数のビデオ・フレームのサブセットをランク付けする。別の実施形態では、ユーザ固有の要約プログラム122は、複数の音声およびビデオ・フレームのサブセットをランク付けする。 In step 425, the user-specific summarization program 122 ranks the subset of audio frames and/or video frames selected in step 420. In an embodiment, the user-specific summarization program 122 ranks the subset of audio frames. In another embodiment, the user-specific summarization program 122 ranks the subset of video frames. In another embodiment, the user-specific summarization program 122 ranks the subset of audio and video frames.

実施形態では、ユーザ固有の要約プログラム122は、アルゴリズム法を使用して複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、音声フレームまたはビデオ・フレームあるいはその両方が、会議から離れていたユーザの名前を含んでいるかどうかに基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、ステップ405で受信された参加者をランク付けすることに基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、参加者と会議から離れていたユーザの間の関係に基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。会議から離れていたユーザとの参加者の関連性は、会議における参加者の役割(すなわち、会議の主催者、会議の要求された出席者、会議の任意選択的な出席者)、参加者の企業プロフィール、参加者の企業の階層、企業の階層内の参加者の地位、参加者の企業内の参加者の年功序列、参加者の主要な仕事、参加者の主要な仕事の職務を含むが、これらに限定されない、因子のセットによって決定される。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、ユーザの技術に関する関心に基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、ユーザの専門知識に基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、過去の分析に基づいて、複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けするユーザ固有の要約プログラム122の例は、本明細書では個別の方法を使用して説明されるが、ユーザ固有の要約プログラム122が上記の実施形態の1つまたは複数の組合せを介して複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けしてよいということに、注意するべきである。 In embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames using an algorithmic method. In one or more embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames based on whether the audio frame and/or video frame contains the name of a user who was absent from the conference. In one or more embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames based on ranking the participants received in step 405. In one or more embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames based on the relationship between the participant and the user who was absent from the conference. A participant's relevance to the user who was away from the conference is determined by a set of factors including, but not limited to, the participant's role in the conference (i.e., conference organizer, conference required attendee, conference optional attendee), the participant's company profile, the participant's company hierarchy, the participant's position within the company hierarchy, the participant's seniority within the participant's company, the participant's primary job, and the participant's primary job function. In one or more embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames based on the user's technology interests. In one or more embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames based on the user's expertise. In one or more embodiments, the user-specific summarization program 122 ranks a subset of the plurality of audio frames and/or video frames based on past analysis. Although examples of the user-specific summarization program 122 ranking a subset of multiple audio and/or video frames are described herein using separate methods, it should be noted that the user-specific summarization program 122 may rank a subset of multiple audio and/or video frames via one or more combinations of the above embodiments.

実施形態では、ユーザ固有の要約プログラム122が複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットを選択することに応答して、ユーザ固有の要約プログラム122は、ステップ420で選択された複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けする。 In an embodiment, in response to the user-specific summarization program 122 selecting a subset of the plurality of audio frames and/or video frames, the user-specific summarization program 122 ranks the selected subset of the plurality of audio frames and/or video frames in step 420.

ステップ430で、ユーザ固有の要約プログラム122は統合された要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームの統合された要約を準備する。別の実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムで決定されたしきい値より上にランク付けされた複数のビデオ・フレームの統合された要約を準備する。別の実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声およびビデオ・フレームの統合された要約を準備する。 At step 430, the user-specific summarization program 122 prepares an integrated summary. In an embodiment, the user-specific summarization program 122 prepares an integrated summary of multiple audio frames ranked above an algorithmically determined threshold. In another embodiment, the user-specific summarization program 122 prepares an integrated summary of multiple video frames ranked above an algorithmically determined threshold. In another embodiment, the user-specific summarization program 122 prepares an integrated summary of multiple audio and video frames ranked above an algorithmically determined threshold.

実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームまたはビデオ・フレームあるいはその両方をマージすることによって、統合された要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームまたはビデオ・フレームあるいはその両方を連続的に一緒につなぎ合わせて、アルゴリズムで決定されたしきい値より上にランク付けされた複数の音声フレームまたはビデオ・フレームあるいはその両方をマージすることによって、統合された要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、アルゴリズムで決定されたしきい値より上にランク付けされなかった複数の音声フレームまたはビデオ・フレームあるいはその両方を取り消すことによって、統合された要約を準備する。しきい値は、動的であり、ユーザ固有の要約プログラム122のユーザごとに変わる。実施形態では、ユーザ固有の要約プログラム122は、トレーニング・データ・セットに対する機械学習に合わせて、アルゴリズムで決定されたしきい値を設定する。 In an embodiment, the user-specific summarization program 122 prepares the integrated summary by merging multiple audio and/or video frames ranked above an algorithmically determined threshold. In an embodiment, the user-specific summarization program 122 prepares the integrated summary by sequentially splicing together multiple audio and/or video frames ranked above an algorithmically determined threshold and merging multiple audio and/or video frames ranked above an algorithmically determined threshold. In an embodiment, the user-specific summarization program 122 prepares the integrated summary by discarding multiple audio and/or video frames that are not ranked above the algorithmically determined threshold. The threshold is dynamic and changes for each user of the user-specific summarization program 122. In an embodiment, the user-specific summarization program 122 sets the algorithmically determined threshold in accordance with machine learning on a training data set.

実施形態では、ユーザ固有の要約プログラム122が複数の音声フレームまたはビデオ・フレームあるいはその両方のサブセットをランク付けすることに応答して、ユーザ固有の要約プログラム122は、統合された要約を準備する。 In an embodiment, in response to the user-specific summarization program 122 ranking a subset of the plurality of audio frames and/or video frames, the user-specific summarization program 122 prepares an integrated summary.

第1の例では、仮想コラボレーション・サーバ・ツール上のユーザAのオンライン仮想クラスが、教師Xによってホストされる。招待講演者Yも、ユーザAのオンライン仮想クラスに参加する。ユーザAのネットワーク接続の問題のために、ユーザAがオンライン仮想クラスから切り離されている間に、教師Xは、25枚のMicrosoft(R)PowerPointスライドを提示する。教師Xが提示する最初のスライドは、スライド1である。しかし、教師Xは、招待講演者Yが後でクラスで提示する内容を説明するために、非常に簡単にスライド25を参照する。次に教師Xは、ユーザAがユーザAのオンライン仮想クラスに再接続する前に、スライド2~24に戻って参照し、説明する。この場合、ユーザ固有の要約プログラム122は、スライド1および25が高度なコンテンツ情報を含んでいるため、スライド1および25をスライド2~24より高くランク付けする。スライド1および25がマージされる。 In a first example, User A's online virtual class on a virtual collaboration server tool is hosted by Teacher X. Invited speaker Y also joins User A's online virtual class. While User A is disconnected from the online virtual class due to User A's network connection issues, Teacher X presents 25 Microsoft® PowerPoint slides. The first slide Teacher X presents is slide 1. However, Teacher X very briefly refers to slide 25 to explain what Invited speaker Y will present later in the class. Teacher X then returns to and explains slides 2-24 before User A reconnects to User A's online virtual class. In this case, the user-specific summarization program 122 ranks slides 1 and 25 higher than slides 2-24 because slides 1 and 25 contain more content information. Slides 1 and 25 are merged.

第2の例では、仮想コラボレーション・サーバ・ツール上のユーザBのチーム会議は、チーム・リーダーXによってホストされる。ユーザBがチーム会議から切り離されている間に、チーム・リーダーXは、ビデオがあまり技術的でなく、より図解的であるため、技術的スライドよりも非常に良くチーム・メンバーの共感を呼んだビデオを提示する。この場合、ユーザ固有の要約プログラム122は、技術的スライドより高くビデオをランク付けする。ビデオおよび他の高くランク付けされたスライドが一緒にマージされるが、技術的スライドは取り消される。 In a second example, User B's team meeting on the virtual collaboration server tool is hosted by Team Leader X. While User B is disconnected from the team meeting, Team Leader X presents a video that resonates much better with team members than the technical slides because the video is less technical and more illustrative. In this case, the user-specific summarization program 122 ranks the video higher than the technical slides. The video and the other highly ranked slides are merged together, but the technical slides are canceled.

ステップ435で、ユーザ固有の要約プログラム122は、統合された要約を1つまたは複数の文に変換する。実施形態では、ユーザ固有の要約プログラム122は、統合された要約をテキスト形式で1つまたは複数の文に変換する。実施形態では、ユーザ固有の要約プログラム122は、抽出テキスト要約アルゴリズムを使用して、統合された要約を1つまたは複数の文に変換する。実施形態では、ユーザ固有の要約プログラム122は、統合された要約内の重要な文および他の際立った情報を識別する。実施形態では、ユーザ固有の要約プログラム122は、統合された要約から重要な文および他の際立った情報を抽出する。会議の全持続時間の間、抽出テキスト要約アルゴリズムを使用する音声テキスト要約が発生するが、持続時間内の30分のローリング・ウィンドウを開いた状態に保つ。実施形態では、ユーザ固有の要約プログラム122が統合された要約を準備することに応答して、ユーザ固有の要約プログラム122は、統合された要約を1つまたは複数の文に変換する。 In step 435, the user-specific summarization program 122 converts the integrated summary into one or more sentences. In an embodiment, the user-specific summarization program 122 converts the integrated summary into one or more sentences in text format. In an embodiment, the user-specific summarization program 122 converts the integrated summary into one or more sentences using an extractive text summarization algorithm. In an embodiment, the user-specific summarization program 122 identifies important sentences and other salient information in the integrated summary. In an embodiment, the user-specific summarization program 122 extracts important sentences and other salient information from the integrated summary. Speech-to-text summarization using the extractive text summarization algorithm occurs for the entire duration of the conference, but keeps a rolling 30-minute window open within the duration. In an embodiment, in response to the user-specific summarization program 122 preparing the integrated summary, the user-specific summarization program 122 converts the integrated summary into one or more sentences.

ステップ440で、ユーザ固有の要約プログラム122は話者ダイアライゼーションを適用する。話者ダイアライゼーションは、話者の識別情報に従って入力音声ストリームを同質のセグメントに分割するプロセスである。話者ダイアライゼーションは、音声ストリームを話者の順番に構造化することによって、および話者認識システムと共に使用された場合に、話者の真の識別情報を提供することによって、自動音声文字起こしの可読性を高める。話者ダイアライゼーションは、話者セグメント化および話者クラスタ化の組合せである。話者セグメント化は、音声ストリーム内の話者の変化点を検出することを目標とする。話者クラスタ化は、話者の特性に基づいて音声セグメントを一緒にグループ化することを目標とする。実施形態では、ユーザ固有の要約プログラム122は、音声フレーム内の話者の変化点を検出する(すなわち、話者セグメント化)。実施形態では、ユーザ固有の要約プログラム122は、話者の特性に基づいて音声セグメントを一緒にグループ化する(すなわち、話者クラスタ化)。実施形態では、ユーザ固有の要約プログラム122が統合された要約を1つまたは複数の文に変換することに応答して、ユーザ固有の要約プログラム122は、話者ダイアライゼーションを適用する。 In step 440, the user-specific summarization program 122 applies speaker diarization. Speaker diarization is the process of dividing the input audio stream into homogeneous segments according to speaker identities. Speaker diarization improves the readability of automatic speech transcription by structuring the audio stream into speaker order and, when used in conjunction with a speaker recognition system, by providing true speaker identities. Speaker diarization is a combination of speaker segmentation and speaker clustering. Speaker segmentation aims to detect speaker change points within an audio stream. Speaker clustering aims to group audio segments together based on speaker characteristics. In an embodiment, the user-specific summarization program 122 detects speaker change points within an audio frame (i.e., speaker segmentation). In an embodiment, the user-specific summarization program 122 groups audio segments together based on speaker characteristics (i.e., speaker clustering). In an embodiment, in response to the user-specific summarization program 122 converting the integrated summary into one or more sentences, the user-specific summarization program 122 applies speaker diarization.

ステップ445で、ユーザ固有の要約プログラム122は、1つまたは複数の文をランク付けする。実施形態では、ユーザ固有の要約プログラム122は、会議における話者の役割(すなわち、ホスト、参加者、出席者)、および会議の意図またはトピックあるいはその両方との文の関連性を含むが、これらに限定されない、因子のセットに基づいて、1つまたは複数の文をランク付けする。実施形態では、ユーザ固有の要約プログラム122は、上位N個の最も有用な文を保持する。Nは、ステップ220でユーザによって設定されたユーザの嗜好または機械駆動の推奨であってよい。実施形態では、ユーザ固有の要約プログラム122が話者ダイアライゼーションを適用することに応答して、ユーザ固有の要約プログラム122は、1つまたは複数の文をランク付けする。 In step 445, the user-specific summarization program 122 ranks the one or more sentences. In an embodiment, the user-specific summarization program 122 ranks the one or more sentences based on a set of factors, including, but not limited to, the speaker's role in the meeting (i.e., host, participant, attendee) and the relevance of the sentence to the meeting's intent and/or topic. In an embodiment, the user-specific summarization program 122 retains the top N most useful sentences, where N may be a user preference set by the user in step 220 or a machine-driven recommendation. In an embodiment, in response to the user-specific summarization program 122 applying speaker diarization, the user-specific summarization program 122 ranks the one or more sentences.

例えば、会議からのユーザの離脱の持続時間の間に、重要人物(例えば、会議のホスト)が100個の文を話した場合、ユーザ固有の要約プログラム122は、重要性の順に100個の文をすべてランク付けする。しかし、Nが25に設定されたため、ユーザ固有の要約プログラム122は、話された上位25個の文のみを保持する。 For example, if an important person (e.g., the conference host) spoke 100 sentences during the duration of the user's absence from the conference, the user-specific summarization program 122 would rank all 100 sentences in order of importance. However, because N was set to 25, the user-specific summarization program 122 would only retain the top 25 sentences spoken.

別の例では、会議からのユーザの離脱の持続時間の間に、重要人物(例えば、会議のホスト)が100個の文を話した場合、ユーザ固有の要約プログラム122は、重要性の順に100個の文をすべてランク付けする。100個の文がすべて重要であるため、ユーザ固有の要約プログラム122に対して100個の文をすべて保持することの機械駆動の推奨が行われ、そのためユーザ固有の要約プログラム122は、100個の文をすべて保持する。 In another example, if an important person (e.g., the conference host) speaks 100 sentences during the duration of the user's absence from the conference, the user-specific summarization program 122 ranks all 100 sentences in order of importance. Because all 100 sentences are important, a machine-driven recommendation is made to the user-specific summarization program 122 to retain all 100 sentences, and so the user-specific summarization program 122 retains all 100 sentences.

さらに別の例では、重要人物(例えば、会議のホスト)が1つの文のみを話した場合、ユーザ固有の要約プログラム122は1つの文を保持する。 In yet another example, if an important person (e.g., the meeting host) speaks only one sentence, the user-specific summarization program 122 retains that one sentence.

ステップ450で、ユーザ固有の要約プログラム122は1つまたは複数のキーワードを識別する。実施形態では、ユーザ固有の要約プログラム122は、1つまたは複数の文内の1つまたは複数のキーワードを識別する。実施形態では、ユーザ固有の要約プログラム122は、会議の意図またはトピックあるいはその両方に関して1つまたは複数のキーワードを識別する。実施形態では、ユーザ固有の要約プログラム122は、会議の2人以上の参加者に関して1つまたは複数のキーワードを識別する。 In step 450, the user-specific summarization program 122 identifies one or more keywords. In an embodiment, the user-specific summarization program 122 identifies one or more keywords in one or more sentences. In an embodiment, the user-specific summarization program 122 identifies one or more keywords related to the intent and/or topic of the meeting. In an embodiment, the user-specific summarization program 122 identifies one or more keywords related to two or more participants of the meeting.

実施形態では、ユーザ固有の要約プログラム122は、重み付けを1つまたは複数のキーワードに割り当てる。実施形態では、ユーザ固有の要約プログラム122は、会議の意図またはトピックあるいはその両方とのキーワードの関連性に基づいて、重み付けを1つまたは複数のキーワードに割り当てる。実施形態では、ユーザ固有の要約プログラム122は、会議の2人以上の参加者とのキーワードの関連性に基づいて、重み付けを1つまたは複数のキーワードに割り当てる。 In an embodiment, the user-specific summarization program 122 assigns a weighting to one or more keywords. In an embodiment, the user-specific summarization program 122 assigns a weighting to one or more keywords based on the relevance of the keyword to the intent and/or topic of the meeting. In an embodiment, the user-specific summarization program 122 assigns a weighting to one or more keywords based on the relevance of the keyword to two or more participants of the meeting.

例えば、3つの文S10、S11、およびS12は、会議の複数の参加者に関する候補である。特定の参加者と一致するキーワードの頻度に基づいてそのような文をランク付けするためのランク付けシステムが構築される。S10、S11、およびS12からキーワードが識別される。識別されたキーワードは、「データ」、「アルゴリズム」、および「K平均クラスタ化」である。参加者X10は、データ・サイエンティストである。参加者X11は、ソリューション・アーキテクトである。X10は、キーワード「データ」、「アルゴリズム」、および「K平均クラスタ化」を含む文により興味があり、一方、X11は、キーワード「データ」を含む文のみに興味がある。 For example, three sentences S10, S11, and S12 are candidates for multiple participants in a meeting. A ranking system is constructed to rank such sentences based on the frequency of keywords that match specific participants. Keywords are identified from S10, S11, and S12. The identified keywords are "data," "algorithm," and "K-means clustering." Participant X10 is a data scientist. Participant X11 is a solution architect. X10 is more interested in sentences containing the keywords "data," "algorithm," and "K-means clustering," while X11 is only interested in sentences containing the keyword "data."

実施形態では、ユーザ固有の要約プログラム122は、1つまたは複数の文をタグ付けする。実施形態では、ユーザ固有の要約プログラム122は、タグ付けシステムを使用して1つまたは複数の文をタグ付けする。実施形態では、ユーザ固有の要約プログラム122は、1つまたは複数の文の意図を表す単語または語句を使用して1つまたは複数の文をタグ付けする。実施形態では、ユーザ固有の要約プログラム122が1つまたは複数の文をランク付けすることに応答して、ユーザ固有の要約プログラム122は1つまたは複数のキーワードを識別する。 In an embodiment, the user-specific summarization program 122 tags one or more sentences. In an embodiment, the user-specific summarization program 122 tags the one or more sentences using a tagging system. In an embodiment, the user-specific summarization program 122 tags the one or more sentences with words or phrases that express the intent of the one or more sentences. In an embodiment, in response to the user-specific summarization program 122 ranking the one or more sentences, the user-specific summarization program 122 identifies one or more keywords.

例えば、3つの文S1、S2、およびS3は、一群の人の意欲を引き出すか、または注目を集める目的で話される。タグ付けシステムは、これらの文を「動機付け」または「グループの注目を集める」としてタグ付けするために使用される。3つの文S4、S5、およびS6は、一群の人の気分を明るくする目的で話される。タグ付けシステムは、これらの文を「気分を明るくする」としてタグ付けするために使用される。3つの文S7、S8、およびS9は、何の目的もなく話される。タグ付けシステムは、これらの文を「無意味」としてタグ付けするために使用される。 For example, three sentences S1, S2, and S3 are spoken with the purpose of motivating or attracting the attention of a group of people. A tagging system is used to tag these sentences as "motivating" or "attention-grabbing". Three sentences S4, S5, and S6 are spoken with the purpose of lightening the mood of a group of people. A tagging system is used to tag these sentences as "lightening the mood". Three sentences S7, S8, and S9 are spoken without any purpose. A tagging system is used to tag these sentences as "nonsense".

ステップ455で、ユーザ固有の要約プログラム122はグローバルなランク付けを準備する。実施形態では、ユーザ固有の要約プログラム122は、ステップ405で識別されて重み付けを割り当てられた2人以上の参加者、ステップ450で識別されて重み付けを割り当てられた1つまたは複数のキーワード、およびステップ455でランク付けされた1つまたは複数の文のサブセットを組み込む、グローバルなランク付けを準備する。実施形態では、ユーザ固有の要約プログラム122は、ユーザに合わせてより調整された要約を準備することにおいてユーザ固有の要約プログラム122を支援するために、会議から離れたユーザがランク付けの優先順位をくつがえすことを可能にする。実施形態では、ユーザ固有の要約プログラム122が1つまたは複数のキーワードを識別することに応答して、ユーザ固有の要約プログラム122はグローバルなランク付けを準備する。 In step 455, the user-specific summarization program 122 prepares a global ranking. In an embodiment, the user-specific summarization program 122 prepares a global ranking that incorporates the two or more participants identified and assigned weights in step 405, the one or more keywords identified and assigned weights in step 450, and the subset of one or more sentences ranked in step 455. In an embodiment, the user-specific summarization program 122 allows a user away from the conference to override the ranking priority to assist the user-specific summarization program 122 in preparing a summary that is more tailored to the user. In an embodiment, in response to the user-specific summarization program 122 identifying one or more keywords, the user-specific summarization program 122 prepares a global ranking.

ステップ460で、ユーザ固有の要約プログラム122は要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、機械学習アルゴリズムを使用して要約を準備する。実施形態では、ユーザ固有の要約プログラム122は、ステップ405で重み付けを割り当てられた参加者ごとに要約を準備する。1つまたは複数の実施形態では、ユーザ固有の要約プログラム122は、上位N個のランク付けされた参加者に関する要約を準備する。Nは、ステップ220でユーザによって設定されたユーザの嗜好または機械駆動の推奨であってよい。 In step 460, the user-specific summarization program 122 prepares summaries. In embodiments, the user-specific summarization program 122 prepares summaries using a machine learning algorithm. In embodiments, the user-specific summarization program 122 prepares summaries for each participant assigned a weight in step 405. In one or more embodiments, the user-specific summarization program 122 prepares summaries for the top N ranked participants, where N may be a user preference or machine-driven recommendation set by the user in step 220.

例えば、15人(すなわち、X1、X2、...、X15)が会議に参加する。ユーザ固有の要約プログラム122は、会議における参加者の役割、参加者の企業における参加者の役割、および会議から離れたユーザとの参加者の関連性に基づいて、重み付けを各参加者に割り当てる。ユーザ固有の要約プログラム122は、上位5人のランク付けされた参加者(すなわち、X1、X2、X3、X4、およびX5)に関する要約を準備する。 For example, 15 people (i.e., X1, X2, ..., X15) participate in a conference. The user-specific summarization program 122 assigns a weighting to each participant based on the participant's role in the conference, the participant's role in the participant's enterprise, and the participant's relevance to the user away from the conference. The user-specific summarization program 122 prepares a summary for the top five ranked participants (i.e., X1, X2, X3, X4, and X5).

実施形態では、ユーザ固有の要約プログラム122は、会議から離れたユーザのプロフィールに合わせて、準備される各要約を調整する。実施形態では、ユーザ固有の要約プログラム122は、ステップ455で準備されたグローバルなランク付けを使用して各要約を調整する。実施形態では、ユーザ固有の要約プログラム122は、会議中に話した参加者と会議から離れたユーザの間の関係に比例して一致するように各要約を調整する。会議から離れたユーザとの参加者の関連性が、要因のセットによって決定される。要因のセットは、会議における参加者の役割(すなわち、会議の主催者、会議の要求された出席者、会議の任意選択的な出席者)、参加者の企業プロフィール、参加者の企業の階層、企業の階層内の参加者の地位、参加者の企業内の参加者の年功序列、参加者の主要な仕事、参加者の主要な仕事の職務、ユーザの技術に関する関心、およびユーザの専門知識、参加者が話すことまたは質問に回答することが期待されたため、会議のホストによって参加者の名前が言及されたかどうか、ならびに参加者が会議中に話していたかどうかを含むが、これらに限定されない。 In an embodiment, the user-specific summarizing program 122 tailors each prepared summary to the profile of the user who left the conference. In an embodiment, the user-specific summarizing program 122 tailors each summary using the global ranking prepared in step 455. In an embodiment, the user-specific summarizing program 122 tailors each summary to proportionally match the relationship between the participant who spoke during the conference and the user who left the conference. The participant's relevance to the user who left the conference is determined by a set of factors, including, but not limited to, the participant's role in the conference (i.e., the conference organizer, the conference requested attendee, the conference optional attendee), the participant's company profile, the participant's company hierarchy, the participant's position within the company hierarchy, the participant's seniority within the participant's company, the participant's primary job, the participant's primary job function, the user's technology interests, and the user's expertise, whether the participant was mentioned by name by the conference host because the participant was expected to speak or answer questions, and whether the participant spoke during the conference.

実施形態では、ユーザ固有の要約プログラム122は、音声認識信頼度スコアまたは意図信頼度スコアあるいはその両方を使用して各要約を調整する。実施形態では、ユーザ固有の要約プログラム122がグローバルなランク付けを準備することに応答して、ユーザ固有の要約プログラム122は要約を準備する。 In an embodiment, the user-specific summarization program 122 adjusts each summary using the speech recognition confidence score, the intent confidence score, or both. In an embodiment, the user-specific summarization program 122 prepares a summary in response to the user-specific summarization program 122 preparing a global ranking.

図5は、本発明の実施形態に従う、図1の分散データ処理環境100内のコンピューティング・デバイス500のコンポーネントのブロック図である。図5は、単に1つの実装の例を提供しており、さまざまな実施形態が実装され得る環境に関して、どのような制限も意味していないと理解されるべきである。図に示された環境に対して、多くの変更が行われ得る。 Figure 5 is a block diagram of components of a computing device 500 within the distributed data processing environment 100 of Figure 1 in accordance with an embodiment of the present invention. Figure 5 provides merely an example of one implementation and is not intended to imply any limitations with regard to the environments in which various embodiments may be implemented. Many modifications to the illustrated environment may be made.

コンピューティング・デバイス500は、キャッシュ516、メモリ506、永続的ストレージ508、通信ユニット510、および入出力(I/O:input/output)インターフェイス512の間の通信を提供する通信ファブリック502を含んでいる。通信ファブリック502は、プロセッサ(マイクロプロセッサ、通信プロセッサ、およびネットワーク・プロセッサなど)、システム・メモリ、周辺機器、およびシステム内の任意の他のハードウェア・コンポーネントの間で、データまたは制御情報あるいはその両方を渡すために設計された、任意のアーキテクチャを使用して実装され得る。例えば、通信ファブリック502は、1つまたは複数のバスまたはクロスバ・スイッチを使用して実装され得る。 Computing device 500 includes a communications fabric 502 that provides communication between cache 516, memory 506, persistent storage 508, communications unit 510, and input/output (I/O) interface 512. Communications fabric 502 may be implemented using any architecture designed to pass data and/or control information between processors (such as microprocessors, communications processors, and network processors), system memory, peripherals, and any other hardware components in the system. For example, communications fabric 502 may be implemented using one or more buses or crossbar switches.

メモリ506および永続的ストレージ508は、コンピュータ可読ストレージ媒体である。この実施形態では、メモリ506はランダム・アクセス・メモリ(RAM:random access memory)を含んでいる。一般に、メモリ506は、任意の適切な揮発性または不揮発性のコンピュータ可読ストレージ媒体を含むことができる。キャッシュ516は、メモリ506から最近アクセスされたデータ、およびアクセスされたデータに近いデータを保持することによって、コンピュータ・プロセッサ504の性能を向上させる高速なメモリである。 Memory 506 and persistent storage 508 are computer-readable storage media. In this embodiment, memory 506 includes random access memory (RAM). In general, memory 506 may include any suitable volatile or non-volatile computer-readable storage medium. Cache 516 is high-speed memory that improves the performance of computer processor 504 by holding recently accessed data and data near the accessed data from memory 506.

キャッシュ516を介して各コンピュータ・プロセッサ504のうちの1つまたは複数によって実行するため、またはアクセスするため、あるいはその両方のために、プログラムが永続的ストレージ508およびメモリ506に格納されてよい。実施形態では、永続的ストレージ508は、磁気ハード・ディスク・ドライブを含んでいる。磁気ハード・ディスク・ドライブに対する代替または追加として、永続的ストレージ508は、半導体ハード・ドライブ、半導体ストレージ・デバイス、読み取り専用メモリ(ROM:read-only memory)、消去可能プログラマブル読み取り専用メモリ(EPROM:erasable programmable read-only memory)、フラッシュ・メモリ、あるいはプログラム命令またはデジタル情報を格納できる任意の他のコンピュータ可読ストレージ媒体を含むことができる。 Programs may be stored in persistent storage 508 and memory 506 for execution and/or access by one or more of the computer processors 504 via cache 516. In an embodiment, persistent storage 508 includes a magnetic hard disk drive. As an alternative or in addition to a magnetic hard disk drive, persistent storage 508 may include a solid-state hard drive, a solid-state storage device, read-only memory (ROM), erasable programmable read-only memory (EPROM), flash memory, or any other computer-readable storage medium capable of storing program instructions or digital information.

永続的ストレージ508によって使用される媒体は、取り外し可能であってもよい。例えば、取り外し可能ハード・ドライブが、永続的ストレージ508に使用されてよい。他の例としては、永続的ストレージ508の一部でもある別のコンピュータ可読ストレージ媒体に転送するためのドライブに挿入される、光ディスクおよび磁気ディスク、サム・ドライブ、ならびにスマート・カードが挙げられる。 The media used by persistent storage 508 may be removable. For example, a removable hard drive may be used for persistent storage 508. Other examples include optical and magnetic disks, thumb drives, and smart cards that are inserted into a drive for transfer to another computer-readable storage medium that is also part of persistent storage 508.

これらの例において、通信ユニット510は、他のデータ処理システムまたはデバイスとの通信を提供する。これらの例において、通信ユニット510は、1つまたは複数のネットワーク・インターフェイス・カードを含む。通信ユニット510は、物理的通信リンクおよびワイヤレス通信リンクのどちらかまたは両方を使用して通信を提供してよい。プログラムは、通信ユニット510を介して永続的ストレージ508にダウンロードされてよい。 In these examples, communications unit 510 provides for communication with other data processing systems or devices. In these examples, communications unit 510 includes one or more network interface cards. Communications unit 510 may provide communications using either or both physical and wireless communications links. Programs may be downloaded to persistent storage 508 via communications unit 510.

I/Oインターフェイス512は、サーバ120またはユーザ・コンピューティング・デバイス130あるいはその両方に接続されてよい他のデバイスとのデータの入力および出力を可能にする。例えば、I/Oインターフェイス512は、キーボード、キーパッド、タッチ・スクリーン、または他の適切な入力デバイス、あるいはその組合せなどの、外部デバイス518への接続を提供してよい。外部デバイス518は、例えばサム・ドライブ、ポータブル光ディスクまたはポータブル磁気ディスク、およびメモリ・カードなどの、ポータブル・コンピュータ可読ストレージ媒体を含むこともできる。本発明の実施形態を実践するために使用されるソフトウェアおよびデータは、そのようなポータブル・コンピュータ可読ストレージ媒体に格納することができ、I/Oインターフェイス512を介して永続的ストレージ508に読み込むことができる。I/Oインターフェイス512は、ディスプレイ520にも接続する。 I/O interface 512 allows for the input and output of data with other devices that may be connected to server 120 and/or user computing device 130. For example, I/O interface 512 may provide connection to external devices 518, such as a keyboard, keypad, touch screen, or other suitable input device, or a combination thereof. External devices 518 may also include portable computer-readable storage media, such as thumb drives, portable optical or magnetic disks, and memory cards. Software and data used to practice embodiments of the present invention may be stored on such portable computer-readable storage media and loaded into persistent storage 508 via I/O interface 512. I/O interface 512 also connects to display 520.

ディスプレイ520は、データをユーザに表示するためのメカニズムを提供し、例えば、コンピュータのモニタであってよい。 Display 520 provides a mechanism for displaying data to a user and may be, for example, a computer monitor.

本明細書に記載されたプログラムは、アプリケーションに基づいて識別され、本発明の特定の実施形態において、そのアプリケーションに関して実装される。ただし、本明細書における特定のプログラムの名前は単に便宜上使用されていると理解されるべきであり、したがって、本発明は、そのような名前によって識別されたか、または暗示されたか、あるいはその両方である特定のアプリケーションのみで使用するように制限されるべきではない。 The programs described herein are identified based on the application for which they are implemented in particular embodiments of the invention. However, it should be understood that the names of specific programs herein are used merely for convenience, and thus the invention should not be limited to use with only the particular application identified and/or implied by such names.

本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであってよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読ストレージ媒体を含んでよい。 The present invention may be a system, a method, or a computer program product, or a combination thereof. The computer program product may include a computer-readable storage medium containing computer-readable program instructions for causing a processor to perform aspects of the present invention.

コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組合せであってよいが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・フロッピー(R)・ディスク、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disc read-only memory)、デジタル・バーサタイル・ディスク(DVD:digital versatile disk)、メモリ・スティック、フロッピー(R)・ディスク、命令が記録されているパンチカードまたは溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組合せを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、電波または他の自由に伝搬する電磁波、導波管または他の送信媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいはワイヤを介して送信される電気信号などの、それ自体が一過性の信号であると解釈されるべきではない。 A computer-readable storage medium may be a tangible device capable of holding and storing instructions for use by an instruction execution device. A computer-readable storage medium may be, for example, but is not limited to, an electronic storage device, a magnetic storage device, an optical storage device, an electromagnetic storage device, a semiconductor storage device, or any suitable combination thereof. A non-exhaustive list of more specific examples of computer-readable storage media includes portable floppy disks, hard disks, random access memory (RAM), read-only memory (ROM), erasable programmable read-only memory (EPROM or flash memory), static random access memory (SRAM), portable compact disc read-only memory (CD-ROM), digital versatile disk (DVD), memory stick, floppy disk, mechanically encoded devices such as punch cards or ridge-in-groove structures on which instructions are recorded, and any suitable combination thereof. As used herein, computer-readable storage media should not be construed as being ephemeral signals per se, such as radio waves or other freely propagating electromagnetic waves, electromagnetic waves propagating through waveguides or other transmission media (e.g., light pulses passing through fiber optic cables), or electrical signals transmitted over wires.

本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から各コンピューティング・デバイス/処理デバイスへ、またはネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、またはワイヤレス・ネットワーク、あるいはその組合せ)を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされ得る。このネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを備えてよい。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。 The computer-readable program instructions described herein may be downloaded from a computer-readable storage medium to each computing/processing device or to an external computer or external storage device via a network (e.g., the Internet, a local area network, a wide area network, or a wireless network, or a combination thereof). This network may include copper transmission cables, optical fiber transmissions, wireless transmissions, routers, firewalls, switches, gateway computers, and/or edge servers. A network adapter card or network interface within each computing/processing device receives the computer-readable program instructions from the network and forwards the computer-readable program instructions for storage on a computer-readable storage medium within each computing/processing device.

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA:instruction-set-architecture)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、あるいはSmalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組合せで記述されたソース・コードまたはオブジェクト・コードであってよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワークまたは広域ネットワークを含む任意の種類のネットワークを介してユーザのコンピュータに接続されてよく、または接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行われてよい。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル・ロジック回路、フィールドプログラマブル・ゲート・アレイ(FPGA:field-programmable gate arrays)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic arrays)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行し、電子回路をカスタマイズしてよい。 The computer-readable program instructions for carrying out the operations of the present invention may be source or object code written in any combination of one or more programming languages, including assembler instructions, instruction-set-architecture (ISA) instructions, machine instructions, machine-dependent instructions, microcode, firmware instructions, state-setting data, or object code written in any combination of one or more programming languages, including object-oriented programming languages such as Smalltalk®, C++, and conventional procedural programming languages such as the "C" programming language or similar programming languages. The computer-readable program instructions may execute entirely on the user's computer, partially on the user's computer as a standalone software package, partially on the user's computer and on a remote computer, or entirely on a remote computer or server. In the latter scenario, the remote computer may be connected to the user's computer via any type of network, including a local area network or a wide area network, or the connection may be to an external computer (e.g., via the Internet using an Internet Service Provider). In some embodiments, to carry out aspects of the present invention, electronic circuits including, for example, programmable logic circuits, field-programmable gate arrays (FPGAs), or programmable logic arrays (PLAs), may execute computer-readable program instructions to customize the electronic circuitry by utilizing state information in the computer-readable program instructions.

本発明の態様は、本明細書において、本発明の実施形態に従って、方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組合せが、コンピュータ可読プログラム命令によって実装され得るということが理解されるであろう。 Aspects of the present invention are described herein with reference to flowchart illustrations and/or block diagrams of methods, apparatus (systems), and computer program products according to embodiments of the invention. It will be understood that each block of the flowchart illustrations and/or block diagrams, and combinations of blocks in the flowchart illustrations and/or block diagrams, can be implemented by computer-readable program instructions.

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組合せに特定の方式で機能するように指示できるものであってもよい。 These computer-readable program instructions may be provided to a processor of a general-purpose computer, special-purpose computer, or other programmable data processing apparatus to create a machine, such that the instructions, executed by the processor of the computer or other programmable data processing apparatus, create means for performing the functions/operations specified in one or more blocks of the flowcharts and/or block diagrams. These computer-readable program instructions may be stored on a computer-readable storage medium and capable of directing a computer, programmable data processing apparatus, or other device, or combination thereof, to function in a particular manner, such that the computer-readable storage medium on which the instructions are stored comprises an article of manufacture containing instructions for performing aspects of the functions/operations specified in one or more blocks of the flowcharts and/or block diagrams.

コンピュータ可読プログラム命令は、コンピュータ上、他のプログラム可能な装置上、または他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施するように、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイスに読み込まれてもよく、それによって、一連の動作可能なステップを、コンピュータ上、他のプログラム可能な装置上、またはコンピュータ実装プロセスを生成する他のデバイス上で実行させる。 Computer-readable program instructions may be loaded into a computer, other programmable data processing apparatus, or other device such that the instructions, which execute on the computer, other programmable apparatus, or other device, perform the functions/acts specified in one or more blocks of the flowcharts and/or block diagrams, thereby causing a series of operable steps to be performed on the computer, other programmable apparatus, or other device to produce a computer-implemented process.

図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に従って、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能な命令を備える、命令のモジュール、セグメント、または部分を表してよい。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生してよい。例えば、連続して示された2つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行されてよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組合せは、規定された機能または動作を実行するか、または専用ハードウェアとコンピュータ命令の組合せを実行する専用ハードウェアベースのシステムによって実装され得るということにも注意する。 The flowcharts and block diagrams in the figures illustrate the architecture, functionality, and operation of possible implementations of systems, methods, and computer program products according to various embodiments of the present invention. In this regard, each block in a flowchart or block diagram may represent a module, segment, or portion of instructions, comprising one or more executable instructions for implementing the specified logical function(s). In some alternative implementations, the functions shown in the blocks may occur out of the order shown in the figures. For example, two blocks shown in succession may, in fact, be executed substantially concurrently or in the reverse order, depending on the functionality involved. It is also noted that each block in the block diagrams and/or flowchart diagrams, and combinations of blocks included in the block diagrams and/or flowchart diagrams, may be implemented by a special-purpose hardware-based system that performs the specified functions or operations or executes a combination of special-purpose hardware and computer instructions.

本発明のさまざまな実施形態の説明は、例示の目的で提示されているが、網羅的であることは意図されておらず、開示された実施形態に制限されない。本発明の範囲から逸脱することなく、多くの変更および変形が、当業者にとって明らかになるであろう。本明細書で使用された用語は、実施形態の原理、実際の適用、または市場で見られる技術を超える技術的改良を最も良く説明するため、または他の当業者が本明細書で開示された実施形態を理解できるようにするために選択されている。 The description of various embodiments of the present invention is presented for illustrative purposes, but is not intended to be exhaustive and is not limited to the disclosed embodiments. Many modifications and variations will become apparent to those skilled in the art without departing from the scope of the present invention. The terms used herein have been selected to best explain the principles, practical applications, or technical improvements of the embodiments beyond those found in the marketplace, or to enable others skilled in the art to understand the embodiments disclosed herein.

Claims (20)

コンピュータ実装方法であって、
1つまたは複数のプロセッサによって、事前設定された期間の間、または事前にスケジュールされた仮想会議の割り当てられた合計時間の事前設定された割合の間、少なくとも2人の参加者を含んでいる仮想会議から離れているユーザを検出することと、
1つまたは複数のプロセッサによって、前記ユーザに関するデータの第1のセット、前記仮想会議の前記少なくとも2人の参加者に関するデータの第2のセット、および前記ユーザと前記仮想会議の前記少なくとも2人の参加者の間の関係に関するデータの第3のセットをデータベースから取り出すことと、
1つまたは複数のプロセッサによって、前記ユーザのプロフィールに合わせて調整された、前記ユーザが切り離されていた間の前記仮想会議の一部を対象にする、要約を準備することと、
1つまたは複数のプロセッサによって、前記ユーザが前記仮想会議に再接続することを検出することと、
1つまたは複数のプロセッサによって、事前設定されたユーザの嗜好、前記ユーザによって行われた決定、または機械駆動の推奨に基づいて、前記ユーザが前記仮想会議に再び参加する前に前記要約をレビューするかどうかを判定することと、
前記ユーザが前記仮想会議に再び参加する前に前記要約をレビューするということを決定することに応答して、1つまたは複数のプロセッサによって、デフォルトのユーザの嗜好のセットを使用して、前記要約をレビューするよう前記ユーザに促すことと、
1つまたは複数のプロセッサによって、前記要約を前記ユーザに出力することとを含む、コンピュータ実装方法。
1. A computer-implemented method comprising:
detecting, by one or more processors, a user absent from a virtual conference including at least two participants for a preset period of time or for a preset percentage of the total allotted time of the pre-scheduled virtual conference;
retrieving, by one or more processors, from a database a first set of data regarding the user, a second set of data regarding the at least two participants of the virtual conference, and a third set of data regarding a relationship between the user and the at least two participants of the virtual conference;
preparing, by one or more processors, a summary tailored to the user's profile and covering the portion of the virtual meeting during which the user was disconnected;
detecting, by one or more processors, that the user reconnects to the virtual conference;
determining, by one or more processors, whether the user will review the summary before rejoining the virtual conference based on preset user preferences, decisions made by the user, or machine-driven recommendations;
prompting, by one or more processors, the user to review the summary using a set of default user preferences in response to the user determining that the user will review the summary before rejoining the virtual conference;
and outputting, by one or more processors, the summary to the user.
前記要約を前記ユーザに出力した後に、1つまたは複数のプロセッサによって、前記要約を前記仮想会議の完全な記録の再生と比較することと、
1つまたは複数のプロセッサによって、前記ユーザに対してフィードバックを要求することと、
1つまたは複数のプロセッサによって、前記ユーザから前記フィードバックを受信することと、
1つまたは複数のプロセッサによって、強化学習を使用して、準備される複数の未来の要約の精度を改善することと、
1つまたは複数のプロセッサによって、前記ユーザからの前記フィードバックを前記データベースに格納することとをさらに含む、請求項1に記載のコンピュータ実装方法。
after outputting the summary to the user, comparing, by one or more processors, the summary with a playback of the complete recording of the virtual conference;
requesting, by one or more processors, feedback from the user;
receiving, by one or more processors, the feedback from the user;
improving, by one or more processors, the accuracy of the prepared future summaries using reinforcement learning;
2. The computer-implemented method of claim 1, further comprising: storing, by one or more processors, the feedback from the user in the database.
前記ユーザの前記プロフィールに合わせて調整された、前記ユーザが切り離されていた間の前記仮想会議の前記一部を対象にする、前記要約を準備することが、
1つまたは複数のプロセッサによって、前記仮想会議の前記少なくとも2人の参加者を識別することと、
1つまたは複数のプロセッサによって、要因の第1のセットに基づいて、重み付けを前記仮想会議の前記少なくとも2人の参加者に割り当てることと、
1つまたは複数のプロセッサによって、前記少なくとも2人の参加者に割り当てられた前記重み付けに基づいて、前記仮想会議の前記少なくとも2人の参加者をランク付けすることとをさらに含む、請求項1に記載のコンピュータ実装方法。
preparing the summary tailored to the profile of the user and covering the portion of the virtual meeting while the user was disconnected;
identifying, by one or more processors, the at least two participants of the virtual conference;
assigning, by one or more processors, weights to the at least two participants of the virtual conference based on a first set of factors;
and ranking, by one or more processors, the at least two participants of the virtual conference based on the weightings assigned to the at least two participants.
前記少なくとも2人の参加者に割り当てられた前記重み付けに基づいて前記仮想会議の前記少なくとも2人の参加者をランク付けした後に、1つまたは複数のプロセッサによって、複数の音声フレーム、複数のビデオ・フレーム、あるいは複数の音声およびビデオ・フレームを、前記ユーザが切り離されていた間の前記仮想会議の前記一部から抽出することと、
1つまたは複数のプロセッサによって、前記仮想会議の1つまたは複数のトピックを理解するために、前記複数の音声フレーム、前記複数のビデオ・フレーム、あるいは前記複数の音声およびビデオ・フレームの文脈を識別することとをさらに含む、請求項3に記載のコンピュータ実装方法。
extracting, by one or more processors, a plurality of audio frames, a plurality of video frames, or a plurality of audio and video frames from the portion of the virtual conference during which the users were disconnected, after ranking the at least two participants of the virtual conference based on the weights assigned to the at least two participants;
4. The computer-implemented method of claim 3, further comprising: identifying, by one or more processors, a context of the plurality of audio frames, the plurality of video frames, or the plurality of audio and video frames to understand one or more topics of the virtual conference.
前記仮想会議の前記1つまたは複数のトピックを理解するために前記複数の音声フレーム、前記複数のビデオ・フレーム、あるいは前記複数の音声およびビデオ・フレームの前記文脈を識別した後に、1つまたは複数のプロセッサによって、前記複数の音声フレーム、前記複数のビデオ・フレーム、あるいは前記複数の音声およびビデオ・フレームが、会議から離れていたユーザのための要約の準備に寄与するかどうかに基づいて、前記複数の音声フレームのサブセット、前記複数のビデオ・フレームのサブセット、あるいは前記複数の音声およびビデオ・フレームのサブセットを選択することと、
1つまたは複数のプロセッサによって、アルゴリズム法または要因の第2のセットを使用して、前記複数の音声フレームの前記サブセット、前記複数のビデオ・フレームの前記サブセット、あるいは前記複数の音声およびビデオ・フレームの前記サブセットをランク付けすることと、
1つまたは複数のプロセッサによって、アルゴリズムで決定されたしきい値より上にランク付けされた前記複数の音声フレームの前記サブセット、前記複数のビデオ・フレームの前記サブセット、あるいは前記複数の音声およびビデオ・フレームの前記サブセットをマージすることと、
1つまたは複数のプロセッサによって、前記アルゴリズムで決定されたしきい値より上にランク付けされた前記複数の音声フレームの前記サブセットの統合された要約、前記アルゴリズムで決定されたしきい値より上にランク付けされた前記複数のビデオ・フレームの前記サブセットの統合された要約、ならびに前記アルゴリズムで決定されたしきい値より上にランク付けされた前記複数の音声およびビデオ・フレームの前記サブセットの統合された要約を準備することとをさらに含む、請求項4に記載のコンピュータ実装方法。
After identifying the context of the plurality of audio frames, the plurality of video frames, or the plurality of audio and video frames to understand the one or more topics of the virtual conference, selecting, by one or more processors, a subset of the plurality of audio frames, a subset of the plurality of video frames, or a subset of the plurality of audio and video frames based on whether the plurality of audio frames, the plurality of video frames, or the plurality of audio and video frames contribute to preparing a summary for a user who was away from the conference;
ranking, by one or more processors, the subset of the plurality of audio frames, the subset of the plurality of video frames, or the subset of the plurality of audio and video frames using an algorithmic method or a second set of factors;
merging, by one or more processors, the subset of the plurality of audio frames, the subset of the plurality of video frames, or the subset of the plurality of audio and video frames ranked above an algorithmically determined threshold;
5. The computer-implemented method of claim 4, further comprising preparing, by one or more processors, an integrated summary of the subset of the plurality of audio frames ranked above the algorithmically determined threshold, an integrated summary of the subset of the plurality of video frames ranked above the algorithmically determined threshold, and an integrated summary of the subset of the plurality of audio and video frames ranked above the algorithmically determined threshold.
前記アルゴリズムで決定されたしきい値より上にランク付けされた前記複数の音声フレームの前記サブセットの統合された要約、前記アルゴリズムで決定されたしきい値より上にランク付けされた前記複数のビデオ・フレームの前記サブセットの統合された要約、ならびに前記アルゴリズムで決定されたしきい値より上にランク付けされた前記複数の音声およびビデオ・フレームの前記サブセットの統合された要約を準備した後に、1つまたは複数のプロセッサによって、抽出テキスト要約アルゴリズムを使用して前記統合された要約を1つまたは複数の文に変換することと、
1つまたは複数のプロセッサによって、話者ダイアライゼーションを適用することと、
1つまたは複数のプロセッサによって、要因の第3のセットに基づいて前記1つまたは複数の文をランク付けすることと、
1つまたは複数のプロセッサによって、第2の事前設定されたユーザの嗜好または第2の機械駆動の推奨に基づく第2のしきい値より上にランク付けされた前記1つまたは複数の文のサブセットを保持することとをさらに含む、請求項5に記載のコンピュータ実装方法。
after preparing an integrated summary of the subset of the plurality of audio frames ranked above an algorithmically determined threshold, an integrated summary of the subset of the plurality of video frames ranked above an algorithmically determined threshold, and an integrated summary of the subset of the plurality of audio and video frames ranked above an algorithmically determined threshold, converting, by one or more processors, the integrated summaries into one or more sentences using an extractive text summarization algorithm;
applying, by one or more processors, speaker diarization;
ranking, by one or more processors, the one or more sentences based on a third set of factors; and
and retaining, by one or more processors, a subset of the one or more sentences ranked above a second threshold based on second preset user preferences or second machine-driven recommendations.
前記第2の事前設定されたユーザの嗜好または前記第2の機械駆動の推奨に基づく前記第2のしきい値より上にランク付けされた前記1つまたは複数の文の前記サブセットを保持した後に、1つまたは複数のプロセッサによって、前記1つまたは複数の文の前記サブセット内の1つまたは複数のキーワードを識別することと、
1つまたは複数のプロセッサによって、前記仮想会議の前記1つまたは複数のトピックとの前記1つまたは複数のキーワードの関連性に基づいて、および前記仮想会議の前記少なくとも2人の参加者との前記1つまたは複数のキーワードの関連性に基づいて、重み付けを前記1つまたは複数の文の前記サブセット内の前記1つまたは複数のキーワードに割り当てることと、
1つまたは複数のプロセッサによって、前記1つまたは複数のキーワードを使用して前記1つまたは複数の文の前記サブセットをタグ付けすることとをさらに含む、請求項6に記載のコンピュータ実装方法。
identifying, by one or more processors, one or more keywords in the subset of one or more sentences after retaining the subset of one or more sentences ranked above the second threshold based on the second preset user preferences or the second machine-driven recommendations;
assigning, by one or more processors, a weight to the one or more keywords in the subset of the one or more sentences based on relevance of the one or more keywords to the one or more topics of the virtual conference and based on relevance of the one or more keywords to the at least two participants of the virtual conference;
and tagging, by one or more processors, the subset of the one or more sentences with the one or more keywords.
前記1つまたは複数のキーワードを使用して前記1つまたは複数の文の前記サブセットをタグ付けした後に、1つまたは複数のプロセッサによって、前記少なくとも2人の参加者、前記1つまたは複数のキーワード、および前記1つまたは複数の文の前記サブセットを組み込むグローバルなランク付けを準備することと、
1つまたは複数のプロセッサによって、前記グローバルなランク付けに基づいて、前記ユーザのプロフィールに合わせて調整された前記要約を準備することとをさらに含む、請求項7に記載のコンピュータ実装方法。
preparing, by one or more processors, a global ranking incorporating the at least two participants, the one or more keywords, and the subset of the one or more sentences after tagging the subset of the one or more sentences with the one or more keywords;
and preparing, by one or more processors, the summary tailored to the user's profile based on the global ranking.
前記データベースから収集された、前記ユーザに関する前記データの第1のセット、前記仮想会議の前記少なくとも2人の参加者に関する前記データの第2のセット、前記ユーザと前記仮想会議の前記少なくとも2人の参加者の間の前記関係に関する前記データの第3のセットが、前記ユーザによって作成されたプロフィール、前記ユーザの企業プロフィール、前記ユーザのカレンダー、前記仮想会議の前記少なくとも2人の参加者によって作成された1つまたは複数のプロフィール、前記仮想会議の前記少なくとも2人の参加者の前記企業プロフィール、前記仮想会議の前記少なくとも2人の参加者の前記カレンダー、前記仮想会議の前記少なくとも2人の参加者によって使用される1つまたは複数のプレゼンテーション・ツール、および前記ユーザがホストしたか、参加したか、または出席した1つまたは複数の以前の仮想会議からのデータを含む、請求項1に記載のコンピュータ実装方法。 The computer-implemented method of claim 1, wherein the first set of data about the user, the second set of data about the at least two participants of the virtual conference, and the third set of data about the relationships between the user and the at least two participants of the virtual conference collected from the database include a profile created by the user, a company profile of the user, a calendar of the user, one or more profiles created by the at least two participants of the virtual conference, the company profiles of the at least two participants of the virtual conference, the calendars of the at least two participants of the virtual conference, one or more presentation tools used by the at least two participants of the virtual conference, and data from one or more previous virtual conferences hosted, participated in, or attended by the user. 前記ユーザが前記仮想会議に再接続することを検出することが、
1つまたは複数のプロセッサによって、前記ユーザが再接続したときの前記仮想会議中の間を捕捉することと、
1つまたは複数のプロセッサによって、前記ユーザが前記仮想会議から切り離されていた時間の全持続時間を計算することとをさらに含む、請求項1に記載のコンピュータ実装方法。
detecting that the user reconnects to the virtual conference;
capturing, by one or more processors, the time during the virtual conference when the user reconnects;
and calculating, by one or more processors, a total duration of time that the user was disconnected from the virtual conference.
前記要約をレビューするための前記デフォルトのユーザの嗜好のセットが、言語の嗜好、視聴モードの嗜好、音声の嗜好、およびサブタイトルの嗜好を含む、請求項1に記載のコンピュータ実装方法。 The computer-implemented method of claim 1, wherein the set of default user preferences for reviewing the summary includes language preferences, viewing mode preferences, audio preferences, and subtitle preferences. 前記要約を前記仮想会議の前記完全な記録の前記再生と比較することが、
1つまたは複数のプロセッサによって、1つまたは複数の主要な実体の第1のセットを前記要約から抽出し、1つまたは複数の主要な実体の第2のセットを前記仮想会議の前記完全な記録から抽出することと、
1つまたは複数のプロセッサによって、前記要約からの前記1つまたは複数の主要な実体の第1のセットを、前記仮想会議の前記完全な記録からの前記1つまたは複数の主要な実体の第2のセットと照合することとをさらに含む、請求項2に記載のコンピュータ実装方法。
comparing the summary to the playback of the complete recording of the virtual meeting;
extracting, by one or more processors, a first set of one or more key entities from the summary and a second set of one or more key entities from the full recording of the virtual meeting;
3. The computer-implemented method of claim 2, further comprising: matching, by one or more processors, the first set of one or more key entities from the summary with a second set of one or more key entities from the full recording of the virtual meeting.
前記ユーザに対してフィードバックを要求することが、
1つまたは複数のプロセッサによって、前記ユーザの満足度を表す3つ以上の選択を前記ユーザに提供することをさらに含み、前記3つ以上の選択が、不満足、中立、および満足を含む、請求項2に記載のコンピュータ実装方法。
requesting feedback from the user;
3. The computer-implemented method of claim 2, further comprising: providing, by one or more processors, the user with three or more choices representing a satisfaction level of the user, the three or more choices comprising: dissatisfied, neutral, and satisfied.
前記要因の第1のセットが、前記仮想会議における前記少なくとも2人の参加者の役割、企業における前記少なくとも2人の参加者の前記役割、および前記仮想会議から離れた前記ユーザとの前記少なくとも2人の参加者の前記関係を含む、請求項3に記載のコンピュータ実装方法。 The computer-implemented method of claim 3, wherein the first set of factors includes the roles of the at least two participants in the virtual conference, the roles of the at least two participants in an enterprise, and the relationship of the at least two participants to the user remote from the virtual conference. 前記アルゴリズムで決定されたしきい値が、動的であり、トレーニング・データ・セットに合わせて設定される、請求項5に記載のコンピュータ実装方法。 The computer-implemented method of claim 5, wherein the algorithmically determined threshold is dynamic and tailored to the training data set. 前記要因の第2のセットが、前記フレームが、前記仮想会議から切り離された前記ユーザの名前を含んでいるかどうか、前記少なくとも2人の参加者の前記ランク付け、前記ユーザの技術に関する関心に基づくか、前記ユーザの専門知識に基づくか、または過去の分析に基づく、前記仮想会議から離れた前記ユーザとの前記少なくとも2人の参加者の前記関係を含む、請求項5に記載のコンピュータ実装方法。 The computer-implemented method of claim 5, wherein the second set of factors includes whether the frame includes the name of the user who has left the virtual conference, the ranking of the at least two participants, and the relationship of the at least two participants to the user who has left the virtual conference based on the user's technology interests, the user's expertise, or past analysis. 話者ダイアライゼーションを適用することが、
1つまたは複数のプロセッサによって、前記複数の音声フレーム内の前記少なくとも2人の参加者間の変更点を検出することと、
1つまたは複数のプロセッサによって、前記少なくとも2人の参加者の特性に基づいて、音声のセグメントを一緒にグループ化することとをさらに含む、請求項6に記載のコンピュータ実装方法。
Applying speaker diarization
detecting, by one or more processors, changes between the at least two participants in the plurality of audio frames;
The computer-implemented method of claim 6 , further comprising: grouping, by one or more processors, segments of audio together based on characteristics of the at least two participants.
前記要因の第3のセットが、前記仮想会議の前記少なくとも2人の参加者の役割および前記仮想会議の前記1つまたは複数のトピックとの前記1つまたは複数の文の関連性を含む、請求項6に記載のコンピュータ実装方法。 The computer-implemented method of claim 6, wherein the third set of factors includes roles of the at least two participants in the virtual meeting and relevance of the one or more statements to the one or more topics of the virtual meeting. コンピュータに、請求項1ないし18のいずれかに記載の方法を実行させる、コンピュータ・プログラム。 A computer program causing a computer to execute the method of any one of claims 1 to 18. 1つまたは複数のプロセッサと、
1つまたは複数のコンピュータ可読ストレージ媒体と、
前記1つまたは複数のロセッサのうちの少なくとも1つによって実行するために前記1つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを備えているコンピュータ・システムであって、前記格納されたプログラム命令が、請求1ないし18のいずれか一項に記載の方法を実行するためのプログラム命令を含む、コンピュータ・システム。
one or more processors;
one or more computer-readable storage media;
and program instructions collectively stored on said one or more computer-readable storage media for execution by at least one of said one or more processors , said stored program instructions including program instructions for performing the method of any one of claims 1 to 18.
JP2023558790A 2021-04-15 2022-03-07 Improved virtual meeting user experience based on augmented intelligence Active JP7807460B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17/231,066 2021-04-15
US17/231,066 US11764985B2 (en) 2021-04-15 2021-04-15 Augmented intelligence based virtual meeting user experience improvement
PCT/CN2022/079553 WO2022218062A1 (en) 2021-04-15 2022-03-07 Augmented intelligence based virtual meeting user experience improvement

Publications (3)

Publication Number Publication Date
JP2024514062A JP2024514062A (en) 2024-03-28
JPWO2022218062A5 JPWO2022218062A5 (en) 2024-04-09
JP7807460B2 true JP7807460B2 (en) 2026-01-27

Family

ID=83602930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023558790A Active JP7807460B2 (en) 2021-04-15 2022-03-07 Improved virtual meeting user experience based on augmented intelligence

Country Status (4)

Country Link
US (1) US11764985B2 (en)
JP (1) JP7807460B2 (en)
CN (1) CN117157943A (en)
WO (1) WO2022218062A1 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11727935B2 (en) 2020-12-15 2023-08-15 Optum Technology, Inc. Natural language processing for optimized extractive summarization
TWI790669B (en) * 2021-07-02 2023-01-21 信驊科技股份有限公司 Method and device for viewing meeting
US12406139B2 (en) 2021-08-18 2025-09-02 Optum, Inc. Query-focused extractive text summarization of textual data
US12149568B2 (en) * 2022-01-28 2024-11-19 International Business Machines Corporation Meeting content summarization for disconnected participants
US11729009B1 (en) 2022-02-15 2023-08-15 Microsoft Technology Licensing, Llc Intelligent meeting agent
US12361228B2 (en) 2022-05-26 2025-07-15 Unitedhealth Group Incorporated Natural language processing techniques for machine-learning-guided summarization using hybrid class templates
US12217013B2 (en) 2022-06-22 2025-02-04 Unitedhealth Group Incorporated Machine-learning based transcript summarization
US12028390B2 (en) * 2022-07-15 2024-07-02 Microsoft Technology Licensing, Llc Intelligent meeting management
US11741143B1 (en) * 2022-07-28 2023-08-29 Optum, Inc. Natural language processing techniques for document summarization using local and corpus-wide inferences
CN116366800B (en) * 2023-03-03 2023-12-15 四川九鼎乾元科技有限公司 Online conference method and device, storage medium and electronic equipment
US11816682B1 (en) 2023-03-29 2023-11-14 Simur, Inc. Systems and methods to facilitate synchronized sharing of centralized authentication information to facilitate entity verification and risk assessment
US11799869B1 (en) * 2023-04-10 2023-10-24 Simur, Inc. Systems and methods to store and manage entity verification information to reduce redundant entity information and redundant submission of requests
US20240372967A1 (en) * 2023-05-02 2024-11-07 TMRW Foundation IP Sàrl Multi-modal data-stream-based artificial intelligence interventions in a virtual environment system and method
US12265936B1 (en) 2023-05-23 2025-04-01 Simur, Inc. Systems and methods to assess entities based on custom risk profiles defined through a user interface
US11949777B1 (en) 2023-07-31 2024-04-02 Simur, Inc. Systems and methods to encrypt centralized information associated with users of a customer due diligence platform based on a modified key expansion schedule
US20250124476A1 (en) * 2023-10-12 2025-04-17 Maplebear Inc. Context-Based Generation of Summarized Reviews Using a Large Language Model

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099530A (en) 2000-09-22 2002-04-05 Sharp Corp Minutes preparation apparatus and method, and storage medium using the same
US20160285929A1 (en) 2015-03-27 2016-09-29 Intel Corporation Facilitating dynamic and seamless transitioning into online meetings
US20210092168A1 (en) 2019-09-23 2021-03-25 International Business Machines Corporation Personalized meeting summaries

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308476B2 (en) 2004-05-11 2007-12-11 International Business Machines Corporation Method and system for participant automatic re-invite and updating during conferencing
WO2012088230A1 (en) 2010-12-23 2012-06-28 Citrix Systems, Inc. Systems, methods and devices for facilitating online meetings
US8739046B2 (en) 2011-05-05 2014-05-27 International Business Machines Corporation Dynamic E-meeting summarization
US9002938B2 (en) * 2012-04-26 2015-04-07 International Business Machines Corporation Notifying electronic meeting participants of interesting information
US9008296B2 (en) 2013-06-10 2015-04-14 Microsoft Technology Licensing, Llc Catching up with an ongoing conference call
US9400833B2 (en) 2013-11-15 2016-07-26 Citrix Systems, Inc. Generating electronic summaries of online meetings
EP3254455B1 (en) 2015-02-03 2019-12-18 Dolby Laboratories Licensing Corporation Selective conference digest
GB201600907D0 (en) 2016-01-18 2016-03-02 Dolby Lab Licensing Corp Replaying content of a virtual meeting
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11379799B1 (en) * 2020-09-28 2022-07-05 Ringcentral, Inc. System and method for joining a meeting and setup thereof
US11741949B2 (en) * 2020-10-30 2023-08-29 Nvidia Corporation Real-time video conference chat filtering using machine learning models
US12009937B2 (en) * 2021-01-08 2024-06-11 Microsoft Technology Licensing, Llc Queue management for visual interruption symbols in a virtual meeting

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099530A (en) 2000-09-22 2002-04-05 Sharp Corp Minutes preparation apparatus and method, and storage medium using the same
US20160285929A1 (en) 2015-03-27 2016-09-29 Intel Corporation Facilitating dynamic and seamless transitioning into online meetings
US20210092168A1 (en) 2019-09-23 2021-03-25 International Business Machines Corporation Personalized meeting summaries

Also Published As

Publication number Publication date
CN117157943A (en) 2023-12-01
JP2024514062A (en) 2024-03-28
US11764985B2 (en) 2023-09-19
WO2022218062A1 (en) 2022-10-20
US20220337443A1 (en) 2022-10-20

Similar Documents

Publication Publication Date Title
JP7807460B2 (en) Improved virtual meeting user experience based on augmented intelligence
US10923115B2 (en) Dynamically generated dialog
US10440325B1 (en) Context-based natural language participant modeling for videoconference focus classification
US10691895B2 (en) Dynamic text generation for social media posts
US10630734B2 (en) Multiplexed, multimodal conferencing
WO2022177667A1 (en) Generation and management of data insights to aid collaborative media object generation within a collaborative workspace
US12081601B2 (en) Data realization for virtual collaboration environment
US10282409B2 (en) Performance modification based on aggregation of audience traits and natural language feedback
US20190279164A1 (en) Cognitive-based enhanced meeting recommendation
US11080356B1 (en) Enhancing online remote meeting/training experience using machine learning
Ahmad et al. The news ecosystem in the age of AI: Evidence from the UAE
WO2022177732A1 (en) Collaborative media object generation and presentation in improved collaborative workspace
EP4173276B1 (en) Polling questions for a conference call discussion
US20250232130A1 (en) Dynamic reconfiguration of dashboard content based on call progress
US20170154264A1 (en) Autonomous collaboration agent for meetings
US12106056B2 (en) Natural language processing of structured interactions
US20250232377A1 (en) Dynamic dashboard generation based on focus of conversation
US10235466B2 (en) Profile driven presentation content displaying and filtering
US20240403569A1 (en) Using large language models to generate electronic messages associated with content items
US11811717B2 (en) User preference based message filtering in group messaging
US12282976B2 (en) Automatically enhancing content items through identifying relationships
Onebunne Journalists’ perception of artificial intelligence: the case of Nigerian newsrooms
WO2023071617A1 (en) Augmentation of contextual timeline markers on a virtual video conversation
US12229496B2 (en) Conversational agent counterfactual simulation
US20250348683A1 (en) Multimodal Conversational Artificial Intelligence Architecture and Design

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20251118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260115

R150 Certificate of patent or registration of utility model

Ref document number: 7807460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150