JP2014160463A

JP2014160463A - タイムライン及び経時的なテキスト記述によって定められたメディアコンテンツを改善するための方法及び装置

Info

Publication number: JP2014160463A
Application number: JP2014024576A
Authority: JP
Inventors: Guegan Marie; ゲーガンマリー; Lanagan James; ラナガンジェイムス; Schmouker Philippe; シュモーカーフィリップ; Lambert Anne; ランバートアン
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2013-02-11
Filing date: 2014-02-12
Publication date: 2014-09-04
Also published as: US20140229472A1; EP2765783A1; KR20140101674A; CN103984693A; EP2765784A1

Abstract

【課題】タイムライン及び経時的テキスト記述を備えるマルチメディアコンテンツを改善する方法を提供する。
【解決手段】自然言語処理を用いて、ネットワークから検索されたテキスト文書の少なくとも一部分における少なくとも１つの特徴を識別するステップＥ３と、前記テキスト文書の前記決定された部分と、前記テキスト文書の前記決定された部分にセマンティックに対応する経時的テキスト記述の少なくとも一部分とを自動的に整列するステップＥ４と、を備える前記テキスト文書の少なくとも前記一部分がメディアコンテンツのタイムラインに自動的に同期され、前記経時的テキスト記述はそれ自体が前記タイムラインと同期される。
【選択図】図２

Description

本発明は、一般的に、マルチメディアコンテンツに対するメタデータのアソシエーションに関し、より詳細には、例えば、ソーシャルネットワーク上のウェブユーザによって投稿されたコメント又はウェブフォーラムなどの他のユーザ生成コンテンツを用いた、タイムライン及び経時的なテキスト記述によって定められたメディアコンテンツを改善するための方法及び装置に関する。

この章は、以下に記述又は特許請求された本発明の様々な態様に関連付けられることができる、従来技術の様々な態様に読み手を導入することを意図している。この議論は、本発明の様々な態様のより良い理解を促進するための背景情報を読み手に提供する際の助けとなると考えられる。従って、これらの意見は、この観点から読まれるべきであり、従来技術の自白として読むべきではないことを理解すべきである。

（ＴＶユーザのような）プロフェッショナルではない著者によって書かれたマルチメディアコンテンツ（例えば映画）上のコメントのテキスト分析は、ＴＷＩＴＴＥＲ、ＹＯＵＴＵＢＥ（登録商標）、及び他のウェブフォーラムなどのソーシャルネットワーク及びプラットフォームの発展に伴って近年強い興味を得ている。

特に、いくつかの調査は、ユーザコメントとビデオコンテンツ、とりわけビデオコンテンツのタイムラインとの同期にフォーカスを当てている。

次に、ライブイベント中の（ＴＷＩＴＴＥＲプラットフォームによるつぶやきのような）ソーシャルネットワークを通して生成されたテキストマイクロポストを使用することによって音響映像コンテンツを向上することは周知であり、同期はマイクロポストのタイムスタンプを使用することによって直接なされる。

加えて、ユーザが、ビデオコンテンツを見ることを可能にし、及びビデオ内の時間に自動的及び自然に関連付けられたコメントを同時に投稿することを可能にするシステムもまた周知である。

両方のケースでは、達成される場合、タイムスタンピングによりコメントが既にタイムコードを有するため、コメントと音響映像コンテンツのタイムラインとの同期は容易である。

言い換えると、各コメントが一時的な情報（例えば、テキストマイクロポストがその対応するソーシャルネットワーク上に送信された時間）に関連付けられ、マルチメディアコンテンツが同時に再生されるばかりに、これらの従来技術はコメントをマルチメディアコンテンツのライムラインと同期することを可能にする。

"Aspect-based sentiment analysis of movie reviews on discussion bards", (Thet & al., 2010), the Journal of information Science, 36(6), 823-848 Jaccard, Paul, "Etude comparative de la distribution florale dans une portion des Alpes et des Jura", (1901), the Bulletin de la Societe Vaudoise des Sciences Naturelles 37:547-579（「アクサン・テギュ（accent aigu）」は省略する） http://en.wikipedia.org/wiki/Cosine_similarity

それにも関わらず、これらの従来技術の１つの欠点は、各コメントの放出の時間とマルチメディアコンテンツの特定の時点とを一致するために、それらがマルチメディアコンテンツの再生中にコメントを書き込むことを要求するという事実に頼ることである。加えて、コメントを書き込む時間がかかるため、そのコメントはマルチメディアコンテンツの以前のシーンに関連する場合があり、コメントが最終的に関連付けられるシーンと関連しない場合がある。言い換えると、同期は不正確であるように見える。

本発明は、以前に言及された不都合な点の少なくともいくつかを改善しようと試み、特に、如何なるタイムコードも用いずに、その対応するタイムライン内の特定の時点でのマルチメディアコンテンツに対するテキスト形式のメタデータを整列しようと試みる。

本発明は、タイムライン及び経時的なテキスト記述によって定められたメディアコンテンツを改善するための方法に関する。

この目的のため、その方法は、
− 自然言語処理を用いて、テキスト文書の少なくとも一部分における少なくとも１つの特徴を識別するステップと、
− 前記テキスト文書の決定された部分と、テキスト文書の決定された部分にセマンティックに対応する経時的テキスト記述の少なくとも一部分とを自動的に整列するステップと、
を備え、
その結果、テキスト文書の少なくとも一部分がメディアコンテンツのタイムラインに自動的に同期される。

本明細書において、以下の点を理解すべきである。
− テキスト文書は、プロフェッショナル又はプロフェッショナルではないユーザ、−特に、排他的ではないが、ウェブ及び／又はＴＶユーザによって書き込まれた、コメント、ブログ若しくはフォーラムの投稿、エンサイクロペディアの記事、ニュースの記事などの、任意の種類のテキストを意味する。明らかに、テキスト文書は、英数字で構成することができる。
− 著者は、テキスト文書などを書き込んだ人（例えば、ウェブユーザ、ＴＶユーザ等）である。
− マルチメディアコンテンツは、音響映像文書（例えば、映画、スポーツイベント、ラジオプログラム等）に対応することができる。
− 経時的テキスト記述は、マルチメディアコンテンツを経時的に記述する任意の種類のテキスト文書に対応する。限定されない例として、そのような経時的テキスト記述は、映画のスクリプト、サッカーの試合の概要、映画のサブタイトル、映画の音声記述スクリプト等とすることができる。
− 特徴は、特定のシーン、イベント若しくはアクション、映画の特定の状況（名付けられたエンティティ、役者、編集者、照明等）、又は特定のシーンの特定の状況など、テキスト文書において言及、記述、又は評価されたマルチメディアの特定の要素である。

加えて、以下の明細書において、マルチメディアコンテンツ及びその経時的テキスト記述はすでに周知技術によって一緒に整列されていると仮定され、その結果、経時的テキスト記述は直接的に及びすでにマルチメディアコンテンツのタイムラインと同期されている。変形例において、そのような整列は本発明の実装後に実行することができる。

このように、本発明により、テキストとテキストとの整列を、タイムコード又は時間情報を必ずしも用いずに、テキスト文書とマルチメディアコンテンツの経時的テキスト記述との間で実行することができる。そのような方法は、参照している１又はいくつかの時点又はタイムラインの間隔を経時的テキスト記述内に関連付けるように、テキスト文書の少なくとも１つをマルチメディアコンテンツの経時的テキスト記述の１又はいくつかの対応する部分と整列することができる。

本発明の方法は、テキスト文書、又はその一部分を、対応する経時的テキスト記述を通してのみ、マルチメディアコンテンツと直接的に一致させることを意図している。

さらに、単一のテキスト文書において参照される特徴は、経時的テキスト記述におけるいくつかの異なる時点又は間隔を参照することができることを理解すべきである。

加えて、自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ）は、コンピュータと人間（自然）言語との間の相互作用で関連付けられたコンピュータサイエンス、人工知能、及び言語学の分野である。したがって、ＮＬＰは、ヒューマン−コンピュータ・インタラクションに関連する。

本発明の態様において、テキスト文書は、マルチメディアコンテンツに関連するものとして、テキスト文書の集合から、識別されることができる。

加えて、テキスト文書の集合は、インターネットネットワークから検索することができる。

本発明の他の態様において、整列するステップ中に、照応解析技術は、有利には、テキスト文書の決定された部分と経時的テキスト記述との間のセマンティックな対応関係を実行するように実装することができる。

加えて、識別するステップ及び整列するステップは、複数のテキスト文書に適用されてテキスト文書とマルチメディアコンテンツのタイムラインとを自動的に同期することができる。

本発明の好ましい実施形態によると、特徴は、少なくとも、
− 単語の組み合わせ；
− セマンティックエンティティ；
− 単語のリスト；
− イベント、
を備える特徴のグループに属する。

好ましくは、自然言語処理は、エンティティ認識処理に対応するか、又は特徴ベースのセンチメント分析に対応する。

本発明の実現の一例において、マルチメディアコンテンツは音響映像コンテンツであり、前記テキスト文書はウェブユーザによって書き込まれたコメント（いわゆる投稿）である。

本発明の他の態様において、マルチメディアコンテンツはタイムラインの対応する時間間隔が関連付けられるシーンにセグメント化され、関連付けられた経時的テキスト記述に対するその同期の結果として、テキスト文書は関連付けられるシーンの時間間隔に同期される。

さらに、本発明は、タイムライン及び経時的テキスト記述を備えるマルチメディアコンテンツを改善するシステムにも関連する。本発明によると、システムは、
− テキスト文書の少なくとも一部分における少なくとも１つの特徴を識別するように構成された自然言語処理モジュールと、
− テキスト文書の決定された部分と、テキスト文書の決定された部分にセマンティックに対応する経時的テキスト記述の少なくとも一部分とを自動的に整列する整列モジュールと、
を備え、
その結果、テキスト文書の少なくとも一部分がメディアコンテンツのタイムラインに自動的に同期される。

開示された実施形態の範囲において同等のある態様は、以下に説明される。これらの態様は、本発明がとることができるある形式の概要を読み手に提供するために単に提示され、及びこれらの対応は、本発明の範囲を限定することを意図しないことを理解すべきである。実際、本発明は、以下に説明することができない様々な態様を包含することができる。

本発明は、添付の図面を参照して、決して限定的ではない、以下の実施形態及び実行例によって、より良く理解され、例示されるであろう。
本発明の好ましい実施形態によるマルチメディアコンテンツを改善するためのシステムのブロック図である。好ましい実施形態によるマルチメディアコンテンツを改善するための方法によって実装されるステップを例示するフローチャートである。好ましい実施形態による映画を改善するためのステップを示す全体的な図である。映画専用ウェブサイトからの、以前の第２のユーザの投稿に対する返答として第１のユーザによって書き込まれた投稿のスクリーンショットを示す図である。

できる限り、同じ参照番号は同じ又は類似の部分を参照して図面を通して用いられる。

好ましい実施形態の例によると、本発明は、タイムライン及びスクリプトが関連付けられた映画に関して描かれる。スクリプトは、映画の経時的なテキスト記述の特定の例であることに留意しなければならない。

明らかに、本発明は、この例に限定されず、タイムライン及び少なくとも１つの経時的なテキスト記述（スクリプトなど）によって定められた如何なるマルチメディアコンテンツにも適用することができる。

図１は、この例によると、テキスト文書（例えば、プロフェッショナルおよび／又はプロフェッショナルではないウェブ／ＴＶウェブユーザによって書き込まれた投稿）を用いて映画を改善するためのシステムＳが描かれている。映画は、経時的なシーンの連続で作られている。

特に、システムＳは、直接的又はゲートウェイ（図１には不図示）を通して、ネットワークＮ（例えばインターネットネットワーク）に接続される。明らかに、変形において、システムＳは如何なるネットワークにも接続されない場合がある。

映画に関連する投稿Ｐｉの集合（ｉ∈［１；Ｎ］、Ｎは整数）は、ネットワークＮに接続された、（例えば、ＩＭＤｂなどの映画専用ウェブサイトのような）リモートサーバＲＳ上に格納される。上記の映画に関連する投稿Ｐｉの集合は、インターネットネットワークＮを用いて、システムＳによりサーバＲＳから検索することができ、システムＳの適合メモリＭに格納することができる。

さらに、例示において、映画及びその対応するスクリプトは、インターネットＮを通して、ビデオサーバＶＳからダウンロードすることができ、上記のメモリＭに格納することができる。当然ながら、変形において、映画は任意の他の適合化された方法から（例えば、ＵＳＢキー又はＤＶＤから）検索することができる。明らかに、変形において、リモートサーバＲＳ及びビデオサーバＶＳは、同一のサーバとすることができる。

システムＳはまた、投稿Ｐｉの集合から抽出される１又はいくつかの異なる特徴を入力するために、オペレータによって使用されることを意図された、（例えばタッチスクリーンなどの）マン−マシンインターフェースＭＭＩを備える。当然ながら、その特徴は、自動的に定める及び／又は選択することができる。一旦システムＳに入力すると、その特徴をメモリＭに格納することができる。

各特徴は、特定のシーン、イベント若しくはアクション、映画の特定の状況（名付けられたエンティティ、役者、編集者、照明等）又は特定のシーンにおける特定の状況などの、投稿Ｐｉにおいて言及、説明、又は評価されることができる映画の特定の要素である。

特に、特徴は、
− 単語の組み合わせ；
− セマンティックエンティティ；
− 単語のリスト；
− イベント；
− その他、
とすることができる。

図１に示されるように、システムＳはまた、システムＳに入力される上記の特徴の少なくとも１を、メモリＭに格納された各投稿Ｐｉに関して、自動的に識別するための自然言語処理モジュールＮＬＰ（例えばプロセッサ）を備える。特に、モジュールＮＬＰは、投稿Ｐｉが、所定の特徴と、投稿Ｐｉが特徴に対する参照を含む場合には上記の特徴に対応する特定の投稿の１又は複数の部分とに関連付けられているか否かを決定することができる。

特に、自然言語処理が、例えば非特許文献１に定められるような、エンティティ認識処理及び／又は特徴ベースのセンチメント分析に対応することができる。

一旦少なくともいくつかの定められた特徴が識別されると、対応テーブルを規定して、各所定の特徴をモジュールＮＬＰによって識別された投稿Ｐｉの対応する一部分又は複数部分に関連付けることができる。この対応テーブルは、メモリＭに格納することができる。

さらに、図１に示されるように、システムＳは、投稿Ｐｉの当該決定された一部分又は複数の部分と、投稿Ｐｉの決定部分にセマンティックに対応する映画のスクリプトの対応する一部分又は複数の部分とを自動的に整列するための整列モジュールＡ（例えばプロセッサ）を追加的に備える。

特に、セマンティックな対応は、例えば、（非特許文献２に定められるような）ジャカール係数（Jaccard coefficient）若しくは（非特許文献３に示されるような）コサイン測度（cosine measure）を用いて、抽出した特徴と経時的なテキスト記述との間のテキスト類似性測度を計算することにより、又は共通の単語の数を簡単に計算することにより、得ることができる。

代替として、セマンティックな対応は、それ自体自然言語処理を用いて導くことができる。

加えて、整列モジュールＡは、照応解析（anaphora resolution）技術を実装して投稿Ｐｉの決定部分と映画のスクリプトとの間のセマンティックな対応を実行することができる。

このように、投稿Ｐｉの各識別された特徴は、シーン（所定の時間間隔により識別される各シーン）又はタイムラインのより正確な時間情報（例えば分）である場合がある、スクリプトにおける特定の点と整列される。その結果、投稿Ｐｉは、場合によっては複数の時点でスクリプトと整列される。

本発明により、投稿Ｐｉ又はそれらの１若しくは複数の部分が直接的及び自動的に映画のスクリプトと同期される。投稿とスクリプトとのテキスト同士の同期はこのように実装される。映画のタイムラインを参照することにより定められる時間情報は、それから暗に各投稿Ｐｉ又はそれの１若しくは複数の部分に添えられる。

スクリプトが既に時間的に映画と整列されている場合、投稿Ｐｉ又はそれらの１若しくは複数の部分は、スクリプトを通して、同様に、暗に時間的に映画と整列される。

本発明は次に、経時的情報もタイムスタンプも使用せずに、マルチメディアコンテンツの経時的記述に対するテキスト文書の整列を実行することができる。

図２のフローチャートは、本発明の好ましい実施形態に従って、タイムラインによって及びスクリプトによって定められた映画を改善するための方法の様々なステップを示す。

第１の準備ステップＥ０において、リモートサーバＲＳ上に格納された投稿Ｐｉは、検討される映画に関連するものとして準備的に識別される。

更なるステップＥ１において、識別された投稿Ｐｉは、システムＳのメモリＭに格納されるように、リモートサーバＲＳから検索される。

更なるステップＥ２において、投稿Ｐｉから識別及び抽出されることを意図された特徴は、マン−マシンインターフェースＭＭＩ（又は、変形において、ソフトウェアプログラミングを通して）を介して、システムＳに定められ、入力される。

更なるステップＥ３において、モジュールＮＬＰは、各投稿Ｐｉにおいて、１又はいくつかの定められた特徴を自動的に識別し、対応テーブルを規定して、各所定の特徴に対して、対応する投稿Ｐｉ又はそれらの１若しくは複数の部分が関連付けられる。

更なるステップＥ４において、整列モジュールＡは、投稿Ｐｉ又はそれらの１若しくは複数の部分とスクリプトのセマンティックに対応する１又は複数の部分とを自動的に整列する。そのような整列は、投稿Ｐｉ（又はそれらの１若しくは複数の部分）に映画の時間に関する時間情報を提供する。

当然ながら、前述のステップは、異なる順序で実装される場合もある。

次に、一旦整列が所定の映画に関して実行されると、整列された投稿Ｐｉがスクリプトと共に格納され、その結果、映画の再生中、対応する時点で、整列された投稿Ｐｉ又はそれらの１若しくは複数の部分がメイン表示デバイス（例えばＴＶ）及び／又はセカンドスクリーン（例えばタブレット）上にポップアップすることができる。

図３は、書き込まれた投稿Ｐｉを有する映画を改善するための方法のステップＥ１からＥ４を例示する。２つの定められた特徴Ｆ１及びＦ２が例示されている。各特徴Ｆ１、Ｆ２は、単語の組み合わせ、すなわち場所、キャラクター及び日時を備える。

特に、図３において、スクリプトと映画の整列が表される。この追加及び周知のステップは、任意のステップＥ１からＥ４の前又は後に実行することができる。

加えて、第１の例示であるが限定的ではない例として、図４は、以前のユーザの投稿に対する返答として第１のユーザによって書き込まれた投稿のスクリーンショットを示す。この投稿は、映画専用ウェブサイト（公序良俗違反につき、不掲載）から検索され、以下のコンテンツを有する。

「あなたが言いたいことは分かるし、ロメールはまさにそのことを上手く伝えた。それは見かけ程軽くなく且つ表面的ではなく、まさにそう見えるように作られていて、事実、本音を言えばずっと気がめいる。全体のロケーションの選択は、この種類の話に関して驚くほどまさに的確であると私は考えた。我々は、人々が映画からのエキストラのように歩いている、おしゃれな「Nouvelle Ville」（これらの人工の都市は存在しない）にいる。それはすべて白く、きれいで、歴史がなく、人間的なふれあいがないが、他のどこかの建築学的パターンの複製がある。全てのもののデザインは、歴史的な景観又は視点の奥行きなしで、そこに住むヤッピーの必要性及びレジャーにただ合わせたようである。キャラクターが幻想の中にいるかのように、「古い」風景が遠ざけられている（おそらく、２３００年未来への旅（Logan’s Run）風に！）。小さい若枝、未だ茂っていない芝生などの植物でさえもがちょうど茂りだしている。ブランシュとファビアンが荒野で迷子になったときに初めて、完全に彼女の要素である彼女の空っぽの白いアパートの外にいるかのように、自然の力により一見圧倒されたように（我々が緑の光線（le Rayon Vert）でもみることができるパターンである）、彼女は泣くのである。キャラクターたちは、互いに遊んでいるようで、そのため彼らはそれのすべてのすぐ下に巨大な無があることを忘れることができる。とても実存的！そして実際、ある種気がめいる。しかし、偉大な映画はすべて同じである。ロメールのみが監督の重要な特性である、そのようなあいまいさのレベルに達することができる。」
投稿のテキストは、非常に豊かであり、特定の場所及び／又はシーン、例えば、
− 場所：「彼女の空っぽの白いアパート」；
− シーン：「ブランシュとファビアンが荒野で迷子になったとき［・・・］彼女は泣く」
と同様に、「友だちの恋人（Boyfriends and Girlfriends）」と題名が付けられた映画の多くの状況について言及している。

システムＳによって実行される識別のステップＥ３の後、対応の以下のテーブルを規定することができる。

映画のスクリプトがシーンの以下の情報を提供すると仮定される。

システムＳの整列モジュールＡは、ステップＥ４において、抽出された複数の投稿又はそれらの１若しくは複数の部分を用いて、スクリプトのタイムラインのマッピングを実現する。

特に、第１の特徴は位置を示す。スクリプトに従って、シーン３及び１３の両方は、アパートで行われる。投稿のこの部分は、これらのシーンを参照することができる。これは、以前に言及したように、（「彼女の空っぽの白いアパート」における）単語「彼女の」をブランシュにリンク付けることになる、照応解析技術を用いてチェック又は改善することができた。

第２の特徴は、「荒野で」行われるブランシュとファビアンのシーンを記述する。キャラクターは、両シーン７及び１３で一致している。しかしながら、「荒野」は、「アパート」よりも「森」にセマンティックにより近い。これは、ワードネット（WordNet）などの外部の単語オントロジー（ontology）を用いて見出すことができた。シーン１３はこのため、破棄される。

その結果、この投稿がシーン３、７及び１３を参照していることを知ることができ、どの部分がどのシーンに対応しているかをテキストにおいて指摘することが可能である。

第２の例示的であるが限定的ではない例において、マルチメディアコンテンツは、サッカーゲームビデオ（チェルシー対バルセロナ）である。投稿は、スポーツ専用ウェブサイト上でクロールすることができる、このサッカーゲームを参照するフォーラムコメントである。スクリプトは、サッカーゲームのテキストの概要である。例えば、
− プレゼンターによって作られる音声概要のトランスクリプト；
− （経時的な順序で書き込まれた）試合の新聞報道；
− ゲーム内のキーとなる瞬間を伝えるサッカーティッカー；
− その他；
とすることができる。

以下は、サッカーゲームの章の間の主な瞬間を示すティッカーを表す：
ＦＴ：チェルシー１バルセロナ０
最終更新：２０１２年４月１８日
事もあろうにメッシからのミスはラミレスがブレークすることを可能にし、彼は、ストライカーがすばらしいフィニッシュによりホームをドライブすることを可能にする猛烈な走りの後のピンポイントクロスでドログバを際立たせる。
ゴール！ドログバが先制点を挙げ、チェルシーが１−０になる。
４５＋２彼が無様に滑ったようにそれがメッシの倒れるようなターンであるが、彼は数秒後に足を戻す。バルサは、時間が過ぎるにつれてボールを保持する。
４５＋１ドログバは、２分のロスタイムがこのハーフに追加されたときにぐったりと倒れ込むが、何も与えられなかった。
４５メッシがチェルシーのボックスでサンチェスを見分けようとしたが、彼のパスが彼のチームメイトの頭上を超え、ホームの熱狂的ファンを「お前は誰だ？」と絶叫させる。
４４心臓が止まる瞬間がチェルシーにあり、コールから決定的な最後のあがきの隙間があった。メッシが数秒後にシュートを打とうとしたが、外れた。

各スポーツがその特定の用語集（例えば、ゴール、バスケット、ファウル、ラインアウト、等）を有するため、この用語集のいくつかの用語は、スクリプトと検索された投稿との間の整列を実行するために使用することができる。

次に、ゲーム内に含まれるプレイヤーの名前、ゴールなどのいくつかの特定の用語、経時的情報等を引き出すことが可能である。

図１において、システムＳの代表されるブロックは、純粋に、必ずしも物理的に分離されたエンティティに対応する必要のない、機能的なエンティティである。すなわち、それらはソフトウェア、ハードウェアの形式で開発することができ、１又はいくつかの集積回路において実装することができる。

発明の詳細な説明、特許請求の範囲、及び図面において開示された参考文献は、独立又は任意の適切な組み合わせにおいて提供することができる。特徴は、適切な場合、ハードウェア、ソフトウェア、またはその２つの組み合わせにおいて実装することができる。

本発明を、その好ましい実施形態において説明してきたが、当業者の能力内及び発明的な能力の実行なしで、多数の変形及び実施形態が許容されることは明らかである。従って、本発明の範囲は、以下の特許請求の範囲によって定められる。

本明細書に記載された全ての例及び条件付き言語は、本発明の原理及び更なる従来技術に対する発明者によって寄与される概念を理解する際の読解の一助となるような教育的な目的を意図し、そのような特定の記載された例及び条件に限定されずに解釈されるべきである。

さらに、原理、態様、本原理の実施形態、及びそれらの特定の例を記載する本明細書における全ての意見は、それらの構造的及び機能的な等価物の両方を包含することを意図されている。加えて、そのような均等物が現在周知の等価物とともに将来に開発される均等物、すなわち、構造に関わらず、同様の機能を実行するように開発された任意の要素の両方を含むことを意図されている。

Claims

タイムライン及び経時的テキスト記述を備えるマルチメディアコンテンツを改善する方法であって、
自然言語処理を用いて、ネットワーク（Ｎ）から検索されたテキスト文書（Ｐｉ）の少なくとも一部分における少なくとも１つの特徴（Ｆ１、Ｆ２）を識別するステップ（Ｅ３）と、
前記テキスト文書（Ｐｉ）の前記決定された部分と、前記テキスト文書（Ｐｉ）の前記決定された部分にセマンティックに対応する前記経時的テキスト記述の少なくとも一部分とを自動的に整列するステップ（Ｅ４）と、
を備え、
その結果、前記テキスト文書（Ｐｉ）の少なくとも前記一部分が前記メディアコンテンツの前記タイムラインに自動的に同期される、前記方法。
前記テキスト文書（Ｐｉ）は、前記マルチメディアコンテンツに関連するものとして、テキスト文書（Ｐｉ）の集合から、識別される（Ｅ１）、請求項１に記載の方法。
前記テキスト文書の集合は、前記インターネットネットワーク（Ｎ）から検索される（Ｅ２）、請求項２に記載の方法。
前記整列するステップ中に（Ｅ４）、照応解析技術が前記テキスト文書（Ｐｉ）の前記決定された部分と前記経時的テキスト記述との間のセマンティックな対応関係を実行するように実装される、請求項１乃至３のいずれかに記載の方法。
前記識別するステップ（Ｅ３）及び前記整列するステップ（Ｅ４）は、複数のテキスト文書に適用されて前記テキスト文書（Ｐｉ）と前記マルチメディアコンテンツの前記タイムラインとを自動的に同期する、請求項１乃至４のいずれかに記載の方法。
前記特徴（Ｆ１、Ｆ２）は、少なくとも、
− 単語の組み合わせ；
− セマンティックエンティティ；
− 単語のリスト；
− イベント、
を備える特徴のグループに属する、請求項１乃至５のいずれかに記載の方法。
前記自然言語処理は、エンティティ認識処理に対応するか、又は特徴ベースのセンチメント分析に対応する、請求項１乃至６のいずれかに記載の方法。
前記マルチメディアコンテンツは音響映像コンテンツであり、前記テキスト文書はウェブユーザによって書き込まれたコメント（Ｐｉ）である、請求項１乃至７のいずれかに記載の方法。
前記マルチメディアコンテンツは前記タイムラインの対応する時間間隔が関連付けられるシーンにセグメント化され、前記テキスト文書（Ｐｉ）は関連付けられる前記シーンの前記時間間隔に同期される、請求項１乃至８のいずれかに記載の方法。
タイムライン及び経時的テキスト記述を備えるマルチメディアコンテンツを改善するシステムであって、
− ネットワーク（Ｎ）から検索されたテキスト文書（Ｐｉ）の少なくとも一部分における少なくとも１つの特徴（Ｆ１、Ｆ２）を識別するように構成された自然言語処理モジュール（ＮＬＰ）と、
− 前記テキスト文書（Ｐｉ）の前記決定された部分と、前記テキスト文書（Ｐｉ）の前記決定された部分にセマンティックに対応する前記経時的テキスト記述の少なくとも一部分とを自動的に整列する整列モジュール（Ａ）と、
を備え、
その結果、前記テキスト文書（Ｐｉ）の少なくとも前記一部分が前記メディアコンテンツの前記タイムラインに自動的に同期される、前記システム。