JP2000003126A

JP2000003126A - 音声部を使用するテキスト要約方法

Info

Publication number: JP2000003126A
Application number: JP11843099A
Authority: JP
Inventors: Gregory T Grefenstette; ティーグレフェンステットグレゴリー
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1998-03-23
Filing date: 1999-03-23
Publication date: 2000-01-07
Also published as: US6289304B1; GB9806085D0; EP0952533A3; EP0952533A2; EP0952533B1

Abstract

(57)【要約】【課題】本発明は自動的に要約するテキストで浮上す
る問題、特に視覚障害者又はテキストを見ることのでき
ない他の人達に影響を及ぼす問題に取り組んでいる。【解決手段】テキストは音声部（ＰＯＳ）を使用して
要約され、テキストのトークンのため音声部を示す。Ｐ
ＯＳデータはＰＯＳのタグ付けによるように、テキスト
を形成する入力テキストデータを使用して得ることがで
きる。ＰＯＳデータはグループデータを得るために使用
され、動詞グループ及び名詞グループのように、テキス
トのトークンのグループを示す。また、グループデータ
は各グループ内でＰＯＳベースの除去基準を満たすトー
クンを示す。グループデータは除去基準を満たすトーク
ンを除去することにより要約したテキストデータを得る
ために使用することができる。元のテキストは、使用者
の文書からスキャナ又はビデオカメラを介して得てもよ
く、また、入力テキストデータを得るために認識されて
もよい。要約したテキストはテキストとして又はスピー
チシンセサイザーを使用して音声発音記号表記として出
力されてもよい。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声部に基づく自動
テキスト要約に関する。

【０００２】

【従来の技術】盲人又は視覚障害者のための従来の読取
り機械はスキャンされる文書のテキストが音声に変換さ
れる割合を使用者に手動で増加させ、非常に迅速な音声
を発生させることができ、従って、文書を聞こえるよう
にフリップし一種の要約を得ている。また、使用者は手
動で文書のサンプルを選択し、各サンプルから音声を発
生させ別のタイプの要約を得ている。

【０００３】多くの自動要約技術が他の事情で提案され
ていた。そのような技術によれば、手動で引き出された
テンプレートがテキストの一定のパターンに合致するた
めに使用される。テンプレートが満たされると、見せ掛
けのテンプレートがコンピュータにより製造可能であ
る。この見せ掛けはテンプレートに含まれなかった項目
を無視し、それによりテキストの量を減少させる。これ
は年１回のメッセージ理解会議(ＭＵＣ)の関係者により
使用されるアプローチである。この技術の欠点は、テン
プレートを作り出すことが無制限のテキストに適用でき
ないドメイン特定フィルタを製造する長期の手動処理で
あることである。

【０００４】別の公知な方法によると、完全なテキスト
をメモリに読み込み、単語の用途の統計を計算する必要
があり、最も頻繁な用語はテキストの理解では最も重要
であると考える。その後、元のテキストはメモリで再ス
キャンされ、完全な文は位置と用語の重要性によって得
点を付けられる。最高点の文はテキストの要約としてそ
のまま抜粋される。この種の要約の不利な点は、ページ
を基にページ上で行われるのではなく完全な文書を読み
取らなければならないことである。

【０００５】１９８１年のマサチューセツ州レディング
(Reading)のアディソン−ウェズリー社（Addison-Wesle
y）のSager,Nによる「自然言語情報処理−英語のコンピ
ュータ文法及びその適用（Natural Language Informati
on Processing-A ComputerGrammar of English and Its
Applications)」の７〜１６及び２５３〜２５５は第２
言語を教える技術を説明しており、これは文の終わりで
始まり左の方向に移動する列の摘出方法を適用してい
る。その方法は、残りが依然として文法的に正しい文の
場合には、文から１つの単語又は１列の単語を摘出し、
これはそれ以上の摘出ができなくなるまで各々次の残り
部分のため繰り返される。摘出の例は前置詞句の除去、
接続詞の要素の数の減少等を含んでいる。その摘出は非
常に類似していると判明したフランス文及びその英訳を
分析する。

【０００６】

【発明が解決しようとする課題】本発明は自動的に要約
するテキストで浮上する問題、特に視覚障害者又はテキ
ストを見ることのできない他の人達に影響を及ぼす問題
に取り組んでいる。例えば、人は乗り物を運転していた
りテキストを見ることを妨げる別の行動をしているかも
しれない。或いは、人は完全に、テキストを見たり又は
完全にテキストを読んだりする時間がないかもしれな
い。或いは、照明又は表示状態が印刷又は表示された形
式のテキストを見ることができなくしているかもしれな
い。

【０００７】本発明は、意味を示しそうもない非常に僅
かな単語を保持している間に、テキストの意味を示しそ
うな単語を保持する方法で自動的にテキストを要約する
方法の問題に取り組んでいる。より詳細には、本発明
は、十分なデータの不足のため統計的方法を行わせるこ
とができないという、短いテキストを自動的に要約する
問題に取り組んでいる。同様に、本発明は、原則に基づ
いた方法で自動的に文を要約する方法の問題に取り組
み、要約された文が元の文より短くなるようになってい
る。また、本発明は、テンプレートの創作を要求せずに
原則として１つのパスで実行可能な方法でのように、テ
キストを自動的に簡略かつ効率よく要約する方法の問題
に取り組んでいる。また、本発明は、適当なレベルの簡
潔さを提供する方法でテキストを自動的に要約する方法
の問題に取り組んでいる。

【０００８】

【課題を解決するための手段】本発明は、自動的に要約
するテキストの音声部(ＰＯＳ)情報を使用する技術を提
供することによりこれらの問題を多少とも解決する。幾
つかの技術はＰＯＳ情報を使用して、１つのグループの
連続するトークン内で、自動要約中に除去されるトーク
ンと保持されるトークンとを識別をする。幾つかの技術
は使用者により選択されたＰＯＳベースの基準を適用す
ることにより自動的に要約を実行する。

【０００９】本発明は、テキストを自動的に要約する技
術を提供し、入力テキストデータがＰＯＳデータを得る
ために使用され、テキストのトークンのため音声部を示
す。ＰＯＳデータがグループデータを得るために使用さ
れ、連続するトークンのグループを示すと共に各グルー
プ内でＰＯＳベースの除去基準を満たすトークンを示
す。その後、グループデータがテキストの要約版を得る
ために使用され、除去基準を満たすトークンが除去さ
れ、従って、トークンの数を減少させる。

【００１０】グループデータは第１及び第２グループタ
イプのデータを含むことができ、それぞれ第１及び第２
のＰＯＳベースの除去基準が適用可能な第１及び第２の
単語グループタイプを示す。例えば、そのタイプは動詞
グループタイプ及び名詞グループタイプとすることがで
き、各グループはグループタイプを示す要素によって先
行及び後に続かれることができる。

【００１１】入力テキストはトークン化されトークン化
した文を得ることができ、ＰＯＳデータは各トークン化
した文のため得ることができる。その後、文のＰＯＳデ
ータは文のグループデータを得るために使用され、順番
に文を要約するために使用することができる。

【００１２】入力テキストは画像データを機械読取り可
能なテキストデータに変換することにより得て、移動式
媒体を運ぶ画像により含まれたテキスト内容を表現す
る。要約したテキストは音声データに変換され、要約し
たテキストの単語の発音記号表記を表現でき、相当する
音が発せられ、従って、テキストの音声の要約を提供す
る。

【００１３】また、本発明は自動的にテキストを要約す
る技術を提供し、使用者の入力デバイスからの信号は１
セットのＰＯＳベースの除去基準の１つを選択する。入
力テキストデータはＰＯＳデータを得るために使用さ
れ、テキストのトークンのため音声部を示し、ＰＯＳデ
ータはテキストの要約版を得るために使用され、トーク
ンは選択されたＰＯＳベースの基準に従って除去され、
従って、トークンの数を減少させる。

【００１４】信号を得て基準を選択するため、ＰＯＳベ
ースの除去基準のセットを示す画像が表示可能である。
上記のように、要約したテキストは音声データに変換で
き、要約したテキストの単語の発音記号表記を表現し、
対応する音が発せられ、従って、テキストの音声の要約
を提供することができる。

【００１５】上記技術の各々は入力テキストデータと自
動的にテキストを要約するプロセッサを含むシステムで
実行可能である。更に、各技術は記憶媒体で記憶された
命令データを含む製品で実行可能であり、システムのプ
ロセッサが自動的にテキストの要約を実行できる命令を
示している。

【００１６】本発明は、その意味を保持している間にテ
キストの長さを縮小できるので有利な技術を提供し、従
って、テキストを音声に変換するシステム設計又はテキ
ストの要約版を有することに左右される他の動作を実行
するために必要な時間を減少させる。本発明は、僅かな
統語的な解剖で実行され、テキストのどの部分が除去可
能であるかを明らかにする。除去は使用者のコントロー
ルの下、恐らくノブを介して進めることができ、多かれ
少なかれテキストは保持されるようになっている。極端
な場合のみ、重要な名詞又は固有名称が保持される。

【００１７】本発明は、盲目の読者に聞こえるようにテ
キストをスキャンさせ、目が見える読者ができるよう
に、テキストのどの部分が完全に読まれるべきかを決定
するため、テキストの可聴の要約を得る。少なくともこ
の適用のため、本発明は、３つの理由のため、従来の統
計ベースの要約技術を改善している。（１）選択された
文だけよりむしろ、テキストの各文の重要な部分を読む
ことができ、（２）従来の統計ベースの要約は２つのパ
スを必要とするが、本発明の技術は、テキストを通る１
つのパスで作動するように実行可能であり、（３）本発
明の技術は、従来の統計ベースの要約とは異なり統計を
使用することなく実行可能であるので、長いテキストと
同様に短いテキストにも適用可能である。本発明の技術
は手動でテンプレートを作ることなく実行可能であるの
で、テンプレートベースの技術を改善する。

【００１８】本発明は、光学文字認識とテキストの音声
への変換の生成との間のテキストの処理で適切に使用す
ることができる。入力テキストは電子的に文毎に読取り
可能であり、本発明の実行は、現在使用者に求められる
簡約のレベルによって出力テキストとして簡約版を製作
可能である。完全なテキストからの情報をバッファに入
れる必要はない。入力文は有限状態のトランスデューサ
技術を使用して１列の言語のマーク付けを経験可能であ
る。これらのマーク付けは、所定文の文脈の各単語の音
声部、名詞グループと動詞グループの境界、及び各句内
の主要部要素のように、入力テキストの言語の特徴を示
すことができる。本発明の技術は入力テキストを読むこ
とにより実行可能であり、後述するような方法でマーキ
ングを使用し、その後、使用者に求められる簡約のレベ
ルによって出力する要素を選択する。

【００１９】本発明の利点は、入力テキストから電信
（即ち、短く、簡明、簡潔な）テキストを即座に製作す
るために実行されることができることである。更なる利
点は、電信の簡約レベルが最も極端な簡約からほぼフル
テキストまで使用者により制御できることである。

【００２０】本発明による技術は、簡約が文毎に実行可
能であるので、盲目の読者（先にゼロックス画像システ
ム（Xerox Imaging Systems）により売られたリーディ
ングエッジ（ReadingEdge）等）のように、テキストス
トリームの要約の要求に適切に適用可能である。このア
プローチは、統計ベースの要約を改善し、そのアルゴリ
ズムは要約が実行可能な前に全体の文書をメモリに読み
込むことを要求する。

【００２１】

【発明の実施の形態】ここで使用しているように、「ト
ークン」と「トークン区切り」の概念は密接に関連して
いる。「トークン区切り」はトークンを分けるための基
準（「トークン区切り基準」）を満たす１以上の要素の
１列であり、一方、「トークン」は１以上の要素の１列
であり、その各々は１文字又は文字の組合わせであり、
その１列は適用可能なトークン区切り基準による内部の
トークン区切りを含まない。フランス語及び英語のよう
な言語に適用可能なトークン区切り基準はしばしばトー
クン区切りとして１以上のスペースの列を扱う。正確に
綴った単語、略語、頭字語、短縮形、誤綴りで意味のな
い単語、公式及び方程式を含む数学的で論理的な表現、
区切り基準を満たさない句読点の組合わせ（点線、署名
の線、「スマイリー」等）、及び文字列の各種他のタイ
プに加えて、意味論上、意味を持つかどうかは、それら
が適用可能な基準の下で内部のトークン区切りを含まな
ければ、この定義の下に全てトークンとすることができ
る。また、ＳＧＭＬ及びＸＭＬタグ及びハイパーリンキ
ング、フォーマッティング等に関する他のそのような文
字列は、幾つかのトークン区切り基準の下でトークンと
して取扱われる。この定義の下、「単語」又は「単語ト
ークン」は意味論上意味を持つ単位でもあるトークンで
ある。

【００２２】「テキスト」はトークン区切りにより分け
られた一連のトークンを形成する一連の文字である。例
えば、テキストは書かれた又は印刷された一連の文字に
より或いは一連の文字コードを含むデータの項目により
定義されてもよい。

【００２３】トークン化することはトークン区切り基準
によりテキストをトークンに分割することである。トー
クンナイザ（tokenizer）はここではデータ構造、プロ
グラム、対象、又はテキストをトークン化するために使
用可能なデバイスを意味するために使用される。ここで
使用されているように、文及び文の区切りの概念は同様
に関連している。１つの文の区切りは文を分ける基準
（「文の区切り基準」）を満たす１以上のトークンの１
列であり、一方、１つの文は１以上のトークンの１列で
あり、その列は適用可能な文の区切り基準による内部の
文の区切りを含んでいない。フランス語及び英語のよう
な言語に適用可能な文の区切り基準はしばしば、ピリオ
ド、クウェスチョンマーク、感嘆符等のような文の区切
りとして１以上の適当な文の終止の中断符号の列である
トークンを扱う。そのようなトークンはここでは「文の
最終文字」と呼ばれる。

【００２４】トークンの「音声部」又は「ＰＯＳ」はト
ークンがテキストでする文法上の機能であり、他のＰＯ
Ｓがトークンとして得ることができない時にトークンに
割り当てられる音声のデフォルト部を含んでいる。

【００２５】ＰＯＳベースの除去基準は、テキストのト
ークンの音声部に適用可能な基準であり、テキストから
どのトークンを除去してどのトークンを保持するかを決
定する。従って、除去基準を満たすトークンは除去され
テキストの要約を得ることができる。同じ要約は除去基
準を満たさないトークンだけを保持することにより得る
ことができ、除去はここでは両方のアプローチを達成す
るために使用される。

【００２６】単語グループタイプはテキストのトークン
のグループに適用可能な１セットのタイプの１つであ
る。例えば、動詞グループと名詞グループは２つともそ
のタイプである。

【００２７】ＰＯＳベースの除去基準は、所定の単語グ
ループタイプのグループ内でどのトークンが基準を満た
してどれがトークンのＰＯＳを基にしないかを決定する
ことができる場合には、そのグループのタイプのグルー
プに適用可能である。

【００２８】図１及び図２はコンピュータベースの机上
スキャニングシステムを示しており、本発明による技術
のシステムの多くのタイプの１つが実行されてもよい。
図１及び図２の配列の動作は日本特許出願No.9,221,863
にもっと詳細に説明されている。当然、本発明は、プロ
セッサがテキストを形成するデータへのアクセスを有す
る広範な各種の他のシステムで実行でき、それらのシス
テムは、読取り機械、デジタルコピー機、多機能機械
（例えば、スキャン、印刷、コピー、ファックス、及び
他の動作が可能な機械）、及びスキャナが画像データを
提供しＯＣＲを実行可能なプロセッサにテキストの画像
を形成可能な他のシステムと同様に従来のデスクトップ
及び携帯パソコン及びワークステーションを含んでいる
であろう。

【００２９】図１では、コンピュータシステム１はハウ
ジング２、表示画面６を有するＣＲＴモニタ４、ハード
ディスクドライブ８、フロッピディスクドライブ１０、
キーボード１２、及びマウス１４を含んでいる。コンピ
ュータはネットワークケーブル１６に接続され、従来の
内部ドライバカード（図示せず）及び適当なソフトウェ
ア（Novell社から入手可能なNetware等）と一緒になっ
て、コンピュータにローカルエリアネットワーク（ＬＡ
Ｎ）、ワイドエリアネットワーク（ＷＡＮ）、又は他の
ネットワークの一部を形成させる。

【００３０】剛体のフレーム２０はブラケット２１又は
別の適当な取り付け設備（図示せず）によりシステム１
を支持する表面１８に貼り付けられている。ビデオカメ
ラ２２はフレーム２０の上部の内部に取付けられ、二者
択一的にカメラ２２は書棚又は表面１８上の他の剛体の
設備に取付けられてもよい。文書２４はカメラ２２の視
野内に配置されている。

【００３１】図２は図１のコンピュータシステム１のハ
ードウェアを概略的に示している。システム１は共通バ
ス３０とそれに接続される中央処理装置（ＣＰＵ）３
２、ランダムアクセスメモリ（ＲＡＭ）３４、読み出し
専用メモリ（ＲＯＭ）３６、及びディスク、テープ、Ｃ
Ｄ−ＲＯＭ、又は別の記憶媒体に記憶されるデータにア
クセスするためのドライブ３８を含むメモリデバイス、
キーボード１２、マウス１４、印刷、製図、又はスキャ
ンする装置４０、及びカメラ２２のように外部のデバイ
ス４６にインターフェースを提供するアナログをデジタ
ル（Ａ／Ｄ）及びデジタルをアナログ（Ｄ／Ａ）に変換
するデバイス４２とデジタル入力／出力（Ｉ／Ｏ）デバ
イス４４及びＬＡＮ又はＷＡＮの残り部分（図示せず）
を含んでいる。

【００３２】使用において、ビデオカメラ２２は表面１
８上の物体（例えば、文書）の画像を捕らえ、これらの
画像はコンピュータ表示画面６の窓５０に同時に表示さ
れる。この方法では、（ＯＣＲ及び要約を含む）次の処
理のため本文の内容がそのような文書からスキャンされ
てもよい。

【００３３】図３は本発明の１実施例の方法で行われる
行為を概略的に示しているフロー図である。図３に示し
ている行為はＣＰＵ３２により実行可能であり、ＲＡＭ
３４、ＲＯＭ３６、又は他のローカル又はリモートメモ
リ、又はディスク、テープ、ＣＤ−ＲＯＭ又は他の記憶
媒体にドライブ３８によりアクセスしてＣＰＵ３２に提
供されるようなメモリから検索し、ケーブル１６を通し
てネットワークから受け取った命令データにより示され
た実行命令でそれらを実行可能である。

【００３４】ボックスＳ１では、（図１及び図２に関連
して上述した光学文字リーダー又はビデオスキャニング
システム、或いはテキストを表現する他の信号源から発
生可能な）入力文書又はテキスト部分はテキストを定義
する入力テキストデータに変換される。例えば、入力テ
キストデータは、入力文書の画像上のＯＣＲ操作から得
たコンピュータで読み取り可能な文字コードのストリー
ムである。しかし、入力テキストデータが、メモリ又は
周辺デバイスから検索又はＨＴＭＬワールドワイドウェ
ブ文書のようなネットワークから受信したファイルを基
に従来のコンピュータから引き出し可能であり、又、音
声認識システムから受取り可能であり、（適当なマイク
ロフォン、インターフェース及び音声認識ソフトウェア
を用いて）直接又は適当な通信施設を介して伝達される
使用者の発言からテキストを生成できることは、当業者
であれば認識されるであろう。とにかく、入力テキスト
データはＲＡＭ３４又は他のローカル又はリモートメモ
リのようなメモリに記憶可能である。

【００３５】次に、ボックスＳ２では、ボックスＳ１か
らの文字ストリーム又は他の入力テキストデータが、例
えば、有限状態のトークンナイザ又は文字の入力ストリ
ームをトークン又は単語に分ける他のコンピュータベー
スのトークンナイザでトークン化される。有限状態のト
ークンナイザはその分野では公知であり、例えば、US-A
-5,721,939に見られ、US-A-5,488,719に開示された関連
の技術である。従って、例えば、“Hakkinen was again
on pole.”という文からトークン化動作は“Hakkine
n”,“was”,“again”,“on”,“pole”,及び“.”と
いうトークンを生成する。ここで、トークンの“．”は
分の終止トークンと呼ばれ、他のものは単語トークンと
呼ばれる。

【００３６】ボックスＳ３では、ボックスＳ２からのト
ークンが、文の終止トークンに遭遇するようになるま
で、例えば現在の文のバッファで集められる。トークン
の収集順序は文として考慮されている。（文の終止トー
クンのリストは、ピリオド、クウェスチョンマーク、感
嘆符等のように取扱われる各言語のため意外に早く形成
可能である。）次に、ボックスＳ３からの現在の文の収
集したトークンは、ボックスＳ９を介してボックスＳ４
に示されるように処理可能である。

【００３７】ボックスＳ４では、ボックスＳ３からのト
ークンは音声部のタグ付けを経験し音声部（ＰＯＳ）デ
ータを得て文の文脈で各トークンの音声部を示し、音声
部は文のトークンの文法の機能を示す範疇の広い意味に
使用される。トークンは語形論的に分析可能であり、注
釈文を得るためタグ付けされた音声部とすることがで
き、ＰＯＳデータはデータの項目を含み、現在の文のバ
ッファの単語に添えられた各単語のために決定された音
声部を示している。音声部のタグ付けのための技術は公
知であり、例えば、１９９２年のコンピュータ音声及び
言語（ComputerSpeech and Language),6:225-242のJ．
M．Kupiecによる「隠れたマルコフ模型を使用するロー
バスト音声タグ付け（Robust part-of-speech tagging
using ahidden Markov model）」及び「ＦＳＰの近似の
隠れたマルコフ模型及びそれを使用するテキストタグ付
け(FSPs Approximating Hidden Markov Models andText
Tagging Using Same)」という表題の共同で譲り受けさ
れた国際出願 WO-A-99/01828に見られる。

【００３８】次に、ボックスＳ４からのＰＯＳデータは
文の要約版を形成する要約テキストデータを得るために
使用されている。ボックスＳ５からＳ９はこれが行える
１つの方法を示している。

【００３９】ボックスＳ５では、ボックスＳ４からのＰ
ＯＳデータは文の動詞グループの注釈版を得るために使
用される。例えば、現在の文のバッファでの音声部の注
釈文はコンピュータベースの動詞グループのアノテータ
（annotator）を通過可能であり、最初はシンボルを括
弧に入れる特別の動詞グループを現在の文のバッファに
挿入し、その後、第２にトークンの統語的特性を識別す
る特別のマーカーを各動詞グループ、例えば動詞グルー
プの主要部、動詞グループの音声（能動／受動／不定
詞）等に挿入する。その技術は例えば、１９９２年２月
のコンピュータ科学技術レポート、CS92-05のG.Grefens
tetteによる「六分儀、生のテキストからの意味論を引
き出すこと、詳細な手段(Sextant. Extracting Semanti
cs fromraw text, implementation details)」、及び１
９９６年８月１１から１２日の言語の拡張有限状態モデ
ルのECAI'96研究集会議事録（Proceedings ECAI'96Work
shop on Extended Finite-State Models of Language）
でG．Grefenstetteによる「有限状態フィルタリングと
しての簡単な構文解析(Light Parsing asFinite-State
Filtering)」で説明されている。これらの技術によれ
ば、各動詞グループは原則、又は主要部を識別する有限
状態フィルタを通過可能であり、動詞グループの動詞及
び動詞の主要部マーカーはこれらの動詞の各々に取り付
け可能である。この動詞の主要部マーカーは動詞グルー
プの構造による。動詞グループの主要部マーカーの例
は、“Head_of_Passive_Verb_Group”，Head_of_Active
_Verb_Group”，“Head_of_Infinitive_Verb_Group”等
を含んでいる。

【００４０】ボックスＳ６では、ボックスＳ４からのＰ
ＯＳデータは文の名詞グループの注釈版を得るために使
用可能である。例えば、現在の文を注釈する動詞グルー
プは同様にコンピュータベースの名詞グループのアノテ
ータを通過可能であり、名詞グループのマーキングを現
在の文のバッファに挿入し、名詞句の主要部をマーク
し、各名詞の統語的特性、例えば、名詞が前置詞により
支配されているかどうかを示す。適当な名詞グループの
マーキング技術の詳細のため、上述したG．Grefenstett
eの参考文献を参照しなさい。これらの技術によると、
各名詞グループは原則、又は主要部を識別する有限状態
のフィルタを通過可能であり、名詞グループの名詞及び
名詞の主要部マーカーはこれらの名詞の各々に取付け
る。名詞グループの主要部のマーカーの例は、（主語又
は目的語として動詞に付くことのできる）「自由名詞(F
reeNoun)」及び前置詞に付く「前置詞名詞(PreNoun)」
である。

【００４１】本発明の幾つかの実施例では、１つだけの
ＰＯＳベースの基準を適用し、要約中にどのトークンを
除去すべきかを決定するよりむしろ、１セットのＰＯＳ
ベースの除去基準をどれでも使用できる。図３の方法に
おいて、除去基準は「簡約レベル」と呼ばれるが、セッ
トの除去基準はレベルの階層内で関係したり、又、何か
他の方法で互いに関係する必要はない。簡約レベルは
又、テキストが要約技術により保持される程度を決定
し、永久に固定される必要はないが、文書の処理開始時
に、又はあらゆる文の処理開始時に、１セットの予め定
義されたレベルから使用者により選択されてもよく（例
えば、キーボード、ディスプレイ、マウスデバイス及び
適当なＵＩ対話技術を含む従来の使用者入力技術によ
り、又は、ノブ、トグル、ダイアル、又はプッシュボタ
ンのような手動選択装置により（図示せず））、又は、
使用者の選択の代わりに、デフォルトレベルで設定され
てもよい。選択されると、１セットの予め定義されたレ
ベルの１つは別のレベルが選択されるまで、使用のため
記憶されてもよい。

【００４２】ボックスＳ７ａでは、信号は使用者の入力
デバイスから受け取られ、１セットのＰＯＳベースの除
去基準の１つを選択する。図３の方法において、基準は
図示されているような簡約レベルである。簡約レベルを
選択することにより、使用者の入力デバイスからの信号
はどのくらいのテキストが保持され、又は反対に、どの
くらい除去されるべきかを間接的に示すであろう。

【００４３】従って、ボックスＳ７では、現在設定した
簡約レベルを基に、テキストに付加された注釈は、どの
トークンが保持され、どれが除去されるべきかを決定す
る簡約フィルタにより使用可能である。事実上、簡約フ
ィルタは選択したＰＯＳベースの除去基準を使用してい
る。例えば、簡約の１つのレベルでは、フィルタはトー
クンを保持するだけであり、該トークンは前置詞の音声
部タグでタグ付けされるか（下記の例では、/IN）、又
は、グループ内の重要なトークンを示す動詞又は名詞グ
ループの主要部マーカーにより先行されるか（下記の例
では、^★HeadＮ，^★ActＶ,^★PrepＮ等）、又は、否定の
音声タグでタグ付けされるか、又は、下記の例のピリオ
ドのように或る中断トークンのいずれかである。異なる
簡約レベルを使用する効果は図５〜７に関連して下記に
もっと詳細に述べられている。

【００４４】ボックスＳ７で使用された簡約フィルタは
何か適当な方法で実行可能であり、入力としてタグ付け
され分類されたトークン列を受け取ると共に出力として
簡約した列を提供する有限状態のトランスデューサを含
んでいる。そのようなトランスデューサは従来の技術を
使用して簡約の各レベルのため製造されることができる
であろう。

【００４５】次に、ボックスＳ８では、音声部タグ及び
動詞及び名詞グループのマーキングは現在の文から削除
される。その後、現在の文のバッファの残りのテキスト
はボックスＳ９では出力である。１つの実施例では、結
果のテキストは、市販のテキストを音声に変換するシン
セサイザを使用して使用者に発音記号で表記したテキス
トとして与えられ、簡約の各レベルのための発音記号で
表記したテキストはこの方法で得ることができ、簡約レ
ベルを選択する使用者の信号に応じて次に起こる再生の
ため記録される。結果のテキストは表示画面上に選択的
に全段抜き大見出し又はボックスで与えられることがで
きるだろう。

【００４６】最後に、ボックスＳ１０では、システムは
調べて入力テキストが完全に消費されたかどうかを見
る。そうでなければ、システムはボックスＳ１の入力テ
キストの処理を続行し、さもなければシステムは停止す
る。

【００４７】図４はテキストの典型的な入力文のための
図３での各種行為の結果を示しており、即ち、現在の文
のバッファの内容の視覚化は各段階後のディスプレイに
示された画像に付加されている。

【００４８】ボックスＳ４での行為の後、バッファに入
れられた文は音声タグを含み、例えば、限定詞のため
“/DT”,形容詞のため“/JJ”,単一名詞のため“/NN”,
複数名詞のため“/NNS”,イラストレイテッド(illustra
ted)動詞のため“/VBZ”，文の終わりのため“/SENT”
である。その後、ボックスＳ５及びＳ６での行為に続い
て、バッファに入れた文は更にそれぞれ、動詞グループ
のマーキング（例えば、“[VG，“VG]”）及び名詞グル
ープのマーキング（“[NG”,“NG]”）を含んでいる。
動詞及び名詞グループ内では、重要なトークン、又は主
要部は又、動詞グループの能動態の動詞のための“^★Ac
tＶ”及び名詞グループの重要な名詞のための“^★Head
Ｎ”のようなデータの項目を先行してマークされる。ボ
ックスＳ７でのフィルタリング行為の後、“dog”,“ea
ts”,“bones”,“on”,及び“floor”の単語、文の終
わりのピリオド、及びそれらの付加のタグ及び動詞グル
ープ及び名詞グループのマーキングだけが残り、それら
の付加されたタグと共に全ての他のトークンはＰＯＳベ
ースの除去基準が適用されるのに従って除去された。ボ
ックスＳ８でのタグのストリッピング及び動詞グループ
及び名詞グループのマーキングの後、“dog”,“eat
s”,“bones”,“on”,及び“floor”の単語及び文の終
わりのピリオドは文のバッファに残っている。

【００４９】図５〜７は、簡約の幾つかの異なるレベル
から起こる出力が比較のために表示可能な本発明の実施
例による、典型的な入力テキストのための図３での幾つ
かの段階の結果を示しており、簡約の各種レベルを示し
ている。

【００５０】上述したように、テキストを注釈したグル
ープ及び主要部は簡約トランスデューサに送られ、使用
者により選択された簡約レベル（何も選択されない場合
にはデフォルトレベル）により単語及び他のトークンを
(ボックスＳ７で)除去する。簡約のレベルの狭い例は以
下の通りである。１．固有名称だけで、副節なし２．主語及び目的名詞だけで、副節なし３．主語、主要部動詞、及び目的名詞だけで、副節なし４．主語、主要部動詞、及び目的名詞、前置詞及び従属
名詞主要部だけで、副節なし５．固有名称だけで、副節を含む６．主語及び目的名詞だけで、副節を含む７．主語、主要部動詞、及び目的名詞だけで、副節を含
む８．主語、主要部動詞、及び目的名詞、前置詞及び従属
名詞主要部だけで、副節を含む

【００５１】元の又は入力テキスト(節)が図５に示され
ている。(ボックスＳ４からＳ６での)マーク付け後の同
じテキストが図６に示されている。上述した各簡約レベ
ル１〜４及び８のための結果としての出力(要約)テキス
トは図７に示されている。

【００５２】公に利用可能なシンセサイザーrsynthのよ
うにテキストを音声に変換するシンセサイザーを使用し
て、元のテキスト(図５)が３６秒で発音記号表記される
ことが分かった。（ほとんどの元の意味が保持される）
上記レベル８の簡約として分類された簡約により製作さ
れたテキストを発音表記することは、ＰＯＳのマーク付
け及び浅薄な構文解析を実行するのに必要な時間を含め
て、同じテキストを音声に変換するシンセサイザーでた
った２０秒しか掛からない。

【００５３】図４〜７から分かるように、マーク付けさ
れたテキストに含まれたグループデータは適用可能なＰ
ＯＳベースの除去基準を満たすトークンを直接示してい
ないが、それらはそれらのトークンを間接的に示すのに
十分な情報を提供する。例えば、それが主語、主要部動
詞、目的名詞、又は節又は副節の従属名詞主要部を示す
主要部のマーキングを有する場合、及びそれが前置詞と
してタグ付けされない場合には、（文の終わりのトーク
ン以外の）トークンは上記の簡約レベル８の除去基準を
満たす。

【００５４】上述した方法では、コンピュータベースの
机上スキャニングシステムを使用している。しかし、本
発明は、何か特定のデスクトップ、携帯用、又はワーク
ステーションべースの方法に限定されるものではない
が、そのようなデバイス、（スキャン、印刷、ファック
ス等の可能な）多機能機械のような他のプロセッサ制御
デバイスを含むコンピュータ配列の方法、及びワイヤー
ド又はワイヤレスネットワーク配置を組合わせて、周知
のＬＡＮ、ＷＡＮ及び又はインターネットプロトコルを
使用して動作させ、そのようなデバイスの適当な組合わ
せを組み込んでもよい。例えば、本発明は、プロセッサ
制御のデスクトップ平台型スキャニングシステムで実行
することができるであろう。そのようなシステムはその
分野では周知であり、先にゼロックス画像システムから
利用可能なリーディングエッジ（ReadingEdge）により
例示されている。二者択一的には、ハードウェアの構成
は、適当な使用者のインターフェース周辺装置及び平台
型又は用紙送りのデスクトップスキャナに結合された従
来のコンピュータ、スキャンされた書類から機械読取り
可能なテキストを生成可能な適当なＯＣＲソフトウェア
（例えば、スキャンソフト社からのテキストブリッジ）
を組み込んだコンピュータ又はスキャナの形式をとって
もよい。

【００５５】方法は、段階、動作、又は文字、単語、テ
キスト等を含む操作に関連する用語で説明された。その
ような段階、動作、又は操作は、そのような文字、単
語、テキスト等の機械読取り可能な(例えば、ＡＳＩＩ
コード)表現のプロセッサの作動を制御するソフトウェ
アによって、適切に実行可能であるが、また、ハードウ
ェアの作動でも実行可能である。

【００５６】方法は、浅薄な構文解析、ＰＯＳタグを使
用して統語的なタイプのグループ又は大きな塊(「チャ
ンク(chunk)」)にトークンを分類可能で重要なトークン
又はグループの主要部を任意に識別可能でもある動作に
関して説明した。本発明は又、どのトークンがＰＯＳベ
ースの除去基準を満たすかを示すデータを得るための他
の技術で実行することもできるだろう。例えば、そのよ
うな技術は幾つかの文をうまく解剖しなくてもよいが、
完全な構文解析技術が使用可能であろう。

【００５７】方法はＰＯＳタグ付けした文を得て、その
後次の文を取扱う前に文の要約版を得ることを説明し
た。本発明は又、１度に１つより多い文で作動し、又は
テキストを文に分けることなくテキストで作動するよう
に実行可能である。

【００５８】方法は、ＰＯＳタグ及び他のマーク付けし
たデータがバッファの一連の文字コードに含まれている
ことを説明した。しかし、ＰＯＳタグ及び他のマーク付
けしたデータが記憶され、テキストに含まれるよりむし
ろ、テキストとは別個に又はテキストと並行して取扱わ
れる。

【００５９】上述された方法は、特定の方法で特定のＰ
ＯＳベースの除去基準を適用するが、各種の他のＰＯＳ
ベースの除去基準が適用可能であり、そのような基準は
各種方法で適用可能であろう。

【００６０】上述した方法は、トークンを動詞及び名詞
グループに分類し、どのトークンがＰＯＳベースの除去
基準を満たすかをそのようなグループ内の主要部を示す
ことにより間接的に示すが、トークンは他の方法で分類
可能であり、ＰＯＳベースの除去基準を満たすトークン
は直接又は何か他の適当な方法で示されることができる
だろう。更に、除去基準を満たすか又は満たさないトー
クンは、除去基準を満たすトークンを示すグループデー
タを得ることによるよりもむしろ、他の方法で示される
ことができる。

【００６１】上述した方法は、基準が適用される前に使
用者から信号を受け取りＰＯＳベースの除去基準を選択
するが、除去基準は各種他の方法で選択可能であろう。
例えば、１セットの除去基準の各々はテキストの二者択
一の要約を得るために適用可能であり、その各々は音声
の録音に変換可能であり、その後、使用者は基準の１つ
で製作された要約を再生のために選択し、又は要約は別
の適当な方法で再生のため選択可能であろう。

【００６２】上述した方法は、フィルタとして有限状態
のトランスデューサーを使用して、ＰＯＳベースの除去
基準をＰＯＳデータに適用するが、ＰＯＳベースの除去
基準は、データ構造の他のタイプの使用又はアルゴリズ
ムの使用によるように、他の方法でＰＯＳデータに適用
可能である。

【００６３】方法は英語に関して上述されているが、本
発明は英語以外の言語に適用可能である。

【００６４】上述した方法では、特定の行為は、省略又
は異なって実行可能なことを実行している。例えば、タ
グ付けされマーク付けしたトークンは現在の文のバッフ
ァ以外のデータ構造で保管可能であろう。

【００６５】上述した方法では、行為は多くの場合で修
正可能な順序で実行される。例えば、図３のボックスＳ
５及びＳ６での行為は順序正しく反対にし、又は説明し
た機能性を変更することなく単一動作にまとめられても
よい。

【００６６】上述した方法は、現在使用可能な演算技術
を使用しているが、新たに発見された演算技術が利用可
能になるとそれらを使用するために容易に修正可能であ
ろう。

【００６７】上述したように、本発明は要約を行う各種
方法に適用可能である。

【００６８】本発明は、盲目又は視覚障害者のための読
取り機械に適用し、資料の音声要約を提供することがで
きる。

【００６９】本発明は又、デジタルコピー機、多機能機
械、又は光学文字認識が行えると共に要約が製作され印
刷され出力として提供される別の方法で可能なスキャン
及びプロセス能力を有する他の機械にも適用可能であ
る。

【００７０】本発明は又、ウェブページサマライザにも
適用されるかもしれない。

【図面の簡単な説明】

【図１】自動要約が実行されるコンピュータベースの
机上スキャニングシステムの例を示している。

【図２】図１のシステムで使用可能なコンピュータの
概略ブロック図である。

【図３】自動要約を行う処理段階を概略的に示すフロ
ー図である。

【図４】テキストの典型的な入力文用の図３での各種
段階の結果を示している。

【図５】典型的な入力テキスト用の図３での段階から
選択した段階の結果を示し、簡約の各種レベルを示して
いる。

【図６】典型的な入力テキスト用の図３での段階から選
択した段階の結果を示し、簡約の各種レベルを示してい
る。

【図７】典型的な入力テキスト用の図３での段階から選
択した段階の結果を示し、簡約の各種レベルを示してい
る。

Claims

【特許請求の範囲】

【請求項１】（ａ）２以上のトークンを含むテキスト
を形成する入力テキストデータを得て、（ｂ）前記入力テキストデータを使用してテキストのト
ークンのため音声部を示す音声部（ＰＯＳ）データを得
て、（ｃ）前記ＰＯＳデータを使用してテキストの２以上の
グループの２以上の連続するトークンを示すと共に各グ
ループ内でＰＯＳベースの除去基準を満たすトークンを
示すグループデータを得て、（ｄ）前記グループデータを使用して要約されたテキス
トデータを得てテキストの要約版を形成し、前記除去基
準を満たすように示されている各グループのトークンが
除去され、テキストの要約版のトークンの数がテキスト
のトークンの数より少なくなるようになっている、こと
を特徴とするテキストを自動的に要約する方法。
【請求項２】（Ａ）使用者の入力デバイスから信号を
受け取り１セットの音声部（ＰＯＳ）ベースの除去基準
の１つを選択すると共に、入力テキストデータを得て２
以上のトークンを含むテキストを形成し、（Ｂ）前記入力テキストデータを使用してＰＯＳデータ
を得てテキストのトークンのため音声部を示し、（Ｃ）前記ＰＯＳデータを使用して要約されたテキスト
データを得てテキストの要約版を形成し、トークンが選
択したＰＯＳベースの基準に従って除去され、テキスト
の要約板のトークンの数がテキストのトークンの数より
少なくなるようになっている、ことを特徴とするテキス
トを自動的に要約する方法。