[go: up one dir, main page]

JP4055944B2 - Web content conversion method and system - Google Patents

Web content conversion method and system Download PDF

Info

Publication number
JP4055944B2
JP4055944B2 JP2002272202A JP2002272202A JP4055944B2 JP 4055944 B2 JP4055944 B2 JP 4055944B2 JP 2002272202 A JP2002272202 A JP 2002272202A JP 2002272202 A JP2002272202 A JP 2002272202A JP 4055944 B2 JP4055944 B2 JP 4055944B2
Authority
JP
Japan
Prior art keywords
content
component
layout
template
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002272202A
Other languages
Japanese (ja)
Other versions
JP2004110427A (en
JP2004110427A5 (en
Inventor
宏至 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2002272202A priority Critical patent/JP4055944B2/en
Publication of JP2004110427A publication Critical patent/JP2004110427A/en
Publication of JP2004110427A5 publication Critical patent/JP2004110427A5/ja
Application granted granted Critical
Publication of JP4055944B2 publication Critical patent/JP4055944B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばパーソナルコンピュータ向けに作成された既存コンテンツを、表示能力の異なる様々な端末のそれぞれに適したコンテンツに変換するコンテンツ変換方法およびシステムに関するものである。
【0002】
【従来の技術】
携帯電話機、PDA(Personal Digital Assistance)、固定電話機など、インターネットに接続可能なクライアント端末の多様化にともない、主にパーソナルコンピュータ(以下、PC)向けに作成された既存のコンテンツをクライアント端末に表示するには、クライアント端末の能力(表示画面サイズやファイルサイズなど)に合せて自動的に変換する必要がある。
このような場合、従来の技術では、クライアント端末が表示できるように、クライアント端末に対応するコンテンツ記述言語に合せたコンテンツ記述言語変換、クライアント端末のファイルサイズに合せたページ分割、クライアント端末が対応する画像フォーマットやディスプレイの大きさに合せた画像のフォーマットや大きさの変換を行ってきた(例えば、特許文献1参照)。
【0003】
【特許文献1】
特開2001−63018号公報(第13−21頁、第3−25図)
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の技術は、PC以外のクライアント端末でもPC向けのコンテンツを表示できるようにコンテンツを変換する技術であり、必ずしもそれぞれのクライアント端末の表示能力を考慮した見易いコンテンツに変換できないという問題がある。
【0005】
最近のPC向けコンテンツは、年々そのレイアウトが複雑になり、1ページに表示する情報量が増加する傾向にある。これを、従来の技術で変換を行うと、レイアウト構造を考慮せずに、順番に全ての情報を変換してしまう。このため、ユーザは、整理されていない大量の情報を、例えば携帯電話機の小さな画面で閲覧することになり、コンテンツの見にくさを感じる。
【0006】
本発明の目的は、このような問題を解決し、コンテンツのレイアウトを解析し、クライアント端末のコンテンツ表示能力に合せてレイアウトで分割されたコンテンツの構成要素を選択して変換するコンテンツ方法およびシステムを提供することを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明に係るWebコンテンツ変換方法は、特定の情報機器向けに作成されたWebコンテンツ(以下、コンテンツ)を変換し、前記特定の情報機器とは異なる情報端末に配信するためのコンテンツ変換装置におけるWebコンテンツ変換方法であって、
前記コンテンツ変換装置が、
コンテンツ配信要求を行った情報端末の機種情報を当該配信要求のヘッダ情報により判定し、該機種情報に対応したコンテンツ表示能力を第1のデータベースから取得する第1のステップと、
取得した情報端末のコンテンツ表示能力と予め作成されたコンテンツの変換方法の複数のテンプレートを比較し、その情報端末に適したテンプレートを第2のデータベースから取得する第2のステップと、
当該テンプレートに従い既存のコンテンツから必要な構成要素を取得する構成要素取得ステップと、
取得した構成要素と前記テンプレートに記述された要素とを合成し、コンテンツ配信要求元の情報端末向けのコンテンツを生成するコンテンツ生成ステップと
を備え、
前記構成要素取得ステップが構成要素の取得に失敗したときに、新たなテンプレートを作成するためのコンテンツ解析ステップをさらに備え、
前記コンテンツ解析ステップが、コンテンツのレイアウトを取得するレイアウト取得ステップと、取得したレイアウトで分けられたコンテンツの各構成要素の重要度を取得する重要度取得ステップと、各構成要素の更新頻度を取得する更新頻度取得ステップと、これら3つのステップで得られた情報に基づきテンプレートの作成を指示するステップとを備えることを特徴とする。
また、前記レイアウト取得ステップが、レイアウトを構成する可能性のあるタグを定義するステップと、解析対象となるコンテンツとレイアウトが同じとなる可能性が高いコンテンツ同士を比較するステップと、レイアウトを構成する可能性のあるタグのうち高い確率でコンテンツ内の同じ位置にある特定のタグを、レイアウトを構成するタグとして取得するステップからなることを特徴とする。
また、前記重要度取得ステップが、前記レイアウト取得ステップで得られたレイアウトを持つコンテンツと解析対象のコンテンツとを比較し、レイアウト取得ステップで得られたレイアウトの各構成要素が同一の内容となる確率の低い順から、重要度の高い構成要素であると判断する重要度判定ステップを備えることを特徴とする。
また、前記重要度判定ステップは、解析対象となるコンテンツを前記特定の情報機器用のディスプレイに表示したときに、ディスプレイの中心点を含む画面要素を最も重要度の高い構成要素であると判断することを特徴とする。
また、前記重要度判定ステップは、解析対象となるコンテンツを前記特定の情報機器のディスプレイに表示したときに、表示面積の大きい画面要素をより高い重要度をもつ画面要素として判断することを特徴とする。
また、前記重要度判定ステップは、バックカラーが白である画面要素を重要度の高い画面要素として判断することを特徴とする。
また、前記重要度判定ステップは、文字数の多い画面要素を重要度の高い画面要素として判断することを特徴とする。
また、前記更新頻度取得ステップが、解析対象のコンテンツを第3のデータベースに記憶されている過去のコンテンツと比較することにより、各構成要素の更新頻度を取得するステップ備えることを特徴とする。
また、前記コンテンツ生成ステップは、対象コンテンツを配信する情報端末の情報を登録するステップと、コンテンツの解析結果を表示するステップと、コンテンツ管理者の指示に従いコンテンツ解析結果を修正するステップと、修正されたコンテンツ解析結果をもとにテンプレートを作成するステップとを備え、
前記コンテンツの解析結果を表示するステップは、構成要素の更新頻度の高いものと低いものとで強調方法を違えて表示することを特徴とする。
また、前記テンプレートを作成するステップは、構成要素の更新頻度が予め設定された閾値よりも頻繁に更新されている構成要素については、コンテンツ変換時に対象となるコンテンツを取得し動的に変換するようにテンプレートに記述し、閾値より頻繁に更新されない構成要素については直接その内容をテンプレートに記述することを特徴とする。
【0008】
本発明に係るWebコンテンツ変換システムは、特定の情報機器向けに作成されたコンテンツを変換し、前記特定の情報機器とは異なる情報端末に配信するためのWebコンテンツ変換システムであって、
コンテンツ配信要求を行った情報端末の機種情報を当該配信要求のヘッダ情報により判定し、該機種情報に対応したコンテンツ表示能力を第1のデータベースから取得する第1の手段と、
取得した情報端末のコンテンツ表示能力と予め作成されたコンテンツの変換方法の複数のテンプレートを比較し、その情報端末に適したテンプレートを第2のデータベースから取得する第2の手段と、
当該テンプレートに従い既存のコンテンツから必要な構成要素を取得する第3の手段と、
取得した構成要素と前記テンプレートに記述された要素とを合成し、コンテンツ配信要求元の情報端末向けのコンテンツを生成する第4の手段とを備え、
前記第3の手段が構成要素の取得に失敗したときに、新たなテンプレートを作成するためのコンテンツ解析手段をさらに備え、
前記コンテンツ解析手段が、コンテンツのレイアウトを取得するレイアウト取得手段と、取得したレイアウトで分けられたコンテンツの各構成要素の重要度を取得する重要度取得手段と、各構成要素の更新頻度を取得する更新頻度取得手段と、これらレイアウト取得手段、重要度取得手段、更新頻度取得手段の3つの手段で得られた情報に基づきテンプレートの作成を指示する手段とを備えることを特徴とする。
また、前記レイアウト取得手段が、レイアウトを構成する可能性のあるタグを定義する手段と、解析対象となるコンテンツとレイアウトが同じとなる可能性が高いコンテンツ同士を比較する手段と、レイアウトを構成する可能性のあるタグのうち高い確率でコンテンツ内の同じ位置にある特定のタグを、レイアウトを構成するタグとして取得する手段からなることを特徴とする。
また、前記重要度取得手段が、前記レイアウト取得手段で得られたレイアウトを持つコンテンツと解析対象のコンテンツとを比較し、前記レイアウト取得手段で得られたレイアウトの各構成要素が同一の内容となる確率の低い順から、重要度の高い構成要素であると判断する重要度判定手段を備えることを特徴とする。
また、前記重要度判定手段は、解析対象となるコンテンツを前記特定の情報機器用のディスプレイに表示したときに、ディスプレイの中心点を含む画面要素を最も重要度の高い構成要素であると判断するものであることを特徴とする。
また、前記重要度判定手段は、解析対象となるコンテンツを前記特定の情報機器のディスプレイに表示したときに、表示面積の大きい画面要素をより高い重要度をもつ画面要素として判断するものであることを特徴とする。
また、前記重要度判定手段は、バックカラーが白である画面要素を重要度の高い画面要素として判断するものであることを特徴とする。
また、前記重要度判定手段は、文字数の多い画面要素を重要度の高い画面要素として判断するものであることを特徴とする。
また、前記更新頻度取得手段が、解析対象のコンテンツを第3のデータベースに記憶されている過去のコンテンツと比較することにより、各構成要素の更新頻度を取得する手段を備えることを特徴とする。
また、前記コンテンツ生成手段は、対象コンテンツを配信する情報端末の情報を登録する手段と、コンテンツの解析結果を表示する手段と、コンテンツ管理者の指示に従いコンテンツ解析結果を修正する手段と、修正されたコンテンツ解析結果をもとにテンプレートを作成する手段とを備え、
前記コンテンツの解析結果を表示する手段は、構成要素の更新頻度の高いものと低いものとで強調方法を違えて表示することを特徴とする。
また、前記テンプレートを作成する手段は、構成要素の更新頻度が予め設定された閾値 よりも頻繁に更新されている構成要素については、コンテンツ変換時に対象となるコンテンツを取得し動的に変換するようにテンプレートに記述し、閾値より頻繁に更新されない構成要素については直接その内容をテンプレートに記述するものであることを特徴とする。
【0009】
【発明の実施の形態】
以下、本発明を実施する場合の一形態を、図面を参照して具体的に説明する。
図1は、本発明に関わるWebコンテンツ変換方法を実行するシステムの一実施形態を示す全体構成図である。
ここで示すシステムは、既存コンテンツを配信するWebサーバ100、主にPC向けに作成された既存コンテンツを保持する既存コンテンツDB101、イントラネット110により接続され、クライアント端末のコンテンツ表示能力に適したテンプレートを用いて既存コンテンツの変換、配信を行うコンテンツ変換装置120、既存コンテンツを解析してテンプレートを作成するテンプレート生成装置130、インターネット140を介して接続されるコンテンツの取得及び表示を行うクライアント端末150から構成される。
【0010】
コンテンツ変換装置120は、インターネット140を通してクライアント端末150と、イントラネット110を通してWebサーバ100およびテンプレート生成装置130と通信する通信部121、通信部121を経由したクライアント端末150からのコンテンツ要求からクライアント端末150の機種を特定し、その表示能力を取得する機種判定部122、機種判定部122が特定機種の表示能力を取得するために使用する機種とその表示能力の情報が保持されている機種情報DB123、様々な表示能力に合った変換方法が記述されたテンプレートを保持するテンプレートDB125、機種判定部122が取得した表示能力に合せて適切なテンプレートをテンプレートDB125から取得するテンプレート取得部124、テンプレート取得部124が取得したテンプレートに基づき既存コンテンツを変換、生成し、クライアント端末150に配信するコンテンツ生成部126、コンテンツ生成部126においてコンテンツの生成に失敗したときに既存のコンテンツに必要な変換を行い、クライアント端末150に配信するコンテンツ変換部127から構成される。
【0011】
テンプレート生成装置130は、イントラネット110を通してWebサーバ100及びコンテンツ変換装置120との通信をおこなう通信部131、通信部131を経由してWebサーバ100から既存コンテンツを取得するコンテンツ取得部132、取得した既存コンテンツを時間経過とともに保存する既存コンテンツ履歴DB133、取得した既存コンテンツのレイアウトを解析し、既存コンテンツを複数の構成要素に分割するレイアウト解析部134、得られた構成要素の重要度及び更新頻度を判定する構成要素解析部135、得られたレイアウトや構成要素の情報をもとにテンプレートを生成するテンプレート生成部137、生成されたテンプレートを表示し、コンテンツ管理者の指示に従い、テンプレートを変更する表示・入力部136から構成される。
【0012】
このようなシステム構成において、コンテンツ変換装置120が、クライアント端末150からコンテンツの要求を受信し、図2の例に示す既存のコンテンツを図3の例に示すテンプレートに従って変換し、図4の例に示すコンテンツを生成して配信するまでの手順を図5のフローチャートを用いて説明する。
図2の既存コンテンツについて説明する。
図2の(a)は既存コンテンツをブラウザ表示したもので、図2(b)はHTML文書で表示したものである。このコンテンツは、「○○ソフトが取り扱っている製品を説明するコンテンツ」であり、URLが「http://www.○○soft.co.jp/Product/kokyaku.html」であり、大きく4つの構成要素から構成されている。
201の構成要素1は「○○ソフト」のロゴであり、202の構成要素2はこのサイト全体のメニューであり、203の構成要素3は構成要素2の全体メニューの項目の1つである「製品一覧」のメニューであり、204の構成要素4は構成要素3の製品一覧メニューの1つ「顧客/販売システム」の内容である製品を説明する本文である。
また、図2(b)のHTML文書で、四角で囲まれた構成要素1〜4は実際には対応するHTML文書が記述されている。
【0013】
図3のテンプレートについて説明する。
テンプレートは、主にレイアウトを記述するテンプレートファイル(図3(a)template1.jsp)と、このテンプレートを適用するクライアント端末の表示能力や構成要素の場所が記述されたプロファイルから構成される(図3(b) templateProfile1.xml)。
図3(a)のテンプレートファイルにおいて、301は対応するプロファイルを指定し、302は構成要素3のHTML文書が記述されており、303はプロファイルを参照して配信時に構成要素4を取得することを意味している。
このテンプレートは、クライアント端末の表示能力を考慮して、もとのコンテンツよりもレイアウトが変更され、情報量が制限されている。
図3(b)のプロファイルにおいて、311の要素Templateの属性FileNameは対応するテンプレートファイル名、312の属性AppliedURLはこのテンプレートを適用するコンテンツのURL、313の属性Deviceはこのテンプレートを適用するクライアント端末の表示能力を意味し、314の要素Blockは特定の構成要素の位置を属性URLと属性XPathで指定している。これらファイルは、テンプレートDB114に保持されている。
【0014】
図5のフローチャートを用いて、コンテンツ変換装置120がコンテンツを変換する手順について説明する。
ステップS501では、クライアント端末150からのコンテンツhttp://www.○○soft.co.jp/Product/kokyaku.htmlの要求を通信部121が受信する。
ステップS502では、機種判定部122が、クライアント端末150からのリクエストのヘッダ情報からクライアント端末150の機種を判定し、さらに機種情報DB123からこの機種の情報(対応するコンテンツ記述言語、対応する画像フォーマット、スクリーンサイズ、ファイルサイズ等)を取得する。
ステップS503では、テンプレート取得部124が、要求されたURL及びクライアント端末150の情報をもとに、テンプレートDB125から適切なテンプレートを取得する。この際、URLがプロファイルの要素Templateの属性AppliedURL312と一致しており、クライアント端末150の表示能力がプロファイルの要素Deviceで記述された表示能力313に最も近いテンプレートを選択する。もし、クライアント端末150から要求されたURLと属性AppliedURL312のURLとが一致するテンプレートがない場合など、テンプレートの取得に失敗した場合はステップS507を実行し、取得できた場合はステップS504を実行する。
【0015】
ステップS504では、コンテンツ生成部126が、テンプレートファイルの指示に従いコンテンツから構成要素を取得する。図3の例では、テンプレートファイルtemplate1.jspの303において構成要素4の取得が記述されており、プロファイルtemplateProfile1.xmlの314において属性nameが「構成要素4」である要素Blockから属性URLの値を取得し、このURLに対応するコンテンツをWebサーバ100から取得する。クライアント端末130に応じて、取得した構成要素のコンテンツ記述言語の変換を行う。もし、対応するコンテンツが削除されたなどの理由から、このコンテンツが取得できない場合はS505を実行し、取得できた場合はS506を実行する。
【0016】
ステップS505では、コンテンツ生成部126が、既存のコンテンツが取得できない旨のエラーページを生成する。
ステップS506では、図3のプロファイルtempProfile1.xmlの314において属性nameが「構成要素4」である要素Blockから属性XPathの値を取得し、これを用いてステップS505で取得したコンテンツから必要な構成要素を取得する。もし、テンプレート作成時ともとのコンテンツが変更された等の理由で、必要な構成要素が取得できない場合はステップS507を実行し、取得できた場合はステップS509を実行する。
ステップS507では、コンテンツ生成部126が、構成要素の取得に失敗した旨の情報を、テンプレート名と取得に失敗したURLと共にコンテンツ変換部127に通知する。
【0017】
ステップS508では、テンプレートを用いたコンテンツ生成に失敗したことから、コンテンツ変換部127が、クライアント端末150から要求があったコンテンツを、従来技術を用いてクライアント端末150に合せたコンテンツ記述言語の変換やページ分割を行う。
ステップS509では、コンテンツ生成部126が、テンプレートファイルに記述されたレイアウト情報とステップS506で取得した構成要素とを合成して図4に示すコンテンツを生成する。
【0018】
以上のようにして、テンプレートを用いて既存コンテンツを変換することで、図4に示すようなクライアント端末150のコンテンツ表示能力を考慮し、情報量が削減された見易いコンテンツを生成・配信できる。すなわち、図2(a)の既存コンテンツのうち全体メニューである構成要素2が削除されたコンテンツがクライアント端末150に表示される。
【0019】
次に、テンプレートを作成するのに必要な情報をテンプレート生成装置130が取得する手順を、図6のフローチャートを用いて説明する。
ここでは、テンプレートを作成する対象となる既存コンテンツを図2に示すコンテンツとして説明する。
まず、ステップS601では、コンテンツ変換装置130からの構成要素取得失敗の通知を受信した、あるいはコンテンツ管理者からの指示があったのを契機に、テンプレート生成装置130が、コンテンツ解析を開始する。
ステップS602では、コンテンツ取得部132が、通信部131を通して、テンプレートの生成対象となる既存コンテンツとそれに関連する既存コンテンツをWebサーバ100から取得する。取得した既存コンテンツは、既存コンテンツ履歴DB133に保管する。
【0020】
ここで、関連するコンテンツとは、対象となるコンテンツと同様のレイアウトであると考えられるコンテンツである。具体的には、対象となるコンテンツと類似度の高いコンテンツ、またサイトのディレクトリ構造において同一ディレクトリにあるコンテンツや同一階層上にあるコンテンツである。対象となるコンテンツを
http://www.○○soft.co.jp/Product/kokyaku.html
としたときに、同一ディレクトリにあるコンテンツとは、
http://www.○○soft.co.jp/Product/cad.html
http://www.○○soft.co.jp/Product/tuushin.html
等であり、これらは図2のコンテンツと構成要素1から3までが同一で、構成要素4(本文)のみが異なるコンテンツである。すなわち、構成要素4の内容がそれぞれ「CAD/地図システム」、「通信システム」の説明になっている。
また、同一階層上のコンテンツとは
http://www.○○soft.co.jp/Company/profile.html
http://www.○○soft.co.jp/Company/vision.html
等である。ただし、前述の同一ディレクトリのコンテンツは含まないものとする。
これらは図2のコンテンツと構成要素1と2が同一で、構成要素3と4が異なるコンテンツである。すなわち、構成要素3が「会社情報」のメニューで、構成要素4がそれぞれ「会社情報」の「プロファイル」および「ビジョン」の説明になっている。
【0021】
ステップS603では、レイアウト解析部132が、対象となるコンテンツのレイアウト構造を解析する。コンテンツのレイアウトは通常<TABLE>、<DIV>タグで記述されている。レイアウトを定義しているタグを判定するために以下の判定条件を用いる。
(1)レイアウト定義可能タグとして<TABLE>、<DIV>を定義する。
(2)レイアウト定義可能タグのうち、<BODY>タグあるいはレイアウト定義可能タグの子要素または孫要素であるものを取得する。
(3)上記(2)で取得したレイアウト定義可能タグのうち、ステップS602で取得した同一ディレクトリまたは同一階層上にあるコンテンツにおいても同じ位置にあるタグを取得する。
(4)上記(3)で取得したレイアウト定義可能タグのうち、このタグによって分けられた複数の構成要素のうち少なくとも1つがステップS602で取得したコンテンツの構成要素と一致しているタグを取得する。
以上(4)で取得したタグがこのコンテンツのレイアウトを定義しているタグであり、これがレイアウト情報である。これにより、コンテンツを複数の構成要素に分割することができる。図2のコンテンツの例では、構成要素1から4に分割できる。
【0022】
ステップS604では、レイアウトで分けられた構成要素のコンテンツ内での重要度を判定する。重要な構成要素とは、そのコンテンツの特徴を表現している構成要素であり、他のコンテンツでは得られない情報を持つ構成要素である。重要度を判定するために、ステップS602で取得した同一ディレクトリおよび同一階層にあるコンテンツと比較する。
図2のコンテンツにおいて、構成要素4は他のコンテンツにはない情報をもっているので最も重要度の高い重要度1と判定する。構成要素3は、同一ディレクトリにあるコンテンツには同一内容の構成要素が含まれているが、同一階層上のコンテンツには含まれないので、次に重要度の高い重要度2と判定する。構成要素1および2は、同一ディレクトリにあるコンテンツおよび同一階層上のコンテンツの両方に同一内容の構成要素が含まれているので最も低い重要度3と判定する。
【0023】
重要度1の構成要素が複数存在する場合は、レイアウト構造の解析結果で得られたレイアウトを持つコンテンツと解析対象のコンテンツとを比較し、レイアウト解析結果で得られたレイアウトの各構成要素が同一の内容となる確率の低い順から、重要度の高い構成要素であると判断する。具体的には、例えば以下の条件により最も重要な構成要素を決定する。
(1)1024×768ピクセルのディスプレイに表示したときに、ディスプレイの中心点を含む構成要素
(2)1024×768ピクセルのディスプレイに表示したときに、最も広い面積をもつ構成要素
(3)構成要素のバックカラーが、白である構成要素
(4)構成要素の文字数が最も多い構成要素
【0024】
ステップS605では、構成要素解析部135が、構成要素が変更される頻度を判定する。コンテンツの時間変化を見るためにコンテンツ取得部132は、定期的にWebサーバ100からコンテンツを取得し、既存コンテンツ履歴DB133に保管する。
【0025】
構成要素解析部135は、既存コンテンツ履歴DB133から過去のコンテンツを取得し、ステップS603で得られた構成要素の時間変化を調べる。予め設定された閾値以上に更新されている構成要素を動的要素、更新されていない構成要素を静的要素と定義する。
図2の例では、製品のバージョンアップや価格改定、新規製品の登録などの理由により構成要素4が頻繁に更新されると仮定する。すると、構成要素4が動的要素であり、残りの構成要素1から3は静的要素とする。
ステップS606では、表示・入力部136が、これまでのステップで得られたレイアウト情報(各構成要素の位置)および構成要素の重要度、更新頻度(動的要素か静的要素か)を表示する。表示例を図7に示す。
【0026】
以上のようにして、テンプレート生成装置130は、テンプレート作成に必要なレイアウト情報、構成要素の重要度および更新頻度を取得できる。
次に、解析した結果を表示・入力部136が表示し、コンテンツ管理者の指示に従い修正を行う。
【0027】
図7に表示・入力部136の画面を示す。この画面は、主に2つの画面(構成要素プロパティ設定画面710とブラウザ表示画面720)から構成される。
ブラウザ表示画面720は、テンプレート作成対象のコンテンツを表示し、さらにレイアウト解析部134によって得られたレイアウトをもとに構成要素721の境界を強調表示する。
あるいは、構成要素の更新頻度の高いものと低いものとで強調方法を違えて表示する。また、構成要素の重要度に応じて強調方法を違えて表示する。
構成要素プロパティ設定画面710は、ブラウザ表示画面720においてマウスポインタ730によって選択された構成要素のプロパティ(重要度、静的/動的)を表示し、さらに設定することができる。
また、メニュー740の「設定」を選択すると「コンテンツ表示装置登録ダイアログ」750が表示され、コンテンツを表示させる予定のクライアント端末を登録する。テンプレートは、基本的にここに登録したクライアント端末の種類数だけ作成される。
【0028】
次に、コンテンツ管理者が表示・入力部136に対して行った操作に基づき、テンプレート生成部137がテンプレートを作成する手順について、図8のフローチャートにもとづいて説明する。
まず、ステップS801では、表示・入力部136が、コンテンツ管理者によって入力された配信対象のクライアント端末150を登録する。コンテンツ管理者は「コンテンツ表示装置登録ダイアログ」750に、このコンテンツを表示させる予定のクライアント端末の情報(スクリーンサイズ、メモリ等)を入力する。
ステップS802では、表示・入力部136が、コンテンツ管理者の指示に従い構成要素の範囲を変更する。範囲を変更する方法は、例えばコンテンツ管理者が「Ctrlキー」を押しながら、マウスポインタ730で構成要素をクリックすると、その親の要素が新しい構成要素として選択することによって範囲を変更する。もし親要素が<BODY>であるならば、そのマウスポインタ730が指し示している最小の要素を構成要素として選択する。
【0029】
ステップS803では、表示・入力部136が、コンテンツ管理者の指示に従い構成要素のプロパティを変更する。コンテンツ管理者は、プロパティを変更したい構成要素をマウスポインタ730で選択し、その画面要素のプロパティを構成要素プロパティ設定画面710に表示し、修正を行う。
ステップS804では、テンプレート生成部137が、コンテンツ管理者によりメニュー740の「テンプレート作成」を選択されると、ステップS801で登録した各クライアント端末それぞれに適したテンプレートの作成を開始する。
【0030】
ステップS805では、テンプレート生成部137が、表示する構成要素及びレイアウトを決める。
まず、各構成要素のデータサイズおよび表示サイズを計算する。次に、対象となるクライアント端末のスクリーンサイズ、メモリ等を参照して、表示する構成要素を重要度の高いものから順に選択していく。選択した構成要素をもとのレイアウトを活かした形で再構成する。また、選択されなかった構成要素は別のテンプレートで表示し、そのテンプレートへのハイパーリンクを付加する。
図4の例では、重要度1及び2である構成要素4及び3を表示し、それ以外の構成要素を別のテンプレートにし、そこへのハイパーリンクが生成されている。
ステップS806では、テンプレート生成部137が、ステップS805で得られた構成要素及びレイアウトをテンプレートファイルに出力する。
【0031】
図3のテンプレートにおいて、まず対象となったクライアント端末の情報312プロファイル(templateProfile1.xml)に書き込む。次に構成要素3は静的要素であるので、テンプレートファイル(template1.jsp)に直接HTML文書302を書き込む。また、構成要素4は動的要素であるので、プロファイルに構成要素4を含むコンテンツのURLとそのコンテンツ内での位置をXPathで指定し、テンプレートファイルにおいて構成要素4を表示する位置に、構成要素4を表示するためのタグを挿入する。
ステップS807では、テンプレート生成部137が、通信部131を経由してコンテンツ変換装置120のテンプレートDB125にステップS806で作成したテンプレートを配置する。
【0032】
【発明の効果】
以上の説明から明らかなように、本発明によれば、コンテンツのレイアウト及びレイアウトで分けられた構成要素を取得し、さらに、構成要素の重要度を自動的に判断することができるので、PC等の特定の情報機器向けに作成されたコンテンツを携帯電話機等のクライアント端末のコンテンツ表示能力に合せて構成要素を取捨選択することによって、クライアント端末に適したコンテンツを配信、提供することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示すシステム構成図である。
【図2】 PC向けに作成された既存のコンテンツ例を示す図である。
【図3】図2のコンテンツから作成したテンプレート例を示す図である。
【図4】図3のテンプレートを用いて図2のコンテンツを変換した例を示す図である。
【図5】コンテンツ変換装置がテンプレートを用いて既存コンテンツを変換しクライアント端末に配信する手順を示すフローチャートである。
【図6】テンプレート生成装置がコンテンツを解析する手順を示すフローチャートである。
【図7】コンテンツの解析結果を表示する画面例を示す図である。
【図8】テンプレート生成装置がテンプレートを作成する手順を示すフローチャートである。
【符号の説明】
100…Webサーバ、101…既存コンテンツDB、110…イントラネット、120…コンテンツ変換装置、121…コンテンツ変換装置の通信部、122…機種判定部、123…機種情報DB、124…テンプレート取得部、125…テンプレートDB、126…コンテンツ生成部、127…コンテンツ変換部、130…テンプレート生成装置、131…テンプレート生成装置の通信部、132…コンテンツ取得部、133…既存コンテンツ履歴DB、134…レイアウト解析部、135…構成要素解析部、136…表示・入力部、140…インターネット、150…クライアント端末。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a content conversion method and system for converting, for example, existing content created for a personal computer into content suitable for various terminals having different display capabilities.
[0002]
[Prior art]
With the diversification of client terminals that can be connected to the Internet, such as mobile phones, PDAs (Personal Digital Assistance), and fixed telephones, existing contents created mainly for personal computers (hereinafter referred to as PCs) are displayed on the client terminals. Needs to be automatically converted according to the capabilities of the client terminal (display screen size, file size, etc.).
In such a case, in the conventional technique, the content description language conversion according to the content description language corresponding to the client terminal, the page division according to the file size of the client terminal, and the client terminal are supported so that the client terminal can display. Conversion of the format and size of the image according to the image format and the size of the display has been performed (see, for example, Patent Document 1).
[0003]
[Patent Document 1]
Japanese Patent Laid-Open No. 2001-63018 (pages 13-21, FIG. 3-25)
[0004]
[Problems to be solved by the invention]
However, the above-mentioned conventional technology is a technology for converting content so that content for PC can be displayed even on a client terminal other than a PC, and there is a problem that it cannot always be converted into easy-to-read content considering the display capability of each client terminal. is there.
[0005]
Recent PC content tends to become more complex in layout year by year, and the amount of information displayed on one page tends to increase. If this is converted by the conventional technique, all information is converted in order without considering the layout structure. For this reason, the user browses a large amount of unorganized information on a small screen of a mobile phone, for example, and feels difficult to see the content.
[0006]
An object of the present invention is to provide a content method and system for solving such problems, analyzing the content layout, and selecting and converting the content components divided by the layout in accordance with the content display capability of the client terminal. The purpose is to provide.
[0007]
[Means for Solving the Problems]
  In order to achieve the above object, a Web content conversion method according to the present invention converts Web content (hereinafter referred to as content) created for a specific information device and distributes it to an information terminal different from the specific information device. A web content conversion method in a content conversion apparatus for performing
  The content conversion device is
  A first step of determining model information of an information terminal that has made a content distribution request from header information of the distribution request, and acquiring content display capability corresponding to the model information from the first database;
  A second step of comparing the acquired content display capability of the information terminal with a plurality of templates of a content conversion method created in advance and acquiring a template suitable for the information terminal from the second database;
  A component acquisition step for acquiring necessary components from existing content according to the template,
  A content generation step of combining the acquired component and the element described in the template to generate content for the information terminal of the content distribution request source;
With
  A content analysis step for creating a new template when the component acquisition step fails to acquire the component;
  The content analysis step acquires a layout acquisition step for acquiring a content layout, an importance acquisition step for acquiring the importance of each component of the content divided by the acquired layout, and an update frequency of each component An update frequency acquisition step, and a step of instructing creation of a template based on the information obtained in these three steps.It is characterized by that.
  The layout acquisition step includesThe step of defining a tag that can constitute a layout, the step of comparing contents that are likely to have the same layout as the content to be analyzed, and the higher of tags that may constitute the layout The method includes a step of acquiring a specific tag at the same position in the content with probability as a tag constituting the layout.
  Also, the probability that the importance level acquisition step compares the content having the layout obtained in the layout acquisition step with the content to be analyzed, and the respective components of the layout obtained in the layout acquisition step have the same content It is characterized by comprising an importance level determining step for determining that the component is a highly important component in ascending order.
  In the importance level determination step, when the content to be analyzed is displayed on the display for the specific information device, the screen element including the center point of the display is determined to be the most important component. It is characterized by that.
  In the importance level determining step, when content to be analyzed is displayed on the display of the specific information device, a screen element having a large display area is determined as a screen element having a higher level of importance. To do.
  In the importance level determining step, a screen element whose background color is white is determined as a screen element having a high level of importance.
  In the importance level determining step, a screen element having a large number of characters is determined as a screen element having a high level of importance.
  The update frequency acquisition step includes a step of acquiring the update frequency of each component by comparing the content to be analyzed with the past content stored in the third database.
  The content generation step includes a step of registering information of an information terminal that distributes the target content, a step of displaying the analysis result of the content, a step of correcting the content analysis result according to an instruction from the content manager, Creating a template based on the content analysis resultsPrepared,
The step of displaying the analysis result of the content is characterized in that the emphasis method is displayed differently depending on whether the component update frequency is high or low.
  Also,In the step of creating the template, the component is updated so that the component content is updated more frequently than a preset threshold value so that the target content is acquired and dynamically converted at the time of content conversion. The component elements that are not updated more frequently than the threshold value are directly described in the template.
[0008]
  The web content conversion system according to the present invention is a web content conversion system for converting content created for a specific information device and delivering it to an information terminal different from the specific information device,
  First means for determining model information of an information terminal that has made a content distribution request from header information of the distribution request, and acquiring content display capability corresponding to the model information from a first database;
  A second means for comparing the acquired content display capability of the information terminal with a plurality of templates of a content conversion method created in advance and acquiring a template suitable for the information terminal from the second database;
  A third means for acquiring necessary constituent elements from existing content according to the template;
  A fourth means for synthesizing the acquired component and the element described in the template, and generating content for the information terminal of the content distribution request source,
  When the third means fails to acquire the component, it further comprises content analysis means for creating a new template,
  The content analysis unit acquires a layout acquisition unit that acquires a layout of the content, an importance level acquisition unit that acquires the importance level of each component of the content divided by the acquired layout, and an update frequency of each component An update frequency acquisition means, and a means for instructing creation of a template based on information obtained by the three means of the layout acquisition means, the importance level acquisition means, and the update frequency acquisition means.It is characterized by that.
  Further, the layout acquisition means constitutes a layout, a means for defining a tag that may constitute a layout, a means for comparing contents that are likely to have the same layout as the content to be analyzed, and a layout It is characterized by comprising means for acquiring a specific tag at the same position in the content with high probability among possible tags as a tag constituting the layout.
  Further, the importance level acquisition unit compares the content having the layout obtained by the layout acquisition unit with the content to be analyzed, and each component of the layout obtained by the layout acquisition unit has the same content. It is characterized by comprising importance level judging means for judging that it is a component having a high importance level from the lowest probability.
  The importance level determination means determines that the screen element including the center point of the display is the most important component when the content to be analyzed is displayed on the display for the specific information device. It is characterized by being.
  Further, the importance level determination means determines a screen element having a large display area as a screen element having a higher importance level when the content to be analyzed is displayed on the display of the specific information device. It is characterized by.
  Further, the importance level determination means determines a screen element whose background color is white as a screen element having a high level of importance.
  Further, the importance level judging means judges a screen element having a large number of characters as a screen element having a high level of importance.
  Further, the update frequency acquisition means includes means for acquiring the update frequency of each component by comparing the content to be analyzed with the past content stored in the third database.
  Further, the content generation means is corrected with means for registering information of an information terminal that distributes the target content, means for displaying the analysis result of the content, means for correcting the content analysis result in accordance with an instruction from the content manager, To create a template based on the content analysis results obtained,
  The means for displaying the analysis result of the content is characterized by displaying differently in the emphasis method depending on whether the update frequency of the component is high or low.
  Further, the means for creating the template is a threshold value in which the update frequency of the component is set For components that are updated more frequently, describe the content in the template so that the target content is acquired and dynamically converted at the time of content conversion. It is what is described in.
[0009]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment for carrying out the present invention will be specifically described with reference to the drawings.
FIG. 1 is an overall configuration diagram showing an embodiment of a system for executing a Web content conversion method according to the present invention.
The system shown here uses a template suitable for the content display capability of a client terminal, connected by a Web server 100 that distributes existing content, an existing content DB 101 that mainly holds existing content created for a PC, and an intranet 110. Content conversion device 120 that converts and distributes existing content, a template generation device 130 that analyzes existing content to create a template, and a client terminal 150 that acquires and displays content connected via the Internet 140. The
[0010]
The content conversion device 120 communicates with the client terminal 150 through the Internet 140, the communication unit 121 that communicates with the Web server 100 and the template generation device 130 through the intranet 110, and a content request from the client terminal 150 through the communication unit 121. A model determination unit 122 that identifies a model and obtains its display capability, a model information DB 123 that stores information on a model used by the model determination unit 122 to acquire the display capability of the specific model and its display capability, A template DB 125 that holds a template describing a conversion method suitable for display capability, a template acquisition unit 124 that acquires an appropriate template from the template DB 125 according to the display capability acquired by the model determination unit 122, and a template acquisition unit 24, the existing content is converted and generated based on the acquired template, and the content generation unit 126 that distributes the content to the client terminal 150. When the content generation unit 126 fails to generate the content, the existing content is converted, and the client A content conversion unit 127 that distributes to the terminal 150 is configured.
[0011]
The template generation device 130 includes a communication unit 131 that communicates with the Web server 100 and the content conversion device 120 via the intranet 110, a content acquisition unit 132 that acquires existing content from the Web server 100 via the communication unit 131, and the acquired existing Existing content history DB 133 that stores content over time, layout analysis of acquired existing content, layout analysis unit 134 that divides existing content into multiple components, and determines the importance and update frequency of the obtained components The component analysis unit 135, the template generation unit 137 that generates a template based on the obtained layout and component information, the generated template is displayed, and the display is changed according to the instruction of the content manager. Input unit 136 Constructed.
[0012]
In such a system configuration, the content conversion apparatus 120 receives a content request from the client terminal 150, converts the existing content shown in the example of FIG. 2 according to the template shown in the example of FIG. A procedure for generating and distributing the content shown will be described with reference to the flowchart of FIG.
The existing content in FIG. 2 will be described.
FIG. 2A shows the existing content displayed in a browser, and FIG. 2B shows the HTML content. This content is “Content that explains the products that XX Software handles” and the URL is “http://www.XXsoft.co.jp/Product/kokyaku.html”. It consists of components.
The component 1 of 201 is a logo of “XX software”, the component 2 of 202 is a menu of the entire site, and the component 3 of 203 is one of items of the entire menu of the component 2 “ “Product list” is a menu, and a component 4 of 204 is a text describing a product that is the content of one of the product list menus of the component 3 “customer / sales system”.
In addition, in the HTML document of FIG. 2B, the corresponding HTML document is actually described in the components 1 to 4 surrounded by a square.
[0013]
The template of FIG. 3 will be described.
A template is mainly composed of a template file (FIG. 3 (a) template1.jsp) that describes a layout and a profile that describes the display capability and location of components of the client terminal to which this template is applied (FIG. 3). (B) templateProfile1.xml).
In the template file of FIG. 3A, 301 designates the corresponding profile, 302 describes the HTML document of component 3, and 303 obtains component 4 at the time of distribution with reference to the profile. I mean.
In consideration of the display capability of the client terminal, the layout of the template is changed from that of the original content, and the amount of information is limited.
In the profile of FIG. 3B, the attribute FileName of the element Template 311 is the corresponding template file name, the attribute AppliedURL is the URL of the content to which this template is applied, and the attribute Device of 313 is the client terminal to which this template is applied. This means display capability, and the element block 314 designates the position of a specific component element by an attribute URL and an attribute XPath. These files are held in the template DB 114.
[0014]
A procedure for the content conversion apparatus 120 to convert content will be described with reference to the flowchart of FIG.
In step S501, the communication unit 121 receives a request for content http://www.XXsoft.co.jp/Product/kokyaku.html from the client terminal 150.
In step S502, the model determination unit 122 determines the model of the client terminal 150 from the header information of the request from the client terminal 150, and further, information on this model (corresponding content description language, corresponding image format, Screen size, file size, etc.).
In step S503, the template acquisition unit 124 acquires an appropriate template from the template DB 125 based on the requested URL and information on the client terminal 150. At this time, a template whose URL matches the attribute AppliedURL 312 of the profile element Template and whose display capability of the client terminal 150 is closest to the display capability 313 described by the profile element Device is selected. If there is no template in which the URL requested from the client terminal 150 and the URL of the attribute AppliedURL 312 match, step S507 is executed if acquisition of the template fails, and step S504 is executed if acquisition is successful.
[0015]
In step S504, the content generation unit 126 acquires a component from the content according to the instruction of the template file. In the example of FIG. 3, the acquisition of the component element 4 is described in the template file template1.jsp 303, and the attribute URL value is obtained from the element Block whose attribute name is “component element 4” in the template templateProfile1.xml 314. The content corresponding to this URL is acquired from the Web server 100. In accordance with the client terminal 130, the content description language of the acquired component is converted. If this content cannot be acquired because the corresponding content has been deleted, S505 is executed, and if it can be acquired, S506 is executed.
[0016]
In step S505, the content generation unit 126 generates an error page indicating that existing content cannot be acquired.
In step S506, the value of the attribute XPath is acquired from the element Block whose attribute name is “component 4” in the profile tempProfile1.xml 314 of FIG. 3, and the necessary component from the content acquired in step S505 using this value. To get. If a necessary component cannot be acquired because the original content is changed at the time of template creation, step S507 is executed, and if it can be acquired, step S509 is executed.
In step S507, the content generation unit 126 notifies the content conversion unit 127 of information indicating that the component acquisition has failed, together with the template name and the URL that has failed to be acquired.
[0017]
In step S508, since content generation using the template has failed, the content conversion unit 127 converts the content requested by the client terminal 150 into the content description language converted to the client terminal 150 using the conventional technology. Perform page splitting.
In step S509, the content generation unit 126 generates the content shown in FIG. 4 by combining the layout information described in the template file and the component acquired in step S506.
[0018]
By converting the existing content using the template as described above, it is possible to generate and distribute easy-to-view content with a reduced amount of information in consideration of the content display capability of the client terminal 150 as shown in FIG. That is, the content from which the component 2 that is the entire menu is deleted from the existing content in FIG.
[0019]
Next, a procedure for the template generation apparatus 130 to acquire information necessary for creating a template will be described with reference to the flowchart of FIG.
Here, the existing content for which a template is to be created will be described as the content shown in FIG.
First, in step S601, the template generation apparatus 130 starts content analysis in response to the reception of the component acquisition failure notification from the content conversion apparatus 130 or the instruction from the content manager.
In step S <b> 602, the content acquisition unit 132 acquires, from the Web server 100, existing content that is a template generation target and existing content related thereto through the communication unit 131. The acquired existing content is stored in the existing content history DB 133.
[0020]
Here, the related content is content that is considered to have the same layout as the target content. Specifically, content that is highly similar to the target content, content that is in the same directory or content that is on the same hierarchy in the directory structure of the site. Target content
http://www.XXsoft.co.jp/Product/kokyaku.html
And the content in the same directory is
http://www.XXsoft.co.jp/Product/cad.html
http://www.XXsoft.co.jp/Product/tuushin.html
These are contents in which the constituent elements 1 to 3 are the same as the contents in FIG. 2 and only the constituent element 4 (text) is different. That is, the contents of the component 4 are “CAD / map system” and “communication system”, respectively.
What is content on the same level?
http://www.XXsoft.co.jp/Company / profile.html
http://www.XXsoft.co.jp/Company / vision.html
Etc. However, the contents of the same directory are not included.
These are contents in which the components 1 and 2 are the same as the content in FIG. 2 but the components 3 and 4 are different. That is, the component 3 is a menu of “company information”, and the component 4 is an explanation of “profile” and “vision” of “company information”.
[0021]
In step S603, the layout analysis unit 132 analyzes the layout structure of the target content. The content layout is usually described with <TABLE> and <DIV> tags. The following determination conditions are used to determine the tag defining the layout.
(1) Define <TABLE> and <DIV> as layout definable tags.
(2) Acquire a tag that is a child element or grandchild element of a <BODY> tag or a layout definable tag among the layout definable tags.
(3) Among the layout definable tags acquired in the above (2), a tag at the same position is acquired even in the content in the same directory or the same hierarchy acquired in step S602.
(4) Of the layout definable tags acquired in (3) above, acquire a tag in which at least one of the plurality of components divided by the tag matches the content component acquired in step S602. .
The tag acquired in (4) above is a tag defining the layout of this content, and this is layout information. Thereby, the content can be divided into a plurality of components. In the example of the content in FIG. 2, it can be divided into components 1 to 4.
[0022]
In step S604, the importance level in the content of the component divided by the layout is determined. An important component is a component that expresses the characteristics of the content, and is a component having information that cannot be obtained by other content. In order to determine the importance, the content is compared with the content in the same directory and the same hierarchy acquired in step S602.
In the content of FIG. 2, since the component 4 has information that is not found in other content, it is determined to have the highest importance 1. As for the component 3, the content in the same directory includes the component having the same content, but is not included in the content on the same hierarchy. The constituent elements 1 and 2 are determined to have the lowest importance level 3 because the constituent elements having the same contents are included in both the content in the same directory and the content on the same hierarchy.
[0023]
When there are multiple components of importance 1, the contents with the layout obtained from the layout structure analysis result are compared with the content to be analyzed, and the components of the layout obtained from the layout analysis result are the same. From the order of the low probability of being the contents of, it is determined that the component is of high importance. Specifically, for example, the most important component is determined under the following conditions.
(1) Components including the center point of the display when displayed on a 1024 x 768 pixel display
(2) Component with the widest area when displayed on a 1024 x 768 pixel display
(3) Constituents whose constituent back color is white
(4) Component with the largest number of characters
[0024]
In step S605, the component analysis unit 135 determines the frequency with which the component is changed. In order to see the time change of the content, the content acquisition unit 132 periodically acquires the content from the Web server 100 and stores it in the existing content history DB 133.
[0025]
The component analysis unit 135 acquires past content from the existing content history DB 133, and examines the temporal change of the component obtained in step S603. A component updated more than a preset threshold is defined as a dynamic element, and a component not updated is defined as a static element.
In the example of FIG. 2, it is assumed that the component 4 is frequently updated for reasons such as product upgrades, price revisions, and new product registrations. Then, the component 4 is a dynamic element, and the remaining components 1 to 3 are static elements.
In step S606, the display / input unit 136 displays the layout information (position of each component) obtained in the previous steps, the importance of the component, and the update frequency (whether dynamic or static). . A display example is shown in FIG.
[0026]
As described above, the template generation device 130 can acquire layout information, component importance, and update frequency necessary for template creation.
Next, the display / input unit 136 displays the analyzed result, and performs correction according to the instruction of the content manager.
[0027]
FIG. 7 shows a screen of the display / input unit 136. This screen is mainly composed of two screens (component property setting screen 710 and browser display screen 720).
The browser display screen 720 displays the content of the template creation target, and further highlights the boundary of the component 721 based on the layout obtained by the layout analysis unit 134.
Alternatively, the emphasis method is displayed differently depending on whether the component is frequently updated or not. Also, the emphasis method is displayed differently depending on the importance of the component.
The component element property setting screen 710 can display and further set properties (importance, static / dynamic) of the component selected by the mouse pointer 730 on the browser display screen 720.
When “Setting” in the menu 740 is selected, a “content display device registration dialog” 750 is displayed, and a client terminal that is to display content is registered. Templates are basically created for the number of types of client terminals registered here.
[0028]
Next, a procedure in which the template generation unit 137 creates a template based on an operation performed on the display / input unit 136 by the content manager will be described with reference to a flowchart of FIG.
First, in step S801, the display / input unit 136 registers the client terminal 150 to be distributed input by the content manager. The content manager inputs information (screen size, memory, etc.) of the client terminal that is scheduled to display this content in the “content display device registration dialog” 750.
In step S802, the display / input unit 136 changes the range of the constituent elements in accordance with an instruction from the content manager. As a method of changing the range, for example, when the content manager clicks the component element with the mouse pointer 730 while pressing the “Ctrl key”, the parent element selects the new component as the new component. If the parent element is <BODY>, the smallest element indicated by the mouse pointer 730 is selected as a constituent element.
[0029]
In step S803, the display / input unit 136 changes the property of the component according to the instruction of the content manager. The content manager selects a component whose property is to be changed with the mouse pointer 730, displays the property of the screen element on the component element property setting screen 710, and performs correction.
In step S804, when the content manager selects “template creation” in the menu 740, the template generation unit 137 starts creating templates suitable for each client terminal registered in step S801.
[0030]
In step S805, the template generation unit 137 determines the components and layout to be displayed.
First, the data size and display size of each component are calculated. Next, referring to the screen size, memory, and the like of the target client terminal, the components to be displayed are selected in descending order of importance. Reconfigure the selected components using the original layout. Moreover, the component which was not selected is displayed with another template, and the hyperlink to the template is added.
In the example of FIG. 4, the components 4 and 3 having the importance levels 1 and 2 are displayed, the other components are made another template, and hyperlinks to the templates are generated.
In step S806, the template generation unit 137 outputs the components and layout obtained in step S805 to a template file.
[0031]
In the template of FIG. 3, first, the information 312 profile (templateProfile1.xml) of the target client terminal is written. Next, since the component 3 is a static element, the HTML document 302 is directly written in the template file (template1.jsp). Since the component 4 is a dynamic element, the URL of the content including the component 4 in the profile and the position in the content are specified by XPath, and the component 4 is displayed at the position where the component 4 is displayed in the template file. A tag for displaying 4 is inserted.
In step S807, the template generation unit 137 places the template created in step S806 in the template DB 125 of the content conversion apparatus 120 via the communication unit 131.
[0032]
【The invention's effect】
As is clear from the above description, according to the present invention, the layout of content and the components divided by the layout can be acquired, and further, the importance of the components can be automatically determined. It is possible to distribute and provide content suitable for the client terminal by selecting the components created for the specific information device according to the content display capability of the client terminal such as a mobile phone. .
[Brief description of the drawings]
FIG. 1 is a system configuration diagram showing an embodiment of the present invention.
FIG. 2 is a diagram showing an example of existing content created for a PC.
3 is a diagram showing an example of a template created from the content shown in FIG.
4 is a diagram illustrating an example in which the content in FIG. 2 is converted using the template in FIG. 3;
FIG. 5 is a flowchart illustrating a procedure in which a content conversion apparatus converts existing content using a template and distributes the content to a client terminal.
FIG. 6 is a flowchart illustrating a procedure for analyzing content by a template generation device.
FIG. 7 is a diagram illustrating an example of a screen displaying a content analysis result.
FIG. 8 is a flowchart showing a procedure for creating a template by the template generation apparatus.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 100 ... Web server, 101 ... Existing content DB, 110 ... Intranet, 120 ... Content conversion apparatus, 121 ... Communication part of content conversion apparatus, 122 ... Model determination part, 123 ... Model information DB, 124 ... Template acquisition part, 125 ... Template DB, 126 ... Content generation unit, 127 ... Content conversion unit, 130 ... Template generation device, 131 ... Communication unit of template generation device, 132 ... Content acquisition unit, 133 ... Existing content history DB, 134 ... Layout analysis unit, 135 ... component analysis unit, 136 ... display / input unit, 140 ... internet, 150 ... client terminal.

Claims (20)

特定の情報機器向けに作成されたWebコンテンツ(以下、コンテンツ)を変換し、前記特定の情報機器とは異なる情報端末に配信するためのコンテンツ変換装置におけるWebコンテンツ変換方法であって、
前記コンテンツ変換装置が、
コンテンツ配信要求を行った情報端末の機種情報を当該配信要求のヘッダ情報により判定し、該機種情報に対応したコンテンツ表示能力を第1のデータベースから取得する第1のステップと、
取得した情報端末のコンテンツ表示能力と予め作成されたコンテンツの変換方法の複数のテンプレートを比較し、その情報端末に適したテンプレートを第2のデータベースから取得する第2のステップと、
当該テンプレートに従い既存のコンテンツから必要な構成要素を取得する構成要素取得ステップと、
取得した構成要素と前記テンプレートに記述された要素とを合成し、コンテンツ配信要求元の情報端末向けのコンテンツを生成するコンテンツ生成ステップと
を備え、
前記構成要素取得ステップが構成要素の取得に失敗したときに、新たなテンプレートを作成するためのコンテンツ解析ステップをさらに備え、
前記コンテンツ解析ステップが、コンテンツのレイアウトを取得するレイアウト取得ステップと、取得したレイアウトで分けられたコンテンツの各構成要素の重要度を取得する重要度取得ステップと、各構成要素の更新頻度を取得する更新頻度取得ステップと、これら3つのステップで得られた情報に基づきテンプレートの作成を指示するステップとを備えることを特徴とするWebコンテンツ変換方法。
A web content conversion method in a content conversion device for converting web content (hereinafter referred to as content) created for a specific information device and distributing it to an information terminal different from the specific information device,
The content conversion device is
A first step of determining model information of an information terminal that has made a content distribution request from header information of the distribution request, and acquiring content display capability corresponding to the model information from the first database;
A second step of comparing the acquired content display capability of the information terminal with a plurality of templates of a content conversion method created in advance and acquiring a template suitable for the information terminal from the second database;
A component acquisition step for acquiring necessary components from existing content according to the template,
A content generation step of synthesizing the acquired component and the element described in the template to generate content for the information terminal of the content distribution request source,
A content analysis step for creating a new template when the component acquisition step fails to acquire the component;
The content analysis step acquires a layout acquisition step for acquiring a content layout, an importance acquisition step for acquiring the importance of each component of the content divided by the acquired layout, and an update frequency of each component A Web content conversion method comprising: an update frequency acquisition step; and a step of instructing creation of a template based on information obtained in these three steps .
前記レイアウト取得ステップが、レイアウトを構成する可能性のあるタグを定義するステップと、解析対象となるコンテンツとレイアウトが同じとなる可能性が高いコンテンツ同士を比較するステップと、レイアウトを構成する可能性のあるタグのうち高い確率でコンテンツ内の同じ位置にある特定のタグを、レイアウトを構成するタグとして取得するステップからなることを特徴とする請求項1に記載のWebコンテンツ変換方法。  The layout acquisition step includes a step of defining a tag that may constitute a layout, a step of comparing content that is likely to be the same as the content to be analyzed, and a possibility of configuring the layout 2. The Web content conversion method according to claim 1, further comprising: acquiring a specific tag at the same position in the content with a high probability among the certain tags as a tag constituting the layout. 前記重要度取得ステップが、前記レイアウト取得ステップで得られたレイアウトを持つコンテンツと解析対象のコンテンツとを比較し、レイアウト取得ステップで得られたレイアウトの各構成要素が同一の内容となる確率の低い順から、重要度の高い構成要素であると判断する重要度判定ステップを備えることを特徴とする請求項1に記載のWebコンテンツ変換方法。  The importance acquisition step compares the content having the layout obtained in the layout acquisition step with the content to be analyzed, and has a low probability that each component of the layout obtained in the layout acquisition step has the same content. The Web content conversion method according to claim 1, further comprising an importance level determining step for determining that the component is a component having a high importance level. 前記重要度判定ステップは、解析対象となるコンテンツを前記特定の情報機器用のディスプレイに表示したときに、ディスプレイの中心点を含む画面要素を最も重要度の高い構成要素であると判断することを特徴とする請求項3に記載のWebコンテンツ変換方法。  The importance determination step determines that the screen element including the center point of the display is the most important component when the content to be analyzed is displayed on the display for the specific information device. The Web content conversion method according to claim 3, wherein the method is a Web content conversion method. 前記重要度判定ステップは、解析対象となるコンテンツを前記特定の情報機器のディスプレイに表示したときに、表示面積の大きい画面要素をより高い重要度をもつ画面要素として判断することを特徴とする請求項3に記載のWebコンテンツ変換方法。  The importance level determining step determines a screen element having a large display area as a screen element having a higher level of importance when the content to be analyzed is displayed on the display of the specific information device. Item 6. The Web content conversion method according to Item 3. 前記重要度判定ステップは、バックカラーが白である画面要素を重要度の高い画面要素として判断することを特徴とする請求項3に記載のWebコンテンツ変換方法。  4. The Web content conversion method according to claim 3, wherein the importance level determining step determines a screen element whose background color is white as a screen element having a high level of importance. 前記重要度判定ステップは、文字数の多い画面要素を重要度の高い画面要素として判断することを特徴とする請求項3に記載のWebコンテンツ変換方法。  4. The Web content conversion method according to claim 3, wherein the importance level determining step determines a screen element having a large number of characters as a screen element having a high importance level. 前記更新頻度取得ステップが、解析対象のコンテンツを第3のデータベースに記憶されている過去のコンテンツと比較することにより、各構成要素の更新頻度を取得するステップ備えることを特徴とする請求項1〜7のいずれか一項に記載のWebコンテンツ変換方法。  The update frequency acquisition step includes a step of acquiring the update frequency of each component by comparing the content to be analyzed with past content stored in a third database. 8. The Web content conversion method according to any one of 7 above. 前記コンテンツ生成ステップは、対象コンテンツを配信する情報端末の情報を登録するステップと、コンテンツの解析結果を表示するステップと、コンテンツ管理者の指示に従いコンテンツ解析結果を修正するステップと、修正されたコンテンツ解析結果をもとにテンプレートを作成するステップとを備え、
前記コンテンツの解析結果を表示するステップは、構成要素の更新頻度の高いものと低いものとで強調方法を違えて表示することを特徴とする請求項8に記載のWebコンテンツ変換方法。
The content generation step includes a step of registering information of an information terminal that distributes the target content, a step of displaying the analysis result of the content, a step of correcting the content analysis result according to an instruction from the content manager, and the corrected content Creating a template based on the analysis result,
9. The Web content conversion method according to claim 8, wherein the step of displaying the analysis result of the content displays the content by changing the emphasis method depending on whether the component is updated frequently or not.
前記テンプレートを作成するステップは、構成要素の更新頻度が予め設定された閾値よりも頻繁に更新されている構成要素については、コンテンツ変換時に対象となるコンテンツを取得し動的に変換するようにテンプレートに記述し、閾値より頻繁に更新されない構成要素については直接その内容をテンプレートに記述することを特徴とする請求項9に記載のWebコンテンツ変換方法。  In the step of creating the template, the component is updated so that the component content is updated more frequently than a preset threshold value so that the target content is acquired and dynamically converted at the time of content conversion. 10. The Web content conversion method according to claim 9, wherein contents of components that are described in (1) and that are not updated more frequently than a threshold value are directly described in a template. 特定の情報機器向けに作成されたコンテンツを変換し、前記特定の情報機器とは異なる情報端末に配信するためのWebコンテンツ変換システムであって、
コンテンツ配信要求を行った情報端末の機種情報を当該配信要求のヘッダ情報により判定し、該機種情報に対応したコンテンツ表示能力を第1のデータベースから取得する第1の手段と、
取得した情報端末のコンテンツ表示能力と予め作成されたコンテンツの変換方法の複数のテンプレートを比較し、その情報端末に適したテンプレートを第2のデータベースから取得する第2の手段と、
当該テンプレートに従い既存のコンテンツから必要な構成要素を取得する第3の手段と、
取得した構成要素と前記テンプレートに記述された要素とを合成し、コンテンツ配信要求元の情報端末向けのコンテンツを生成する第4の手段とを備え、
前記第3の手段が構成要素の取得に失敗したときに、新たなテンプレートを作成するためのコンテンツ解析手段をさらに備え、
前記コンテンツ解析手段が、コンテンツのレイアウトを取得するレイアウト取得手段と、取得したレイアウトで分けられたコンテンツの各構成要素の重要度を取得する重要度取得手段と、各構成要素の更新頻度を取得する更新頻度取得手段と、これらレイアウト取得手段、重要度取得手段、更新頻度取得手段の3つの手段で得られた情報に基づきテンプレートの作成を指示する手段とを備えることを特徴とするWebコンテンツ変換システム。
A web content conversion system for converting content created for a specific information device and delivering it to an information terminal different from the specific information device,
First means for determining model information of an information terminal that has made a content distribution request from header information of the distribution request, and acquiring content display capability corresponding to the model information from a first database;
A second means for comparing the acquired content display capability of the information terminal with a plurality of templates of a content conversion method created in advance and acquiring a template suitable for the information terminal from the second database;
A third means for acquiring necessary constituent elements from existing content according to the template;
A fourth means for synthesizing the acquired component and the element described in the template, and generating content for the information terminal of the content distribution request source,
When the third means fails to acquire the component, it further comprises content analysis means for creating a new template,
The content analysis unit acquires a layout acquisition unit that acquires a layout of the content, an importance level acquisition unit that acquires the importance level of each component of the content divided by the acquired layout, and an update frequency of each component A Web content conversion system comprising: an update frequency acquisition unit; and a unit for instructing creation of a template based on information obtained by the three units of the layout acquisition unit, the importance level acquisition unit, and the update frequency acquisition unit .
前記レイアウト取得手段が、レイアウトを構成する可能性のあるタグを定義する手段と、解析対象となるコンテンツとレイアウトが同じとなる可能性が高いコンテンツ同士を比較する手段と、レイアウトを構成する可能性のあるタグのうち高い確率でコンテンツ内の同じ位置にある特定のタグを、レイアウトを構成するタグとして取得する手段からなることを特徴とする請求項11に記載のWebコンテンツ変換システム。  The layout acquisition means may define a tag that may constitute a layout, a means that compares contents that are likely to have the same layout as the content to be analyzed, and a possibility that constitutes a layout 12. The Web content conversion system according to claim 11, further comprising means for acquiring a specific tag at the same position in the content with a high probability among the certain tags as a tag constituting the layout. 前記重要度取得手段が、前記レイアウト取得手段で得られたレイアウトを持つコンテンツと解析対象のコンテンツとを比較し、前記レイアウト取得手段で得られたレイアウトの各構成要素が同一の内容となる確率の低い順から、重要度の高い構成要素であると判断する重要度判定手段を備えることを特徴とする請求項11に記載のWebコンテンツ変換システム。  The importance level acquisition unit compares the content having the layout obtained by the layout acquisition unit with the content to be analyzed, and the probability that each component of the layout obtained by the layout acquisition unit has the same content. 12. The Web content conversion system according to claim 11, further comprising importance level judging means for judging that the constituent elements have a high importance level from the lowest order. 前記重要度判定手段は、解析対象となるコンテンツを前記特定の情報機器用のディスプレイに表示したときに、ディスプレイの中心点を含む画面要素を最も重要度の高い構成要素であると判断するものであることを特徴とする請求項13に記載のWebコンテンツ変換システム。  The importance level determination unit determines that the screen element including the center point of the display is the most important component when the content to be analyzed is displayed on the display for the specific information device. 14. The Web content conversion system according to claim 13, wherein the Web content conversion system is provided. 前記重要度判定手段は、解析対象となるコンテンツを前記特定の情報機器のディスプレイに表示したときに、表示面積の大きい画面要素をより高い重要度をもつ画面要素として判断するものであることを特徴とする請求項13に記載のWebコンテンツ変換システム。  The importance level determination unit is configured to determine a screen element having a large display area as a screen element having a higher importance level when the content to be analyzed is displayed on the display of the specific information device. The Web content conversion system according to claim 13. 前記重要度判定手段は、バックカラーが白である画面要素を重要度の高い画面要素として判断するものであることを特徴とする請求項13に記載のWebコンテンツ変換システム。  14. The Web content conversion system according to claim 13, wherein the importance level determination unit determines a screen element whose background color is white as a screen element having a high level of importance. 前記重要度判定手段は、文字数の多い画面要素を重要度の高い画面要素として判断するものであることを特徴とする請求項13に記載のWebコンテンツ変換システム。  14. The Web content conversion system according to claim 13, wherein the importance level determination unit determines a screen element having a large number of characters as a screen element having a high level of importance. 前記更新頻度取得手段が、解析対象のコンテンツを第3のデータベースに記憶されている過去のコンテンツと比較することにより、各構成要素の更新頻度を取得する手段を備えることを特徴とする請求項11〜17のいずれか一項に記載のWebコンテンツ変換システム。  12. The update frequency acquisition means comprises means for acquiring the update frequency of each component by comparing the content to be analyzed with past content stored in a third database. The Web content conversion system as described in any one of -17. 前記コンテンツ生成手段は、対象コンテンツを配信する情報端末の情報を登録する手段と、コンテンツの解析結果を表示する手段と、コンテンツ管理者の指示に従いコンテンツ解析結果を修正する手段と、修正されたコンテンツ解析結果をもとにテンプレートを作成する手段とを備え、
前記コンテンツの解析結果を表示する手段は、構成要素の更新頻度の高いものと低いものとで強調方法を違えて表示することを特徴とする請求項18に記載のWebコンテンツ変換システム。
The content generation means includes means for registering information of an information terminal that distributes the target content, means for displaying the analysis result of the content, means for correcting the content analysis result in accordance with an instruction from the content manager, and corrected content And a means for creating a template based on the analysis result,
19. The Web content conversion system according to claim 18, wherein the means for displaying the analysis result of the content displays the content by changing the emphasis method depending on whether the component is frequently updated or not.
前記テンプレートを作成する手段は、構成要素の更新頻度が予め設定された閾値よりも頻繁に更新されている構成要素については、コンテンツ変換時に対象となるコンテンツを取得し動的に変換するようにテンプレートに記述し、閾値より頻繁に更新されない構成要素については直接その内容をテンプレートに記述するものであることを特徴とする請求項19に記載のWebコンテンツ変換システム。  The means for creating the template obtains the target content at the time of content conversion and dynamically converts the component for which the update frequency of the component is updated more frequently than a preset threshold. 20. The Web content conversion system according to claim 19, wherein a component that is described in (1) and that is not updated more frequently than a threshold value is directly described in a template.
JP2002272202A 2002-09-18 2002-09-18 Web content conversion method and system Expired - Fee Related JP4055944B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002272202A JP4055944B2 (en) 2002-09-18 2002-09-18 Web content conversion method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002272202A JP4055944B2 (en) 2002-09-18 2002-09-18 Web content conversion method and system

Publications (3)

Publication Number Publication Date
JP2004110427A JP2004110427A (en) 2004-04-08
JP2004110427A5 JP2004110427A5 (en) 2005-09-08
JP4055944B2 true JP4055944B2 (en) 2008-03-05

Family

ID=32269291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002272202A Expired - Fee Related JP4055944B2 (en) 2002-09-18 2002-09-18 Web content conversion method and system

Country Status (1)

Country Link
JP (1) JP4055944B2 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617449B2 (en) * 2004-05-28 2009-11-10 Microsoft Corporation Method and system for mapping content between a starting template and a target template
US20090025030A1 (en) * 2005-05-18 2009-01-22 Nec Corporation Contents display system and contents display method
JP2007104011A (en) * 2005-09-30 2007-04-19 Matsushita Electric Ind Co Ltd Content receiver and content conversion program
JP2007249387A (en) * 2006-03-14 2007-09-27 Nippon Telegr & Teleph Corp <Ntt> Document information distribution system and server device for the same
JP2008282114A (en) * 2007-05-09 2008-11-20 Profield Co Ltd Information processor, server device, information processing system, information processing method, and program
JP5267342B2 (en) * 2009-06-08 2013-08-21 富士通株式会社 Mashup program, mashup device, and mashup method
KR101071786B1 (en) * 2009-12-02 2011-10-11 (주)어헤드원 Server and system for providing mobile standard template data
JP2011138315A (en) * 2009-12-28 2011-07-14 Fujifilm Corp Image output device, system, method, and program
CN102622219B (en) * 2011-01-31 2015-06-17 富士通株式会社 Method, device and system for rendering execution result of dynamic transfer service
JP5927719B2 (en) * 2012-05-09 2016-06-01 株式会社日立ソリューションズ東日本 Screen conversion system
JP5956515B2 (en) * 2014-07-03 2016-07-27 アンリツ株式会社 Test apparatus and test method

Also Published As

Publication number Publication date
JP2004110427A (en) 2004-04-08

Similar Documents

Publication Publication Date Title
US8184128B2 (en) Data distribution system and method therefor
US7286145B2 (en) System for describing markup language for mobile use, and information processing apparatus and program for generating display content
US7054952B1 (en) Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing interactive javascript support
US6725424B1 (en) Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing assistive technology support
US20200133987A1 (en) Method and apparatus for using proxies to interact with webpage analytics
US6829746B1 (en) Electronic document delivery system employing distributed document object model (DOM) based transcoding
US7761601B2 (en) Strategies for transforming markup content to code-bearing content for consumption by a receiving device
US7475354B2 (en) Method for generating a portal page
US7694000B2 (en) Context sensitive portlets
US8595634B2 (en) Distributed hosting of web application styles
US20080215966A1 (en) Adaptive server-based layout of web documents
US20050216439A1 (en) Update notification method and update notification apparatus of web page
JP2012059275A (en) System and method for digital document processing
JP2002108870A (en) System and method for processing information
JP4055944B2 (en) Web content conversion method and system
US20120246557A1 (en) System and method for transcoding web content adaptable to multiple client devices
US20050024355A1 (en) Selecting items displayed on respective areas on a screen
US9349130B2 (en) Generating relative and absolute positioned resources using a single editor having a single syntax
US20060265359A1 (en) Flexible data-bound user interfaces
US20070101278A1 (en) Web site theme designer
JP2002351781A (en) Content generation device using page layout for screen display
US20050198568A1 (en) Table display switching method, text data conversion program, and tag program
US20060064632A1 (en) Method and system to inverse graphs
US8533588B2 (en) Overriding images in user interfaces
KR20030094241A (en) System and method for dynamic web page generation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050311

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071206

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees