JP2013077150A - File management program, information processing device, and file management method - Google Patents
File management program, information processing device, and file management method Download PDFInfo
- Publication number
- JP2013077150A JP2013077150A JP2011216384A JP2011216384A JP2013077150A JP 2013077150 A JP2013077150 A JP 2013077150A JP 2011216384 A JP2011216384 A JP 2011216384A JP 2011216384 A JP2011216384 A JP 2011216384A JP 2013077150 A JP2013077150 A JP 2013077150A
- Authority
- JP
- Japan
- Prior art keywords
- file
- character string
- tag
- display
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims description 43
- 230000010365 information processing Effects 0.000 title claims description 35
- 239000000284 extract Substances 0.000 abstract description 10
- 238000000034 method Methods 0.000 description 36
- 230000008569 process Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000010979 ruby Substances 0.000 description 3
- 229910001750 ruby Inorganic materials 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010413 gardening Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明はファイル管理プログラム、情報処理装置およびファイル管理方法に関する。 The present invention relates to a file management program, an information processing apparatus, and a file management method.
複数の情報処理装置で扱うファイルをネットワークで接続されたサーバ装置に格納することがある。サーバ装置は、ファイルを一元管理して共有化や冗長化などを行いファイルへのアクセス性や安全性の向上を図る。このようなサーバ装置はファイルサーバと呼ばれることがある。 A file handled by a plurality of information processing apparatuses may be stored in a server apparatus connected via a network. The server device manages the files in a unified manner to share and make redundant, thereby improving the accessibility and safety of the files. Such a server device may be called a file server.
ファイルサーバは、多数のファイルを記憶する。このため、ファイルサーバはファイルを検索し易くするため、各ファイルに含まれる文字列をインデックスとして抽出する。ファイルサーバは、ユーザにより入力された文字列とインデックスとを用いて、ファイルを高速に検索できる。しかし、テキスト以外の形式のファイルではインデックス抽出や文字列による検索を行えない。そこで、テキスト抽出が困難な登録文書について、登録文書とともにテキスト抽出のための別ファイルをクライアント装置で指定して、サーバ装置にアップロードする提案がある(例えば、特許文献1参照)。 The file server stores a large number of files. For this reason, the file server extracts a character string included in each file as an index so that the file can be easily searched. The file server can search a file at high speed using the character string and index input by the user. However, index extraction or character string search cannot be performed on files other than text. Therefore, there is a proposal for uploading a registered document that is difficult to extract a text to a server device by specifying another file for text extraction together with the registered document on the client device (for example, see Patent Document 1).
ところで、ファイルサーバには種々の装置がアクセスし得る。特に、携帯端末装置は、デスクトップ型/ラップトップ型の情報処理装置に比べて表示画面が小さく、一度に表示可能な情報量も少ない。このため、携帯端末装置からの検索依頼を受け得る場合には、ユーザの求めるファイルを、検索結果として的確に提示可能にしたいという要求がある。 By the way, various devices can access the file server. In particular, a portable terminal device has a smaller display screen and a smaller amount of information that can be displayed at a time than a desktop / laptop type information processing device. For this reason, when a search request from a mobile terminal device can be received, there is a request to be able to accurately present a file requested by a user as a search result.
例えば、詳細な検索を可能とするために、ユーザがファイルに対して検索用の付加的な情報を別個に用意し、ファイル内テキストに加えて該情報も検索条件として指定可能とすることが考えられる。しかし、この方法では、ファイルに情報を付加するためのユーザの作業負担が生じてしまう。 For example, in order to enable a detailed search, it is possible that a user separately prepares additional information for search for a file, and the information can be specified as a search condition in addition to the text in the file. It is done. However, this method creates a work burden on the user for adding information to the file.
そこで、効率的なファイル検索を支援する仕組みを実現するために、どのようにしてファイルを管理すればよいかが問題となる。
一側面では、本発明は、効率的なファイル検索を支援するファイル管理プログラム、情報処理装置およびファイル管理方法を提供することを目的とする。
Thus, how to manage files to realize a mechanism for supporting efficient file search is a problem.
In one aspect, an object of the present invention is to provide a file management program, an information processing apparatus, and a file management method that support efficient file search.
一実施態様によれば、ファイル管理プログラムが提供される。このファイル管理プログラムは、記憶手段に格納された第1のファイルを取得して、第1のファイルに含まれる1またはそれ以上の要素に応じた1またはそれ以上のタグを含む第2のファイルを生成し、1またはそれ以上のタグに基づいて第2のファイルに含まれる1またはそれ以上の文字列を抽出して、第2のファイルと抽出した文字列とを対応付けて記憶手段に格納し、文字列が入力されると、記憶手段を参照して、入力された文字列に対応する第2のファイルを検索し、検索結果を出力する、処理をコンピュータに実行させる。 According to one embodiment, a file management program is provided. The file management program acquires a first file stored in the storage means, and stores a second file including one or more tags according to one or more elements included in the first file. Generate one or more character strings included in the second file based on one or more tags, and store the second file and the extracted character strings in association with each other in association with each other. When a character string is input, the storage unit is referred to search for a second file corresponding to the input character string, and a process for outputting the search result is executed by the computer.
また、一実施態様によれば、情報処理装置が提供される。この情報処理装置は、生成手段と検索手段とを有する。生成手段は、記憶手段に格納された第1のファイルを取得して、第1のファイルに含まれる1またはそれ以上の要素に応じた1またはそれ以上のタグを含む第2のファイルを生成し、1またはそれ以上のタグに基づいて第2のファイルに含まれる1またはそれ以上の文字列を抽出して、第2のファイルと抽出した文字列とを対応付けて記憶手段に格納する。検索手段は、文字列が入力されると、記憶手段を参照して、入力された文字列に対応する第2のファイルを検索し、検索結果を出力する。 According to one embodiment, an information processing apparatus is provided. The information processing apparatus includes a generation unit and a search unit. The generation unit acquires the first file stored in the storage unit, and generates a second file including one or more tags corresponding to one or more elements included in the first file. One or more character strings included in the second file are extracted based on one or more tags, and the second file and the extracted character strings are associated with each other and stored in the storage unit. When the character string is input, the search means refers to the storage means, searches for the second file corresponding to the input character string, and outputs the search result.
また、一実施態様によれば、コンピュータが実行するファイル管理方法が提供される。このファイル管理方法では、記憶手段に格納された第1のファイルを取得して、第1のファイルに含まれる1またはそれ以上の要素に応じた1またはそれ以上のタグを含む第2のファイルを生成し、1またはそれ以上のタグに基づいて第2のファイルに含まれる1またはそれ以上の文字列を抽出して、第2のファイルと抽出した文字列とを対応付けて記憶手段に格納する。文字列が入力されると、記憶手段を参照して、入力された文字列に対応する第2のファイルを検索し、検索結果を出力する。 According to one embodiment, a file management method executed by a computer is provided. In this file management method, a first file stored in a storage means is acquired, and a second file including one or more tags corresponding to one or more elements included in the first file is obtained. Generate one or more character strings included in the second file based on one or more tags, and store the second file and the extracted character strings in association with each other in association with each other. . When a character string is input, the second file corresponding to the input character string is searched with reference to the storage means, and the search result is output.
一実施態様によれば、効率的なファイル検索を支援することができる。 According to one embodiment, efficient file search can be supported.
以下、本実施の形態を図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態に係る情報処理装置を示す図である。情報処理装置1は、種々のファイルを管理する装置である。情報処理装置1は、CPU(Central Processing Unit)などのプロセッサとRAM(Random Access Memory)などのメモリとを備えてもよく、メモリに記憶されたプログラムをプロセッサが実行するコンピュータであってもよい。情報処理装置1は、記憶手段1a、生成手段1bおよび検索手段1cを有する。
Hereinafter, the present embodiment will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating an information processing apparatus according to the first embodiment. The
記憶手段1aは、第1のファイル2および第2のファイル3を記憶する。第1のファイル2は、ユーザが記憶手段1aに格納したオリジナルのファイルである。第1のファイル2は、要素2a,2bを含む。要素2aは、例えば表内の文字列“項目X1”である。要素2bは、例えば図である。例えば、ユーザは、自身の操作するクライアント装置から、ネットワークを介して情報処理装置1にアクセスし、第1のファイル2を記憶手段1aに格納できる。
The
第2のファイル3は、第1のファイル2に基づいて、生成手段1bにより生成されたファイルである。第2のファイル3は、第1のファイル2に含まれる要素2a,2bに応じたタグA,Bを含む。タグを含む第2のファイル3の形式としては、例えば、HTML(HyperText Markup Language)やXML(eXtensible Markup Language)などが考えられる。第2のファイル3では、複数のタグを用いて1つの要素が記述されてもよい。
The
記憶手段1aは、HDD(Hard Disk Drive)などのディスク装置によって実装されてもよい。また、記憶手段1aとは異なる記憶手段を設けて、第1のファイル2および第2のファイル3を別個の記憶手段に格納してもよい。
The
生成手段1bは、記憶手段1aに格納された第1のファイル2を取得して、第2のファイル3を生成する。生成手段1bは、第1のファイル2内の要素間の位置関係に基づいて、タグ内の属性に値を設定することもできる。例えば、図の要素2bの付近に図のタイトルを示す文字列が存在する場合に、該文字列をタグB内の“属性Y”に設定する。例えば、HTMLでいえば図の要素を示す“<image>”タグ内において、図のタイトルを示す“title”属性に“図面Z1”などの文字列を設定することが考えられる。
The generation unit 1b acquires the
生成手段1bが第1のファイル2を取得するタイミングとしては、例えば、記憶手段1aに第1のファイル2が格納されたタイミングや所定の時間に達したタイミングなどが考えられる。
As the timing at which the generation unit 1b acquires the
生成手段1bは、タグA,Bに基づいて第2のファイル3に含まれる1またはそれ以上の文字列を抽出する。例えば、要素2aに対して第2のファイル3からタグAで示される“項目X1”の文字列を抽出できる。また、例えば、要素2bに対して第2のファイル3からタグB内の属性“属性Y”で示される“図面Z1”の文字列を抽出できる。HTMLの例でいえば、図の要素を示す“<image>”タグ内から、図のタイトルを示す“title”属性を検出することで該文字列の抽出を行える。
The generation unit 1b extracts one or more character strings included in the
生成手段1bは、第2のファイル3と抽出した文字列とを対応付けて記憶手段1aに格納する。例えば、第2のファイル3と“項目X1”の文字列とを対応付けて記憶手段1aに格納する。また、例えば、第2のファイル3と“図面Z1”の文字列とを対応付けて記憶手段1aに格納する。このとき、“項目X1”の文字列を含むタグや“図面Z1”の文字列を含むタグ(および属性)に基づいて、各文字列に文書内での属性情報(例えば、図タイトルなど)を対応付けてもよい。
The generation unit 1b associates the
検索手段1cは、文字列が入力されると、記憶手段1aを参照して、入力された文字列に対応する第2のファイル3を検索し、検索結果を出力する。例えば、ユーザは、自身の操作するクライアント装置から、ネットワークを介して情報処理装置1にアクセスし、ファイルを検索するための検索用の文字列を情報処理装置1に入力できる。例えば、検索手段1cは、“項目X1”という文字列に対する検索結果として、該文字列を含む第2のファイル3を出力する。また、検索手段1cは、“図面Z1”という文字列に対する検索結果として該文字列を含む第2のファイル3を出力する。このとき、“図面Z1”という文字列に対して“図タイトル”という属性情報が対応付けられている場合、検索用の文字列とともに該属性情報を取得して、検索を行うこともできる。例えば、該属性情報を指定することで“図タイトル”として文字列“図面Z1”を含むファイルを検索することも可能となる。
When the character string is input, the
情報処理装置1によれば、生成手段1bにより、記憶手段1aに格納された第1のファイル2が取得され、第1のファイル2に含まれる要素2a,2bに応じたタグA,Bを含む、第2のファイル3が生成される。生成手段1bにより、タグA,Bに基づいて第2のファイル3に含まれる1またはそれ以上の文字列が抽出される。生成手段1bにより、第2のファイル3と抽出された文字列とが対応付けられて記憶手段1aに格納される。文字列が入力されると、検索手段1cにより、記憶手段1aが参照され、入力された文字列に対応する第2のファイル3が検索され、検索結果が出力される。
According to the
これにより、効率的なファイル検索を支援することができる。具体的には、第1のファイル2に基づき第2のファイル3を生成し、タグに基づいて文字列を抽出するので、第1のファイル2から文字列を抽出する場合よりも、詳細なインデックスを作成できる。例えば、タグやタグ内の属性が示す内容に対応付けて、抽出した文字列をインデックスに追加することで、文書内での属性情報を該文字列に与えることができる。具体的には、その文字列に対して、文書のタイトル、図のタイトル、表内の文字列などの属性情報を与えることが考えられる。該文書内での属性情報とともに文字列の検索を行えば、検索結果を一層効率的に絞り込むことが可能となる。更に、上記のような詳細なインデックスを作成する際にタグを用いることで、ユーザに付加的な情報を作成させるのを回避できる。よって、ユーザによる作業の省力化を図れる。
Thereby, efficient file search can be supported. Specifically, since the
また、第2のファイル3をHTML形式などで生成するので、該検索した第2のファイル3をクライアント装置に送信すれば、クライアント装置では、該装置が備える所定のWebブラウザによって、第2のファイル3の内容を閲覧することができる。
In addition, since the
ここで、クライアント装置が携帯端末装置である場合、他の装置(デスクトップ型の情報処理装置など)で動作可能なアプリケーションを、該携帯端末装置では動作させることが困難なこともある。この場合、オリジナルのファイル(第1のファイル2)を携帯端末装置に提供しても、該ファイルの内容を閲覧するのが困難となり不便なこともある。一方で、携帯端末装置であってもWebブラウザは利用可能なことが多い。そこで、上記のようにHTML形式などで生成した第2のファイル3を携帯端末装置に提供すれば、携帯端末装置でも容易に該ファイルの内容を閲覧可能となる。
Here, when the client device is a mobile terminal device, it may be difficult to operate an application that can operate on another device (such as a desktop information processing device) on the mobile terminal device. In this case, even if the original file (first file 2) is provided to the mobile terminal device, it is difficult to view the contents of the file, which may be inconvenient. On the other hand, Web browsers are often available even for portable terminal devices. Therefore, if the
なお、記憶手段1a,生成手段1bおよび検索手段1cを情報処理装置1で実現するものとしたが、これらの各手段を別個の装置上で実現してもよい。例えば、記憶手段1aをストレージ装置で実現し、生成手段1bおよび検索手段1cを異なる2つの情報処理装置で実現してもよい。
In addition, although the memory | storage means 1a, the production | generation means 1b, and the search means 1c shall be implement | achieved by the
[第2の実施の形態]
図2は、第2の実施の形態に係る情報処理システムを示す図である。第2の情報処理システムは、クライアント装置で利用するファイルをサーバ装置で一元管理するシステムである。第2の情報処理システムは、ファイルサーバ100およびクライアント200,300を含む。ファイルサーバ100およびクライアント200は、ネットワーク10およびアクセスポイント20を介して接続されている。ファイルサーバ100およびクライアント300はネットワーク10を介して接続されている。ネットワーク10はLAN(Local Area Network)でもよい。ネットワーク10はインターネットなどの広域ネットワークでもよい。更に、クライアント200とアクセスポイント20との間は無線で接続する。該無線による通信は、無線LANでもよい。クライアント200は、基地局(図示を省略)と無線通信し、移動通信網(図示を省略)およびネットワーク10を介してファイルサーバ100にアクセスしてもよい。
[Second Embodiment]
FIG. 2 is a diagram illustrating an information processing system according to the second embodiment. The second information processing system is a system that centrally manages the files used by the client device using the server device. The second information processing system includes a
ファイルサーバ100は、クライアント200,300で使用するファイルを一元的に記憶するサーバ装置である。ファイルサーバ100は、Webサーバの機能も備えており、ファイル操作を支援するためのGUI(Graphical User Interface)をクライアント200,300に提供する。
The
クライアント200は、ユーザが使用するクライアント装置である。クライアント200は携帯端末装置であり、アクセスポイント20と無線通信する。クライアント200はWebブラウザを備えており、ファイルサーバ100へのWebアクセスが可能である。なお、クライアント200を複数台用意して、複数のユーザが個々に所持して利用してもよい。
The
クライアント300は、ユーザが使用するクライアント装置である。クライアント300は、ラップトップ型のコンピュータである。クライアント300は、ネットワーク10に有線または無線で接続し、ファイルサーバ100にアクセスできる。クライアント300はWebブラウザを備えており、ファイルサーバ100へのWebアクセスが可能である。
The
ここで、クライアント300は、クライアント200よりも大型であり、クライアント200と比べて、実装されるハードウェアの性能も高い。このため、動作に高い処理能力を要求されるアプリケーションを利用することができる。
Here, the
一方で、クライアント200は、クライアント300よりも小型である。このため、クライアント200では、ディスプレイに一度に表示可能な情報もクライアント300に比べて少ない。また、クライアント300に比べてハードウェアの性能は低い。このため、クライアント300で利用可能なアプリケーションであっても、クライアント200で利用することが困難な場合がある。また、両者で実行されるOS(Operating System)が異なるときは、クライアント300で利用可能なアプリケーションが、クライアント200のOSでサポートされていないこともある。その場合、クライアント300のアプリケーションで作成されたファイルをクライアント200で閲覧することが困難な場合がある。
On the other hand, the
ファイルサーバ100は、クライアント300が格納したファイルをクライアント200からでも効率的に検索・閲覧できる環境を提供する。以下では、このようなファイル管理を行う情報処理システムの構成を具体的に説明する。
The
図3は、ファイルサーバのハードウェア例を示す図である。ファイルサーバ100は、CPU101、ROM(Read Only Memory)102、RAM103、HDD104、画像信号処理部105、入力信号処理部106、ディスクドライブ107および通信部108を有する。各ユニットがファイルサーバ100のバスに接続されている。クライアント300もファイルサーバ100と同様のハードウェアを用いて実装できる。
FIG. 3 is a diagram illustrating a hardware example of the file server. The
CPU101は、ファイルサーバ100の情報処理を制御するプロセッサである。CPU101は、HDD104に記憶されているプログラムやデータの少なくとも一部を読み出し、RAM103に展開してプログラムを実行する。なお、ファイルサーバ100は、複数のプロセッサを設けて、プログラムを分散して実行してもよい。
The
ROM102は、ファイルサーバ100の起動時に実行されるBIOS(Basic Input / Output System)プログラムなどの所定のプログラムを記憶する。ROM102は、書き換え可能な不揮発性メモリであってもよい。
The
RAM103は、CPU101が実行するプログラムや処理に用いるデータを一時的に記憶する揮発性メモリである。なお、ファイルサーバ100は、RAM以外の種類のメモリを備えてもよく、複数個のメモリを備えていてもよい。
The
HDD104は、OSプログラムやアプリケーションプログラムなどのプログラムおよびデータを記憶する不揮発性の記憶装置である。HDD104は、CPU101の命令に従って、内蔵の磁気ディスクに対してデータの読み書きを行う。なお、ファイルサーバ100は、HDD以外の種類の不揮発性の記憶装置(例えば、SSD(Solid State Drive)など)を備えてもよく、複数の記憶装置を備えていてもよい。
The
画像信号処理部105は、CPU101の命令に従って、ファイルサーバ100に接続されたディスプレイ11に画像を出力する。ディスプレイ11としては、例えば、CRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイを用いることができる。
The image
入力信号処理部106は、ファイルサーバ100に接続された入力デバイス12から入力信号を取得し、CPU101に出力する。入力デバイス12としては、例えば、マウスやタッチパネルなどのポインティングデバイス、キーボードなどを用いることができる。
The input
ディスクドライブ107は、記録媒体13に記録されたプログラムやデータを読み取る駆動装置である。記録媒体13として、例えば、フレキシブルディスク(FD:Flexible Disk)やHDDなどの磁気ディスク、CD(Compact Disc)やDVD(Digital Versatile Disc)などの光ディスク、光磁気ディスク(MO:Magneto-Optical disk)を使用できる。ディスクドライブ107は、例えば、CPU101の命令に従って、記録媒体13から読み取ったプログラムやデータをRAM103またはHDD104に格納する。
The
通信部108は、ネットワーク10を介してクライアント200,300と通信を行う通信インタフェースである。通信部108は、有線通信インタフェースでもよいし、無線通信インタフェースでもよい。
The
図4は、クライアントのハードウェア例を示す図である。クライアント200は、CPU201、ROM202、RAM203、記録媒体読取部204、無線通信部205、アンテナ205a、画像信号処理部206、ディスプレイ206a、入力信号処理部207、タッチパネル207a,キーパッド207b、音声信号処理部208、マイク208aおよびスピーカ208bを有する。各ユニットがファイルサーバ100のバスに接続されている。
FIG. 4 is a diagram illustrating a hardware example of the client. The
CPU201は、クライアント200の情報処理を制御するプロセッサである。CPU201は、RAM203に記憶されているプログラムやデータの少なくとも一部を読み出し、RAM203に展開してプログラムを実行する。なお、クライアント200は、複数のプロセッサを設けて、プログラムを分散して実行してもよい。
The
ROM202は、クライアント200の起動時に実行されるBIOS(Basic Input / Output System)プログラムなどの所定のプログラムを記憶する。ROM202は、書き換え可能な不揮発性メモリであってもよい。
The
RAM203は、CPU201が実行するプログラムや処理に用いるデータを一時的に記憶する揮発性メモリである。なお、クライアント200は、RAM以外の種類のメモリを備えてもよく、複数個のメモリを備えていてもよい。
The
記録媒体読取部204は、記録媒体14に記憶されたデータを読み取り、また、記録媒体14にデータを格納する。記録媒体14としては、例えば、半導体メモリを使用できる。
The recording
無線通信部205は、無線信号処理を行い、アクセスポイント20との間での無線通信を実現する。無線通信部205は、アクセスポイント20からアンテナ205aを介して受信した信号を復調・復号し、得られた受信データをCPU201に出力する。また、無線通信部205は、CPU201から取得した送信データを符号化・変調し、得られた送信信号をアンテナ205aを介してアクセスポイント20へ送信する。
The
画像信号処理部206は、CPU201の命令に従って、ディスプレイ206aに画像を出力する。ディスプレイ206aとしては、例えば、液晶ディスプレイを用いることができる。
The image
入力信号処理部207は、タッチパネル207aに対するタッチ操作やキーパッド207bに対するキー押下を検出すると、該タッチ操作や押下されたキーなどを示す入力信号を取得し、CPU201に出力する。
When the input
音声信号処理部208は、マイク208aから音声アナログ信号を取得し、所定の信号変換処理を行ってCPU201に音声データを出力する。また、音声信号処理部208は、CPU201から音声データを取得し、所定の信号変換処理を行ってスピーカ208bに音声再生させる。
The audio
図5は、情報処理システムのソフトウェア例を示す図である。図5に示すユニットの一部または全部は、ファイルサーバ100およびクライアント200が実行するプログラムのモジュールであってもよい。また、図5に示すユニットの一部または全部は、FPGA(Field Programmable Gate Array)やASIC(Application Specific Integrated Circuit)などの電子回路であってもよい。クライアント300もクライアント200と同様のユニットを用いて実装できる。
FIG. 5 is a diagram illustrating an example of software of the information processing system. Part or all of the units shown in FIG. 5 may be modules of programs executed by the
ファイルサーバ100は、記憶部110、Webサービス提供部120、ファイル管理部130およびアプリケーション140を有する。
記憶部110は、クライアント200,300で利用するファイルを記憶する。また、記憶部110は、ファイル検索に用いるインデックステーブルを記憶する。更に、記憶部110は、ファイル間の関連性などを管理するためのファイル管理データや、参照されたファイルの履歴などを管理するための参照履歴データを記憶する。
The
The
Webサービス提供部120は、クライアント200,300にWebサービスを提供する。具体的には、クライアント200,300からファイルサーバ100にファイルをアップロードしたり、ファイルサーバ100からファイルをダウンロードしたりするためのWebページを、クライアント200,300に送信する。クライアント200,300は、Webブラウザを用いて所定のURLにアクセスすることで、該Webページを取得できる。このWebページには、ファイル検索に用いる文字列などを入力するためのGUIも含まれる。
The web
Webサービス提供部120は、入力された文字列をファイル管理部130に出力して、ファイル検索を依頼する。また、Webサービス提供部120は、ファイル管理部130による検索結果を取得して、検索結果を出力するための画面を生成し、要求元のクライアント200,300に送信する。クライアント200,300では、検索結果からファイルを選択して、該ファイルの内容を閲覧したり、該ファイルをダウンロードしたりすることができる。
The Web
なお、本実施の形態では、ファイル検索の受付やダウンロードの機能をWebサービスにより実装する場合を例示するが、これは一例であり、Webサービス以外の所定のアプリケーションによって実装してもよい。 In the present embodiment, the case where the file search reception and download functions are implemented by a Web service is illustrated, but this is only an example, and it may be implemented by a predetermined application other than the Web service.
ファイル管理部130は、ファイルサーバ100のファイル管理を制御する。ファイル管理部130は、生成部131、抽出部132、検索部133および履歴管理部134を有する。
The
生成部131は、記憶部110に格納されたオリジナルのファイル(以下、格納ファイルと称することがある)を取得して、該ファイルに含まれる要素に応じたタグを含むHTMLファイル(以下、表示用ファイルと称することがある)を生成する。ここで、格納ファイルは、例えば、クライアント200,300上のアプリケーションで生成されたファイルである。
The
ここで、アプリケーション140がクライアント200,300上のアプリケーションで生成されたファイルからHTMLファイルを生成する機能を有している場合もある。その場合、生成部131は、アプリケーション140にHTMLファイルの生成を依頼してもよい。例えば、生成部131は、ファイルに付された拡張子に基づいて、依頼先のアプリケーション140を選択することができる。例えば、該拡張子のファイルを処理可能なものとして、ファイルサーバ100上のOSに登録されたアプリケーションを選択することが考えられる。
Here, the
また、生成部131は、表示用ファイルに所定のスクリプトを追加する。表示用ファイルがWebブラウザ220によって閲覧されたときにユーザによる所定の操作を受付可能とするためである。
Further, the
抽出部132は、生成部131が生成したHTMLファイルに含まれるタグに基づいて、インデックス用の文字列を抽出し、記憶部110に記憶されたインデックステーブルに追加する。
The
検索部133は、Webサービス提供部120からファイルの検索依頼を取得する。検索部133は、検索依頼に含まれる検索用の文字列と記憶部110に記憶されたインデックステーブルとに基づいて、表示用ファイルの検索を行い、検索結果をWebサービス提供部120に出力する。
The
履歴管理部134は、ファイルの参照履歴を管理する。履歴管理部134は、検索部133の検索結果に対して、何れのファイルが参照されたかをWebサービス提供部120から取得して、記憶部110に記憶された参照履歴データに記録する。
The
アプリケーション140は、格納ファイルからHTMLファイルを生成する機能を有するアプリケーションである。このようなアプリケーションとして、例えば、Microsoft(登録商標) Word,Excel,PowerPoint(登録商標)などがある。
The
クライアント200は、記憶部210およびWebブラウザ220を有する。
記憶部210は、クライアント200で利用するファイルを記憶する。例えば、クライアント200上のアプリケーションが生成したファイルや、ファイルサーバ100からダウンロードしたファイルを記憶する。
The
The
Webブラウザ220は、Webサービス提供部120にWebアクセスを行うためのブラウザである。ユーザは、ファイルサーバ100にアクセスするために、認証サーバ(図示を省略)によるユーザ認証を受けることが考えられる。認証サーバには、認証に用いる情報(例えば、ユーザID(Identifier)、パスワードおよびユーザの所属)などの情報が格納される。
The
なお、第2の実施の形態のファイルサーバ100は、第1の実施の形態の情報処理装置1の一例である。生成部131および抽出部132は、生成手段1bの一例である。また、検索部133は、検索手段1cの一例である。
Note that the
図6は、ファイルサーバのディレクトリツリーの例を示す図である。ディレクトリツリー50は、記憶部110のディレクトリおよびファイルのパス構造をツリー形式に表示したものの一例である。
FIG. 6 is a diagram illustrating an example of a directory tree of a file server. The directory tree 50 is an example of a directory and file path structure displayed in a tree format in the
ディレクトリツリー50上では、ディレクトリ500が設けられている。ディレクトリ500は、共有ファイルを格納するためのディレクトリである。ディレクトリ500のディレクトリ名は“/データ”である。クライアント200,300からアップロードされたファイルは、ディレクトリ500配下のディレクトリに格納される。ディレクトリ500の配下には、ディレクトリ510,520,530が配置されている。ディレクトリ510,520は、格納ファイルを格納するためのディレクトリである。ディレクトリ530は、表示用ファイルを格納するためのディレクトリである。
A
ディレクトリ510のディレクトリ名は“/システム”である。例えば、格納ファイルのうち、情報処理システムの利用等に関するファイルをディレクトリ510に格納する。ディレクトリ510には、格納ファイル511,512が含まれる。格納ファイル511は、システム利用のマニュアルを記述したものであり、ファイル名は“マニュアル.dat”である。格納ファイル512は、新規導入システムなどの計画を記述したものであり、ファイル名は“プロジェクト.dat”である。
The directory name of the
ディレクトリ520のディレクトリ名は“/資材”である。例えば、格納ファイルのうち、情報処理システムを利用する企業の資材管理を行うためのファイルをディレクトリ520に格納する。ディレクトリ520には、格納ファイル521が含まれる。格納ファイル521は、資材管理のための表を含むものであり、ファイル名は“管理表.dat”である。
The directory name of the
ディレクトリ530のディレクトリ名は“/表示用ファイル”である。ディレクトリ530には、表示用ファイル531,532,533が含まれる。表示用ファイル531は、格納ファイル511に対応する表示用ファイルであり、ファイル名は“マニュアル.html”である。表示用ファイル532は、格納ファイル512に対応する表示用ファイルであり、ファイル名は“プロジェクト.html”である。表示用ファイル533は、格納ファイル521に対応する表示用ファイルであり、ファイル名は“管理表.html”である。
The directory name of the
何れのディレクトリに格納ファイルを格納するかは、ユーザがアップロード時に指定してもよい。また、ユーザに直接格納先のディレクトリを指定させる他、格納ファイルの分類をユーザに指定させ、該分類に基づいて格納先のディレクトリを判断してもよい。ただし、ディレクトリ530は、通常では格納ファイルの格納先としてユーザが選択できないディレクトリとなっている。
The directory in which the storage file is stored may be specified by the user at the time of uploading. In addition to allowing the user to directly specify the storage destination directory, the user may specify the storage file classification and determine the storage destination directory based on the classification. However, the
図7は、格納ファイルの例を示す図である。図7では、格納ファイル511(ファイル名“マニュアル.dat”)を所定のアプリケーションに入力した場合の表示内容を例示している。格納ファイル511は、要素511a,511b,511c,511d,511e,511fを含む。
FIG. 7 is a diagram illustrating an example of a storage file. FIG. 7 illustrates the display contents when the storage file 511 (file name “manual.dat”) is input to a predetermined application. The
要素511a,511cは図の名称を示す文字列である。要素511b,511dは図(イメージ)である。要素511eは表の名称を示す文字列である。要素511fは表(テーブル)である。
ユーザは、例えばクライアント300上のアプリケーションに格納ファイル511を入力することで、このような内容を閲覧することができる。一方で、該アプリケーションをクライアント200で実行することが困難な場合、このような内容をクライアント200上で閲覧することは困難となる。そこで、生成部131は、格納ファイル511に基づいて表示用ファイル531を生成する。
The user can view such contents by inputting the
図8は、表示用ファイルの例を示す図である。図8では、表示用ファイル531(ファイル名“マニュアル.html”)の記述内容を例示している。生成部131は、格納ファイル511のファイル名“マニュアル.dat”の拡張子を“.html”に代えて、表示用ファイル531のファイル名とする。表示用ファイル531は、記述531a,531b,531c,531d,531e,531fを含む。
FIG. 8 is a diagram illustrating an example of a display file. FIG. 8 illustrates the description content of the display file 531 (file name “manual.html”). The
記述531aは、表示用ファイル531のタイトル“マニュアル”を示す。生成部131は、例えば、格納ファイル511のファイル名から拡張子“.dat”を除いた部分“マニュアル”を“<title>”タグとして、表示用ファイル531に追加する。
The
記述531bは、生成部131により表示用ファイル531に追加されたJavaScript(登録商標)である。例えば、表示用ファイル531に基づいてWebブラウザ220がディスプレイ206aに表示させた画面に対し、ユーザのフリック操作を受け付け、該操作に応じた画面スクロールを行う処理が記述される。また、例えば、該画面の拡大や縮小などを行う際のアニメーションを制御するための処理を記述することが考えられる。また、例えば、クライアント200のディスプレイ206aの画素数に応じて、表示用ファイル531の表示画面を整形する処理を記述することが考えられる。
The
記述531cは、格納ファイル511に含まれる文字列の要素を示す記述である。例えば、要素511aに対して、“<td>”タグに文字列“図1:”が記述されている。“<td>”タグで囲まれた“<ruby>”タグに文字列“設定”、“画面”が記述されている。“<ruby>”タグで囲まれた“<rt>”タグに文字列“セッテイ”、“ガメン”が記述されている。このように、生成部131は、格納ファイル511に含まれる本文の各文字列要素に対して所定のタグを付与し、表示用ファイル531に記述する。
The
記述531dは、格納ファイル511に含まれる図の要素を示す記述である。例えば、生成部131は、要素511bに対して、“<img>”タグを表示用ファイル531に記述する。“<img>”タグには、例えば、格納ファイル511の情報に基づいて、“title”属性、“src”属性などを更に記述する。
The
記述531eは、格納ファイル511に含まれる表の要素を示す記述である。例えば、生成部131は、要素511fに対して、“<table>”タグを表示用ファイル531に記述する。“<table>”タグには、例えば、“<caption>”タグを含めて、表のタイトルを記述する。
The
記述531fは、生成部131により表示用ファイル531に追加された記述である。記述531fでは、記述531bのように表示用ファイル531の内容を表示したWebブラウザ220で受け付け可能とする操作を記述する。例えば、表示用ファイル531に対応する格納ファイル511のパスを“hidden”属性により記述しておき、格納ファイル511をファイルサーバ100からダウンロード可能にする処理が記述される。
The
ここで、生成部131は、格納ファイル511に含まれる要素間の位置関係を検出することで、上述したようなタグやタグ内の属性を決定し、表示用ファイル531に記述できる。次に、その記述方法の具体例を説明する。
Here, the
図9は、表示用ファイルの生成例を示す図である。図9(A)は記述531dの生成例を示している。図9(B)は記述531eの生成例を示している。
記述531dは、格納ファイル511に含まれる文字列の要素511aを、図の要素511bのタイトルとして記述したものである。生成部131は、例えば、要素511bから所定の距離L1以内にある文字列の要素511aを要素511bのタイトル(“title”属性の設定値)として取得できる。要素間の距離を検出する場合には、例えば、要素511a,511bを覆う矩形を特定し、各矩形の最も近い辺同士の間の距離を検出することが考えられる。
FIG. 9 is a diagram illustrating a generation example of a display file. FIG. 9A shows a generation example of the
The
更に、例えば、検出した該文字列が“図”や“図”と記号/英数字の結合(例えば、“図−1”)などの文字列を含む場合に図のタイトルとして取得してもよい。図の要素511bに対して、より関連性の高いと考えられる文字列を抽出するためである。なお、図9(A)では、要素511aが要素511bの紙面に向かって上側に配置されている場合を例示しているが、要素511aが要素511bの紙面に向かって左右や下側に配置されている場合にも、両要素間の距離によって要素511aを図のタイトルとするかを判断できる。
Further, for example, when the detected character string includes a character string such as “figure” or “figure” and a symbol / alphanumeric combination (for example, “figure 1”), it may be acquired as the title of the figure. . This is because a character string considered to be more relevant to the
記述531eは、格納ファイル511に含まれる文字列の要素511eを表の要素511fのタイトルとして記述したものである。生成部131は、例えば、図9(A)と同様に要素511fから所定の距離L2以内にある文字列の要素511eを要素511fのタイトル(“<caption>”タグの設定値)として取得できる。要素間の距離を検出する方法は、図9(A)と同様に、例えば、要素511e,511fを覆う矩形を特定し、各矩形の最も近い辺同士の間の距離を検出すればよい。
The
更に、例えば、検出した該文字列が“表”や“表”と記号/英数字の結合(例えば、“表−1”)などの文字列を含む場合に表のタイトルとしてもよい。表の要素511fに対して、より関連性の高いと考えられる文字列を抽出するためである。なお、図9(B)では、要素511eが要素511fの紙面に向かって上側に配置されている場合を例示しているが、要素511eが要素511fの紙面に向かって左右や下側に配置されている場合にも、両要素間の距離によって要素511eを表のタイトルとするかを判断できる。
Further, for example, when the detected character string includes a character string such as “table” or “table” and a symbol / alphanumeric combination (for example, “table-1”), the title of the table may be used. This is because a character string considered to be more relevant to the
抽出部132は、このように生成部131によって生成された表示用ファイルのタグに基づいて文字列を抽出し、インデックステーブルに登録する。抽出部132は、表示用ファイル531から例えば次のような文字列を抽出する。
The
(1)“<title>”タグ内に記述された文字列“マニュアル”を文書のタイトルとして抽出する。
(2)“<td>”タグ、“<ruby>”タグ、“<rt>”タグ内に記述された文字列“図1:”、“設定”、“セッテイ”などを文書の本文に含まれる文字列として抽出する。
(1) The character string “manual” described in the “<title>” tag is extracted as a document title.
(2) “<td>” tag, “<ruby>” tag, character string “FIG. 1:” described in the “<rt>” tag, “setting”, “setting”, etc. are included in the text of the document Extracted as a character string.
(3)“<img>”タグ内の“title”属性として記述された文字列“図1:設定画面”を図のタイトルとして抽出する。
(4)“<table>”タグで囲われた“<caption>”タグで記述された文字列“表1:設定手順”を表のタイトルとして抽出する。
(3) The character string “FIG. 1: Setting screen” described as the “title” attribute in the “<img>” tag is extracted as the title of the figure.
(4) The character string “Table 1: Setting Procedure” described by the “<caption>” tag enclosed by the “<table>” tag is extracted as the title of the table.
なお、“<table>”タグ内に記述された文字列(特に罫線で囲われた領域内の文字列)を、例えば表内に含まれる文字列(表内本文)として抽出することも考えられる。表の罫線は、例えば“<table>”タグ内の“border”属性により検出できる。 It is also conceivable to extract a character string described in the “<table>” tag (especially a character string in an area surrounded by a ruled line) as a character string (text in the table) included in the table, for example. . The ruled line of the table can be detected by, for example, a “order” attribute in a “<table>” tag.
また、上述した図表以外にも種々の要素をタグによって識別し得る。例えば、HTML5では、音声要素を記述する“<audio>”タグや動画要素を記述する“<video>”タグを利用できる。この場合、生成部131は、格納ファイルが音声要素を含めば、“<audio>”タグによって音声要素を、“<audio>”タグ内の“src”属性で音声ファイル名を記述する。抽出部132は、“<audio>”タグの“src”属性に設定された文字列を音声ファイルの名称として抽出することができる。格納ファイルが動画要素を含む場合も、音声要素と同様に“<video>”タグを利用できる。
In addition to the above-described charts, various elements can be identified by tags. For example, in HTML5, a “<audio>” tag describing an audio element and a “<video>” tag describing a moving image element can be used. In this case, if the storage file includes an audio element, the
抽出部132は、抽出した文字列を、該文字列のファイル内での役割を示す属性情報(以下、文書内属性と称することがある)および表示用ファイルに対応付けてインデックステーブルに登録する。
The
図10は、インデックステーブルの例を示す図である。インデックステーブル111は、記憶部110に格納される。インデックステーブル111は、文字列、文書内属性および表示用ファイルの項目を含む。
FIG. 10 is a diagram illustrating an example of an index table. The index table 111 is stored in the
文字列の項目には、表示用ファイルから抽出した文字列(1文字でもよい)が登録される。文書内属性の項目には、該文字列が示す文書内属性が登録される。文書内属性としては、例えば“文書タイトル”、“図タイトル”、“表タイトル”、“表内本文”および“本文”などを登録できる。表示用ファイルの項目には、抽出元の表示用ファイルのファイル名が設定される。なお、表示用ファイルは、ディレクトリ530(ディレクトリ名“/表示用ファイル”)に格納されることが予め規定されているため、表示用ファイルの項目の設定では、プレフィックスを省略している。ただし、フルパスで設定してもよい。 In the item of the character string, a character string extracted from the display file (one character may be registered) is registered. In the document attribute item, the document attribute indicated by the character string is registered. As the in-document attributes, for example, “document title”, “figure title”, “table title”, “in-table text”, “text”, and the like can be registered. In the item of display file, the file name of the display file of the extraction source is set. Since the display file is previously defined to be stored in the directory 530 (directory name “/ display file”), the prefix is omitted in the setting of the display file item. However, the full path may be set.
なお、インデックステーブル111には、例えば、格納ファイルの項目を設けて、格納ファイルのパスを設定してもよい。このようにすれば、インデックステーブル111に基づいて、文字列から格納ファイルを検索することも可能となる。 In the index table 111, for example, a storage file item may be provided and a path of the storage file may be set. In this way, it is possible to search the storage file from the character string based on the index table 111.
図11は、ファイル管理データの例を示す図である。ファイル管理データ112は、記憶部110に格納される。ファイル管理データ112は、ディレクトリツリー50に含まれる各ディレクトリを分類するための情報(ファイル分類情報)、および、格納ファイルと表示用ファイルとを関連付けるための情報(ファイル関連付け情報)を登録したファイルである。ファイル管理データ112は、csv(Comma Separated Values)形式で記述されている。ただし、XMLなど他の形式でもよい。
FIG. 11 is a diagram illustrating an example of file management data. The
ファイル分類情報には、例えば、“システム利用”という分類が定義されている。そして、“システム利用”の分類に属するディレクトリとして、“.../データ/システム/”および“.../データ/利用規定/”が定義されている。同様に、“資材管理”、“ガーデニング”および“インテリア”などの分類も定義されている。ファイル分類情報は、情報処理システムの管理者が予め登録する。 In the file classification information, for example, a classification “system use” is defined. Then, “... / data / system /” and “... / data / usage rules /” are defined as directories belonging to the classification of “system use”. Similarly, classifications such as “material management”, “gardening”, and “interior” are defined. File classification information is registered in advance by an administrator of the information processing system.
ファイル関連付け情報には、例えば、“.../データ/システム/マニュアル.dat”という格納ファイル511に対して、“マニュアル.html”という表示用ファイル531が対応付けられている。ここで、図10で説明したように表示用ファイルのプレフィックスは省略しているが、フルパスで登録されてもよい。ファイル関連付け情報は、生成部131が格納ファイルから表示用ファイルを生成したときに登録する。
In the file association information, for example, a
なお、ファイル管理データ112では、ファイル関連付け情報で格納ファイルと表示用ファイルとが対応付けられ、ファイル分類情報で格納ファイルのディレクトリとファイル分類とが対応付けられている。すなわち、ファイル管理データ112は、表示用ファイルとファイル分類情報とを、格納ファイルのディレクトリを介して間接的に関連付けている。よって、ファイル管理データ112は、表示用ファイルとファイル分類情報との対応付けを定義した情報ということもできる。
In the
図12は、参照履歴データの例を示す図である。参照履歴データ113は、記憶部110に格納される。参照履歴データ113は、表示用ファイルがユーザによって参照された回数を日ごとに記録したものである。履歴管理部134は、ユーザが選択した表示用ファイル、ユーザIDおよびユーザの所属などの情報をWebサービス提供部120から取得して、各表示用ファイルの参照回数を記録する。参照履歴データ113は、csv形式で記述されている。ただし、XMLなど他の形式でもよい。
FIG. 12 is a diagram illustrating an example of reference history data. The
参照履歴データ113には、例えば、“2011/9/1”、“マニュアル.html”、“30”、“システム管理課”、“10”、“第1システム課”、“5”、・・・が登録されている。これは、2011年9月1日に、表示用ファイル531(ファイル名“マニュアル.html”)に対して全所属から30回の参照があったこと、システム管理課から10回の参照があったこと、第1システム課から5回の参照があったことを示している。
The
ここで、ファイル管理データ112や参照履歴データ113を、RDB(Relational DataBase)ではなく、csvやXMLで管理することで、各データの更新や参照などを容易に行える。また、例えば、ファイルサーバ100の管理者は、参照履歴データ113を参照することで、どのような所属からどのようなファイルが参照されているかを容易に分析可能となる。
Here, by managing the
図13は、検索画面の例を示す図である。検索画面600は、Webブラウザ220により生成され、ディスプレイ206aに表示される。Webブラウザ220は、所定のURL(Uniform Resource Locator)にアクセスすることで、Webサービス提供部120から検索画面600のHTMLファイルを取得できる。
FIG. 13 is a diagram illustrating an example of a search screen. The
検索画面600には、領域610,620,630が含まれる。
領域610は、ディレクトリツリー50を表示する領域である。ユーザは、例えば、何れかのディレクトリをタッチすることで、該ディレクトリ内に配置されたファイルの一覧を領域630に表示させることができる。
The
An
領域620は、検索する文字列(キーワード)や検索対象範囲を入力するための領域である。領域620には、入力フォーム621,622,623および検索ボタン624が設けられている。
An
入力フォーム621は、キーワードを入力するためのテキストボックスである。
入力フォーム622は、該キーワードが含まれる得る文書内属性(“文書タイトル”や“図タイトル”など)を選択するためのリストボックスである。
The
The
入力フォーム623は、検索対象とするファイル分類(“システム利用”や“資材管理”など)を選択するためのリストボックスである。
検索ボタン624は、入力フォーム621,622,623に入力した情報に基づいて、ファイルサーバ100に検索依頼を送信するためのボタンである。入力フォーム622に入力がない場合には、全文書内属性に対して検索が行われる。入力フォーム623に入力がない場合には、全ファイル分類に対して検索が行われる。
The
The
ユーザは、所望の入力フォームをタッチして、文字列(1文字でもよい)の入力や、文書内属性およびファイル分類の選択を行える。また、ユーザは、検索ボタン624をタッチすることで、ファイルサーバ100に検索依頼を行える。
The user can touch a desired input form to input a character string (or even one character), and to select a document attribute and file classification. The user can make a search request to the
領域630は、領域610で選択されたディレクトリに格納されたファイルの一覧を表示する領域である。また、領域630は、検索ボタン624の押下後、ファイルサーバ100から検索結果を取得した場合に、その検索結果の一覧を表示する領域である。
The
領域630に表示される検索結果は、各表示用ファイルへのリンクとなっている。ユーザは、検索結果の一覧から、所望のファイルのリンクを選択することで、該表示用ファイルの内容を表示する表示画面631を領域630内あるいはWebブラウザ220の他のウィンドウ内に表示させることができる。図13の例では、領域630で“マニュアル.html”のリンクが選択された場合を例示している。Webブラウザ220は、該リンクを指定したHTTPリクエストをファイルサーバ100に送信し、その応答として表示用ファイル531(ファイル名“マニュアル.html”)を取得する。Webブラウザ220は、表示用ファイル531に基づいて、表示画面631内に該ファイルの内容を表示させる。表示される内容は、クライアント300上のアプリケーションが“マニュアル.dat”を実行してディスプレイに表示させる内容と同一あるいはほぼ同一である(要素のレイアウトなど多少異なっていてもよい)。
The search result displayed in the
次に、以上の構成のファイルサーバ100の処理手順を説明する。まず、表示用ファイル生成処理の手順を説明する。ファイルサーバ100は、例えば、スケジュールされた所定の時間に以下の処理を開始する。ただし、格納ファイルがファイルサーバ100に新たに格納(あるいは更新)されたタイミングで、該格納ファイルに対する表示用ファイルを生成するようにしてもよい。
Next, the processing procedure of the
図14は、表示用ファイル生成処理を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。
(ステップS11)生成部131は、記憶部110から未処理の格納ファイルを1つ取得する。
FIG. 14 is a flowchart showing display file generation processing. In the following, the process illustrated in FIG. 14 will be described in order of step number.
(Step S11) The
(ステップS12)生成部131は、取得した格納ファイルに対して表示用ファイルを未生成であるか否かを判定する。未生成である場合、処理をステップS14に進める。生成済である場合、処理をステップS13に進める。生成部131は、例えば、記憶部110に記憶されたファイル管理データ112を参照して、ファイル関連付け情報に該格納ファイルに対応する表示用ファイルが登録済か否かによって、該判定を行える。表示用ファイルが登録されていなければ、表示用ファイルを未生成である。表示用ファイルが登録されていれば、表示用ファイルを生成済みである。
(Step S12) The
(ステップS13)生成部131は、表示用ファイルが格納ファイルに対して古いか否かを判定する。表示用ファイルが古い場合、処理をステップS14に進める。表示用ファイルが古くない場合、処理をステップS22に進める。生成部131は、例えば、格納ファイルと対応する表示用ファイルの作成日時(または更新日時)を参照することで該判定を行える。表示用ファイルの作成日時の方が過去であれば、表示用ファイルは格納ファイルに対して古い。格納ファイルの作成日時の方が過去であれば、表示用ファイルは古くない。
(Step S13) The
(ステップS14)生成部131は、格納ファイルを読み込んで表示用ファイルを生成する。表示用ファイルの具体的な生成方法は、図7〜9で説明した通りである。すなわち、生成部131は、格納ファイルに含まれる要素および要素間の位置関係に応じたタグを記述して表示用ファイルを生成する。なお、生成部131は、所定の形式のファイルをHTML形式のファイルに変換する機能をもったアプリケーション140に、表示用ファイルの生成を依頼してもよい。また、アプリケーション140が生成したHTML形式のファイルに対し、生成部131が所定のタグや属性を追加して表示用ファイルを生成してもよい。
(Step S14) The
(ステップS15)抽出部132は、表示用ファイルから所定のタグを検出する。例えば、上述したような“<title>”タグ、“<table>”タグ、“<caption>”タグ、“<img>”タグなどである。また、タグに含まれる“title”や“border”などの属性を該タグとセットで検出する。更に、“<table>”タグで囲まれた“<caption>”タグなどをセットで検出する。
(Step S15) The
(ステップS16)抽出部132は、ステップS15で検出したタグに含まれる文字列やタグ内の属性に含まれるキーワードを抽出する。
(ステップS17)抽出部132は、抽出した文字列を文書内属性および表示用ファイルに対応付けてインデックステーブル111に登録する。抽出部132は、タグやタグ内の属性に応じて文書内属性を決定する。例えば、“<title>”タグから抽出した文字列であれば、文書内属性は“文書タイトル”とする。また、例えば、“<img>”タグ内の“title”属性から抽出した文字列であれば、文書内属性は“図タイトル”とする。何れの文書内属性に対応付けるかは、抽出部132に予め設定される。なお、表示用ファイルを更新する場合には、前回登録したインデックスと重複することも考えられる。その場合には、差分だけ登録すればよい。
(Step S16) The
(Step S17) The extracting
(ステップS18)生成部131は、Webブラウザ220で操作に応じた処理を実行するためのスクリプトを表示用ファイルに追加する。例えば、図8で説明した表示用ファイル531内の記述531b,531fが該スクリプトに相当する。
(Step S <b> 18) The
(ステップS19)生成部131は、Webブラウザ220での表示内容を整形するためのスクリプトを表示用ファイルに追加する。
(ステップS20)生成部131は、表示用ファイルを記憶部110に格納する。
(Step S <b> 19) The
(Step S20) The
(ステップS21)生成部131は、格納ファイルと表示用ファイルとの対応をファイル管理データ112に登録する。なお、既に登録済である場合には、ステップS21をスキップしてステップS22に進んでもよい。
(Step S21) The
(ステップS22)生成部131は、記憶部110に記憶された全ての格納ファイルを処理済であるか否か判定する。全格納ファイルを処理済である場合、処理を終了する。未処理の格納ファイルがある場合、処理をステップS11に進める。
(Step S <b> 22) The
このようにして、生成部131は、格納ファイルから表示用ファイルを生成する。抽出部132は、表示用ファイルに含まれるタグに基づいて表示用ファイルから文字列を抽出し、インデックステーブル111に登録する。
In this way, the
図15は、ファイル検索処理を示すフローチャートである。以下、図15に示す処理をステップ番号に沿って説明する。
(ステップS31)Webブラウザ220は、検索画面600の領域620で入力された内容に基づいて検索依頼を生成し、Webサービス提供部120に送信する。Webサービス提供部120は、Webブラウザ220から検索依頼を受信する。検索依頼には、ユーザID、ユーザの所属、検索キーワード、文書内属性、ファイル分類などの情報が含まれる。Webサービス提供部120は、取得した検索依頼を検索部133に出力する。
FIG. 15 is a flowchart showing the file search process. In the following, the process illustrated in FIG. 15 will be described in order of step number.
(Step S <b> 31) The
(ステップS32)検索部133は、検索依頼に含まれる情報に基づいて、インデックステーブル111を検索する。例えば、検索依頼が検索キーワード“手順”、文書内属性“表タイトル”を含む場合、インデックステーブル111から、文字列“手順”を含み、文書内属性が“表タイトル”であるレコードを検索する。そして、該レコードに含まれる表示用ファイル“マニュアル.html”を特定する。
(Step S32) The
(ステップS33)検索部133は、何れかの表示用ファイルを特定したか(ヒットがあったか)否かを判定する。ヒットなしの場合、処理をステップS34に進める。ヒットありの場合、処理をステップS36に進める。
(Step S33) The
(ステップS34)検索部133は、ヒットなしをWebサービス提供部120に出力する。
(ステップS35)Webサービス提供部120は、検索依頼に対する応答として、ヒットしたファイルなしを表示するための結果ページをWebブラウザ220に送信する。そして、処理を終了する。
(Step S <b> 34) The
(Step S <b> 35) The Web
(ステップS36)検索部133は、検索依頼でファイル分類を受け付けているか否かを判定する。ファイル分類を受け付けている場合、処理をステップS37に進める。ファイル分類を受け付けていない場合、処理をステップS38に進める。
(Step S36) The
(ステップS37)検索部133は、ファイル管理データ112を参照して、ファイル分類で検索結果の絞込を行う。例えば、検索依頼がファイル分類“システム利用”を含む場合、ステップS33でヒットした表示用ファイルのうち、対応する格納ファイルが格納されたディレクトリがファイル分類“システム利用”に属するディレクトリであるものを特定する。
(Step S37) The
(ステップS38)検索部133は、参照履歴データ113を参照して、検索結果(ファイル分類で絞り込んでいる場合は絞込後の結果)に含まれる表示用ファイルを参照回数でソートする。例えば、その日の総参照回数が最大の表示用ファイルを上から順に並べる。また、例えば、ユーザの所属単位の参照回数を取得してソートしてもよい。例えば、ユーザが属する所属からの参照回数が大きい程、上位とすることが考えられる。何れの方法でソートを行うかは、管理者によって検索部133に予め設定される。また、ソートを行わなくてもよい。その場合、本ステップをスキップしてステップS39に進めばよい。
(Step S38) The
(ステップS39)検索部133は、ステップS38でソートした結果をWebサービス提供部120に出力する。
(ステップS40)Webサービス提供部120は、検索依頼に対する応答として、検索部133の検索結果を表示するための結果ページをWebブラウザ220に送信する。
(Step S39) The
(Step S40) As a response to the search request, the Web
(ステップS41)Webブラウザ220は、結果ページ(例えば、検索画面600の領域630の内容)をディスプレイ206aに表示させる。Webブラウザ220は、何れかの表示用ファイルを選択するタッチ操作を受け付けると、Webサービス提供部120に該表示用ファイルを要求する。Webサービス提供部120は、該要求を受信することで表示用ファイルの選択を受け付ける。
(Step S41) The
(ステップS42)Webサービス提供部120は、記憶部110から選択された表示用ファイルを取得し、Webブラウザ220に送信する。Webブラウザ220は、該表示用ファイルの内容をディスプレイ206aに表示させる(例えば、表示画面631の内容)。
(Step S <b> 42) The web
(ステップS43)Webサービス提供部120は、選択された表示用ファイルを示す情報、ユーザIDおよびユーザの所属などを示す情報を履歴管理部134に出力する。履歴管理部134は、受け付けた情報に基づいて、参照履歴データ113を更新する。例えば、2011年9月1日に、システム管理課に所属するユーザが“マニュアル.html”を選択した場合、全所属からの参照回数およびシステム管理課からの参照回数に、それぞれ1を加算する。
(Step S <b> 43) The Web
このようにして、検索部133はファイル検索を行う。このとき、検索部133は、検索キーワードとして、文書内属性やファイル分類を受け付けることで、詳細なファイル検索を可能とする。ユーザは、クライアント200を用いて、所望の表示用ファイルを効率的に探し出すことができ、ファイルの内容を容易に閲覧することができる。
In this way, the
ここで、クライアント200は、表示用ファイルに記述されたスクリプトによって、種々の制御が可能である。次に、スクリプトによって実現し得るクライアント200の制御を例示する。
Here, the
図16は、表示用ファイルを用いたクライアント制御の例を示す図である。図16(A)は、クライアント200のディスプレイ206aの表示能力に応じた表示整形の制御を示している。例えば、ディスプレイ206aの画素数に応じて、要素の大きさ、要素の色、要素のレイアウトおよび文章の改行位置などの定義(スタイルシート)を変更する制御を行える。
FIG. 16 is a diagram illustrating an example of client control using a display file. FIG. 16A shows display shaping control in accordance with the display capability of the
図16(B)は、表示変更時のアニメーションの制御を示している。例えば、タッチパネル207aに対するユーザのフリック操作に応じた画面スクロールのアニメーションや、ピンチアウト/ピンチイン操作に応じた画面の拡大/縮小のアニメーションなどの制御を行える。
FIG. 16B shows control of animation when the display is changed. For example, it is possible to control screen scrolling animation according to a user's flick operation on the
図16(C)は、格納ファイルのダウンロードを示している。例えば、タッチパネル207aにより、表示用ファイルの所定位置に対するタップ操作を受け付けた場合に、ファイルサーバ100から該表示用ファイルに対応する格納ファイルのダウンロードを行える。これにより、ユーザは、表示用ファイルを閲覧できるだけでなく、該表示用ファイルのオリジナルの格納ファイルをクライアント200に格納できる。より具体的には、“マニュアル.html”の内容をWebブラウザ220により閲覧しながら、“マニュアル.dat”を記憶部210に格納することもできる。
FIG. 16C shows downloading of the storage file. For example, when a tap operation on a predetermined position of the display file is received by the
以上で説明したように、ファイルサーバ100は、格納ファイルに基づいて、HTML形式の表示用ファイルを生成する。表示用ファイル内に格納ファイル中の要素を示すタグを記述する際、該要素に関するタイトルや該要素に含まれる文字列であることを識別できるように、所定のタグや属性を追加する。そして、該表示用ファイルに含まれるタグに基づき文字列を抽出してインデックスを作成する。このため、格納ファイルから文字列を抽出する場合に比べて、詳細なインデックスを作成できる。具体的には、タグやタグ内の属性に基づいて抽出した文字列に文書内属性を付与してインデックスを作成する。このため、キーワードと該キーワードの文書内属性とのセットで、表示用ファイルの検索を行える。したがって、例えば、図のタイトルや表内に含まれる文字列など、詳細な検索を効率的に行えるようになる。
As described above, the
また、インデックステーブル111を作成する際にタグを用いることで、ユーザに付加的な情報を作成させるのを回避できる。よって、ユーザによる作業の省力化を図れる。
更に、表示用ファイルをHTML形式で生成する。このため、表示用ファイルをクライアント200に送信すれば、Webブラウザ220を用いて表示用ファイルの内容を閲覧することができる。
In addition, by using a tag when creating the index table 111, it is possible to prevent the user from creating additional information. Therefore, labor saving of work by the user can be achieved.
Further, a display file is generated in the HTML format. For this reason, if the display file is transmitted to the
ここで、クライアント200は携帯端末装置であるため、ラップトップ型のクライアント300で動作可能なアプリケーションを、クライアント200では動作させるのが困難なこともある。この場合、オリジナルの格納ファイルをクライアント200に提供しても該格納ファイルの内容を閲覧するのが困難となり不便なこともある。
Here, since the
これに対し、携帯端末装置でもWebブラウザであれば利用可能なことが多い。そこで、ファイルサーバ100は、HTML形式などで生成した表示用ファイルをクライアント200に提供することで、クライアント200でも容易に該ファイルの内容を閲覧可能となる。なお、第2の実施の形態では、表示用ファイルをHTML形式で生成するものとしたが、他の形式でもよい。例えば、XML形式およびXSL(eXtensible Stylesheet Language)形式のファイルで生成してもよい。
On the other hand, even a mobile terminal device can often be used with a Web browser. Therefore, the
このようにして、ファイルサーバ100は、効率的なファイル検索を支援することができる。
以上、本発明のファイル管理プログラム、情報処理装置およびファイル管理方法を図示の実施の形態に基づいて説明したが、これらに限定されるものではなく、各部の構成は同様の機能を有する任意の構成のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。更に、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。
In this way, the
As described above, the file management program, the information processing apparatus, and the file management method according to the present invention have been described based on the illustrated embodiments. Can be substituted. Moreover, other arbitrary structures and processes may be added. Further, any two or more configurations (features) of the above-described embodiments may be combined.
1 情報処理装置
1a 記憶手段
1b 生成手段
1c 検索手段
2 第1のファイル
2a,2b 要素
3 第2のファイル
DESCRIPTION OF
Claims (9)
文字列が入力されると、前記記憶手段を参照して、入力された文字列に対応する前記第2のファイルを検索し、検索結果を出力する、
処理をコンピュータに実行させるファイル管理プログラム。 Obtaining a first file stored in a storage means to generate a second file including one or more tags corresponding to one or more elements included in the first file; Alternatively, one or more character strings included in the second file are extracted based on more tags, the second file and the extracted character strings are associated with each other and stored in the storage unit,
When a character string is input, the second file corresponding to the input character string is searched with reference to the storage means, and a search result is output.
A file management program that causes a computer to execute processing.
文字列とともに属性情報が入力されると、前記記憶手段を参照し、入力された文字列および属性情報に対応する前記第2のファイルを検索する、
請求項1記載のファイル管理プログラム。 When extracting a character string, a tag including the character string is detected, attribute information corresponding to the tag is determined, and stored in the storage unit in association with the second file and the extracted character string. ,
When attribute information is input together with a character string, the second file corresponding to the input character string and attribute information is searched with reference to the storage means.
The file management program according to claim 1.
文字列および分類が入力されると、前記記憶手段に記憶された前記ファイル分類情報に基づき、入力された分類で前記検索結果を絞り込む、
請求項1乃至5の何れか一項に記載のファイル管理プログラム。 The storage means stores file classification information that associates the classification to which the second file belongs,
When a character string and a classification are input, the search result is narrowed down by the input classification based on the file classification information stored in the storage means.
The file management program according to any one of claims 1 to 5.
文字列が入力されると、前記記憶手段を参照して、入力された文字列に対応する前記第2のファイルを検索し、検索結果を出力する検索手段と、
を有する情報処理装置。 Obtaining a first file stored in a storage means to generate a second file including one or more tags corresponding to one or more elements included in the first file; Alternatively, one or more character strings included in the second file are extracted based on more tags, and the second file and the extracted character strings are associated with each other and stored in the storage unit. Means,
When a character string is input, search means for searching the second file corresponding to the input character string with reference to the storage means, and outputting a search result;
An information processing apparatus.
記憶手段に格納された第1のファイルを取得して、前記第1のファイルに含まれる1またはそれ以上の要素に応じた1またはそれ以上のタグを含む第2のファイルを生成し、前記1またはそれ以上のタグに基づいて前記第2のファイルに含まれる1またはそれ以上の文字列を抽出して、前記第2のファイルと抽出した文字列とを対応付けて前記記憶手段に格納し、
文字列が入力されると、前記記憶手段を参照して、入力された文字列に対応する前記第2のファイルを検索し、検索結果を出力する、
ファイル管理方法。 A file management method executed by a computer,
Obtaining a first file stored in a storage means to generate a second file including one or more tags corresponding to one or more elements included in the first file; Alternatively, one or more character strings included in the second file are extracted based on more tags, the second file and the extracted character strings are associated with each other and stored in the storage unit,
When a character string is input, the second file corresponding to the input character string is searched with reference to the storage means, and a search result is output.
File management method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011216384A JP2013077150A (en) | 2011-09-30 | 2011-09-30 | File management program, information processing device, and file management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011216384A JP2013077150A (en) | 2011-09-30 | 2011-09-30 | File management program, information processing device, and file management method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013077150A true JP2013077150A (en) | 2013-04-25 |
Family
ID=48480567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011216384A Pending JP2013077150A (en) | 2011-09-30 | 2011-09-30 | File management program, information processing device, and file management method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013077150A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017072965A (en) * | 2015-10-07 | 2017-04-13 | 株式会社バッファロー | Archive system, archive device, and computer program for archive |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007036837A (en) * | 2005-07-28 | 2007-02-08 | Canon Inc | Image generation apparatus and information processing apparatus |
JP2007058605A (en) * | 2005-08-24 | 2007-03-08 | Ricoh Co Ltd | Document management system |
JP2007188134A (en) * | 2006-01-11 | 2007-07-26 | Yafoo Japan Corp | Document search method using index file |
JP2008181503A (en) * | 2006-12-26 | 2008-08-07 | Canon Marketing Japan Inc | Information processor, control method, program and computer-readable storage medium |
JP2011192145A (en) * | 2010-03-16 | 2011-09-29 | Canon Inc | Image processor, image processing method, and program |
-
2011
- 2011-09-30 JP JP2011216384A patent/JP2013077150A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007036837A (en) * | 2005-07-28 | 2007-02-08 | Canon Inc | Image generation apparatus and information processing apparatus |
JP2007058605A (en) * | 2005-08-24 | 2007-03-08 | Ricoh Co Ltd | Document management system |
JP2007188134A (en) * | 2006-01-11 | 2007-07-26 | Yafoo Japan Corp | Document search method using index file |
JP2008181503A (en) * | 2006-12-26 | 2008-08-07 | Canon Marketing Japan Inc | Information processor, control method, program and computer-readable storage medium |
JP2011192145A (en) * | 2010-03-16 | 2011-09-29 | Canon Inc | Image processor, image processing method, and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017072965A (en) * | 2015-10-07 | 2017-04-13 | 株式会社バッファロー | Archive system, archive device, and computer program for archive |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8595634B2 (en) | Distributed hosting of web application styles | |
US20080077880A1 (en) | Method and device for selecting and displaying a region of interest in an electronic document | |
US20070067305A1 (en) | Display of search results on mobile device browser with background process | |
US20100199197A1 (en) | Selective content transcoding | |
US20080016462A1 (en) | Methods and apparatus for enabling use of web content on various types of devices | |
US20080215966A1 (en) | Adaptive server-based layout of web documents | |
US20130019189A1 (en) | Augmented editing of an online document | |
JP4991948B1 (en) | Information processing apparatus and information processing method | |
WO2008092079A2 (en) | System, method and apparatus for selecting content from web sources and posting content to web logs | |
US20120303695A1 (en) | Device specific web services | |
CN103699684B (en) | A kind of portal management method and system | |
JP5903783B2 (en) | Server apparatus and information processing apparatus | |
US20130282716A1 (en) | Delivering recommendations based on user content profile | |
KR100845355B1 (en) | Image Preference Application, System and Its Operation Method | |
JP2013077150A (en) | File management program, information processing device, and file management method | |
WO2016011699A1 (en) | Method and device for use in configuring navigation page of browser | |
JP2008046879A (en) | Page display device, page display method, and computer program | |
US20100017418A1 (en) | Method of presenting a topology, using a visual object | |
US8533588B2 (en) | Overriding images in user interfaces | |
JP6847498B2 (en) | Configuration information display system, method, and program that displays configuration information about remote resources | |
JP2012212398A (en) | Information processor and information processing method | |
JP2017228233A (en) | Data analysis system, data analysis method, terminal device and computer program | |
JP5331166B2 (en) | Search server and method | |
JP5808484B2 (en) | Program, information processing apparatus and data providing method | |
WO2011064904A1 (en) | Content conversion system, content conversion program and content selection program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140930 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160202 |