JP7326637B2 - チャンキング実行システム、チャンキング実行方法、及びプログラム - Google Patents
チャンキング実行システム、チャンキング実行方法、及びプログラム Download PDFInfo
- Publication number
- JP7326637B2 JP7326637B2 JP2023006662A JP2023006662A JP7326637B2 JP 7326637 B2 JP7326637 B2 JP 7326637B2 JP 2023006662 A JP2023006662 A JP 2023006662A JP 2023006662 A JP2023006662 A JP 2023006662A JP 7326637 B2 JP7326637 B2 JP 7326637B2
- Authority
- JP
- Japan
- Prior art keywords
- search query
- chunking
- tokens
- token
- occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
本開示に係るチャンキング実行システムの実施形態の一例である第1実施形態を説明する。
図1は、チャンキング実行システムの全体構成の一例を示す図である。チャンキング実行システムSは、ネットワークNに接続可能なサーバ10及びユーザ端末20を含む。ネットワークNは、インターネット又はLAN等の任意のネットワークである。チャンキング実行システムSは、少なくとも1つのコンピュータを含めばよく、図1の例に限られない。
図2は、第1実施形態の概要を示す図である。第1実施形態では、ウェブサイトの検索サービスにチャンキング実行システムSを適用する場合を例に挙げる。チャンキング実行システムSは、種々のサービスに適用可能である。他のサービスへの適用例は、後述する。例えば、ユーザは、ユーザ端末20のブラウザ又はアプリケーションを起動し、検索サービスのトップページP1にアクセスする。
図3は、第1実施形態で実現される機能の一例を示す機能ブロック図である。第1実施形態では、主な機能がサーバ10で実現される場合を説明する。データ記憶部100は、記憶部12を主として実現される。検索クエリ取得部101、マッチング実行部102、共起尺度取得部103、出力取得部104、チャンキング実行部105、検索処理実行部106、及び提示部107は、制御部11を主として実現される。
データ記憶部100は、チャンキングに必要なデータを記憶する。例えば、データ記憶部100は、検索対象データベースDB、辞書データD、及び学習モデルMを記憶する。検索対象データベースDBは、検索対象となるデータが格納されたデータベースを記憶してもよい。このデータベースには、検索クエリとの比較対象となるインデックスが格納されている。第1実施形態では、ウェブサイトが検索対象に相当するので、種々のウェブサイトから抽出された語を含むインデックスが格納される。
検索クエリ取得部101は、少なくとも1つのトークンを含む検索クエリを取得する。第1実施形態では、ユーザ端末20は、ユーザが入力した検索クエリをサーバ10に送信するので、検索クエリ取得部101は、ユーザ端末20から検索クエリを取得する。検索クエリは、データ記憶部100に予め記憶されていてもよい。この場合、検索クエリ取得部101は、データ記憶部100から検索クエリを取得する。検索クエリ取得部101は、サーバ10又はユーザ端末20以外の他のコンピュータから検索クエリを取得してもよい。
マッチング実行部102は、検索クエリ取得部101により取得された検索クエリに基づいて、辞書データDを利用したマッチングを実行する。マッチングとは、検索クエリと、辞書データDに格納された語と、を比較することである。第1実施形態では、検索クエリに含まれる個々のトークンと、辞書データDに格納された語と、を比較することがマッチングに相当する場合を説明するが、検索クエリに含まれる複数のトークンと、辞書データDに格納された語と、を比較することがマッチングに相当してもよい。
共起尺度取得部103は、検索クエリ取得部101により取得された検索クエリに基づいて、共起尺度を取得する。共起尺度は、複数の語の関連性の高さに関する情報である。即ち、共起尺度は、複数の語の共起のしやすさに関する情報である。例えば、同時に登場しやすい複数の語は、共起尺度の値が高くなる。第1実施形態では、共起尺度が数値によって表現される場合を説明するが、共起尺度は、文字又は記号によって表現されてもよい。例えば、ある語と他の語の共起尺度の数値が高いほど、これらの語の関連性が高いことを意味する。共起尺度は、好ましくは、自己相互情報量(MI)である。一の実施形態において、共起尺度は、自己相互情報量に代えて、tスコアであってよく、zスコアであってよく、Log-likelihoodであってよく、ダイス係数であってよく、MI3であってよく、既知の手法に基づき定量化された共起のしやすさであってよい。Log-likelihood及びtスコア等は、仮設検定の方法を利用した共起尺度の一例である。一方で、自己相互情報量及びMI3等は、情報理論を利用した共起尺度の一例である。例えば、共起尺度は、共起頻度、共起有意性、エフェクトサイズ、又はこれらの組み合わせに基づいた計算方法であってよい。
出力取得部104は、検索クエリ取得部101により取得された検索クエリに基づいて、チャンキングに関する学習モデルMからの出力を取得する。第1実施形態では、マッチング実行部102により辞書データDに存在すると判定されたトークンは、学習モデルMに入力されない場合を説明するが、出力取得部104は、マッチング結果に関係なく検索クエリの全てのトークンを学習モデルMに入力してもよい。他にも例えば、共起尺度が閾値以上のトークンは、学習モデルMに入力されなくてもよい。
チャンキング実行部105は、マッチングの実行結果と、学習モデルMからの出力と、に基づいて、検索クエリに関するチャンキングを実行する。第1実施形態では、共起尺度も利用されるので、チャンキング実行部105は、マッチングの実行結果、学習モデルMからの出力、及び共起尺度に基づいて、検索クエリに関するチャンキングを実行する。検索クエリに関するチャンキングとは、検索クエリに含まれる1つのトークンを複数のトークンに分割すること、又は、検索クエリに含まれる複数のトークンを1つのトークンに結合することである。
検索処理実行部106は、検索対象データベースDBと、チャンキングの実行結果と、に基づいて、検索処理を実行する。検索処理実行部106は、検索対象データベースDBに格納されたインデックスと、チャンキング実行部105によるチャンキングによって取得されたトークンと、を比較することによって、検索処理を実行する。検索処理自体は、公知の種々の方法を利用可能である。例えば、チャンキング実行部105により複数のトークンが取得された場合には、検索処理実行部106は、複数のトークンをOR条件で検索処理を実行する。図2の例であれば、検索クエリ「Tokyo restaurant」と、検索クエリ「U.S.A. championship」と、はチャンキングされないので、検索処理実行部106は、これらの検索クエリのまま検索処理を実行する。
提示部107は、検索クエリを入力したユーザに、検索処理の実行結果を提示する。第1実施形態では、画像を利用して視覚的に実行結果が提示される場合を説明するが、音声を利用して聴覚的に実行結果が提示されてもよい。検索処理の実行結果は、検索でヒットしたインデックスの一覧である。例えば、提示部107は、検索処理の実行結果を含む画面の表示データ(例えば、HTMLデータ)を生成し、ユーザ端末20に送信する。
図6は、第1実施形態で実行される処理の一例を示すフロー図である。この処理は、制御部11,21が記憶部12,22に記憶されたプログラムに従って動作することによって実行される。
次に、チャンキング実行システムSの別実施形態である第2実施形態を説明する。第1実施形態では、ウェブサイトの検索サービスにおいて英語の検索クエリが入力される場合を例に挙げて説明した。チャンキング実行システムSは、任意のサービスにおける任意の言語の検索クエリに適用可能であり、サービス及び言語は、第1実施形態の例に限られない。第2実施形態では、オンラインショッピングサービスにおいて日本語の検索クエリが入力される場合を例に挙げる。なお、第1実施形態と同様の点は、説明を省略する。
図7は、第2実施形態の概要を示す図である。例えば、ユーザは、ユーザ端末20のブラウザ又はアプリケーションを起動し、オンラインショッピングサービスのトップページP2にアクセスする。第2実施形態では、サーバ10が、オンラインショッピングサービスのトップページを含む種々のページを、ユーザに提供可能であるものとする。ユーザは、入力フォームF20に任意の検索クエリを入力し、所望の商品を検索する。ユーザは、検索クエリの1つとして、ジャンル、在庫の有無、カラー、サイズ、産地、又はメーカー等の種々の属性を指定することもできる。検索クエリは、オンラインショッピングサービスの検索時に入力される。
図9は、第2実施形態で実現される機能の一例を示す機能ブロック図である。サーバ10は、第1実施形態と共通の機能を有するが、一部の機能が異なる。特定部108及び分割部109は、制御部11を主として実現される。
データ記憶部100は、第1実施形態と概ね同様であるが、データ記憶部100が記憶するデータの詳細が第1実施形態とは異なる。例えば、検索対象データベースDBは、オンラインショッピングモールで販売される商品に関する情報を含む。例えば、検索対象データベースDBは、商品を販売する店舗を識別可能な店舗ID、個々の商品を識別可能な商品ID、商品の検索用に抽出されたキーワードを含むインデックス、商品タイトル、商品ジャンル等の属性、商品の詳細な説明文、商品の画像、及び商品の価格といった情報が格納される。商品タイトルは、商品の簡単な説明を示す文字列である。商品タイトルは、単語の羅列であってもよい。商品タイトルや商品の詳細な説明文等は、店舗の担当者によって入力される。
検索クエリ取得部101は、第1実施形態と同様である。
マッチング実行部102は、複数の辞書データDを利用したマッチングを実行する。個々の辞書データDのマッチング自体は、第1実施形態で説明した通りである。第2実施形態では、マッチング実行部102は、第1マッチング実行部102A、第2マッチング実行部102B、及び第3マッチング実行部102Cを含む場合を説明するが、マッチング実行部102は、第1マッチング実行部102A及び第2マッチング実行部102Bだけを含んでもよい。他にも例えば、マッチング実行部102は、第1マッチング実行部102A及び第3マッチング実行部102Cだけを含んでもよいし、第2マッチング実行部102B及び第3マッチング実行部102Cだけを含んでもよい。
共起尺度取得部103は、第1共起尺度取得部103A及び第2共起尺度取得部103Bを含む。第2実施形態では、第1共起尺度取得部103Aが第2共起尺度取得部103Bよりも先に処理を実行する場合を説明するが、第2共起尺度取得部103Bが第1共起尺度取得部103Aよりも先に処理を実行してもよい。
出力取得部104は、第1実施形態と同様である。
チャンキング実行部105は、複数の辞書データDを利用したマッチングの実行結果と、学習モデルMからの出力と、に基づいて、チャンキングを実行する。例えば、チャンキング実行部105は、第1マッチングの実行結果、第2マッチングの実行結果、及び学習モデルMからの出力に基づいて、チャンキングを実行してもよい。個々のマッチングの実行結果に基づくチャンキングの実行方法は、第1実施形態と同様であり、チャンキング実行部105は、マッチングしたトークンについては、チャンキングしないと決定する。
検索処理実行部106は、第1実施形態と同様である。
提示部107は、第1実施形態と同様である。
特定部108は、検索クエリに対応する商品ジャンルを特定する。商品ジャンルは、商品を分類するために利用される情報である。商品ジャンルは、商品カテゴリと呼ばれることもある。商品ジャンルは、商品の属性の1つである。検索クエリに対応する商品ジャンルとは、検索クエリに関連付けられた商品ジャンルである。例えば、検索クエリに商品ジャンルが含まれる場合には、検索クエリに含まれる商品ジャンルは、検索クエリに対応する商品ジャンルである。検索クエリに商品ジャンルが付帯する場合には、検索クエリに付帯した商品ジャンルは、検索クエリに対応する商品ジャンルである。
分割部109は、形態素解析に基づいて、検索クエリに含まれる少なくとも1つのトークンを分割する。分割部109は、先述した公知のツールに基づいて、検索クエリに含まれるトークンを形態素に分割する。形態素解析のツールについては、先述したように、公知の種々のツールを利用可能である。図8の例であれば、トークン1は、文字1-1及び文字1-2からなる形態素と、文字1-3からなる形態素と、に分割される。トークン2-1,2-2は、これ以上分割されない。トークン3は、文字3-1及び文字3-2からなる形態素、文字3-3からなる形態素、及び文字3-4からなる形態素に分割される。トークン4は、文字2-1~文字2-4からなる形態素と、文字2-5,2-6からなる形態素と、に分割される。トークン5-1~5-3は、これ以上分割されない。ただし、第2実施形態では、全てのトークンが形態素解析の対象になるとは限らないので、あくまで形態素解析の対象となったトークンに対して形態素解析が実行される。
図10及び図11は、第2実施形態で実行される処理の一例を示すフロー図である。この処理は、制御部11,21が記憶部12,22に記憶されたプログラムに従って動作することによって実行される。
なお、本開示は、以上に説明した実施形態に限定されるものではない。本開示の趣旨を逸脱しない範囲で、適宜変更可能である。
Claims (7)
- 少なくとも1つのトークンを含む検索クエリを取得する検索クエリ取得部と、
前記検索クエリに基づいて、チャンキングに関する学習モデルからの出力を取得する出
力取得部と、
前記検索クエリに基づいて、共起尺度を取得する共起尺度取得部と、
辞書データを利用したマッチングにより前記辞書データに存在すると判定された前記トークンを前記検索クエリから抜き出して、残りの前記トークンについて、前記学習モデルからの出力と、前記共起尺度と、に基づいて、前記検索クエリに関するチャンキングを実行するチャンキング実行部と、
を含むチャンキング実行システム。 - 複数のトークンを含む検索クエリを取得する検索クエリ取得部と、
形態素解析に基づいて、前記複数のトークンを複数の形態素に分割する分割部と、
前記形態素解析により分割される前の前記複数のトークンのつながりに関する第1共起尺度を取得し、前記形態素解析により分割された形態素に基づいて、接尾語又は接頭語に関する第2共起尺度を取得する共起尺度取得部と、
辞書データを利用したマッチングにより前記辞書データに存在すると判定された前記トークンを前記検索クエリから抜き出して、残りの前記トークンについて、前記第1共起尺度に基づいて、つながりのあるトークン同士が1つのトークンとなるように、前記検索クエリに関するチャンキングを実行し、前記第2共起尺度に基づいて、接尾語とその前の形態素が1つのトークンとなるように、又は、接頭語とその後の形態素が1つのトークンとなるように、前記チャンキングを実行するチャンキング実行部と、
を含むチャンキング実行システム。 - 前記共起尺度取得部は、
前記複数のトークンに基づいて、過去のマッチング率が相対的に高い第1算出方法を利用した前記第1共起尺度を取得し、
前記複数のトークンのうちの前記第1共起尺度が閾値未満のトークンに基づいて、過去のマッチング率が相対的に低い第2算出方法を利用した前記第2共起尺度を取得する、
請求項2に記載のチャンキング実行システム。 - コンピュータが、
少なくとも1つのトークンを含む検索クエリを取得する検索クエリ取得ステップと、
前記検索クエリに基づいて、チャンキングに関する学習モデルからの出力を取得する出力取得ステップと、
前記検索クエリに基づいて、共起尺度を取得する共起尺度取得ステップと、
辞書データを利用したマッチングにより前記辞書データに存在すると判定された前記トークンを前記検索クエリから抜き出して、残りの前記トークンについて、前記学習モデルからの出力と、前記共起尺度と、に基づいて、前記検索クエリに関するチャンキングを実行するチャンキング実行ステップと、
を実行するチャンキング実行方法。 - コンピュータが、
複数のトークンを含む検索クエリを取得する検索クエリ取得ステップと、
形態素解析に基づいて、前記複数のトークンを複数の形態素に分割する分割ステップと、
前記形態素解析により分割される前の前記複数のトークンのつながりに関する第1共起尺度を取得し、前記形態素解析により分割された形態素に基づいて、接尾語又は接頭語に関する第2共起尺度を取得する共起尺度取得ステップと、
辞書データを利用したマッチングにより前記辞書データに存在すると判定された前記トークンを前記検索クエリから抜き出して、残りの前記トークンについて、前記第1共起尺度に基づいて、つながりのあるトークン同士が1つのトークンとなるように、前記検索クエリに関するチャンキングを実行し、前記第2共起尺度に基づいて、接尾語とその前の形態素が1つのトークンとなるように、又は、接頭語とその後の形態素が1つのトークンとなるように、前記チャンキングを実行するチャンキング実行ステップと、
を実行するチャンキング実行方法。 - 少なくとも1つのトークンを含む検索クエリを取得する検索クエリ取得部、
前記検索クエリに基づいて、チャンキングに関する学習モデルからの出力を取得する出力取得部、
前記検索クエリに基づいて、共起尺度を取得する共起尺度取得部、
辞書データを利用したマッチングにより前記辞書データに存在すると判定された前記トークンを前記検索クエリから抜き出して、残りの前記トークンについて、前記学習モデルからの出力と、前記共起尺度と、に基づいて、前記検索クエリに関するチャンキングを実行するチャンキング実行部、
としてコンピュータを機能させるためのプログラム。 - 複数のトークンを含む検索クエリを取得する検索クエリ取得部、
形態素解析に基づいて、前記複数のトークンを複数の形態素に分割する分割部、
前記形態素解析により分割される前の前記複数のトークンのつながりに関する第1共起尺度を取得し、前記形態素解析により分割された形態素に基づいて、接尾語又は接頭語に関する第2共起尺度を取得する共起尺度取得部、
辞書データを利用したマッチングにより前記辞書データに存在すると判定された前記トークンを前記検索クエリから抜き出して、残りの前記トークンについて、前記第1共起尺度に基づいて、つながりのあるトークン同士が1つのトークンとなるように、前記検索クエリに関するチャンキングを実行し、前記第2共起尺度に基づいて、接尾語とその前の形態素が1つのトークンとなるように、又は、接頭語とその後の形態素が1つのトークンとなるように、前記チャンキングを実行するチャンキング実行部、
としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/488,336 US20230096564A1 (en) | 2021-09-29 | 2021-09-29 | Chunking execution system, chunking execution method, and information storage medium |
US17/488,336 | 2021-09-29 | ||
JP2022111420A JP7216241B1 (ja) | 2021-09-29 | 2022-07-11 | チャンキング実行システム、チャンキング実行方法、及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022111420A Division JP7216241B1 (ja) | 2021-09-29 | 2022-07-11 | チャンキング実行システム、チャンキング実行方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023050201A JP2023050201A (ja) | 2023-04-10 |
JP7326637B2 true JP7326637B2 (ja) | 2023-08-15 |
Family
ID=82899089
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022111420A Active JP7216241B1 (ja) | 2021-09-29 | 2022-07-11 | チャンキング実行システム、チャンキング実行方法、及びプログラム |
JP2023006662A Active JP7326637B2 (ja) | 2021-09-29 | 2023-01-19 | チャンキング実行システム、チャンキング実行方法、及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022111420A Active JP7216241B1 (ja) | 2021-09-29 | 2022-07-11 | チャンキング実行システム、チャンキング実行方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230096564A1 (ja) |
EP (1) | EP4160441A1 (ja) |
JP (2) | JP7216241B1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080154577A1 (en) | 2006-12-26 | 2008-06-26 | Sehda,Inc. | Chunk-based statistical machine translation system |
US20180032574A1 (en) | 2016-07-31 | 2018-02-01 | Appdynamics Llc | Dynamic Streaming of Results of Multi-Leveled Queries |
WO2018179355A1 (ja) | 2017-03-31 | 2018-10-04 | 日本電気株式会社 | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6775666B1 (en) * | 2001-05-29 | 2004-08-10 | Microsoft Corporation | Method and system for searching index databases |
US11100124B2 (en) * | 2014-05-09 | 2021-08-24 | Camelot Uk Bidco Limited | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches |
US11640436B2 (en) * | 2017-05-15 | 2023-05-02 | Ebay Inc. | Methods and systems for query segmentation |
-
2021
- 2021-09-29 US US17/488,336 patent/US20230096564A1/en active Pending
-
2022
- 2022-07-11 JP JP2022111420A patent/JP7216241B1/ja active Active
- 2022-08-11 EP EP22189910.7A patent/EP4160441A1/en active Pending
-
2023
- 2023-01-19 JP JP2023006662A patent/JP7326637B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080154577A1 (en) | 2006-12-26 | 2008-06-26 | Sehda,Inc. | Chunk-based statistical machine translation system |
US20180032574A1 (en) | 2016-07-31 | 2018-02-01 | Appdynamics Llc | Dynamic Streaming of Results of Multi-Leveled Queries |
WO2018179355A1 (ja) | 2017-03-31 | 2018-10-04 | 日本電気株式会社 | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2023050092A (ja) | 2023-04-10 |
JP7216241B1 (ja) | 2023-01-31 |
EP4160441A1 (en) | 2023-04-05 |
JP2023050201A (ja) | 2023-04-10 |
US20230096564A1 (en) | 2023-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Burger et al. | Discriminating gender on Twitter | |
JP5936698B2 (ja) | 単語意味関係抽出装置 | |
AU2016269573B2 (en) | Input entity identification from natural language text information | |
CN105095204B (zh) | 同义词的获取方法及装置 | |
US10496928B2 (en) | Non-factoid question-answering system and method | |
US9483460B2 (en) | Automated formation of specialized dictionaries | |
CN102214189B (zh) | 基于数据挖掘获取词用法知识的系统及方法 | |
US11537795B2 (en) | Document processing device, document processing method, and document processing program | |
CN108319583B (zh) | 从中文语料库提取知识的方法与系统 | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN111444713B (zh) | 新闻事件内实体关系抽取方法及装置 | |
CN103608805B (zh) | 辞典产生装置及方法 | |
Ghosh et al. | A rule based extractive text summarization technique for Bangla news documents | |
JP4979637B2 (ja) | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム | |
WO2019163642A1 (ja) | 要約評価装置、方法、プログラム、及び記憶媒体 | |
JP2014132406A (ja) | 同義語抽出システム、方法およびプログラム | |
Nanba et al. | Bilingual PRESRI-Integration of Multiple Research Paper Databases. | |
CN114255067A (zh) | 数据定价方法和装置、电子设备、存储介质 | |
JP7326637B2 (ja) | チャンキング実行システム、チャンキング実行方法、及びプログラム | |
CN108763258B (zh) | 文档主题参数提取方法、产品推荐方法、设备及存储介质 | |
CN113449063B (zh) | 一种构建文档结构信息检索库的方法及装置 | |
JPWO2018025317A1 (ja) | 自然言語処理装置及び自然言語処理方法 | |
JP7441982B2 (ja) | クエリ整形システム、クエリ整形方法、及びプログラム | |
JP7139271B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230119 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7326637 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |