JP7598901B2 - Query shaping system, query shaping method, and program - Google Patents
Query shaping system, query shaping method, and program Download PDFInfo
- Publication number
- JP7598901B2 JP7598901B2 JP2022104459A JP2022104459A JP7598901B2 JP 7598901 B2 JP7598901 B2 JP 7598901B2 JP 2022104459 A JP2022104459 A JP 2022104459A JP 2022104459 A JP2022104459 A JP 2022104459A JP 7598901 B2 JP7598901 B2 JP 7598901B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- conversion
- shaping
- search
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本開示は、クエリ整形システム、クエリ整形方法、及びプログラムに関する。 The present disclosure relates to a query shaping system, a query shaping method, and a program.
従来、ユーザが入力したクエリに応じた検索結果とともに、当該クエリに応じた広告を表示させる検索連動型広告が知られている。検索連動型広告でコンバージョンが発生したコンバージョンクエリは、種々の目的で利用できるので、非常に有用な情報である。例えば、コンバージョンクエリは、検索連動型広告におけるインデックス又は表示用キーワードとして利用したり、ユーザの傾向を分析するためのマーケティングに利用したりすることができる。 Search-based advertising is known in the past, which displays search results corresponding to a query entered by a user along with advertisements corresponding to the query. Conversion queries that result in conversions in search-based advertising are very useful information, as they can be used for a variety of purposes. For example, conversion queries can be used as indexes or display keywords in search-based advertising, or in marketing to analyze user trends.
検索連動型広告では、必ずしも、コンバージョンクエリが適切な状態で取得されるとは限らない。例えば、スペースが一切挿入されなかったり、逆に、不要なほど多くのスペースが挿入されたりすることがあるので、コンバージョンクエリを適切に整形することが求められている。例えば、特許文献1には、検索ログのクエリからスペースを削除した後に、複数の文字列に分割することによって、クエリを整形することが記載されている。 In search-based advertising, conversion queries are not necessarily acquired in an appropriate state. For example, no spaces may be inserted, or conversely, an unnecessary number of spaces may be inserted, so it is necessary to appropriately format the conversion query. For example, Patent Document 1 describes a method of formatting the query by deleting spaces from the query in the search log and then splitting it into multiple character strings.
しかしながら、特許文献1には、コンバージョンに関係なく過去に入力された多数のクエリが格納された検索ログのクエリを整形することが記載されているにすぎない。このため、特許文献1の技術は、検索連動型広告におけるコンバージョンクエリを整形するものではない。従来の技術では、検索連動型広告におけるコンバージョンクエリを適切な状態に整形することはできなかった。 However, Patent Document 1 only describes shaping queries in a search log that stores a large number of queries entered in the past regardless of conversion. For this reason, the technology in Patent Document 1 does not shape conversion queries in paid search advertising. Conventional technology has not been able to shape conversion queries in paid search advertising into an appropriate state.
本開示の目的の1つは、検索連動型広告におけるコンバージョンクエリを適切な状態に整形することである。 One of the objectives of this disclosure is to appropriately shape conversion queries in search advertising.
本開示に係るクエリ整形システムは、検索連動型広告に関するコンバージョンが発生したコンバージョンクエリを取得する取得部と、クエリ整形に関する訓練データが学習された学習モデルに基づいて、前記コンバージョンクエリを整形するクエリ整形部と、前記クエリ整形部により整形された整形済みの前記コンバージョンクエリに基づいて、所定の処理を実行する処理実行部と、を含む。 The query shaping system according to the present disclosure includes an acquisition unit that acquires a conversion query in which a conversion related to a search-based advertisement has occurred, a query shaping unit that shapes the conversion query based on a learning model in which training data related to query shaping has been learned, and a processing execution unit that executes a predetermined process based on the conversion query that has been shaped by the query shaping unit.
本開示によれば、検索連動型広告におけるコンバージョンクエリを適切な状態に整形できる。 According to this disclosure, it is possible to appropriately shape conversion queries in search-based advertising.
[1.第1実施形態]
本開示に係る実施形態の一例である第1実施形態を説明する。第1実施形態では、EC(Electronic Commerce)サービスの運営者がクエリ整形システムを利用する場合を例に挙げる。クエリ整形システムは、ECサービス以外の他のサービスにも適用可能である。他のサービスへの適用例は、後述の変形例で説明する。
[1. First embodiment]
A first embodiment, which is an example of an embodiment according to the present disclosure, will be described. In the first embodiment, a case where an operator of an EC (Electronic Commerce) service uses a query shaping system will be described as an example. The query shaping system can also be applied to services other than the EC service. Examples of application to other services will be described in the modified examples described later.
[1-1.クエリ整形システムの全体構成]
図1は、クエリ整形システムの全体構成の一例を示す図である。例えば、クエリ整形システム1は、ECサーバ10及び広告主端末20を含む。クエリ整形システム1の外部には、検索サーバ30及びユーザ端末40が存在する。ECサーバ10、広告主端末20、検索サーバ30、及びユーザ端末40の各々は、インターネット又はLAN等のネットワークNに接続可能である。
[1-1. Overall configuration of the query shaping system]
1 is a diagram showing an example of the overall configuration of a query shaping system. For example, the query shaping system 1 includes an EC server 10 and an advertiser terminal 20. A search server 30 and a user terminal 40 exist outside the query shaping system 1. Each of the EC server 10, the advertiser terminal 20, the search server 30, and the user terminal 40 can be connected to a network N such as the Internet or a LAN.
ECサーバ10は、ECサービスにおけるサーバコンピュータである。例えば、ECサーバ10は、制御部11、記憶部12、及び通信部13を含む。制御部11は、少なくとも1つのプロセッサを含む。記憶部12は、RAM等の揮発性メモリと、フラッシュメモリ等の不揮発性メモリと、を含む。通信部13は、有線通信用の通信インタフェースと、無線通信用の通信インタフェースと、の少なくとも一方を含む。 The EC server 10 is a server computer in the EC service. For example, the EC server 10 includes a control unit 11, a memory unit 12, and a communication unit 13. The control unit 11 includes at least one processor. The memory unit 12 includes a volatile memory such as a RAM, and a non-volatile memory such as a flash memory. The communication unit 13 includes at least one of a communication interface for wired communication and a communication interface for wireless communication.
広告主端末20は、検索サービスに検索連動型広告を掲載する広告主のコンピュータである。第1実施形態では、ECサービスの運営者が広告主である場合を説明するが、広告主は、ECサービスに出店する店舗又は商品メーカーといった他の者であってもよい。例えば、広告主端末20は、パーソナルコンピュータ、スマートフォン、タブレット端末、又はウェアラブル端末である。 The advertiser terminal 20 is a computer of an advertiser that places search-linked advertisements in a search service. In the first embodiment, a case is described in which the operator of an EC service is the advertiser, but the advertiser may be another party such as a store that opens a shop in the EC service or a product manufacturer. For example, the advertiser terminal 20 is a personal computer, a smartphone, a tablet terminal, or a wearable terminal.
例えば、広告主端末20は、制御部21、記憶部22、通信部23、操作部24、及び表示部25を含む。制御部21、記憶部22、及び通信部23の物理的構成は、それぞれ制御部11、記憶部12、及び通信部13と同様である。操作部24は、タッチパネル又はマウス等の入力デバイスである。表示部25は、液晶ディスプレイ又は有機ELディスプレイである。 For example, the advertiser terminal 20 includes a control unit 21, a memory unit 22, a communication unit 23, an operation unit 24, and a display unit 25. The physical configurations of the control unit 21, the memory unit 22, and the communication unit 23 are similar to those of the control unit 11, the memory unit 12, and the communication unit 13, respectively. The operation unit 24 is an input device such as a touch panel or a mouse. The display unit 25 is a liquid crystal display or an organic EL display.
検索サーバ30は、検索サービスにおけるサーバコンピュータである。第1実施形態では、ウェブページの検索サービスを例に挙げるが、検索サービスは、コンテンツ、商品、サービス、又は文書といった他の検索対象を検索するサービスであってもよい。例えば、検索サーバ30は、制御部31、記憶部32、及び通信部33を含む。制御部31、記憶部32、及び通信部33の物理的構成は、それぞれ制御部11、記憶部12、及び通信部13と同様である。 The search server 30 is a server computer in a search service. In the first embodiment, a search service for web pages is taken as an example, but the search service may be a service for searching other search targets such as content, products, services, or documents. For example, the search server 30 includes a control unit 31, a memory unit 32, and a communication unit 33. The physical configurations of the control unit 31, the memory unit 32, and the communication unit 33 are similar to those of the control unit 11, the memory unit 12, and the communication unit 13, respectively.
ユーザ端末40は、ユーザのコンピュータである。例えば、ユーザ端末40は、パーソナルコンピュータ、スマートフォン、タブレット端末、又はウェアラブル端末である。例えば、ユーザ端末40は、制御部41、記憶部42、通信部43、操作部44、及び表示部45を含む。制御部41、記憶部42、通信部43、操作部44、及び表示部45の物理的構成は、それぞれ制御部11、記憶部12、通信部13、操作部24、及び表示部25と同様である。 The user terminal 40 is a user's computer. For example, the user terminal 40 is a personal computer, a smartphone, a tablet terminal, or a wearable terminal. For example, the user terminal 40 includes a control unit 41, a memory unit 42, a communication unit 43, an operation unit 44, and a display unit 45. The physical configurations of the control unit 41, the memory unit 42, the communication unit 43, the operation unit 44, and the display unit 45 are similar to those of the control unit 11, the memory unit 12, the communication unit 13, the operation unit 24, and the display unit 25, respectively.
なお、記憶部12,22,32,42に記憶されるプログラムは、ネットワークNを介して供給されてもよい。また、コンピュータ読み取り可能な情報記憶媒体を読み取る読取部(例えば、メモリカードスロット)と、外部機器とデータの入出力をするための入出力部(例えば、USBポート)と、の少なくとも一方が各コンピュータに含まれてもよい。例えば、情報記憶媒体に記憶されたプログラムが、読取部及び入出力部の少なくとも一方を介して供給されてもよい。 The programs stored in the storage units 12, 22, 32, and 42 may be supplied via the network N. Each computer may also include at least one of a reading unit (e.g., a memory card slot) that reads a computer-readable information storage medium and an input/output unit (e.g., a USB port) for inputting and outputting data to and from an external device. For example, a program stored in an information storage medium may be supplied via at least one of the reading unit and the input/output unit.
また、クエリ整形システム1は、少なくとも1つのコンピュータを含めばよく、図1の例に限られない。例えば、クエリ整形システム1は、ECサーバ10を含まずに、広告主端末20だけを含んでもよい。この場合、ECサーバ10は、クエリ整形システム1の外部に存在する。例えば、クエリ整形システム1は、広告主端末20を含まずに、ECサーバ10だけを含んでもよい。この場合、広告主端末20は、クエリ整形システム1の外部に存在し、ECサーバ10は、広告主端末20と同様の機能を有する。 Furthermore, the query shaping system 1 only needs to include at least one computer, and is not limited to the example of FIG. 1. For example, the query shaping system 1 may include only the advertiser terminal 20 without including the EC server 10. In this case, the EC server 10 exists outside the query shaping system 1. For example, the query shaping system 1 may include only the EC server 10 without including the advertiser terminal 20. In this case, the advertiser terminal 20 exists outside the query shaping system 1, and the EC server 10 has the same functions as the advertiser terminal 20.
[1-2.クエリ整形システムの概要]
第1実施形態では、ECサービスの運営者は、検索サービスに対し、検索連動型広告の掲載を依頼する。検索連動型広告は、検索サービスで検索結果とともに表示される広告である。検索連動型広告は、クエリに関連する広告である。クエリは、ユーザが入力した検索条件である。クエリは、キーワードと呼ばれることもある。検索サービスで利用される検索エンジン、クエリ、及び検索連動型広告自体は、種々のタイプを利用可能である。クエリは、日本語、中国語、又は英語といった任意の言語で入力可能である。
[1-2. Overview of the Query Reshaping System]
In the first embodiment, an operator of an EC service requests a search service to place a search-related advertisement. A search-related advertisement is an advertisement displayed together with search results in a search service. A search-related advertisement is an advertisement related to a query. A query is a search condition input by a user. A query is sometimes called a keyword. Various types of search engines, queries, and search-related advertisements themselves used in a search service are available. A query can be input in any language, such as Japanese, Chinese, or English.
図2は、検索サービスで検索連動型広告が表示されて、ECサービスでコンバージョンが発生する流れの一例を示す図である。コンバージョンは、検索連動型広告の成果である。第1実施形態では、商品が購入されることがコンバージョンに相当する場合を説明するが、コンバージョンは、目標となる行動が行われた状態であればよく、商品の購入に限られない。例えば、コンバージョンは、検索連動型広告を選択すること、特定のウェブページを表示させること、特定のデータをダウンロードすること、又は商品を買い物かごに入れることであってもよい。 Figure 2 is a diagram showing an example of a flow in which a search-based advertisement is displayed on a search service and a conversion occurs on an EC service. A conversion is the result of a search-based advertisement. In the first embodiment, a case is described in which a conversion corresponds to the purchase of a product, but a conversion can be any state in which a target action is taken, and is not limited to the purchase of a product. For example, a conversion can be selecting a search-based advertisement, displaying a specific web page, downloading specific data, or adding a product to a shopping cart.
例えば、ユーザ端末40が検索サーバ30にアクセスすると、検索サービスのトップ画面SC1が表示部45に表示される。ユーザは、トップ画面SC1の入力フォームF10に、クエリを入力する。ユーザがボタンB11を選択すると、検索サーバ30は、ユーザが入力したクエリに基づいて、ウェブページの検索と、検索連動型広告の検索と、を実行する。ユーザ端末40が検索サーバ30からこれらの実行結果を受信すると、検索結果画面SC2が表示部45に表示される。 For example, when the user terminal 40 accesses the search server 30, the top screen SC1 of the search service is displayed on the display unit 45. The user inputs a query into the input form F10 on the top screen SC1. When the user selects the button B11, the search server 30 executes a search for web pages and a search-related advertisement based on the query entered by the user. When the user terminal 40 receives the results of these executions from the search server 30, the search result screen SC2 is displayed on the display unit 45.
例えば、検索結果画面SC2は、検索連動型広告を表示するための表示領域A20と、検索結果を表示するための表示領域A21と、を含む。クエリにヒットする検索連動型広告が存在しなければ、表示領域A20には、検索連動型広告が表示されない。検索連動型広告は、ECサービスへのリンクを含む。リンクは、クエリと、検索連動型広告を識別可能な広告IDと、を引数として含む。リンクの引数により、ECサービスの運営者は、何のクエリによってどの検索連動型広告が選択されたかを特定できる。 For example, the search result screen SC2 includes a display area A20 for displaying search-related advertisements, and a display area A21 for displaying search results. If there are no search-related advertisements that match the query, the search-related advertisements are not displayed in the display area A20. The search-related advertisements include a link to an EC service. The link includes the query and an advertisement ID that can identify the search-related advertisement as arguments. The link arguments enable the operator of the EC service to identify which search-related advertisement was selected by which query.
第1実施形態では、検索サービスにおいて、ユーザが入力したクエリに対し、形態素解析が実行されるものとする。検索サービスでは、ユーザが入力したクエリが形態素に分割され、不要な語が除去されたうえで検索が実行される。ECサービスの運営者は、検索サービスの運営者とは異なる。このため、ECサービスの運営者は、検索サービス側でどのような形態素解析が実行されるかを把握できないものとする。 In the first embodiment, in the search service, morphological analysis is performed on the query entered by the user. In the search service, the query entered by the user is divided into morphemes, unnecessary words are removed, and then a search is performed. The operator of the EC service is different from the operator of the search service. For this reason, the operator of the EC service is not able to know what kind of morphological analysis is performed on the search service side.
例えば、表示領域A20には、形態素に分割されたクエリと、ECサービスへのリンクと、が表示される。リンクの引数に含まれるクエリは、形態素に分割されたクエリである。入力フォームF22には、形態素に分割される前のクエリが表示される。ただし、検索サービスの内部的には、入力フォームF22ではなく、表示領域A20に表示されたクエリに基づいて検索が実行されるものとしてよい。ユーザは、入力フォームF22に対し、再びクエリを入力して検索を実行することもできる。 For example, the display area A20 displays a query divided into morphemes and a link to an EC service. The query included in the link's argument is the query divided into morphemes. The input form F22 displays the query before it is divided into morphemes. However, within the search service, a search may be performed based on the query displayed in the display area A20, not on the input form F22. The user can also perform a search by inputting a query again into the input form F22.
例えば、ユーザが表示領域A20の検索連動型広告を選択すると、ユーザ端末40がECサーバ10にアクセスして商品画面SC3が表示部45に表示される。商品画面SC3は、検索連動型広告のリンク先のウェブページである。ユーザが、ECサービスで商品を買い物かごに入れて注文手続を完了すると、注文完了画面SC4が表示部45に表示される。商品の注文手続自体は、公知のECサービスと同じ流れであってよい。 For example, when a user selects a search-based advertisement in display area A20, the user terminal 40 accesses the EC server 10 and a product screen SC3 is displayed on the display unit 45. The product screen SC3 is a web page linked to by the search-based advertisement. When a user adds a product to the shopping cart in the EC service and completes the ordering procedure, an order completion screen SC4 is displayed on the display unit 45. The product ordering procedure itself may be the same as that of known EC services.
第1実施形態では、ユーザが、検索連動型広告を選択してECサーバにアクセスし、商品の注文を完了することが、コンバージョンに相当する。以降、コンバージョンが発生したクエリを、コンバージョンクエリという。表示領域A20では、コンバージョンクエリが形態素に分割された状態で表示されるので、ユーザが違和感を抱く可能性がある。更に、表示領域A20に表示されるコンバージョンクエリの見栄えが悪いので、検索連動型広告の訴求効果が低下する可能性がある。 In the first embodiment, a conversion occurs when a user selects a search-based advertisement, accesses an EC server, and completes an order for a product. Hereinafter, a query that has resulted in a conversion is referred to as a conversion query. In the display area A20, the conversion query is displayed divided into morphemes, which may cause a sense of incongruity to the user. Furthermore, the conversion query displayed in the display area A20 does not look good, which may reduce the appeal of the search-based advertisement.
例えば、検索サービス側で、形態素に分割される前のコンバージョンクエリ(入力フォームF22と同じ状態のコンバージョンクエリ)を表示領域A20に表示させるようにすることも考えられる。しかしながら、ECサービスの運営者が、このような改修を要求しても、検索サービスの運営者が改修に応じない可能性がある。もし仮に、検索サービスの運営者が改修に応じたとしても、検索サービスの運営者側の負担がかかる。 For example, it is conceivable that the search service side could display in the display area A20 the conversion query before being divided into morphemes (the conversion query in the same state as the input form F22). However, even if the operator of the EC service requests such a modification, there is a possibility that the operator of the search service will not agree to the modification. Even if the operator of the search service agrees to the modification, the burden would be placed on the operator of the search service.
この点、ECサービスの運営者が、形態素に分割される前のコンバージョンクエリを取得できれば、検索サービスにおける広告主専用のデータベースに、このコンバージョンクエリを登録することによって、表示領域A20の表示を適切な状態にすることができる。しかしながら、形態素に分割された後の状態のコンバージョンクエリがリンクの引数に含まれるので、ECサービスの運営者は、適切な状態のコンバージョンクエリを取得できない。そこで、クエリ整形システム1は、形態素に分割されたコンバージョンクエリが元に戻るように整形する。 In this regard, if the operator of the EC service could obtain the conversion query before it was split into morphemes, the display in the display area A20 could be made appropriate by registering this conversion query in a database dedicated to advertisers in the search service. However, because the conversion query in the state after it has been split into morphemes is included in the link argument, the operator of the EC service cannot obtain the conversion query in an appropriate state. Therefore, the query shaping system 1 shapes the conversion query split into morphemes so that it is returned to its original state.
図3は、コンバージョンクエリを整形する流れの一例を示す図である。第1実施形態では、コンバージョンクエリに含まれる語の単位を、トークンという。トークンは、スペース又は記号等のセパレータによって分割された語である。図3の例では、ユーザが入力したコンバージョンクエリQ1は、トークンT10~T12を含む。トークンT10,T11の間と、トークンT11,T12の間と、には、セパレータが存在する。 Figure 3 is a diagram showing an example of the flow of shaping a conversion query. In the first embodiment, a unit of words included in a conversion query is called a token. A token is a word divided by a separator such as a space or a symbol. In the example of Figure 3, the conversion query Q1 entered by the user includes tokens T10 to T12. Separators exist between tokens T10 and T11 and between tokens T11 and T12.
例えば、形態素に分割された後のコンバージョンクエリQ2は、トークンT20~T27を含む。トークンT20,T21の間、トークンT21,T22の間、トークンT22,T23の間、トークンT23,T24の間、トークンT24,T25の間、トークンT25,T26の間、及びトークンT26,T27の間には、セパレータが存在する。ECサービスの運営者は、コンバージョンクエリQ2を取得する。 For example, conversion query Q2 after being divided into morphemes includes tokens T20 to T27. Separators exist between tokens T20 and T21, between tokens T21 and T22, between tokens T22 and T23, between tokens T23 and T24, between tokens T24 and T25, between tokens T25 and T26, and between tokens T26 and T27. The operator of the EC service obtains conversion query Q2.
例えば、コンバージョンクエリQ2に対し、デトークナイゼーションが実行される。デトークナイゼーションは、全部又は一部のセパレータを削除することである。図3の例では、コンバージョンクエリQ2の全てのセパレータが削除される。このため、トークンT20~T27が全て結合される。デトークナイゼーション済みのコンバージョンクエリQ3は、1つのトークンT30のみを含む。 For example, detokenization is performed on conversion query Q2. Detokenization is the removal of all or some of the separators. In the example of FIG. 3, all separators are removed from conversion query Q2. As a result, tokens T20 to T27 are all combined. The detokenized conversion query Q3 contains only one token, T30.
第1実施形態では、機械学習の手法を利用したクエリ整形モデルM1が用意されている。クエリ整形モデルM1は、デトークナイゼーションされたコンバージョンクエリQ3に対し、適切なトークナイゼーションを実行できるように学習されている。トークナイゼーションは、少なくとも1つのセパレータを挿入することである。図3の例では、クエリ整形モデルM1により整形されたコンバージョンクエリQ4は、コンバージョンクエリQ1と同じである。 In the first embodiment, a query shaping model M1 that uses a machine learning technique is prepared. The query shaping model M1 is trained so as to perform appropriate tokenization on the detokenized conversion query Q3. Tokenization is the insertion of at least one separator. In the example of FIG. 3, the conversion query Q4 shaped by the query shaping model M1 is the same as the conversion query Q1.
以上のように、クエリ整形システム1は、形態素に分割された後のコンバージョンクエリQ2に対し、デトークナイゼーションを実行したうえで、クエリ整形モデルM1でトークナイゼーションを実行することによって、コンバージョンクエリQ1を取得する。これにより、検索連動型広告におけるコンバージョンクエリを適切な状態に整形できるようになっている。以降、クエリ整形システム1の詳細を説明する。なお、図3を参照する必要がない時は、コンバージョンクエリQ1~Q4の符号を省略する。 As described above, the query shaping system 1 performs detokenization on the conversion query Q2 after it has been divided into morphemes, and then performs tokenization using the query shaping model M1 to obtain the conversion query Q1. This makes it possible to appropriately shape the conversion query in search-linked advertising. Details of the query shaping system 1 will be described below. Note that when it is not necessary to refer to FIG. 3, the reference numbers of the conversion queries Q1 to Q4 will be omitted.
[1-3.第1実施形態で実現される機能]
図4は、第1実施形態で実現される機能の一例を示す図である。
[1-3. Functions realized in the first embodiment]
FIG. 4 is a diagram illustrating an example of functions realized in the first embodiment.
[1-3-1.ECサーバで実現される機能]
例えば、ECサーバ10は、データ記憶部100及び注文処理部101を含む。データ記憶部100は、記憶部12により実現される。注文処理部101は、制御部11により実現される。
[1-3-1. Functions realized by the EC server]
For example, the EC server 10 includes a data storage unit 100 and an order processing unit 101. The data storage unit 100 is realized by the storage unit 12. The order processing unit 101 is realized by the control unit 11.
[データ記憶部]
データ記憶部100は、ECサービスの提供に必要なデータを記憶する。例えば、データ記憶部100は、商品データベースDB1と、コンバージョンデータベースDB2と、を記憶する。
[Data storage unit]
The data storage unit 100 stores data necessary for providing EC services. For example, the data storage unit 100 stores a product database DB1 and a conversion database DB2.
図5は、商品データベースDB1の一例を示す図である。商品データベースDB1は、ECサービスにおける商品に関する各種情報が格納されたデータベースである。例えば、商品データベースDB1には、店舗ID、商品ID、商品のタイトル、商品の属性、商品の価格、商品の詳細説明、及び検索用のキーワードが格納される。商品データベースDB1には、商品に関する任意の情報が格納されてよく、図5以外の他の情報が格納されてもよい。 Figure 5 is a diagram showing an example of product database DB1. Product database DB1 is a database that stores various information related to products in the EC service. For example, product database DB1 stores a store ID, product ID, product title, product attributes, product price, detailed product description, and search keywords. Product database DB1 may store any information related to products, and may also store information other than that shown in Figure 5.
店舗IDは、ECサービスにおける店舗を識別可能な店舗識別情報の一例である。店舗識別情報は、店舗名、電話番号、又はメールアドレスといった他の情報であってもよい。商品IDは、商品を識別可能な商品識別情報の一例である。商品識別情報は、商品名又はJANコードといった他の情報であってもよい。タイトル、属性、価格、詳細説明、及びキーワードは、ECサービスにおける検索時のインデックスとして利用される。検索サービスではなく、ECサービスの中でも、ユーザはクエリを入力して商品を検索できる。 The store ID is an example of store identification information that can identify a store in the EC service. The store identification information may be other information such as a store name, a phone number, or an email address. The product ID is an example of product identification information that can identify a product. The product identification information may be other information such as a product name or a JAN code. The title, attributes, price, detailed description, and keywords are used as indexes when searching in the EC service. A user can search for products by entering a query within the EC service, rather than within the search service.
図6は、コンバージョンデータベースDB2の一例を示す図である。コンバージョンデータベースDB2は、ECサービスで発生したコンバージョンに関する各種情報が格納されたデータベースである。例えば、コンバージョンクエリデータベースには、広告ID、商品ID、ユーザID、形態素に分割されたコンバージョンクエリ、及びコンバージョンの日時が格納される。コンバージョンデータベースDB2には、コンバージョンに関する任意の情報が格納されてよく、図6以外の他の情報が格納されてもよい。 Figure 6 is a diagram showing an example of a conversion database DB2. The conversion database DB2 is a database that stores various information related to conversions that occur in an EC service. For example, the conversion query database stores an advertisement ID, a product ID, a user ID, a conversion query divided into morphemes, and the date and time of the conversion. The conversion database DB2 may store any information related to the conversion, and may also store information other than that shown in Figure 6.
広告IDは、検索連動型広告を識別可能な広告識別情報の一例である。広告識別情報は、検索連動型広告を何らかの形で識別可能な情報であればよく、広告ID以外の名前で呼ばれる他の情報であってもよい。コンバージョンデータベースDB2には、コンバージョンの要因となった検索連動型広告の広告IDが格納される。広告IDは、検索連動型広告のリンクの引数に含まれる。ECサーバ10は、引数に含まれる広告IDを取得することによって、どの検索連動型広告が選択されたのかを特定できる。 The ad ID is an example of ad identification information that can identify a search-based ad. The ad identification information may be any information that can identify a search-based ad in some way, and may be information called by a name other than an ad ID. The conversion database DB2 stores the ad ID of the search-based ad that caused the conversion. The ad ID is included in the argument of the link of the search-based ad. The EC server 10 can identify which search-based ad was selected by obtaining the ad ID included in the argument.
例えば、コンバージョンデータベースDB2には、コンバージョンによって注文された商品の商品ID、商品を注文したユーザのユーザID、検索連動型広告のリンクの引数に含まれるコンバージョンクエリ、及びコンバージョンが発生した時の現在日時が格納される。第1実施形態では、コンバージョンが発生するたびに、後述の注文処理部101は、コンバージョンデータベースDB2に新たなレコードを作成し、当該コンバージョンに関する各種情報を格納する。 For example, the conversion database DB2 stores the product ID of the product ordered through the conversion, the user ID of the user who ordered the product, the conversion query included in the argument of the link of the search-based advertisement, and the current date and time when the conversion occurred. In the first embodiment, each time a conversion occurs, the order processing unit 101 described below creates a new record in the conversion database DB2 and stores various information related to the conversion.
なお、データ記憶部100に記憶されるデータは、上記の例に限られない。例えば、データ記憶部100は、ECサービスに会員登録をしたユーザに関する各種情報が格納されたユーザデータベースを記憶してもよい。ユーザデータベースには、ユーザID、パスワード、氏名、住所、電話番号、メールアドレス、商品の閲覧履歴、及び商品の購入履歴といった情報が格納される。 The data stored in the data storage unit 100 is not limited to the above examples. For example, the data storage unit 100 may store a user database that stores various information about users who have registered as members of an EC service. The user database stores information such as user ID, password, name, address, telephone number, email address, product viewing history, and product purchase history.
[注文処理部]
注文処理部101は、ユーザによる商品の注文を受け付けるための注文処理を実行する。注文処理自体は、公知のECサービスの処理を利用可能である。例えば、注文処理部101は、ユーザが買い物かごに商品を入れて注文の手続をした場合に、商品の決済に必要な決済処理と、商品の発送に必要な発送処理と、を実行する。決済処理は、ユーザが指定したクレジットカード等の決済手段を利用して支払をするための処理である。発送処理は、店舗に対し、ユーザが注文した商品に関する情報を送信するための処理である。先述したように、コンバージョンが発生すると、注文処理部101は、コンバージョンデータベースDB2を更新する。
[Order Processing Unit]
The order processing unit 101 executes order processing for accepting product orders from users. The order processing itself can utilize processing of known EC services. For example, when a user places a product in a shopping cart and completes the order procedure, the order processing unit 101 executes a settlement process required for settling the product and a shipping process required for shipping the product. The settlement process is a process for making a payment using a payment method such as a credit card designated by the user. The shipping process is a process for sending information about the product ordered by the user to the store. As described above, when a conversion occurs, the order processing unit 101 updates the conversion database DB2.
[1-3-2.広告主端末で実現される機能]
例えば、広告主端末20は、データ記憶部200、取得部201、デトークナイゼーション実行部202、クエリ整形部203、及び処理実行部204を含む。データ記憶部200は、記憶部12により実現される。取得部201、デトークナイゼーション実行部202、クエリ整形部203、及び処理実行部204は、制御部11により実現される。
[1-3-2. Functions realized by advertiser terminal]
For example, the advertiser terminal 20 includes a data storage unit 200, an acquisition unit 201, a detokenization execution unit 202, a query shaping unit 203, and a processing execution unit 204. The data storage unit 200 is realized by the storage unit 12. The acquisition unit 201, the detokenization execution unit 202, the query shaping unit 203, and the processing execution unit 204 are realized by the control unit 11.
[データ記憶部]
データ記憶部200は、クエリ整形に必要なデータを記憶する。例えば、データ記憶部200は、学習済みのクエリ整形モデルM1を記憶する。クエリ整形モデルM1は、クエリ整形の処理を実行するプログラム部分と、学習によって調整されるパラメータ部分と、を含む。例えば、パラメータは、重み及びバイアスである。パラメータは、クエリ整形モデルM1として利用する機械学習手法に応じたものであればよい。
[Data storage unit]
The data storage unit 200 stores data necessary for query shaping. For example, the data storage unit 200 stores a trained query shaping model M1. The query shaping model M1 includes a program portion that executes a query shaping process and a parameter portion that is adjusted by learning. For example, the parameters are weights and biases. The parameters may be any parameters that correspond to a machine learning method used as the query shaping model M1.
第1実施形態では、Seq2Seq(Sequence to Sequence)を利用したクエリ整形モデルM1を例に挙げる。Seq2Seqは、処理対象となる入力データが入力されるエンコーダと、エンコーダから出力された特徴量を取得し、特徴量に応じた出力データを出力するデコーダと、を含む。特徴量は、入力データの特徴に関する情報である。第1実施形態では、特徴量が多次元ベクトルで表現される場合を説明するが、特徴量は、配列又は単一の数値といった他の形式で表現されてもよい。 In the first embodiment, a query shaping model M1 using Seq2Seq (Sequence to Sequence) is taken as an example. Seq2Seq includes an encoder to which input data to be processed is input, and a decoder that acquires features output from the encoder and outputs output data according to the features. The features are information related to the features of the input data. In the first embodiment, a case will be described in which the features are expressed as multidimensional vectors, but the features may be expressed in other formats such as an array or a single numerical value.
図7は、クエリ整形モデルM1の学習方法の一例を示す図である。例えば、クエリ整形モデルM1の訓練データは、入力データに相当する訓練用クエリと、出力データに相当する訓練用クエリと、のペアである。入力データに相当する訓練用クエリは、整形前の訓練用クエリである。出力データに相当する訓練用クエリは、整形済みの訓練用クエリである。訓練データに含まれるペアは、クエリ整形モデルM1にどのような整形をさせるかに応じて用意すればよい。 Figure 7 is a diagram showing an example of a learning method for the query shaping model M1. For example, the training data for the query shaping model M1 is a pair of a training query corresponding to the input data and a training query corresponding to the output data. The training query corresponding to the input data is the training query before shaping. The training query corresponding to the output data is the training query that has already been shaped. The pairs included in the training data may be prepared depending on the type of shaping to be performed by the query shaping model M1.
本実施形態では、デトークナイゼーション済みのコンバージョンクエリがクエリ整形モデルM1に入力され、トークナイゼーション済みのコンバージョンクエリがクエリ整形モデルM1から出力されるので、訓練データに含まれるペアも、これらのペアに応じたものになる。図7の例では、入力データに相当する訓練用クエリは、複数のトークンを含む訓練用クエリをデトークナイゼーションして1つのトークンのみを含むものである。出力データに相当する訓練用クエリは、当該複数のトークンを含む訓練用クエリである。 In this embodiment, the detokenized conversion query is input to the query shaping model M1, and the tokenized conversion query is output from the query shaping model M1, so the pairs included in the training data also correspond to these pairs. In the example of FIG. 7, the training query corresponding to the input data is a training query that includes multiple tokens and is detokenized to include only one token. The training query corresponding to the output data is a training query that includes the multiple tokens.
例えば、広告主端末20は、入力データに相当する訓練用クエリが入力された場合に、訓出力データに相当する訓練用クエリが出力されるように、クエリ整形モデルM1のパラメータを調整することによって、訓練データをクエリ整形モデルM1に学習させる。学習自体は、機械学習手法で利用されている種々のアルゴリズムを利用可能であり、例えば、誤差逆伝播法又は勾配降下法が利用されてもよい。クエリ整形モデルM1の学習は、広告主端末20ではなく、他のコンピュータにより実行されてもよい。 For example, the advertiser terminal 20 adjusts the parameters of the query shaping model M1 so that when a training query corresponding to the input data is input, a training query corresponding to the training output data is output, thereby making the query shaping model M1 learn the training data. The learning itself can use various algorithms used in machine learning techniques, and for example, the backpropagation method or the gradient descent method may be used. The learning of the query shaping model M1 may be performed by another computer instead of the advertiser terminal 20.
第1実施形態では、ECサービスで実際に入力されたクエリが訓練用クエリとして利用される。このクエリは、コンバージョンクエリではなくてもよい。例えば、広告主端末20は、ECサーバ10から、ECサービスで実際に入力されたクエリを取得する。広告主端末20は、このクエリに基づいて、訓練データを生成する。このクエリが適切な位置にセパレータを含むのであれば、デトークナイゼーションを実行したものと、このクエリと、のペアが訓練データになる。このクエリが適切な位置にセパレータを含んでいなければ、ECサービスの運営者は、適宜手動で整形を行えばよい。 In the first embodiment, a query actually entered in an EC service is used as a training query. This query does not have to be a conversion query. For example, the advertiser terminal 20 acquires a query actually entered in an EC service from the EC server 10. The advertiser terminal 20 generates training data based on this query. If this query contains a separator in an appropriate position, a pair of the query after detokenization and this query becomes the training data. If this query does not contain a separator in an appropriate position, the operator of the EC service can manually reshape it as appropriate.
なお、ECサービスではなく、検索サービスで実際に入力されたクエリが訓練用クエリとして利用されてもよい。このクエリは、コンバージョンクエリではなくてもよい。例えば、広告主端末20は、検索サーバ30から、検索サービスで実際に入力されたクエリを取得する。広告主端末20は、このクエリに基づいて、訓練データを生成してもよい。また、データ記憶部200は、他のデータを記憶してもよい。例えば、データ記憶部200は、コンバージョンデータベースDB2を記憶してもよい。 Note that a query actually entered in a search service, rather than an EC service, may be used as the training query. This query does not have to be a conversion query. For example, the advertiser terminal 20 acquires a query actually entered in a search service from the search server 30. The advertiser terminal 20 may generate training data based on this query. The data storage unit 200 may also store other data. For example, the data storage unit 200 may store a conversion database DB2.
また、クエリ整形モデルM1は、Seq2Seq以外の種々の機械学習手法を利用可能である。クエリ整形モデルM1は、教師有り学習、半教師有り学習、又は教師無し学習の何れでのモデルあってもよい。例えば、ニューラルネットワークを利用したモデル、又は、Transformerと呼ばれるモデルであってもよい。クエリ整形モデルM1は、機械学習手法のモデルであればよい。また、クエリ整形モデルM1は、LSTMやGRUといったRNNをエンコーダとデコーダとして用いるSeq2Seqモデルであってよい。 The query shaping model M1 can use various machine learning methods other than Seq2Seq. The query shaping model M1 may be a model using supervised learning, semi-supervised learning, or unsupervised learning. For example, it may be a model using a neural network, or a model called a Transformer. The query shaping model M1 may be a model using a machine learning method. The query shaping model M1 may be a Seq2Seq model that uses an RNN such as LSTM or GRU as an encoder and decoder.
[取得部]
取得部201は、検索連動型広告に関するコンバージョンが発生したコンバージョンクエリを取得する。第1実施形態では、コンバージョンクエリがコンバージョンデータベースDB2に格納されているので、取得部201は、コンバージョンデータベースDB2から、クエリ整形の対象となるコンバージョンクエリを取得する。コンバージョンデータベースDB2以外の他のデータベース、又は、ECサーバ10以外の他のコンピュータにコンバージョンクエリが格納されている場合には、取得部201は、他のデータベース又は他のコンピュータからコンバージョンクエリを取得する。
[Acquisition section]
The acquisition unit 201 acquires a conversion query in which a conversion related to a search-related advertisement has occurred. In the first embodiment, since the conversion query is stored in the conversion database DB2, the acquisition unit 201 acquires the conversion query to be subjected to query shaping from the conversion database DB2. When the conversion query is stored in a database other than the conversion database DB2 or in a computer other than the EC server 10, the acquisition unit 201 acquires the conversion query from the other database or the other computer.
第1実施形態では、検索連動型広告は、当該検索連動型広告が表示される検索サービスとは異なるECサービスにユーザをアクセスさせるための広告である。例えば、取得部201は、ECサービスでコンバージョンが発生したコンバージョンクエリを取得する。ECサービスは、他のサービスの一例である。他のサービスは、検索サービス以外のサービスであればよく、ECサービスに限られない。例えば、他のサービスは、旅行予約サービス、オンラインフリーマーケットサービス、動画配信サービス、決済サービス、金融サービス、又は通信サービスであってもよい。 In the first embodiment, the search-based advertisement is an advertisement for directing a user to access an EC service different from the search service in which the search-based advertisement is displayed. For example, the acquisition unit 201 acquires a conversion query in which a conversion occurs in the EC service. The EC service is an example of the other service. The other service may be any service other than a search service and is not limited to an EC service. For example, the other service may be a travel reservation service, an online flea market service, a video distribution service, a payment service, a financial service, or a communication service.
第1実施形態の検索サービスでは、検索時に入力されたコンバージョンクエリが変更されるので、取得部201は、検索サービスにおいて変更された変更済みのコンバージョンクエリを取得する。コンバージョンクエリの変更とは、セパレータ、文字、数字、若しくはその他の記号をコンバージョンクエリに追加すること、又は、セパレータ、文字、数字、若しくはその他の記号をコンバージョンクエリから削除することである。コンバージョンクエリの一部の語を移動させることがコンバージョンクエリの変更に相当してもよい。 In the search service of the first embodiment, the conversion query input at the time of search is changed, so the acquisition unit 201 acquires the changed conversion query changed in the search service. Changing the conversion query means adding a separator, a letter, a number, or other symbol to the conversion query, or deleting a separator, a letter, a number, or other symbol from the conversion query. Moving some words in the conversion query may correspond to changing the conversion query.
第1実施形態では、検索サービスで形態素解析が実行されるので、コンバージョンクエリが形態素に分割されてセパレータが追加されることが、コンバージョンクエリの変更に相当する。このため、形態素解析について説明している箇所は、他の任意の変更と読み替えることができる。形態素解析自体は、種々の手法を利用可能である。例えば、MeCab、JUMAN、又はJANOMEといった形態素解析ツールが利用されてもよい。形態素解析ツールは、日本語に限られず、中国語又は英語といった他の言語に対応したツールであってよい。 In the first embodiment, since morphological analysis is performed in the search service, the conversion query is modified by dividing the conversion query into morphemes and adding separators. Therefore, the description of morphological analysis may be replaced with any other modification. Various methods can be used for the morphological analysis itself. For example, a morphological analysis tool such as MeCab, JUMAN, or JANOME may be used. The morphological analysis tool is not limited to Japanese, and may be a tool compatible with other languages such as Chinese or English.
[デトークナイゼーション実行部]
デトークナイゼーション実行部202は、コンバージョンクエリに関するデトークナイゼーションを実行する。例えば、デトークナイゼーション実行部202は、変更済みのコンバージョンクエリに含まれるセパレータの少なくとも一部を削除することによって、デトークナイゼーションを実行する。第1実施形態では、デトークナイゼーション実行部202は、変更済みのコンバージョンクエリに含まれる全てのセパレータを削除する場合を説明するが、変更済みのコンバージョンクエリに含まれる一部のセパレータだけを削除してもよい。図3の例では、デトークナイゼーションによって、トークンが1つだけの状態になる。
[Detokenization execution unit]
The detokenization execution unit 202 executes detokenization on the conversion query. For example, the detokenization execution unit 202 executes detokenization by deleting at least a part of the separators included in the changed conversion query. In the first embodiment, the detokenization execution unit 202 executes detokenization by deleting all the separators included in the changed conversion query. However, the detokenization execution unit 202 may delete only a part of the separators included in the changed conversion query. In the example of FIG. 3, the detokenization results in a state in which only one token remains.
[クエリ整形部]
クエリ整形部203は、クエリ整形モデルM1に基づいて、コンバージョンクエリを整形する。クエリ整形モデルM1は、クエリ整形に関する訓練データが学習された学習モデルの一例である。このため、クエリ整形モデルM1について説明している箇所は、学習モデルと読み替えることができる。訓練データは、学習モデルとして利用する機械学習手法に応じて作成されるようにすればよい。
[Query Formatter]
The query shaping unit 203 shapes the conversion query based on the query shaping model M1. The query shaping model M1 is an example of a learning model in which training data related to query shaping is learned. Therefore, the description of the query shaping model M1 can be read as learning model. The training data may be created according to a machine learning technique used as the learning model.
例えば、クエリ整形部203は、変更済みのコンバージョンクエリが入力時の状態に戻るように、変更済みのコンバージョンクエリを整形する。入力時の状態とは、検索サービスによる変更前の状態である。クエリ整形部203は、学習済みのクエリ整形モデルM1に対し、変更済みのコンバージョンクエリを入力する。クエリ整形モデルM1は、変更済みのコンバージョンクエリの特徴量を計算し、当該計算された特徴量に応じたコンバージョンクエリを出力する。 For example, the query shaping unit 203 shapes the modified conversion query so that the modified conversion query returns to the state at the time of input. The state at the time of input is the state before modification by the search service. The query shaping unit 203 inputs the modified conversion query to the trained query shaping model M1. The query shaping model M1 calculates the feature quantities of the modified conversion query, and outputs a conversion query according to the calculated feature quantities.
例えば、当該出力されたコンバージョンクエリは、検索サービスにおける入力時のコンバージョンクエリと同じ又は略同じ内容になる。略同じ内容とは、トークン及びセパレータの違いが1~3字程度のことである。また、例えば、当該出力されたコンバージョンクエリは、検索サービスにおける入力時の不自然なコンバージョンクエリに含まれている不要なセパレータが除かれた自然な内容、又は検索サービスにおける入力時の不自然なコンバージョンクエリに含まれていない必要なセパレータが追加された自然な内容になり得る。 For example, the output conversion query will be the same or approximately the same as the conversion query entered into the search service. Approximately the same content means that the tokens and separators differ by about one to three characters. Also, for example, the output conversion query may be natural content with unnecessary separators that were included in the unnatural conversion query entered into the search service removed, or natural content with necessary separators that were not included in the unnatural conversion query entered into the search service added.
第1実施形態の検索サービスでは、検索時に入力されたコンバージョンクエリに対し、形態素解析が実行されることによって変更されるので、クエリ整形部203は、変更済みのコンバージョンクエリに含まれる形態素が入力時の状態に戻るように、変更済みのコンバージョンクエリを整形する。例えば、クエリ整形部203は、形態素解析によって複数の形態素に分割されたトークンが1つのトークンとして戻るように、変更済みのコンバージョンクエリを整形する。別の言い方をすれば、クエリ整形部203は、形態素解析によって挿入されたセパレータを削除するように、変更済みのコンバージョンクエリを整形する。 In the search service of the first embodiment, the conversion query input at the time of search is modified by performing morphological analysis, so the query reforming unit 203 reforms the modified conversion query so that the morphemes included in the modified conversion query are returned to the state they were in at the time of input. For example, the query reforming unit 203 reforms the modified conversion query so that a token divided into multiple morphemes by morphological analysis is returned as a single token. In other words, the query reforming unit 203 reforms the modified conversion query so as to delete the separator inserted by morphological analysis.
第1実施形態では、訓練用クエリは、ECサービスで実際に入力されたクエリなので、クエリ整形部203は、ECサービスで実際に入力された訓練用クエリが変更された変更済みの訓練用クエリと、変更前の訓練用クエリと、の関係が訓練データとして学習されたクエリ整形モデルM1に基づいて、コンバージョンクエリを整形する。ECサービスで実際に入力されたクエリを、訓練用クエリとしてクエリ整形モデルM1に学習させる学習方法は、先述した通りである。 In the first embodiment, the training query is a query that is actually input in the EC service, so the query shaping unit 203 shapes the conversion query based on the query shaping model M1 in which the relationship between the modified training query, which is a modified version of the training query that was actually input in the EC service, and the training query before the modification is learned as training data. The learning method for making the query shaping model M1 learn the query that was actually input in the EC service as the training query is as described above.
第1実施形態では、クエリ整形部203は、クエリ整形モデルM1に基づいて、デトークナイゼーションが実行されたコンバージョンクエリに関するトークナイゼーションを実行することによって、当該実行済みのコンバージョンクエリを整形する。例えば、クエリ整形部203は、デトークナイゼーションによって1つのトークンになったコンバージョンクエリに対し、適切な位置にセパレータを挿入することによって、トークナイゼーションを実行する。適切な位置は、クエリ整形モデルM1によって判定される。 In the first embodiment, the query shaping unit 203 shapes the executed conversion query by performing tokenization on the conversion query on which detokenization has been performed based on the query shaping model M1. For example, the query shaping unit 203 performs tokenization on the conversion query that has been detokenized into one token by inserting a separator at an appropriate position. The appropriate position is determined by the query shaping model M1.
[処理実行部]
処理実行部204は、クエリ整形部203により整形された整形済みのコンバージョンクエリに基づいて、所定の処理を実行する。所定の処理は、整形済みのコンバージョンクエリの用途に応じた処理であればよい。例えば、所定の処理は、整形済みのコンバージョンクエリをデータ記憶部200に記録する記録処理であってもよいし、整形済みのコンバージョンクエリを外部に出力する出力処理であってもよい。
[Processing execution unit]
The processing execution unit 204 executes a predetermined process based on the reformulated conversion query reformed by the query reforming unit 203. The predetermined process may be a process according to the use of the reformulated conversion query. For example, the predetermined process may be a recording process for recording the reformulated conversion query in the data storage unit 200, or an output process for outputting the reformulated conversion query to the outside.
第1実施形態では、処理実行部204は、整形済みのコンバージョンクエリを検索サービスに登録する登録処理を、所定の処理として実行する。例えば、後述の広告データベースDB3のように、検索サービスには、検索連動型広告ごとに、インデックス及び表示用キーワードが登録されている。検索サービスでは、インデックスに基づいて検索連動型広告が検索され、検索連動型広告とともに表示用キーワードが表示される。 In the first embodiment, the process execution unit 204 executes, as a predetermined process, a registration process for registering the formatted conversion query in a search service. For example, as in the advertisement database DB3 described below, an index and a display keyword are registered in the search service for each search-related advertisement. In the search service, the search-related advertisement is searched for based on the index, and the display keyword is displayed together with the search-related advertisement.
例えば、処理実行部204は、整形済みのコンバージョンクエリを表示用キーワードとして検索サービスに登録する処理を、登録処理として実行する。処理実行部204は、検索サーバ30に対し、整形済みのコンバージョンクエリを送信することによって、登録処理を実行する。検索サーバ30は、整形済みのコンバージョンクエリを受信すると、ECサービスの運営者に関連付けて、当該受信した整形済みのコンバージョンクエリを、表示用キーワードとして広告データベースDB3に登録する。 For example, the process execution unit 204 executes, as the registration process, a process of registering the reformulated conversion query in a search service as a display keyword. The process execution unit 204 executes the registration process by sending the reformulated conversion query to the search server 30. When the search server 30 receives the reformulated conversion query, it associates the reformulated conversion query with the operator of the EC service and registers the received reformulated conversion query in the advertisement database DB3 as a display keyword.
なお、整形済みのコンバージョンクエリは、コンバージョンの元となった検索連動型広告に関連付けられて登録されてもよいし、他の検索連動型広告に関連付けられて登録されてもよい。例えば、ECサービスの運営者が、整形済みのコンバージョンクエリに関連付ける検索連動型広告を指定してもよい。また、処理実行部204は、検索連動型広告のインデックスとして、整形済みのコンバージョンクエリを登録する登録処理を、所定の処理として実行してもよい。 The reformulated conversion query may be registered in association with the search-based advertisement that was the source of the conversion, or in association with another search-based advertisement. For example, the operator of the EC service may specify the search-based advertisement to be associated with the reformulated conversion query. The process execution unit 204 may also execute, as a predetermined process, a registration process for registering the reformulated conversion query as an index for the search-based advertisement.
[1-3-3.検索サーバで実現される機能]
例えば、検索サーバ30は、データ記憶部300及び検索部301を含む。データ記憶部300は、記憶部32により実現される。検索部301は、制御部31により実現される。
[1-3-3. Functions realized by the search server]
For example, the search server 30 includes a data storage unit 300 and a search unit 301. The data storage unit 300 is realized by the storage unit 32. The search unit 301 is realized by the control unit 31.
[データ記憶部]
データ記憶部300は、検索サービスの提供に必要なデータを記憶する。例えば、データ記憶部300は、広告データベースDB3を記憶する。
[Data storage unit]
The data storage unit 300 stores data necessary for providing a search service. For example, the data storage unit 300 stores an advertisement database DB3.
図8は、広告データベースDB3の一例を示す図である。広告データベースDB3は、検索連動型広告に関する各種情報が格納されたデータベースである。例えば、広告データベースDB3には、広告ID、広告主ID、検索連動型広告の実データ、インデックス、及び表示用キーワードが格納される。広告データベースDB3には、検索連動型広告に関する任意の情報が格納されてよく、図8以外の他の情報が格納されてもよい。 Figure 8 is a diagram showing an example of the advertisement database DB3. The advertisement database DB3 is a database in which various information related to search-based advertisements is stored. For example, the advertisement database DB3 stores an advertisement ID, an advertiser ID, actual data of the search-based advertisement, an index, and display keywords. The advertisement database DB3 may store any information related to the search-based advertisements, and may store information other than that shown in Figure 8.
広告主IDは、広告主を識別可能な広告主識別情報の一例である、広告主識別情報は、広告主名、電話番号、又はメールアドレスといった他の情報であってもよい。第1実施形態では、ECサービスの運営者以外の他の広告主の検索連動型広告の掲載を希望しているものとする。このため、広告データベースDB3には、種々の広告主の検索連動型広告に関する情報が格納される。実データは、広告の内容を示す文字列、画像、及びリンク先のURLといったデータである。第1実施形態では、リンク先のURLの引数として、形態素に分割されたクエリと、広告IDと、が含まれるものとする。 The advertiser ID is an example of advertiser identification information that can identify the advertiser, and the advertiser identification information may be other information such as the advertiser's name, telephone number, or email address. In the first embodiment, it is assumed that an advertiser other than the operator of the EC service wishes to post search-based advertisements. For this reason, information on search-based advertisements from various advertisers is stored in the advertisement database DB3. The actual data is data such as character strings indicating the content of the advertisement, images, and the URL of the linked site. In the first embodiment, it is assumed that the argument of the linked site URL includes a query divided into morphemes and an advertisement ID.
インデックスは、クエリとの比較対象となる情報である。インデックスは、任意の情報を利用可能である。例えば、商品のタイトルの一部、商品の属性、商品の詳細説明から抽出されたキーワード、ECサービスの運営者が指定した文字列、又はこれらの組み合わせがインデックスとして利用される。表示用キーワードは、検索連動型広告を表示領域A20に表示する際の文字列である。図8のように表示用キーワードに何も指定されていなければ、表示領域A20には、形態素に分割されたクエリが表示される。表示用キーワードが指定されると、表示領域A20には、表示用キーワードが表示される。 An index is information to be compared with a query. Any information can be used as an index. For example, part of a product title, product attributes, keywords extracted from a detailed description of a product, a character string specified by an operator of an EC service, or a combination of these, can be used as an index. A display keyword is a character string used when displaying a search-linked advertisement in the display area A20. If no display keyword is specified as in FIG. 8, the query divided into morphemes is displayed in the display area A20. If a display keyword is specified, the display keyword is displayed in the display area A20.
なお、データ記憶部300に記憶されるデータは、上記の例に限られない。データ記憶部300は、任意のデータを記憶可能である。例えば、データ記憶部300は、ウェブページの検索に必要なウェブページデータベースを記憶してもよい。例えば、ウェブページデータベースには、種々のウェブページのURL及びインデックスが格納される。 The data stored in the data storage unit 300 is not limited to the above example. The data storage unit 300 can store any data. For example, the data storage unit 300 may store a webpage database required for searching webpages. For example, the webpage database stores URLs and indexes of various webpages.
[検索部]
検索部301は、ユーザがクエリを入力した場合に、当該クエリに基づいて、ウェブページの検索と、検索連動型広告の検索と、を実行する。これらの検索自体は、公知の検索エンジンに基づいて実行されるようにすればよい。例えば、検索部301は、ユーザが入力したクエリ、ウェブページデータベースに格納されたインデックス、及び広告データベースDB3に格納されたインデックスに基づいて検索を実行する。検索部301は、ウェブページの検索結果と、検索連動型広告の検索結果と、を取得する。検索部301は、ユーザ端末40に対し、これらの検索結果を示す検索結果画面SC2の表示データを送信する。
[Search section]
When a user inputs a query, the search unit 301 executes a search for web pages and a search-based advertisement based on the query. These searches themselves may be executed based on a known search engine. For example, the search unit 301 executes a search based on the query input by the user, an index stored in the web page database, and an index stored in the advertisement database DB3. The search unit 301 acquires search results for web pages and search results for search-based advertisements. The search unit 301 transmits display data for a search result screen SC2 showing the search results to the user terminal 40.
なお、表示データは、任意の形式であってよく、例えば、ブラウザ上で検索結果画面SC2を表示させるのであれば、HTMLデータである。検索サービス専用のアプリケーション上で検索結果画面SC2を表示させるのであれば、アプリケーションでサポートされている形式のデータであればよい。その他にも、検索部301は、検索サービスの種々の画面の表示データをユーザ端末40に送信可能である。 The display data may be in any format. For example, if the search result screen SC2 is to be displayed on a browser, the display data is HTML data. If the search result screen SC2 is to be displayed on an application dedicated to the search service, the data may be in a format supported by the application. In addition, the search unit 301 can transmit display data for various screens of the search service to the user terminal 40.
[1-3-4.ユーザ端末で実現される機能]
例えば、ユーザ端末40は、データ記憶部400、表示制御部401、及び操作受付部402を含む。データ記憶部400は、記憶部42により実現される。表示制御部401及び操作受付部402は、制御部41により実現される。
[1-3-4. Functions realized by user terminal]
For example, the user terminal 40 includes a data storage unit 400, a display control unit 401, and an operation reception unit 402. The data storage unit 400 is realized by the storage unit 42. The display control unit 401 and the operation reception unit 402 are realized by the control unit 41.
[データ記憶部]
データ記憶部400は、検索サービス及びECサービスの提供に必要なデータを記憶する。例えば、データ記憶部400は、各画面を表示させるためのブラウザ又は専用のアプリケーションを記憶する。
[Data storage unit]
The data storage unit 400 stores data necessary for providing search services and EC services. For example, the data storage unit 400 stores a browser or a dedicated application for displaying each screen.
[表示制御部]
表示制御部401は、種々の画面を表示部45に表示させる。
[Display control unit]
The display control unit 401 causes the display unit 45 to display various screens.
[操作受付部]
操作受付部402は、操作部44から種々の操作を受け付ける。
[Operation reception section]
The operation reception unit 402 receives various operations from the operation unit 44 .
[1-4.第1実施形態で実行される処理]
図9は、第1実施形態で実行される処理の一例を示すフロー図である。この処理は、制御部11,21,31,41が記憶部12,22,32,42に記憶されたプログラムに従って動作することによって実行される。以降、ユーザによるコンバージョンが発生する場合の処理を説明する。このため、ユーザによる入力が発生する時点でコンバージョンクエリという。
[1-4. Processing Executed in the First Embodiment]
9 is a flow diagram showing an example of a process executed in the first embodiment. This process is executed by the control units 11, 21, 31, and 41 operating in accordance with the programs stored in the storage units 12, 22, 32, and 42. Hereinafter, a process in which a conversion occurs by a user will be described. For this reason, the point at which an input by a user occurs is called a conversion query.
図9のように、検索サーバ30は、ユーザ端末40との間で、検索サービスのトップ画面SC1を表示させるための処理を実行する(S1)。S1の処理が実行されると、ユーザは、入力フォームF10に対し、任意の文字列をコンバージョンクエリとして入力してボタンB11を選択する。ユーザ端末40は、検索サーバ30に対し、ユーザが入力したコンバージョンクエリを送信する(S2)。検索サーバ30は、コンバージョンクエリを受信すると、形態素解析ツールを利用して形態素解析を実行する(S3)。 As shown in FIG. 9, the search server 30 executes a process between the user terminal 40 and the search service to display the top screen SC1 (S1). When the process of S1 is executed, the user inputs an arbitrary character string as a conversion query into the input form F10 and selects the button B11. The user terminal 40 transmits the conversion query input by the user to the search server 30 (S2). When the search server 30 receives the conversion query, it executes a morphological analysis using a morphological analysis tool (S3).
検索サーバ30は、形態素に分割されたコンバージョンクエリと、広告データベースDB3と、に基づいて、ウェブページの検索と、検索連動型広告の検索と、を実行する(S4)。検索サーバ30は、S4における検索の実行結果に基づいて、検索結果画面SC2の表示データを生成してユーザ端末40に送信する(S5)。S5では、検索サーバ30は、S3で形態素に分割されたコンバージョンクエリと、検索連動型広告の広告IDと、を引数として検索連動型広告のリンクに含める。 The search server 30 executes a search for web pages and a search for search-related advertisements based on the conversion query divided into morphemes and the advertisement database DB3 (S4). The search server 30 generates display data for the search result screen SC2 based on the results of the search executed in S4 and transmits the display data to the user terminal 40 (S5). In S5, the search server 30 includes the conversion query divided into morphemes in S3 and the advertisement ID of the search-related advertisement as arguments in the link to the search-related advertisement.
ユーザ端末40は、表示データを受信すると、検索結果画面SC2を表示部45に表示させる(S6)。ユーザ端末40は、ユーザが検索連動型広告を選択すると、ECサーバ10との間で、商品画面SC3を表示させるための処理を実行する(S7)。検索連動型広告のリンクに含まれる引数によって、ECサーバ10は、S3で形態素に分割された後のコンバージョンクエリを取得できる。ECサーバ10は、ユーザ端末40との間で、商品の注文を受け付けて注文完了画面SC4を表示させる処理を実行する(S8)。S8では、ECサーバ10は、コンバージョンデータベースDB2にコンバージョンクエリを格納する。 When the user terminal 40 receives the display data, it displays the search result screen SC2 on the display unit 45 (S6). When the user selects the search-based advertisement, the user terminal 40 executes processing with the EC server 10 to display the product screen SC3 (S7). The EC server 10 can obtain the conversion query after being divided into morphemes in S3 using the arguments included in the link of the search-based advertisement. The EC server 10 executes processing with the user terminal 40 to accept a product order and display the order completion screen SC4 (S8). In S8, the EC server 10 stores the conversion query in the conversion database DB2.
広告主端末20は、ECサーバ10との間で、クエリ整形の対象となるコンバージョンクエリを取得するための処理を実行する(S9)。クエリ整形の対象となるコンバージョンクエリは、手動で指定されてもよい。コンバージョンデータベースDB2に格納されたコンバージョンクエリの全て又は一部が取得されてもよい。広告主端末20は、学習済みのクエリ整形モデルM1に基づいて、S9で取得したコンバージョンクエリを整形する(S10)。広告主端末20は、検索サーバ30に対し、整形済みのコンバージョンクエリを送信する(S11)。検索サーバ30は、整形済みのコンバージョンクエリを受信すると、整形済みのコンバージョンクエリを表示用キーワードとして広告データベースDB3に格納し(S12)、本処理は終了する。ここで、表示用キーワードとは、検索連動型広告におけるトリガーとなる検索クエリに相当する。 The advertiser terminal 20 executes a process for acquiring a conversion query to be shaped between the EC server 10 (S9). The conversion query to be shaped may be manually specified. All or part of the conversion queries stored in the conversion database DB2 may be acquired. The advertiser terminal 20 shapes the conversion query acquired in S9 based on the learned query shaping model M1 (S10). The advertiser terminal 20 transmits the shaped conversion query to the search server 30 (S11). When the search server 30 receives the shaped conversion query, it stores the shaped conversion query in the advertisement database DB3 as a display keyword (S12), and this process ends. Here, the display keyword corresponds to the search query that serves as a trigger in search-linked advertising.
第1実施形態のクエリ整形システム1は、クエリ整形モデルM1に基づいて、コンバージョンクエリを整形する。クエリ整形システム1は、整形済みのコンバージョンクエリに基づいて、所定の処理を実行する。これにより、検索連動型広告におけるコンバージョンクエリを適切な状態に整形できる。このため、コンバージョンクエリを適切な状態にしたうえで、所定の処理を実行できるので、コンバージョンクエリを利用する目的を達成しやすくなる。例えば、第1実施形態のように、表示領域A20に表示される検索連動型広告の表示が不自然にならないようにするといった目的でコンバージョンクエリを利用する場合には、より自然な表示にすることができる。 The query shaping system 1 of the first embodiment shapes the conversion query based on the query shaping model M1. The query shaping system 1 executes a predetermined process based on the shaped conversion query. This allows the conversion query in the search-based advertisement to be shaped into an appropriate state. Therefore, the conversion query can be put into an appropriate state and then the predetermined process can be executed, making it easier to achieve the purpose of using the conversion query. For example, when the conversion query is used for the purpose of preventing the display of the search-based advertisement displayed in the display area A20 from looking unnatural, as in the first embodiment, a more natural display can be achieved.
また、クエリ整形システム1は、検索連動型広告が表示される検索サービスとは異なるECサービスでコンバージョンが発生したコンバージョンクエリを取得する。これにより、サービスをまたいでコンバージョンが発生する場合だったとしても、コンバージョンクエリを適切な状態に整形できる。 In addition, the query shaping system 1 acquires conversion queries in which conversions have occurred in an EC service different from the search service in which the search-related advertisement is displayed. This makes it possible to shape the conversion query appropriately even in cases where conversions occur across services.
また、クエリ整形システム1は、整形済みのコンバージョンクエリを検索サービスに登録する登録処理を、所定の処理として実行する。これにより、サービスをまたいでコンバージョンが発生する場合だったとしても、適切な状態に整形したコンバージョンクエリを検索サービスに登録できる。 The query shaping system 1 also executes a registration process to register the shaped conversion query in a search service as a predetermined process. This allows the conversion query that has been shaped appropriately to be registered in the search service even if conversion occurs across services.
また、クエリ整形システム1は、整形済みのコンバージョンクエリを表示用キーワードとして検索サービスに登録する処理を、登録処理として実行する。これにより、検索サービスにおける検索連動型広告の表示を自然な表示にすることができる。 In addition, the query shaping system 1 executes a process of registering the shaped conversion query as a display keyword in a search service as a registration process. This allows search-related advertisements in the search service to be displayed in a natural way.
また、クエリ整形システム1は、検索サービスにおいて変更済みのコンバージョンクエリが入力時の状態に戻るように、変更済みのコンバージョンクエリを整形する。これにより、検索サービスでコンバージョンクエリが不自然な状態に変更されたとしても、元の状態に戻すことができる。 In addition, the query shaping system 1 shapes the modified conversion query so that the modified conversion query returns to the state it was in when it was entered in the search service. This allows the conversion query to be restored to its original state even if it is modified to an unnatural state in the search service.
また、クエリ整形システム1は、変更済みのコンバージョンクエリに含まれる形態素が入力時の状態に戻るように、変更済みのコンバージョンクエリを整形する。これにより、検索サービスでコンバージョンクエリが形態素に分割されたとしても、元の状態に戻すことができる。 In addition, the query shaping system 1 shapes the modified conversion query so that the morphemes contained in the modified conversion query are returned to the state they were in when they were input. This allows the conversion query to be returned to its original state even if it is split into morphemes by the search service.
また、クエリ整形システム1は、ECサービスで実際に入力された訓練用クエリが変更された変更済みの訓練用クエリと、変更前の訓練用クエリと、の関係が訓練データとして学習されたクエリ整形モデルM1に基づいて、コンバージョンクエリを整形する。これにより、ECサービスの運営者が保有する情報を有効活用して学習を実行したクエリ整形モデルM1によって、コンバージョンクエリを整形できる。 The query shaping system 1 also shapes the conversion query based on the query shaping model M1 that has learned, as training data, the relationship between a training query that has been modified from a training query actually input in the EC service and the training query before the modification. This allows the conversion query to be shaped by the query shaping model M1 that has been trained by effectively utilizing information held by the operator of the EC service.
また、クエリ整形システム1は、クエリ整形モデルM1に基づいて、デトークナイゼーションが実行された実行済みのコンバージョンクエリに関するトークナイゼーションを実行することによって、当該実行済みのコンバージョンクエリを整形する。これにより、デトークナイゼーションによって、どのような状態のコンバージョンクエリだったとしても、トークン1つという同じ状態にしたうえでクエリ整形を実行できるので、コンバージョンクエリに対するクエリ整形の精度が高まる。 The query shaping system 1 also shapes an executed conversion query by performing tokenization on the executed conversion query on which detokenization has been performed based on the query shaping model M1. As a result, regardless of the state of the conversion query, detokenization can be used to bring the query into the same state of one token before performing query shaping, thereby improving the accuracy of query shaping for the conversion query.
[2.第2実施形態]
次にクエリ整形システム1の別実施形態である第2実施形態を説明する。例えば、コンバージョンクエリは、表示用キーワードとして登録するといった目的以外にも、検索連動型広告のインデックスとして利用したり、マーケティングの目的で利用したりすることができる。この点、検索連動型広告では、コンバージョンクエリと、コンバージョンが発生した商品と、の間に関連性が無かったとすると、上記の目的で利用するコンバージョンクエリとしては不適切でありノイズになる可能性がある。
[2. Second embodiment]
Next, a second embodiment, which is another embodiment of the query shaping system 1, will be described. For example, the conversion query can be used as an index for search-based advertising or for marketing purposes, in addition to the purpose of registering it as a display keyword. In this regard, in the case of search-based advertising, if there is no association between the conversion query and the product for which the conversion has occurred, the conversion query may be inappropriate for the above purpose and may become noise.
例えば、ユーザが入力したコンバージョンクエリが、意味は全く異なるが文言上似たインデックスが関連付けられた検索連動型広告にヒットしたとする。ユーザが、この検索連動型広告の商品に偶然興味が湧いてコンバージョンが発生する可能性がある。この場合のコンバージョンクエリは、あまり有用ではない可能性が高い。そこで、クエリ整形システム1は、機械学習を利用した関連性推定モデルに基づいて、コンバージョンクエリと、ECサービスと、の関連性を推定するようになっている。 For example, suppose a conversion query entered by a user hits a search-based advertisement that is associated with an index that is completely different in meaning but similar in wording. There is a possibility that the user will accidentally become interested in the product in the search-based advertisement and a conversion will occur. In this case, the conversion query is likely not very useful. Therefore, the query shaping system 1 is configured to estimate the relevance between the conversion query and the EC service based on a relevance estimation model that uses machine learning.
図10は、第2実施形態における関連性推定モデルの一例を示す図である。第2実施形態では、ECサービスに関連性のある語を含む訓練データが関連性推定モデルM2に学習されている。図10では、訓練データに含まれる語を訓練用クエリと記載しているが、訓練用は、仮想的なクエリとして利用される語である。訓練用クエリは、実際に入力されたクエリではなくてもよい。 FIG. 10 is a diagram showing an example of a relevance estimation model in the second embodiment. In the second embodiment, training data including words related to EC services is learned by the relevance estimation model M2. In FIG. 10, the words included in the training data are described as training queries, which are words used as virtual queries. The training queries do not have to be queries that are actually input.
例えば、訓練用クエリは、ECサービスで実際に入力されたクエリ、商品のタイトル、商品の属性、商品の詳細な説明に含まれる語、及び商品のインデックスとして指定されたキーワードといった種々の語であってよい。訓練データは、入力データとしての訓練用クエリと、関連性に関する情報と、のペアである。この訓練データに基づいて、入力された入力データに含まれる語がECサービスに関連するか否かを推定できるように、関連性推定モデルM2の学習が実行される。 For example, the training queries may be various words such as queries actually input to an EC service, product titles, product attributes, words contained in detailed product descriptions, and keywords specified as product indexes. The training data is a pair of training queries as input data and information regarding relevance. Based on this training data, learning of the relevance estimation model M2 is performed so that it can estimate whether or not words contained in the input data are related to the EC service.
例えば、関連性推定モデルM2は、コンバージョンクエリが入力されると、コンバージョンクエリの特徴量を計算する。関連性推定モデルM2は、当該計算された特徴量に基づいて、コンバージョンクエリがECサービスに関連性があるか否かを出力する。第2実施形態では、コンバージョンクエリがECサービスに関連性があることを示す第1の値、又は、コンバージョンクエリがECサービスに関連性がないことを示す第2の値が出力される場合を説明するが、これらの2値ではなく、関連性の高さを示すスコアが出力されてもよい。 For example, when a conversion query is input, the relevance estimation model M2 calculates the feature amount of the conversion query. Based on the calculated feature amount, the relevance estimation model M2 outputs whether or not the conversion query is related to the EC service. In the second embodiment, a case is described in which a first value indicating that the conversion query is related to the EC service or a second value indicating that the conversion query is not related to the EC service is output, but instead of these two values, a score indicating the degree of relevance may be output.
例えば、広告主端末20は、ECサービスに関連性のあることが推定されたコンバージョンクエリを、検索サービスに登録する。広告主端末20は、コンバージョンが発生したとしても、ECサービスに関連性のないことが推定されたコンバージョンクエリについては、検索サービスに登録しない。以上のように、第2実施形態では、関連性推定モデルM2を利用して関連性が推定されるようになっている。以降、第2実施形態の詳細を説明する。第2実施形態では、第1実施形態と同様の点については、説明を省略する。 For example, the advertiser terminal 20 registers a conversion query that is estimated to be related to the EC service in the search service. The advertiser terminal 20 does not register a conversion query that is estimated to be unrelated to the EC service in the search service even if a conversion occurs. As described above, in the second embodiment, relevance is estimated using the relevance estimation model M2. Details of the second embodiment will be described below. In the second embodiment, explanations of the same points as in the first embodiment will be omitted.
[2-1.第2実施形態で実現される機能]
図11は、第2実施形態で実現される機能の一例を示す図である。第2実施形態では、第1実施形態と同様の機能については、説明を省略する。第2実施形態では、第1実施形態で説明した機能に加えて、広告主端末20は、関連性推定部205を含む。関連性推定部205は、制御部11により実現される。
[2-1. Functions realized in the second embodiment]
11 is a diagram showing an example of functions realized in the second embodiment. In the second embodiment, a description of functions similar to those in the first embodiment will be omitted. In the second embodiment, in addition to the functions described in the first embodiment, the advertiser terminal 20 includes a relevance estimation unit 205. The relevance estimation unit 205 is realized by the control unit 11.
第2実施形態のデータ記憶部200は、関連性推定モデルM2を記憶する。関連性推定モデルM2は、関連性推定の処理を実行するプログラム部分と、学習によって調整されるパラメータ部分と、を含む。例えば、パラメータは、重み及びバイアスである。パラメータは、関連性推定モデルM2として利用する機械学習手法に応じたものであればよい。第2実施形態では、2値分類が実行されるので、2値分類が可能な機械学習手法が利用されるようにすればよい。 The data storage unit 200 of the second embodiment stores the relevance estimation model M2. The relevance estimation model M2 includes a program portion that executes the relevance estimation process and a parameter portion that is adjusted by learning. For example, the parameters are weights and biases. The parameters may be any parameters that correspond to the machine learning method used as the relevance estimation model M2. In the second embodiment, binary classification is performed, so a machine learning method capable of binary classification may be used.
第2実施形態では、ニューラルネットワークを利用した関連性推定モデルM2を例に挙げる。例えば、広告主端末20は、ECサービスに関連性がある語に関する訓練データが入力されると、ECサービスに関連性があることを示す第1の値を出力するように、関連性推定モデルM2の学習を実行する。例えば、誤差逆伝播法又は勾配降下法が学習で利用されてもよい。関連性推定モデルM2の学習は、広告主端末20ではなく、他のコンピュータにより実行されてもよい。 In the second embodiment, an example of the relevance estimation model M2 using a neural network is given. For example, when training data on words related to EC services is input, the advertiser terminal 20 executes learning of the relevance estimation model M2 so as to output a first value indicating that the EC service is related. For example, the backpropagation method or the gradient descent method may be used in the learning. The learning of the relevance estimation model M2 may be executed by another computer instead of the advertiser terminal 20.
なお、関連性推定モデルM2は、ニューラルネットワーク以外の種々の機械学習手法を利用可能である。第2実施形態では、関連性の有無又はその蓋然性を推定できればよいので、自然言語処理の分野で何らかの分類をする際に利用される機械学習手法であればよい。例えば、文書のジャンルを推定する機械学習手法を利用可能である。関連性推定モデルM2は、教師有り学習、半教師有り学習、又は教師無し学習の何れでのモデルあってもよい。第1実施形態のクエリ整形モデルM1の説明で例示した機械学習手法を、関連性推定モデルM2で利用してもよい。 Note that the relevance estimation model M2 can use various machine learning methods other than neural networks. In the second embodiment, it is sufficient to be able to estimate the presence or absence of relevance or the likelihood thereof, so any machine learning method used for some classification in the field of natural language processing can be used. For example, a machine learning method for estimating the genre of a document can be used. The relevance estimation model M2 can be any model of supervised learning, semi-supervised learning, or unsupervised learning. The machine learning method exemplified in the explanation of the query shaping model M1 in the first embodiment can be used in the relevance estimation model M2.
第2実施形態でも、取得部201は、検索連動型広告によりECサービスでコンバージョンが発生したコンバージョンクエリを取得する。ECサービスは、所定のサービスの一例である。このため、ECサービスと記載した箇所は、所定のサービスと読み替えることができる。第2実施形態では、所定のサービスは、検索連動型広告を表示させる検索サービスとは異なる他のサービスである。ECサービス以外の例は、第1実施形態で説明した通りである。 In the second embodiment, the acquisition unit 201 also acquires conversion queries in which a conversion has occurred in an EC service due to search-based advertising. The EC service is an example of a specified service. Therefore, the phrase "EC service" can be read as "specified service." In the second embodiment, the specified service is a service other than the search service that displays the search-based advertising. Examples other than the EC service are as described in the first embodiment.
関連性推定部205は、関連性推定モデルM2に基づいて、コンバージョンクエリと、ECサービスと、の関連性を推定する。関連性は、コンバージョンクエリと、ECサービスと、の相関関係である。例えば、コンバージョンクエリでECサービス内を検索した場合のヒット数は、関連性の指標の1つである。関連性が高いほどヒット数が多くなり、関連性が低いほどヒット数が少なくなる。関連性は、関連性があるか否かの2値、又は、関連性の強さを示すスコアによって表現される。スコアは、2値ではなく、中間値が存在する。例えば、スコアが示す数値が高いほど、関連性が強いことを意味する。 The relevance estimation unit 205 estimates the relevance between the conversion query and the EC service based on the relevance estimation model M2. Relevance is the correlation between the conversion query and the EC service. For example, the number of hits when searching an EC service with a conversion query is one indicator of relevance. The higher the relevance, the more hits there are, and the lower the relevance, the fewer hits there are. Relevance is expressed by a binary value indicating whether or not there is relevance, or a score indicating the strength of the relevance. The score is not binary, but has an intermediate value. For example, the higher the score, the stronger the relevance.
関連性推定モデルM2は、ECサービスとの関連性がある訓練用クエリが学習された学習モデルの一例である。このため、関連性推定モデルM2について説明している箇所は、学習モデルと読み替えることができる。訓練用クエリは、訓練データとして利用可能なクエリであればよい。関連性推定モデルM2は、訓練用クエリである訓練データが入力されると、ECサービスと関連性があることを出力するように学習される。 The relevance estimation model M2 is an example of a learning model in which a training query that is related to an EC service is learned. Therefore, any part that describes the relevance estimation model M2 can be read as learning model. The training query may be any query that can be used as training data. The relevance estimation model M2 is trained to output that there is a relevance to an EC service when training data that is a training query is input.
例えば、関連性推定部205は、検索サービスで実際に入力された訓練用クエリであって、ECサービスとの関連性がある訓練用クエリが学習された関連性推定モデルM2に基づいて、関連性を推定する。第2実施形態では、第1実施形態と同様、検索サービス側で形態素解析が実行される場合を説明する。このため、関連性推定モデルM2の訓練データとして利用するためには、クエリ整形を実行する必要があるものとする。 For example, the relevance estimation unit 205 estimates the relevance based on the relevance estimation model M2 that has learned training queries that are actually input to a search service and that are related to an EC service. In the second embodiment, as in the first embodiment, a case will be described in which morphological analysis is performed on the search service side. For this reason, it is assumed that query shaping must be performed in order to use the query as training data for the relevance estimation model M2.
第2実施形態では、第1実施形態で説明したクエリ整形部203によってクエリ整形が実行された整形済みのコンバージョンクエリが関連性推定モデルM2の訓練データとして利用される。このコンバージョンクエリの中には、関連性が無いものも含まれているので、関連性が無い整形済みのコンバージョンクエリは、ECサービスの運営者によって手動で除外されるものとする。 In the second embodiment, the reformulated conversion queries that have been subjected to query reforming by the query reforming unit 203 described in the first embodiment are used as training data for the relevance estimation model M2. Since some of these conversion queries are not relevant, the irrelevant reformulated conversion queries are manually excluded by the operator of the EC service.
なお、関連性推定モデルM2の訓練データは、検索サービスで実際に入力されたものではなく、ECサービスの管理者によって手動で作成された訓練用クエリであってもよい。また、第2実施形態のクエリ整形部203は、クエリ整形モデルM1に基づいて、関連性があると推定されたコンバージョンクエリを整形してもよい。関連性がないと推定されたコンバージョンクエリは、クエリ整形の対象とはならないようにしてもよい。 The training data for the relevance estimation model M2 may not be actually input in the search service, but may be a training query manually created by an administrator of the EC service. Furthermore, the query shaping unit 203 of the second embodiment may shape a conversion query that is estimated to be relevant based on the query shaping model M1. A conversion query that is estimated to be unrelated may not be subject to query shaping.
第2実施形態の処理実行部204は、関連性推定部205により推定された関連性に基づいて、所定の処理を実行する。所定の処理は、第1実施形態と同様に、任意の処理であってよい。例えば、所定の処理は、関連性があると推定されたコンバージョンクエリをデータ記憶部200に記録する処理であってもよいし、関連性があると推定されたコンバージョンクエリを外部に出力する処理であってもよい。所定の処理は、関連性があると推定されたコンバージョンクエリをクエリ整形の対象にする処理であってもよい。 The processing execution unit 204 of the second embodiment executes a predetermined process based on the relevance estimated by the relevance estimation unit 205. The predetermined process may be any process, as in the first embodiment. For example, the predetermined process may be a process of recording a conversion query estimated to be relevant in the data storage unit 200, or a process of outputting a conversion query estimated to be relevant to the outside. The predetermined process may be a process of subjecting a conversion query estimated to be relevant to query shaping.
例えば、処理実行部204は、関連性があると推定されたコンバージョンクエリを検索サービスに登録する登録処理を、所定の処理として実行する。処理実行部204は、関連性があると推定された、クエリ整形部203により整形された整形済みのコンバージョンクエリを検索サービスに登録する処理を、登録処理として実行する。処理実行部204は、関連性があることが推定されたコンバージョンクエリが対象になる点で第1実施形態とは異なるが、他の点については同様である。関連性のスコアが出力される場合には、スコアが閾値以上であることが、関連性があることに相当する。 For example, the process execution unit 204 executes, as the predetermined process, a registration process for registering a conversion query estimated to be relevant in a search service. The process execution unit 204 executes, as the registration process, a process for registering a conversion query that has been formatted by the query formatting unit 203 and that has been estimated to be relevant in a search service. The process execution unit 204 differs from the first embodiment in that it targets conversion queries estimated to be relevant, but is similar in other respects. When a relevance score is output, a score equal to or greater than a threshold corresponds to relevance.
[2-2.第2実施形態で実行される処理]
図12は、第2実施形態で実行される処理の一例を示す図である。図12のS21~S28の処理は、第1実施形態のS1~S8の処理と同様である。
[2-2. Processing Executed in the Second Embodiment]
Fig. 12 is a diagram showing an example of the process executed in the second embodiment. The processes of S21 to S28 in Fig. 12 are similar to the processes of S1 to S8 in the first embodiment.
広告主端末20は、ECサーバ10から、関連性の推定対象となるコンバージョンクエリを取得する(S29)。広告主端末20は、学習済みの関連性推定モデルM2に基づいて、S29で取得されたコンバージョンクエリと、ECサービスと、の関連性を推定する(S30)。関連性がないと推定された場合(S30:N)、本処理は終了する。一方、関連性があると推定された場合(S30:Y)、第1実施形態のS10~S12の処理と同様のS31~S33の処理が実行される。 The advertiser terminal 20 acquires a conversion query for which relevance is to be estimated from the EC server 10 (S29). The advertiser terminal 20 estimates the relevance between the conversion query acquired in S29 and the EC service based on the trained relevance estimation model M2 (S30). If it is estimated that there is no relevance (S30: N), this process ends. On the other hand, if it is estimated that there is relevance (S30: Y), the processes of S31 to S33, which are similar to the processes of S10 to S12 in the first embodiment, are executed.
第2実施形態のクエリ整形システム1は、関連性推定モデルM2に基づいて、コンバージョンクエリと、ECサービスと、の関連性を推定する。クエリ整形システム1は、関連性に基づいて、所定の処理を実行する。これにより、コンバージョンクエリと、ECサービスと、の関連性を推定できる。このため、ECサービスと関連性があるコンバージョンに基づいて所定の処理を実行できるので、コンバージョンクエリを利用する目的を達成しやすくなる。例えば、ECサービスと関連性がないコンバージョンクエリが、表示領域A20に検索連動型広告の一部として表示されてしまうことを防止できる。例えば、ECサービスと関連性がない検索連動型広告が表示されることも防止できるので、ECサービスがレピュテーションリスクにさらされることを低減できる。 The query shaping system 1 of the second embodiment estimates the relevance between a conversion query and an EC service based on the relevance estimation model M2. The query shaping system 1 executes a predetermined process based on the relevance. This makes it possible to estimate the relevance between a conversion query and an EC service. As a result, the predetermined process can be executed based on a conversion that is related to an EC service, making it easier to achieve the purpose of using a conversion query. For example, it is possible to prevent a conversion query that is not related to an EC service from being displayed as part of a search-related advertisement in the display area A20. For example, it is also possible to prevent a search-related advertisement that is not related to an EC service from being displayed, thereby reducing exposure of the EC service to reputation risks.
また、クエリ整形システム1は、ECサービスは、検索連動型広告を表示させる検索サービスとは異なる他のサービスである。これにより、サービスをまたいでコンバージョンが発生する場合だったとしても、コンバージョンクエリと、ECサービスと、の関連性を推定できる。 In addition, the query shaping system 1 considers that the EC service is a different service from the search service that displays search-related advertisements. This makes it possible to estimate the relevance between the conversion query and the EC service even if a conversion occurs across services.
また、クエリ整形システム1は、関連性があると推定されたコンバージョンクエリを検索サービスに登録する登録処理を、所定の処理として実行する。これにより、サービスをまたいでコンバージョンが発生する場合だったとしても、ECサービスと関連性のあるコンバージョンクエリを検索サービスに登録できる。 In addition, the query shaping system 1 executes a registration process, as a predetermined process, for registering conversion queries that are estimated to be relevant in a search service. This allows conversion queries that are relevant to an EC service to be registered in a search service even if conversions occur across services.
また、クエリ整形システム1は、関連性があると推定された整形済みのコンバージョンクエリを検索サービスに登録する処理を、登録処理として実行する。これにより、サービスをまたいでコンバージョンが発生する場合だったとしても、ECサービスと関連性のあり、かつ、適切な状態に整形済みのコンバージョンクエリを検索サービスに登録できる。 In addition, the query shaping system 1 executes a process of registering a shaped conversion query that is estimated to be relevant in a search service as a registration process. This allows a conversion query that is relevant to an EC service and has been shaped appropriately to be registered in the search service even if a conversion occurs across services.
また、クエリ整形システム1は、検索サービスで実際に入力された訓練用クエリであって、他のサービスとの関連性がある訓練用クエリが学習された関連性推定モデルM2に基づいて、関連性を推定する。検索サービスで実際に入力された情報を有効活用して作成した関連性推定モデルM2によって関連性を推定できる。 The query shaping system 1 also estimates relevance based on a relevance estimation model M2 that has learned training queries that are actually input to a search service and have relevance to other services. Relevance can be estimated by the relevance estimation model M2 that is created by effectively utilizing information that is actually input to a search service.
[3.変形例]
本開示は、以上に説明した第1実施形態及び第2実施形態に限定されるものではない。本開示の趣旨を逸脱しない範囲で、適宜変更可能である。
3. Modifications
The present disclosure is not limited to the first and second embodiments described above. Appropriate modifications can be made without departing from the spirit and scope of the present disclosure.
[3-1.第1実施形態に関する変形例]
図13は、第1実施形態に関する変形例における機能の一例を示す図である。後述の変形例1-2では、広告主端末20は、分割実行部206を含む。分割実行部206は、制御部11により実現される。第1実施形態に関する変形例では、デトークナイゼーションが実行されなくてもよいので、図13では、デトークナイゼーション実行部202を示していない。
[3-1. Modifications of the first embodiment]
Fig. 13 is a diagram showing an example of functions in a modified example related to the first embodiment. In modified example 1-2 described below, the advertiser terminal 20 includes a division execution unit 206. The division execution unit 206 is realized by the control unit 11. In the modified example related to the first embodiment, detokenization does not need to be performed, so the detokenization execution unit 202 is not shown in Fig. 13.
[変形例1-1]
例えば、ECサービスの運営者が、検索サービス側でどのような形態素解析が実行されるかを把握している場合には、検索サービス側で実行される形態素解析を再現することによって、クエリ整形モデルM1の訓練データが生成されるようにしてもよい。変形例1-1では、ECサービスの運営者は、検索サービスと同じ形態素解析ツールを取得しているものとする。
[Modification 1-1]
For example, if the operator of the EC service knows what kind of morphological analysis is performed on the search service side, the training data for the query shaping model M1 may be generated by reproducing the morphological analysis performed on the search service side. In the modification 1-1, it is assumed that the operator of the EC service has acquired the same morphological analysis tool as the search service.
変形例1-1のクエリ整形部203は、検索サービスにおけるコンバージョンクエリの変更に応じて訓練用クエリが変更された変更済みの訓練用クエリと、変更前の訓練用クエリと、の関係が訓練データとして学習されたクエリ整形モデルM1に基づいて、変更済みのコンバージョンクエリを整形する。変形例1-1では、第1実施形態と同様に、コンバージョンクエリに対する形態素解析が、コンバージョンクエリに対する変更に相当する。形態素解析が実行される前の訓練用クエリは、第1実施形態と同様にして取得されるようにすればよい。 The query shaping unit 203 of variant 1-1 shapes the modified conversion query based on a query shaping model M1 in which the relationship between the modified training query, in which the training query has been modified in response to a change in the conversion query in the search service, and the training query before the change has been learned as training data. In variant 1-1, as in the first embodiment, the morphological analysis of the conversion query corresponds to a change to the conversion query. The training query before the morphological analysis is performed may be obtained in the same manner as in the first embodiment.
例えば、変形例1-1では、広告主端末20は、検索サービスと同じ形態素解析ツールに基づいて、訓練用のクエリの形態素解析を実行する。広告主端末20は、形態素に分割された後の訓練用クエリを、変更済みの訓練用クエリとして取得する。広告主端末20は、形態素に分割された後の訓練用クエリと、形態素に分割される前の訓練用クエリと、のペアを訓練データとして取得し、クエリ整形モデルM1に学習させる。変形例1-1のクエリ整形モデルM1は、変形例1-3のクエリ整形モデルM1と同様であってよい。 For example, in variant 1-1, the advertiser terminal 20 performs morpheme analysis of the training query based on the same morpheme analysis tool as the search service. The advertiser terminal 20 acquires the training query after it has been divided into morphemes as a modified training query. The advertiser terminal 20 acquires a pair of the training query after it has been divided into morphemes and the training query before it has been divided into morphemes as training data, and trains the query shaping model M1. The query shaping model M1 in variant 1-1 may be similar to the query shaping model M1 in variant 1-3.
なお、変形例1-1では、訓練データの取得方法が第1実施形態とは異なるが、クエリ整形モデルM1の学習方法は、第1実施形態と同様である。また、学習済みのクエリ整形モデルM1を利用してコンバージョンクエリを整形する処理も、第1実施形態と同様である。また、検索サービス側で、コンバージョンクエリに対し、形態素解析以外の他の変更が実行される場合には、ECシステムの運営者は、他の変更を実行するための変更ツールを取得しているものとする。当該変更ツールに基づいて、訓練データが生成されるようにすればよい。 In addition, in the modified example 1-1, the method of acquiring training data is different from that of the first embodiment, but the learning method of the query shaping model M1 is the same as that of the first embodiment. In addition, the process of shaping the conversion query using the trained query shaping model M1 is also the same as that of the first embodiment. In addition, when the search service performs other changes to the conversion query besides morphological analysis, it is assumed that the operator of the EC system has acquired a change tool for performing the other changes. Training data may be generated based on the change tool.
変形例1-1のクエリ整形システム1は、検索サービスにおけるコンバージョンクエリの変更を再現した訓練データが学習されたクエリ整形モデルM1に基づいて、変更済みのコンバージョンクエリを整形することによって、クエリ整形の精度が高まる。 The query shaping system 1 of variant example 1-1 improves the accuracy of query shaping by shaping the modified conversion query based on a query shaping model M1 that has been learned from training data that reproduces the changes to the conversion query in the search service.
[変形例1-2]
例えば、第1実施形態では、デトークナイゼーションが実行された後に、トークナイゼーションが実行されることによって、クエリ整形が実行される場合を説明したが、クエリ整形の方法は、第1実施形態の例に限られない。クエリ整形は、何らかの形でコンバージョンクエリが適切な形に整形されるようにすればよい。変形例1-2では、第1実施形態とは逆に、トークナイゼーションが実行された後に、デトークナイゼーションが実行される場合を例に挙げる。
[Modification 1-2]
For example, in the first embodiment, a case has been described in which detokenization is performed and then tokenization is performed, thereby performing query shaping, but the method of query shaping is not limited to the example of the first embodiment. Query shaping may be performed in any manner so long as the conversion query is shaped into an appropriate form. In Modification 1-2, an example will be given in which, contrary to the first embodiment, detokenization is performed after tokenization is performed.
図14は、変形例1-2におけるクエリ整形の一例を示す図である。変形例1-2のクエリ整形システム1は、分割実行部206を含む。分割実行部206は、コンバージョンクエリを所定の分割単位ごとに分割する。図14の例では、分割単位が1文字である場合を説明するが、分割単位は、予め定められた文字数であればよく、2文字以上であってもよい。分割実行部206は、コンバージョンクエリを文字ごとに分割し、文字間にセパレータを挿入する。 Figure 14 is a diagram showing an example of query shaping in variant example 1-2. The query shaping system 1 in variant example 1-2 includes a division execution unit 206. The division execution unit 206 divides the conversion query into predetermined division units. In the example of Figure 14, a case is described in which the division unit is one character, but the division unit may be any predetermined number of characters and may be two or more characters. The division execution unit 206 divides the conversion query into characters and inserts separators between the characters.
変形例1-2のクエリ整形モデルM1は、文字単位に分割された訓練用クエリを含む訓練データが学習されている。図14の例では、訓練データには、訓練用クエリに含まれる文字間のセパレータの真偽が含まれる。例えば、セパレータの真偽は、ECサービスの運営者によって手動で付与されてもよいし、分割前の訓練用クエリに含まれているセパレータを真にして、分割前の訓練用クエリに含まれていないセパレータを偽にしてもよい。 The query shaping model M1 of variant example 1-2 is trained on training data including training queries split into character units. In the example of FIG. 14, the training data includes the truth or falsity of separators between characters included in the training queries. For example, the truth or falsity of the separators may be manually assigned by the operator of the EC service, or the separators included in the training queries before splitting may be set to true and the separators not included in the training queries before splitting may be set to false.
クエリ整形モデルM1は、分割済みの訓練用クエリが入力されると、訓練用クエリ内のセパレータの真偽を出力する。当該出力された真偽が訓練データに含まれる正解となる真偽になるように、クエリ整形モデルM1のパラメータが調整される。例えば、クエリ整形部203は、クエリ整形モデルM1に基づいて、分割単位ごとに分割された分割済みのコンバージョンクエリに関する分割適否を推定することによって、当該分割済みのコンバージョンクエリを整形する。 When the divided training query is input, the query shaping model M1 outputs the truth or falsity of the separator in the training query. The parameters of the query shaping model M1 are adjusted so that the output truth or falsity becomes the correct truth or falsity included in the training data. For example, the query shaping unit 203 shapes the divided conversion query by estimating the suitability of division for the divided conversion query divided into division units based on the query shaping model M1.
図14の例では、擬似的に挿入されたセパレータのうちの一部が偽として推定されるので、クエリ整形部203は、真であることが推定されたセパレータのみを残すことによって、コンバージョンクエリを整形する。即ち、クエリ整形部203は、分割単位に分割後のコンバージョンクエリに含まれるセパレータのうち、偽と推定されたセパレータを削除することによって、コンバージョンクエリを整形する。 In the example of FIG. 14, some of the pseudo-inserted separators are estimated to be false, so the query reforming unit 203 reforms the conversion query by leaving only the separators estimated to be true. That is, the query reforming unit 203 reforms the conversion query by deleting the separators estimated to be false from among the separators included in the conversion query after division into division units.
変形例1-2のクエリ整形システム1は、分割単位ごとにコンバージョンクエリを分割することによって、どのような状態のコンバージョンクエリだったとしても、トークン1つという同じ状態にしたうえでクエリ整形を実行できるので、コンバージョンクエリに対するクエリ整形の精度が高まる。 The query shaping system 1 of variant example 1-2 divides the conversion query into division units, so that no matter what state the conversion query is in, it can perform query shaping after putting it into the same state of one token, thereby improving the accuracy of query shaping for the conversion query.
[変形例1-3]
例えば、クエリ整形モデルM1は、第1実施形態のようなトークナイゼーション、又は、変形例1-2のようなセパレータの真偽の判定ではなく、他の方法によってクエリ整形を実行してもよい。変形例1-3では、クエリ整形モデルM1には、整形前の訓練用クエリと、整形後の訓練用クエリと、のペアである訓練データが学習されているものとする。
[Modification 1-3]
For example, the query shaping model M1 may perform query shaping by a method other than tokenization as in the first embodiment or judging the truth or falsehood of a separator as in Modification 1-2. In Modification 1-3, it is assumed that the query shaping model M1 has learned training data that is a pair of a training query before shaping and a training query after shaping.
整形後の訓練用クエリは、形態素解析等が実行されていない最適な状態のクエリである。整形前の訓練用クエリは、何らかの形態素解析ツールで形態素解析が実行された後のクエリであってもよい。例えば、変形例1-1のように、検索サービス側と同じ形態素解析ツールではなく、他の形態素解析ツールで形態素解析が実行されることによって、整形前の訓練用クエリが取得されてもよい。 The reformulated training query is a query in an optimal state in which no morphological analysis or the like has been performed. The unformulated training query may be a query after morphological analysis has been performed with some morphological analysis tool. For example, as in variant example 1-1, the unformulated training query may be obtained by performing morphological analysis with a different morphological analysis tool, rather than the same morphological analysis tool as the search service.
例えば、広告主端末20は、訓練データに含まれる整形前の訓練用クエリがクエリ整形モデルM1に入力されると、訓練データに含まれる整形後の訓練用クエリがクエリ整形モデルM1から出力されるように、クエリ整形モデルM1の学習を実行する。変形例1-3のクエリ整形部203は、整形前の訓練用クエリと、整形後の訓練用クエリと、の関係が訓練データとして学習されたクエリ整形モデルM1に対し、コンバージョンクエリを入力し、クエリ整形モデルM1から出力された整形済みのコンバージョンクエリを取得することによって、コンバージョンクエリを整形する。 For example, when an unshaped training query included in the training data is input to the query shaping model M1, the advertiser terminal 20 executes learning of the query shaping model M1 so that the shaped training query included in the training data is output from the query shaping model M1. The query shaping unit 203 of variant example 1-3 shapes the conversion query by inputting a conversion query to the query shaping model M1 in which the relationship between the unshaped training query and the shaped training query is learned as training data, and acquiring the shaped conversion query output from the query shaping model M1.
例えば、クエリ整形部203は、クエリ整形モデルM1に対し、コンバージョンクエリを入力する。クエリ整形モデルM1は、当該入力されたコンバージョンクエリの特徴量を計算し、当該計算された特徴量に応じた整形済みのコンバージョンクエリを出力する。第1実施形態では、デトークナイゼーションが実行されたうえで整形済みのコンバージョンクエリが出力されるが、変形例1-3では、デトークナイゼーションが実行されずに、形態素に分割されたコンバージョンクエリがそのままクエリ整形モデルM1に入力される。 For example, the query shaping unit 203 inputs a conversion query to the query shaping model M1. The query shaping model M1 calculates features of the input conversion query and outputs a shaped conversion query according to the calculated features. In the first embodiment, detokenization is performed and then the shaped conversion query is output, but in variant example 1-3, detokenization is not performed and the conversion query divided into morphemes is input as is to the query shaping model M1.
変形例1-3のクエリ整形システム1は、整形前の訓練用クエリと、整形後の訓練用クエリと、の関係が訓練データとして学習されたクエリ整形モデルM1に基づいて、コンバージョンクエリを整形する。これにより、コンバージョンクエリを適切な状態に整形できる。 The query shaping system 1 of variant example 1-3 shapes the conversion query based on the query shaping model M1 in which the relationship between the training query before shaping and the training query after shaping is learned as training data. This allows the conversion query to be shaped appropriately.
[変形例1-4]
例えば、クエリ整形モデルM1には、訓練用クエリに含まれるトークンの位置に関する位置情報が学習されていてもよい。位置情報自体は、任意の情報であってよく、例えば、BIO(Begin Inside Outside)タグ又はBIOES(Begin Inside Outside End Single)タグであってもよい。変形例1-4では、位置情報がBIOESタグである場合を説明する。訓練データは、訓練用クエリと、訓練用クエリを適切にトークナイズした場合の個々のトークンの1文字目にBタグが付与されて最終文字にEタグが付与された位置情報と、のペアになる。
[Modification 1-4]
For example, the query shaping model M1 may have learned position information regarding the positions of tokens included in the training query. The position information itself may be any information, for example, a BIO (Begin Inside Outside) tag or a BIOES (Begin Inside Outside End Single) tag. In Modification 1-4, a case where the position information is a BIOES tag will be described. The training data is a pair of the training query and position information in which a B tag is assigned to the first character of each token and an E tag is assigned to the last character when the training query is appropriately tokenized.
変形例1-4のクエリ整形部203は、訓練用クエリに含まれるトークンの位置に関する位置情報が訓練データとして学習されたクエリ整形モデルM1に対し、コンバージョンクエリを入力し、学習モデルから出力された位置情報に基づいて、コンバージョンクエリを整形する。クエリ整形モデルM1は、入力されたコンバージョンクエリに対し、トークンの1文字目と推定された文字にBタグを付与し、トークンの最終文字と推定された文字にEタグを付与する。中間的な文字にはIタグが付与され、セパレータにはOタグが付与されてもよい。クエリ整形部203は、Bタグが付与された文字からEタグが付与された文字までが1つのトークンとなるように、コンバージョンクエリを整形する。 The query shaping unit 203 of variant example 1-4 inputs a conversion query to the query shaping model M1 in which location information regarding the location of a token included in a training query has been learned as training data, and shapes the conversion query based on the location information output from the learning model. For the input conversion query, the query shaping model M1 assigns a B tag to a character estimated to be the first character of a token, and an E tag to a character estimated to be the last character of the token. An I tag may be assigned to intermediate characters, and an O tag may be assigned to separators. The query shaping unit 203 shapes the conversion query so that the character assigned the B tag to the character assigned the E tag becomes one token.
変形例1-4のクエリ整形システム1は、訓練用クエリに含まれるトークンの位置に関する位置情報が訓練データとして学習されたクエリ整形モデルM1に基づいて、コンバージョンクエリを整形する。これにより、コンバージョンクエリを適切な状態に整形できる。 The query shaping system 1 of variant example 1-4 shapes the conversion query based on the query shaping model M1 in which location information regarding the positions of tokens included in the training query is learned as training data. This allows the conversion query to be shaped appropriately.
[第1実施形態に関するその他の変形例]
例えば、第1実施形態では、検索サービス側でコンバージョンクエリが変更され、ECサービス側でクエリ整形が実行される場合を説明したが、検索サービス側でコンバージョンクエリが変更されなくてもよい。例えば、ユーザが、スペースを一切入れずにコンバージョンクエリを入力したり、不自然な位置にスペースを入れたコンバージョンクエリを入力したりすることがある。この場合にも、クエリ整形部203は、第1実施形態と同様の処理を実行することによって、ユーザが入力した不自然なコンバージョンクエリを整形してもよい。
[Other Modifications of the First Embodiment]
For example, in the first embodiment, a case has been described in which the conversion query is changed on the search service side and the query shaping is performed on the EC service side, but the conversion query may not be changed on the search service side. For example, a user may enter a conversion query without any spaces or with a space in an unnatural position. In this case, the query shaping unit 203 may perform the same process as in the first embodiment to shape the unnatural conversion query entered by the user.
なお、ユーザが入力した不自然なコンバージョンクエリを整形する場合には、ユーザが入力したコンバージョンクエリがそのまま表示領域A20に表示されるものとする。検索連動型広告に表示用キーワードが関連付けられている場合には、この表示用キーワードが表示領域A20に表示される。ユーザが不自然なコンバージョンクエリを入力したとしても、クエリ整形部203によって整形された自然な表示用キーワードを表示領域A20に表示させることができる。 When shaping an unnatural conversion query input by the user, the conversion query input by the user is displayed as is in the display area A20. When a display keyword is associated with the search-linked advertisement, this display keyword is displayed in the display area A20. Even if the user inputs an unnatural conversion query, a natural display keyword shaped by the query shaping unit 203 can be displayed in the display area A20.
[3-2.第2実施形態に関する変形例]
第2実施形態に関する変形例を説明する。
[3-2. Modifications of the second embodiment]
A modification of the second embodiment will now be described.
[変形例2-1]
例えば、第2実施形態では、検索サービスで実際に入力された訓練用クエリが関連性推定モデルM2に学習される場合を説明したが、関連性推定モデルM2には、ECサービスで実際に入力された訓練用クエリが学習されてもよい。訓練データとして利用される訓練用クエリが、検索サービスで実際に入力されたものであるか、ECサービスで実際に入力されたものであるかが第2実施形態とは異なるが、関連性推定モデルM2の学習方法自体は、第2実施形態と同様である。
[Modification 2-1]
For example, in the second embodiment, a case has been described in which a training query actually input in a search service is learned by the relevance estimation model M2, but a training query actually input in an EC service may be learned by the relevance estimation model M2. Although the second embodiment differs from the second embodiment in that the training query used as training data is one actually input in a search service or one actually input in an EC service, the learning method of the relevance estimation model M2 itself is similar to that of the second embodiment.
変形例2-1の関連性推定部205は、ECサービスで実際に入力された訓練用クエリが学習された関連性推定モデルM2に基づいて、関連性を推定する。関連性推定モデルM2の学習で利用される訓練用クエリが第2実施形態とは異なるが、学習済みの関連性推定モデルM2に基づいて関連性を推定する処理は、第2実施形態と同様である。ECサービスで実際に入力された訓練用クエリは、ECサービスの利用ログとしてデータ記憶部100に格納されているものとする。 The relevance estimation unit 205 of variant example 2-1 estimates relevance based on the relevance estimation model M2 that has been trained with training queries that have actually been input to the EC service. Although the training queries used in training the relevance estimation model M2 are different from those in the second embodiment, the process of estimating relevance based on the trained relevance estimation model M2 is the same as in the second embodiment. It is assumed that the training queries that have actually been input to the EC service are stored in the data storage unit 100 as a usage log of the EC service.
変形例2-1のクエリ整形システム1は、ECサービスで実際に入力された訓練用クエリが学習された学習モデルに基づいて、関連性を推定する。これにより、ECサービスで実際に入力された訓練用クエリが関連性推定モデルM2に学習されることによって、関連性の推定精度が高まる。 The query shaping system 1 of variant example 2-1 estimates relevance based on a learning model that has been trained on training queries that were actually input in EC services. This allows the training queries that were actually input in EC services to be learned by the relevance estimation model M2, thereby improving the accuracy of relevance estimation.
[変形例2-2]
例えば、関連性推定部205は、ECサービスとの関連性がある第1訓練用クエリと、ECサービスとの関連性がない第2訓練用クエリと、が学習された関連性推定モデルM2に基づいて、関連性を推定してもよい。即ち、関連性推定モデルM2には、ECサービスとの関連性がある第1訓練用クエリだけではなく、ECサービスとの関連性がない第2訓練用クエリも学習されてもよい。
[Modification 2-2]
For example, the relevance estimation unit 205 may estimate the relevance based on the relevance estimation model M2 in which a first training query related to an EC service and a second training query not related to an EC service are trained. That is, the relevance estimation model M2 may train not only the first training query related to an EC service but also the second training query not related to an EC service.
ECサービスとの関連性がない第2訓練用クエリは、ECサービスの運営者によって手動で用意されてもよい。第2訓練用クエリに対応する出力としては、ECサービスとは関連性がないことを示す第2の値になる。第1訓練用クエリに基づく学習方法は、第2実施形態で説明した通りである。例えば、第2訓練用クエリが関連性推定モデルM2に入力されると、関連性がないことが出力されるように、関連性推定モデルM2が学習される。 The second training query that is not related to the EC service may be prepared manually by the operator of the EC service. The output corresponding to the second training query is a second value indicating that there is no related to the EC service. The learning method based on the first training query is as described in the second embodiment. For example, when the second training query is input to the relevance estimation model M2, the relevance estimation model M2 is trained so that it outputs that there is no relatedness.
変形例2-2のクエリ整形システム1は、ECサービスとの関連性がある第1訓練用クエリと、ECサービスとの関連性がない第2訓練用クエリと、が学習された関連性推定モデルM2に基づいて、関連性を推定することによって、関連性の推定精度が高まる。 The query shaping system 1 of variant example 2-2 estimates relevance based on a relevance estimation model M2 that has been trained on a first training query that is related to EC services and a second training query that is not related to EC services, thereby improving the accuracy of relevance estimation.
[変形例2-3]
例えば、第2実施形態では、コンバージョンクエリがECサービスに何らか関連性があるか否かが推定される場合を説明したが、コンバージョンクエリがECサービスに何らかの関連性があったとしても、コンバージョンした商品とは関係がないことがある。このため、コンバージョンクエリと、コンバージョンが発生したコンバージョン商品と、の関連性が推定されてもよい。関連性の意味は、第2実施形態で説明した通りである。例えば、ECサービスでコンバージョンクエリが入力された場合に、検索でヒットする商品数が多いほど関連性が高いことを意味する。
[Modification 2-3]
For example, in the second embodiment, a case has been described in which it is estimated whether or not the conversion query has some relevance to the EC service, but even if the conversion query has some relevance to the EC service, it may not be related to the converted product. For this reason, the relevance between the conversion query and the converted product for which the conversion has occurred may be estimated. The meaning of the relevance is as described in the second embodiment. For example, when a conversion query is input in an EC service, the greater the number of products that are hit in the search, the higher the relevance.
変形例2-3の関連性推定部205は、ECサービスにおける訓練用商品との関連性がある訓練用クエリが学習された関連性推定モデルM2に基づいて、コンバージョンクエリと、ECサービスでコンバージョンが発生したコンバージョン商品と、の関連性を推定する。訓練用商品は、訓練用アイテムの一例である。コンバージョン商品は、コンバージョンアイテムの一例である。このため、訓練用商品又はコンバージョン商品と記載した箇所は、それぞれ訓練用アイテム又はコンバージョンアイテムと読み替えることができる。 The relevance estimation unit 205 of variant example 2-3 estimates the relevance between a conversion query and a conversion product for which a conversion has occurred in an EC service, based on the relevance estimation model M2 in which training queries that are relevant to training products in an EC service have been learned. A training product is an example of a training item. A conversion product is an example of a conversion item. Therefore, the places where it is written as a training product or a conversion product can be read as a training item or a conversion item, respectively.
アイテムは、商品に限られず、検索連動型広告の対象となるものであればよい。例えば、旅行予約サービスであれば、宿泊施設がアイテムに相当する。例えば、動画配信サービスであれば、動画又は楽曲等のコンテンツがアイテムに相当する。関連性の推定対象となるものがECサービス全体ではなく、コンバージョン商品である点で第2実施形態とは異なるが、関連性推定モデルM2の学習方法の大まかな仕組みや推定時の処理は同様である。 Items are not limited to products, and may be anything that is the target of search-linked advertising. For example, in a travel reservation service, accommodation facilities are equivalent to items. For example, in a video distribution service, content such as videos or music are equivalent to items. This differs from the second embodiment in that the subject of relevance estimation is not the entire EC service, but conversion products, but the general mechanism of the learning method of the relevance estimation model M2 and the processing during estimation are similar.
例えば、関連性推定モデルM2の訓練データは、入力データとして、訓練用クエリと、コンバージョン商品として適切な商品に関する商品情報(例えば、タイトル、属性、詳細説明の全部又は一部、商品名、又はその他のキーワード)と、を含む。訓練データは、出力データとして、関連性があることを示す第1の値を含む。関連性推定モデルM2は、訓練用クエリ及び商品情報の組み合わせが入力された場合に、関連性があることを示す第1の値が出力されるように学習される。関連性推定部205は、コンバージョンクエリと、コンバージョン商品に関する商品情報と、の組み合わせを関連性推定モデルM2に入力し、関連性推定モデルM2からの出力を取得することによって、関連性を推定する。 For example, the training data for the relevance estimation model M2 includes, as input data, a training query and product information on a product suitable as a conversion product (e.g., a title, attributes, all or part of a detailed description, a product name, or other keywords). The training data includes, as output data, a first value indicating relevance. The relevance estimation model M2 is trained so that when a combination of a training query and product information is input, the first value indicating relevance is output. The relevance estimation unit 205 inputs a combination of a conversion query and product information on a conversion product to the relevance estimation model M2 and estimates the relevance by obtaining an output from the relevance estimation model M2.
変形例2-3のクエリ整形システム1は、ECサービスにおける訓練用商品との関連性がある訓練用クエリが学習された関連性推定モデルM2に基づいて、コンバージョンクエリと、ECサービスでコンバージョンが発生したコンバージョン商品と、の関連性を推定する。これにより、コンバージョンクエリ及びコンバージョン商品の組み合わせが適切か否かといった推定をすることができるので、関連性の推定精度が高まる。 The query shaping system 1 of variant example 2-3 estimates the relevance between a conversion query and a conversion product that has caused a conversion in an EC service, based on the relevance estimation model M2 that has learned training queries that are related to training products in an EC service. This makes it possible to estimate whether the combination of the conversion query and the conversion product is appropriate, thereby improving the accuracy of estimating the relevance.
[変形例2-4]
例えば、変形例2-3では、コンバージョンクエリと、コンバージョン商品と、の関連性が推定される場合を説明したが、更に具体的に、コンバージョンクエリと、コンバージョン商品の属性と、の関連性が推定されてもよい。変形例2-4では、変形例2-3で説明した商品情報が属性を示す。属性は、商品の分類である。属性は、カテゴリ又はジャンルと呼ばれることもある。
[Modification 2-4]
For example, in the modified example 2-3, a case was described in which a relevance between a conversion query and a conversion product was estimated, but more specifically, a relevance between a conversion query and an attribute of the conversion product may be estimated. In the modified example 2-4, the product information described in the modified example 2-3 indicates an attribute. An attribute is a classification of a product. An attribute may also be called a category or genre.
変形例2-4の関連性推定部205は、訓練用商品に関する第1属性との関連性がある訓練用クエリが学習された関連性推定モデルM2に基づいて、コンバージョンクエリと、コンバージョン商品に関する第2属性と、の関連性を推定する。関連性推定モデルM2の学習方法は、変形例2-3と同様である。変形例2-3の説明における商品情報を属性と読み替えればよい。関連性推定部205は、コンバージョンクエリと、コンバージョン商品の属性と、の組み合わせを関連性推定モデルM2に入力し、関連性推定モデルM2からの出力を取得することによって、関連性を推定する。 The relevance estimation unit 205 of variant 2-4 estimates the relevance between the conversion query and the second attribute related to the conversion product based on the relevance estimation model M2 in which training queries that are relevant to the first attribute related to the training product have been learned. The learning method of the relevance estimation model M2 is the same as that of variant 2-3. The product information in the description of variant 2-3 can be read as attribute. The relevance estimation unit 205 estimates the relevance by inputting a combination of the conversion query and the attribute of the conversion product to the relevance estimation model M2 and obtaining an output from the relevance estimation model M2.
変形例2-4のクエリ整形システム1は、訓練用商品に関する第1属性との関連性がある訓練用クエリが学習された関連性推定モデルM2に基づいて、コンバージョンクエリと、コンバージョンアイテムに関する第2属性と、の関連性を推定する。これにより、コンバージョンクエリ及びコンバージョン商品の属性の組み合わせが適切か否かといった推定をすることができるので、関連性の推定精度が高まる。 The query shaping system 1 of variant 2-4 estimates the relevance between a conversion query and a second attribute related to a conversion item based on the relevance estimation model M2 that has been trained with training queries that are relevant to a first attribute related to a training product. This makes it possible to estimate whether the combination of the conversion query and the attribute of the conversion product is appropriate, thereby improving the accuracy of estimating the relevance.
[変形例2-5]
例えば、処理実行部204が実行する所定の処理は、第2実施形態で説明した例に限られない。処理実行部204は、関連性に基づいて、コンバージョンクエリを表示する表示処理を、所定の処理として実行してもよい。変形例2-5では、処理実行部204は、関連性に関する情報(例えば、関連性の有無又はスコア)を広告主端末20の表示部25に表示する表示処理を例に挙げるが、広告主端末20以外の他のコンピュータへの表示処理を実行してもよい。処理実行部204は、関連性を示すスコアに基づいて、複数のコンバージョンクエリをソートして表示させる表示処理を実行してもよい。
[Modification 2-5]
For example, the predetermined process executed by the process execution unit 204 is not limited to the example described in the second embodiment. The process execution unit 204 may execute, as the predetermined process, a display process for displaying conversion queries based on relevance. In Modification 2-5, the process execution unit 204 takes as an example a display process for displaying information related to relevance (e.g., the presence or absence of relevance or a score) on the display unit 25 of the advertiser terminal 20, but may execute a display process on a computer other than the advertiser terminal 20. The process execution unit 204 may execute a display process for sorting and displaying a plurality of conversion queries based on a score indicating the relevance.
変形例2-5のクエリ整形システム1は、関連性に基づいて、コンバージョンクエリを表示する表示処理を、所定の処理として実行する。これにより、ECサービスの運営者がコンバージョンクエリとECサービスの関連性を理解しやすくなる。 The query shaping system 1 of variant example 2-5 executes a display process that displays conversion queries based on relevance as a predetermined process. This makes it easier for operators of EC services to understand the relevance between conversion queries and EC services.
[第2実施形態に関するその他の変形例]
例えば、第2実施形態のクエリ整形システム1は、関連性推定システムの一例である。このため、第2実施形態のクエリ整形システム1について説明している箇所は、関連性推定システムと読み替えることができる。第2実施形態では、第1実施形態で説明したクエリ整形の機能が無くてもよい。このため、関連性推定システムは、デトークナイゼーション実行部202及びクエリ整形部203を含まずに、取得部201、処理実行部204、及び関連性推定部205だけを含んでもよい。
[Other Modifications of the Second Embodiment]
For example, the query shaping system 1 of the second embodiment is an example of a relevance estimation system. Therefore, the parts describing the query shaping system 1 of the second embodiment can be read as the relevance estimation system. The second embodiment does not need to have the query shaping function described in the first embodiment. Therefore, the relevance estimation system may include only the acquisition unit 201, the process execution unit 204, and the relevance estimation unit 205, without including the detokenization execution unit 202 and the query shaping unit 203.
[3-3.その他の変形例]
例えば、上記説明した変形例を組み合わせてもよい。
[3-3. Other Modifications]
For example, the above-described modifications may be combined.
例えば、クエリ整形システム1は、ECサービス以外の他のサービスに適用してもよい。検索サービスと連携する他のサービスは、任意のサービスであってよく、例えば、旅行予約サービス、動画配信サービス、金融サービス、通信サービス、又は決済サービスであってよい。他のサービスは、検索サービスに検索連動型広告を掲載し、何らかのコンバージョンが発生するサービスであればよい。検索連動型広告は、ECサービス内の広告であってもよい。この場合、ECサービスにおける商品の検索時に、検索連動型広告が表示される。 For example, the query shaping system 1 may be applied to services other than EC services. The other services linked to the search service may be any service, for example, a travel reservation service, a video distribution service, a financial service, a communication service, or a payment service. The other services may be services that post search-related advertisements in the search service and generate some kind of conversion. The search-related advertisements may be advertisements within the EC service. In this case, the search-related advertisements are displayed when searching for products in the EC service.
例えば、ECサーバ10、広告主端末20、検索サーバ30、及びユーザ端末40の各々で実現されるものとして説明した機能は、他のコンピュータで実現されてもよいし、複数のコンピュータで分担されてもよい。例えば、データ記憶部100,200,300,400に記憶されるものとしたデータは、図1には示さないデータベースサーバに記憶されていてもよい。 For example, the functions described as being realized by each of the EC server 10, the advertiser terminal 20, the search server 30, and the user terminal 40 may be realized by another computer or may be shared among multiple computers. For example, the data stored in the data storage units 100, 200, 300, and 400 may be stored in a database server not shown in FIG. 1.
[4.付記]
例えば、クエリ整形システムは、下記のような構成も可能である。
(1)
検索連動型広告に関するコンバージョンが発生したコンバージョンクエリを取得する取得部と、
クエリ整形に関する訓練データが学習された学習モデルに基づいて、前記コンバージョンクエリを整形するクエリ整形部と、
前記クエリ整形部により整形された整形済みの前記コンバージョンクエリに基づいて、所定の処理を実行する処理実行部と、
を含むクエリ整形システム。
(2)
前記検索連動型広告は、当該検索連動型広告が表示される検索サービスとは異なる他のサービスにユーザをアクセスさせるための広告であり、
前記取得部は、前記他のサービスでコンバージョンが発生した前記コンバージョンクエリを取得する、
(1)に記載のクエリ整形システム。
(3)
前記処理実行部は、前記整形済みのコンバージョンクエリを前記検索サービスに登録する登録処理を、前記所定の処理として実行する、
(2)に記載のクエリ整形システム。
(4)
前記検索サービスには、前記検索連動型広告ごとに、インデックス及び表示用キーワードが登録されており、
前記検索サービスでは、前記インデックスに基づいて前記検索連動型広告が検索され、前記検索連動型広告とともに前記表示用キーワードが表示され、
前記処理実行部は、前記整形済みのコンバージョンクエリを前記表示用キーワードとして前記検索サービスに登録する処理を、前記登録処理として実行する、
(3)に記載のクエリ整形システム。
(5)
前記検索サービスでは、検索時に入力された前記コンバージョンクエリが変更され、
前記取得部は、前記検索サービスにおいて変更された変更済みの前記コンバージョンクエリを取得し、
前記クエリ整形部は、前記変更済みのコンバージョンクエリが入力時の状態に戻るように、前記変更済みのコンバージョンクエリを整形する、
(2)~(4)の何れかに記載のクエリ整形システム。
(6)
前記検索サービスでは、検索時に入力された前記コンバージョンクエリに対し、形態素解析が実行されることによって変更され、
前記クエリ整形部は、前記変更済みのコンバージョンクエリに含まれる形態素が入力時の状態に戻るように、前記変更済みのコンバージョンクエリを整形する、
(5)に記載のクエリ整形システム。
(7)
前記クエリ整形部は、前記検索サービスにおける前記コンバージョンクエリの変更に応じて訓練用クエリが変更された変更済みの前記訓練用クエリと、変更前の前記訓練用クエリと、の関係が前記訓練データとして学習された前記学習モデルに基づいて、前記変更済みのコンバージョンクエリを整形する、
(5)又は(6)に記載のクエリ整形システム。
(8)
前記クエリ整形部は、前記他のサービスで実際に入力された訓練用クエリが変更された変更済みの前記訓練用クエリと、変更前の前記訓練用クエリと、の関係が前記訓練データとして学習された前記学習モデルに基づいて、前記コンバージョンクエリを整形する、
(2)~(7)の何れかに記載のクエリ整形システム。
(9)
前記クエリ整形システムは、前記コンバージョンクエリに関するデトークナイゼーションを実行するデトークナイゼーション実行部を更に含み、
前記クエリ整形部は、前記学習モデルに基づいて、前記デトークナイゼーションが実行された実行済みの前記コンバージョンクエリに関するトークナイゼーションを実行することによって、当該実行済みのコンバージョンクエリを整形する、
(1)~(8)の何れかに記載のクエリ整形システム。
(10)
前記クエリ整形システムは、前記コンバージョンクエリを所定の分割単位ごとに分割する分割実行部を更に含み、
前記クエリ整形部は、前記学習モデルに基づいて、前記分割単位ごとに分割された分割済みの前記コンバージョンクエリに関する分割適否を推定することによって、当該分割済みのコンバージョンクエリを整形する、
(1)~(9)の何れかに記載のクエリ整形システム。
(11)
前記クエリ整形部は、整形前の訓練用クエリと、整形後の前記訓練用クエリと、の関係が前記訓練データとして学習された前記学習モデルに対し、前記コンバージョンクエリを入力し、前記学習モデルから出力された前記整形済みのコンバージョンクエリを取得することによって、前記コンバージョンクエリを整形する、
(1)~(10)の何れかに記載のクエリ整形システム。
(12)
前記クエリ整形部は、訓練用クエリに含まれるトークンの位置に関する位置情報が前記訓練データとして学習された前記学習モデルに対し、前記コンバージョンクエリを入力し、前記学習モデルから出力された前記位置情報に基づいて、前記コンバージョンクエリを整形する、
(1)~(11)の何れかに記載のクエリ整形システム。
[4. Notes]
For example, the query reformulation system may be configured as follows.
(1)
An acquisition unit that acquires a conversion query in which a conversion related to a search advertisement has occurred;
a query shaping unit that shapes the conversion query based on a learning model in which training data related to query shaping has been learned;
a processing execution unit that executes a predetermined process based on the conversion query that has been shaped by the query shaping unit;
A query formatting system including:
(2)
the search-related advertisement is an advertisement for allowing a user to access a service other than the search service on which the search-related advertisement is displayed,
The acquisition unit acquires the conversion query in which a conversion has occurred in the other service.
Query shaping system according to (1).
(3)
the process execution unit executes, as the predetermined process, a registration process of registering the reformulated conversion query in the search service;
Query shaping system according to (2).
(4)
an index and a display keyword are registered in the search service for each of the search-related advertisements;
In the search service, the search-related advertisement is searched for based on the index, and the display keyword is displayed together with the search-related advertisement.
the processing execution unit executes, as the registration processing, a processing of registering the reformulated conversion query in the search service as the display keyword.
Query shaping system according to (3).
(5)
The search service modifies the conversion query entered at the time of the search,
The acquisition unit acquires the conversion query that has been changed in the search service,
The query reforming unit reforms the modified conversion query so that the modified conversion query is restored to a state at the time of input.
A query shaping system according to any one of (2) to (4).
(6)
In the search service, a morphological analysis is performed on the conversion query input at the time of the search, thereby modifying the conversion query;
The query reforming unit reforms the changed conversion query so that morphemes included in the changed conversion query are restored to their input states.
Query shaping system according to (5).
(7)
the query shaping unit shapes the changed conversion query based on the learning model in which a relationship between a changed training query, in which the training query is changed in response to a change in the conversion query in the search service, and the training query before the change is learned as the training data;
The query shaping system according to (5) or (6).
(8)
the query shaping unit shapes the conversion query based on the learning model in which a relationship between a training query that has been changed by changing a training query that has actually been input in the other service and the training query before the change has been learned as the training data;
A query shaping system according to any one of (2) to (7).
(9)
The query shaping system further includes a detokenization unit that performs detokenization on the conversion query,
The query shaping unit shapes the executed conversion query by performing tokenization on the executed conversion query on which the detokenization has been performed, based on the learning model.
9. A query shaping system according to any one of (1) to (8).
(10)
The query shaping system further includes a division execution unit that divides the conversion query into predetermined division units;
The query reforming unit reforms the divided conversion queries by estimating whether or not the divided conversion queries are appropriate for the divided conversion queries, the divided conversion queries being divided into the division units, based on the learning model.
10. A query shaping system according to any one of (1) to (9).
(11)
the query reforming unit reforms the conversion query by inputting the conversion query to the learning model in which a relationship between a training query before reforming and the training query after reforming is learned as the training data, and acquiring the reformed conversion query output from the learning model;
11. A query shaping system according to any one of (1) to (10).
(12)
the query reforming unit inputs the conversion query to the learning model in which location information regarding a location of a token included in a training query is learned as the training data, and reforms the conversion query based on the location information output from the learning model;
12. A query shaping system according to any one of (1) to (11).
1 クエリ整形システム、N ネットワーク、10 ECサーバ、11,21,31,41 制御部、12,22,32,42 記憶部、13,23,33,43 通信部、20 広告主端末、24,44 操作部、25,45 表示部、30 検索サーバ、40 ユーザ端末、M1 クエリ整形モデル、M2 関連性推定モデル、100,200,300,400 データ記憶部、101 注文処理部、201 取得部、202 デトークナイゼーション実行部、203 クエリ整形部、204 処理実行部、205 関連性推定部、206 分割実行部、300 データ記憶部、301 検索部、400 データ記憶部、401 表示制御部、402 操作受付部、A20,A21 表示領域、DB1 商品データベース、DB2 コンバージョンデータベース、DB3 広告データベース、SC1 トップ画面、SC2 検索結果画面、SC3 商品画面、SC4 注文完了画面。
1 Query shaping system, N Network, 10 EC server, 11, 21, 31, 41 Control unit, 12, 22, 32, 42 Memory unit, 13, 23, 33, 43 Communication unit, 20 Advertiser terminal, 24, 44 Operation unit, 25, 45 Display unit, 30 Search server, 40 User terminal, M1 Query shaping model, M2 Relevance estimation model, 100, 200, 300, 400 Data storage unit, 101 Order processing unit, 201 Acquisition unit, 202 Detokenization execution unit, 203 Query shaping unit, 204 Processing execution unit, 205 Relevance estimation unit, 206 Division execution unit, 300 Data storage unit, 301 Search unit, 400 Data storage unit, 401 Display control unit, 402 Operation reception unit, A20, A21 Display area, DB1 Product database, DB2 Conversion database, DB3 advertising database, SC1 top screen, SC2 search results screen, SC3 product screen, SC4 order completion screen.
Claims (14)
クエリ整形に関する訓練データが学習された学習モデルに基づいて、前記コンバージョンクエリを整形するクエリ整形部と、
前記クエリ整形部により整形された整形済みの前記コンバージョンクエリに基づいて、所定の処理を実行する処理実行部と、
を含むクエリ整形システム。 An acquisition unit that acquires a conversion query in which a conversion related to a search advertisement has occurred;
a query shaping unit that shapes the conversion query based on a learning model in which training data related to query shaping has been learned;
a processing execution unit that executes a predetermined process based on the conversion query that has been shaped by the query shaping unit;
A query formatting system including:
前記取得部は、前記他のサービスでコンバージョンが発生した前記コンバージョンクエリを取得する、
請求項1に記載のクエリ整形システム。 the search-related advertisement is an advertisement for allowing a user to access a service other than the search service on which the search-related advertisement is displayed,
The acquisition unit acquires the conversion query in which a conversion has occurred in the other service.
The query shaping system of claim 1 .
請求項2に記載のクエリ整形システム。 the process execution unit executes, as the predetermined process, a registration process of registering the reformulated conversion query in the search service;
The query shaping system of claim 2 .
請求項3に記載のクエリ整形システム。 the process execution unit executes the registration process by transmitting the reformulated conversion query to a server computer of the search service .
The query shaping system of claim 3 .
前記クエリ整形部は、前記コンバージョンクエリが入力時の状態に戻るように、前記コンバージョンクエリを整形する、
請求項2~4の何れかに記載のクエリ整形システム。 The conversion query is a modified input conversion query input at the time of a search on the search service,
The query reforming unit reforms the conversion query so that the conversion query is returned to a state at the time of input.
A query shaping system according to any one of claims 2 to 4.
請求項5に記載のクエリ整形システム。 The query reforming unit reforms the conversion query such that morphemes included in the conversion query that have been changed as a result of the search service performing a morphological analysis on the input conversion query are restored to their states at the time of input .
The query shaping system of claim 5 .
請求項5に記載のクエリ整形システム。 the query shaping unit shapes the conversion query based on the learning model in which a relationship between a changed training query, in which the training query has been changed in response to a change in the input conversion query in the search service, and the training query before the change has been learned as the training data;
The query shaping system of claim 5 .
請求項2~4の何れかに記載のクエリ整形システム。 the query shaping unit shapes the conversion query based on the learning model in which a relationship between a training query that has been changed by changing a training query that has been actually input in the other service and the training query before the change has been learned as the training data;
A query shaping system according to any one of claims 2 to 4.
前記クエリ整形部は、前記学習モデルに基づいて、前記デトークナイゼーションが実行された実行済みの前記コンバージョンクエリに関するトークナイゼーションを実行することによって、当該実行済みのコンバージョンクエリを整形する、
請求項1~4の何れかに記載のクエリ整形システム。 The query shaping system further includes a detokenization unit that performs detokenization on the conversion query,
The query shaping unit shapes the executed conversion query by performing tokenization on the executed conversion query on which the detokenization has been performed, based on the learning model.
A query shaping system according to any one of claims 1 to 4.
前記クエリ整形部は、前記学習モデルに基づいて、前記分割単位ごとに分割された分割済みの前記コンバージョンクエリに関する分割適否を推定することによって、当該分割済みのコンバージョンクエリを整形する、
請求項1~4の何れかに記載のクエリ整形システム。 The query shaping system further includes a division execution unit that divides the conversion query into predetermined division units;
The query reforming unit reforms the divided conversion queries by estimating whether or not the divided conversion queries are appropriate for the divided conversion queries, the divided conversion queries being divided into the division units, based on the learning model.
A query shaping system according to any one of claims 1 to 4.
請求項1~4の何れかに記載のクエリ整形システム。 the query reforming unit reforms the conversion query by inputting the conversion query to the learning model in which a relationship between a training query before reforming and the training query after reforming is learned as the training data, and acquiring the reformed conversion query output from the learning model;
A query shaping system according to any one of claims 1 to 4.
請求項1~4の何れかに記載のクエリ整形システム。 the query reforming unit inputs the conversion query to the learning model in which location information regarding a location of a token included in a training query is learned as the training data, and reforms the conversion query based on the location information output from the learning model;
A query shaping system according to any one of claims 1 to 4.
検索連動型広告に関するコンバージョンが発生したコンバージョンクエリを取得する取得ステップと、
クエリ整形に関する訓練データが学習された学習モデルに基づいて、前記コンバージョンクエリを整形するクエリ整形ステップと、
前記クエリ整形ステップにより整形された整形済みの前記コンバージョンクエリに基づいて、所定の処理を実行する処理実行ステップと、
を実行するクエリ整形方法。 The computer
An acquisition step of acquiring a conversion query in which a conversion related to a search advertisement has occurred;
a query shaping step of shaping the conversion query based on a learning model in which training data regarding query shaping has been learned;
a processing execution step of executing a predetermined process based on the conversion query shaped by the query shaping step ;
The query formatting method to perform .
クエリ整形に関する訓練データが学習された学習モデルに基づいて、前記コンバージョンクエリを整形するクエリ整形部、
前記クエリ整形部により整形された整形済みの前記コンバージョンクエリに基づいて、所定の処理を実行する処理実行部、
としてコンピュータを機能させるためのプログラム。 an acquisition unit that acquires a conversion query in which a conversion related to a search advertisement has occurred;
a query shaping unit that shapes the conversion query based on a learning model in which training data related to query shaping has been learned;
a processing execution unit that executes a predetermined process based on the conversion query that has been reformulated by the query reforming unit;
A program that makes a computer function as a
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022104459A JP7598901B2 (en) | 2022-06-29 | 2022-06-29 | Query shaping system, query shaping method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022104459A JP7598901B2 (en) | 2022-06-29 | 2022-06-29 | Query shaping system, query shaping method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024004703A JP2024004703A (en) | 2024-01-17 |
JP7598901B2 true JP7598901B2 (en) | 2024-12-12 |
Family
ID=89539705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022104459A Active JP7598901B2 (en) | 2022-06-29 | 2022-06-29 | Query shaping system, query shaping method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7598901B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002157278A (en) | 2000-11-17 | 2002-05-31 | Nec Corp | Device/method for information retrieval of directory editing type and recording medium with information retrieval program of directory editing type stored therein |
JP2010009307A (en) | 2008-06-26 | 2010-01-14 | Kyoto Univ | Feature word automatic learning system, content linkage type advertisement distribution computer system, retrieval linkage type advertisement distribution computer system and text classification computer system, and computer program and method for them |
JP2017518578A (en) | 2014-06-17 | 2017-07-06 | マイクロソフト テクノロジー ライセンシング,エルエルシー | Learning and using contextual content acquisition rules for query disambiguation |
-
2022
- 2022-06-29 JP JP2022104459A patent/JP7598901B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002157278A (en) | 2000-11-17 | 2002-05-31 | Nec Corp | Device/method for information retrieval of directory editing type and recording medium with information retrieval program of directory editing type stored therein |
JP2010009307A (en) | 2008-06-26 | 2010-01-14 | Kyoto Univ | Feature word automatic learning system, content linkage type advertisement distribution computer system, retrieval linkage type advertisement distribution computer system and text classification computer system, and computer program and method for them |
JP2017518578A (en) | 2014-06-17 | 2017-07-06 | マイクロソフト テクノロジー ライセンシング,エルエルシー | Learning and using contextual content acquisition rules for query disambiguation |
Non-Patent Citations (1)
Title |
---|
加藤 龍,語の出現頻度と意味関係分析を用いたWebからのタスク検索,情報処理学会 研究報告 データベースシステム(DBS) 2013-DBS-157 [online],情報処理学会,2013年07月15日,Internet<URL:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=94311&item_no=1&attribute_id=1&file_no=1> |
Also Published As
Publication number | Publication date |
---|---|
JP2024004703A (en) | 2024-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110175325B (en) | Comment analysis method based on word vector and syntactic characteristics and visual interaction interface | |
Zhao et al. | Exploring demographic information in social media for product recommendation | |
US8356248B1 (en) | Generating context-based timelines | |
CN102246167B (en) | Providing search results | |
JP5458181B2 (en) | System and method for providing advanced search result page content | |
TWI471737B (en) | System and method for trail identification with search results | |
CN102859518B (en) | Information processor, information processing method | |
US8301514B1 (en) | System, method, and computer readable medium for providing recommendations based on purchase phrases | |
JP5083669B2 (en) | Information extraction system, information extraction method, information extraction program, and information service system | |
US20100235343A1 (en) | Predicting Interestingness of Questions in Community Question Answering | |
US20080133505A1 (en) | Search results presented as visually illustrative concepts | |
US20080133483A1 (en) | Paid content based on visually illustrative concepts | |
US11461822B2 (en) | Methods and apparatus for automatically providing personalized item reviews | |
US20210390609A1 (en) | System and method for e-commerce recommendations | |
JP6018338B1 (en) | Information processing apparatus, information processing method, and information processing program | |
US11449536B2 (en) | Generating electronic summary documents for landing pages | |
US20080294643A1 (en) | Method of generating information related to a web page | |
JP6976207B2 (en) | Information processing equipment, information processing methods, and programs | |
JP4743766B2 (en) | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program | |
Wong et al. | An unsupervised method for joint information extraction and feature mining across different web sites | |
CN109727088A (en) | Browser-based product recommendation method and device | |
US20210012405A1 (en) | Methods and apparatus for automatically providing personalized item reviews | |
Uçar et al. | A novel algorithm for extracting the user reviews from web pages | |
CN117391824B (en) | Method and device for recommending articles based on large language model and search engine | |
JP7598901B2 (en) | Query shaping system, query shaping method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7598901 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |