[go: up one dir, main page]

JP5993897B2 - 特定装置、特定方法及び特定プログラム - Google Patents

特定装置、特定方法及び特定プログラム Download PDF

Info

Publication number
JP5993897B2
JP5993897B2 JP2014126554A JP2014126554A JP5993897B2 JP 5993897 B2 JP5993897 B2 JP 5993897B2 JP 2014126554 A JP2014126554 A JP 2014126554A JP 2014126554 A JP2014126554 A JP 2014126554A JP 5993897 B2 JP5993897 B2 JP 5993897B2
Authority
JP
Japan
Prior art keywords
classification
input data
output
input
specifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014126554A
Other languages
English (en)
Other versions
JP2016004549A (ja
Inventor
健一 磯
健一 磯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014126554A priority Critical patent/JP5993897B2/ja
Publication of JP2016004549A publication Critical patent/JP2016004549A/ja
Application granted granted Critical
Publication of JP5993897B2 publication Critical patent/JP5993897B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、特定装置、特定方法及び特定プログラムに関する。
従来、各種のデータに対してデータのカテゴリを示すラベル付けが行われている。例えば、インターネットオークションに商品を出品する場合に、出品者は、商品のカテゴリ検索や絞込み検索を行えるようにするため、予め用意されたカテゴリの中から出品する商品が属するカテゴリを手動で選択することで商品に対してラベル付けを行う。
特開2004−062719号公報
しかしながら、上記の方法では、適切なラベルを付けることができるとは限らなかった。例えば、上記の方法では、出品者は、商品が属するカテゴリのラベルを恣意的に判断し、商品のラベルを決定する。このため、上記の方法では、商品に対して不適切なラベルが付けられる場合がある。このようなことから、上記の方法では、適切なラベルを付けることができるとは限らなかった。
本願は、上記に鑑みてなされたものであって、適切なラベルを付けることができる特定装置、特定方法及び特定プログラムを提供することを目的とする。
本願に係る特定装置は、入力データを受け付ける受付部と、所定の分類の特徴情報を再現する学習器に対して、前記受付部によって受け付けられた入力データを入力した場合に出力する出力データの前記入力データに対する再現誤差を算出する算出部と、前記算出部によって算出された再現誤差に基づいて前記入力データが属する分類を特定する特定部とを備えたことを特徴とする。
実施形態の一態様によれば、適切なラベルを付けることができるという効果を奏する。
図1は、実施形態に係る特定装置による特定処理の一例を示す説明図である。 図2は、オートエンコーダの一例を示す説明図である。 図3は、実施形態に係る出品システムの構成例を示す図である。 図4は、実施形態に係る特定装置の構成例を示す図である。 図5は、特定装置による生成処理手順を示すフローチャートである。 図6は、特定装置による特定処理手順を示すフローチャートである。 図7は、特定装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る特定装置、特定方法及び特定プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る特定装置、特定方法及び特定プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.特定処理〕
まず、図1を用いて、実施形態に係る特定処理の一例について説明する。図1は、実施形態に係る特定装置による特定処理の一例を示す説明図である。図1の例では、特定装置100によって製品と共起する人物を特定する特定処理が行われる例を示す。
特定装置100は、所定の分類の特徴情報を再現する学習器(例えば、オートエンコーダ)によって入力データの属する分類を特定するサーバ装置である。この点について図1を用いて詳細に説明する。学習器Le〜Leは、所定の分類の特徴を学習したオートエンコーダである。具体的には、学習器Le〜Leは、入力データに対する演算結果を出力する複数のノード(例えば、ニューロン)を接続したDNN(Deep Neural Network)であって被写体が描出された画像を入力データとして入力した場合に入力データを再現する出力データ(例えば、再現データ)を出力するオートエンコーダである。この点について、図2を用いて説明する。図2は、オートエンコーダの一例を示す説明図である。学習器Leは、ノートパソコンの特徴を学習したオートエンコーダである。学習器Leは、ノートパソコンが描出された画像NPを入力データとして入力した場合に、ノートパソコンを再現する出力データREを出力する。
例えば、学習器Leは、画像NPの各画素の画素値(例えば、グレースケールの8ビット値)を対応する入力ノードに入力し、各出力ノードが出力した値を取得する。また、学習器Leは、各出力ノードが出力した値を、各出力ノードと対応する位置の画素の画素値として画像を構成することで、出力データとなる画像を得る。ここで、オートエンコーダにおいては、入力ノードの数よりも中心部分のノードの数が少ないため、入力ノードに含まれる特徴のうち再現されない特徴が生じる。このため、オートエンコーダにある物体が描出された画像を入力した際に、かかる物体がうまく再現された場合(例えば、ノイズが入っていない画像が出力された場合等)は、かかる物体の特徴を良く学習していると判断できる。一方、学習器Leは、ノートパソコンの特徴を学習していないエンコーダであるため、図2に示すように、ノートパソコンが描出された画像NPが入力データとして入力された場合は、画像をうまく再現することができずに、ビット欠け等のノイズが生じた画像を出力する恐れがある。
なお、図1の例では、学習器Leは、テレビの特徴を学習したオートエンコーダである。学習器Leは、ノートパソコンの特徴を学習したオートエンコーダである。学習器Leは、スマートフォンの特徴を学習したオートエンコーダである。
また、図1の例では、学習器Le〜Leは、入力層と、多段のノード群によって形成される中間層と、出力層とから構成される。ここで、中間層は、図1に示すように、次元数が最も少ない層を中心に含む。
特定装置100は、まず、入力データを受け付ける(ステップS1)。ここで、入力データは、例えば、特定装置100によって分類を特定する特定対象の未知データである。図1の例では、入力データP1は、ノートパソコンが描出された画像である。なお、画像には、被写体に加えて背景などが描出されてもよい。
続いて、特定装置100は、学習器Le〜Leを用いて入力データP1に描出された被写体が属する分類を特定する。具体的には、特定装置100は、まず、入力データP1を学習器Le〜Leに入力する(ステップS2)。なお、図1では、説明を簡単にするため、3つの学習器Le、LeおよびLeに入力データP1を入力する例を示すが実際には各種の異なる分類の特徴を学習した学習器であって予め用意された各学習器に入力データP1を入力する。これにより、図1の例では、学習器Leは、出力データODを出力する。学習器Leは、出力データODを出力する。学習器Leは、出力データODを出力する。
そして、特定装置100は、学習器Le〜Leに対して、入力データP1を入力した場合に出力する出力データOD〜ODの入力データP1に対する再現誤差を算出する(ステップS3)。ここで、再現誤差は、入力データに対する出力データの再現度を示す指標である。例えば、特定装置100は、入力データである画像に含まれる各画素のグレースケールの値を対応する入力ノードに入力し、各出力ノードが出力した値を各画素のグレースケールの値とする。また、特定装置100は、各画素に対応する入力ノードに入力した値と出力ノードが出力した値との差分の累乗値をそれぞれ算出する。そして、特定装置100は、各画素について算出した累乗値の総和を平均誤差の値とする。
すなわち、再現誤差は、出力データが入力データを正確に再現しているほど低くなる。図1の例では、特定装置100は、出力データODの再現誤差を「50」と算出する。また、特定装置100は、出力データODの再現誤差を「0」と算出する。また、特定装置100は、出力データODの再現誤差を「90」と算出する。
その後、特定装置100は、算出された再現誤差に基づいて入力データP1が属する分類を特定する(ステップS4)。例えば、特定装置100は、算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を入力データが属する分類として特定する。図1の例では、算出された再現誤差のうち最も低い再現誤差「0」となる出力データODを出力する学習器Leに対応する分類である「ノートパソコン」を入力データP1が属する分類として特定する。
このように、実施形態に係る特定装置100は、入力データを受け付ける。また、特定装置100は、所定の分類の特徴情報を再現する学習器に対して、受け付けられた入力データを入力した場合に出力する出力データの再現誤差を算出する。また、特定装置100は、算出された再現誤差に基づいて入力データが属する分類を特定する。
これにより、特定装置100は、入力データが属する適切な分類を特定することができるので、適切なラベルを付けることができる。例えば、特定装置100は、被写体が描出された画像が入力された場合に画像に描出された被写体が属する分類を特定することができる。このため、特定装置100は、例えば、インターネットオークションにおいて出品者が新規に出品する商品が描出された画像を受け付けた場合に商品が属するカテゴリを特定することができる。
また、特定装置100は、例えば、インターネットオークションで出品する商品に対して適切なラベルを付けることができるので、不適切なラベルが付いた商品を減らすことができる。このため、特定装置100は、出品者やオークションの利用者の利便性を向上させることができる。
また、特定装置100は、商品の画像を学習器に入力するだけで商品に対して適切なラベルを付けることができるので、出品者がラベルを検討する手間を減らすことができる。このため、特定装置100は、出品者の出品作業における利便性を向上させることができる。
〔2.出品システムの構成〕
図3を用いて、実施形態に係る出品システムの構成について説明する。図3は、実施形態に係る出品システムによる出品処理の一例を示す説明図である。図3に示すように、出品システム1には、端末装置10と、サーバ装置50と、特定装置100とが含まれる。端末装置10、サーバ装置50および特定装置100は、ネットワークを介して、有線又は無線により通信可能に接続される。なお、図3に示した出品システム1には、複数台の端末装置10や、複数台のサーバ装置50や、複数台の特定装置100が含まれてもよい。
端末装置10は、例えば、デスクトップ型PCや、ノート型PCや、タブレット型端末や、スマートフォンや、携帯電話機や、PDA(Personal Digital Assistant)等の情報処理装置である。例えば、端末装置10は、オークションに商品を出品する利用者(例えば、販売者)によって利用される。端末装置10は、利用者によって用意された画像をサーバ装置50に送信する。例えば、端末装置10は、表示部に表示中のウェブページである出品画面に対して所定の操作(例えば、クリック操作)を受け付けた場合に、利用者が出品する商品が描出された画像CPをサーバ装置50に送信する。
サーバ装置50は、各種ウェブページを端末装置10に提供するサーバ装置である。具体的には、サーバ装置50は、ネットオークションに関するウェブページを提供する。例えば、サーバ装置50は、消費者が閲覧するネットオークションサイトや商品を出品する利用者が閲覧する管理画面(例えば、出品画面)を提供する。なお、サーバ装置50は、ネットオークションサイトのウェブページに限らず、技術解説サイト、検索エンジンサイト、ショッピングサイト、ニュースサイト、ファイナンスサイト(株価サイト)等といった各種のウェブページを提供してもよい。
特定装置100は、学習器Leを用いて商品が属する分類を特定するサーバ装置である。具体的には、特定装置100は、まず、入力データとして商品が描出された画像を学習器Leに入力する。続いて、特定装置100は、入力データに対する出力データの再現誤差を算出する。そして、特定装置100は、算出した再現誤差に基づいて商品が属する分類を特定する。
次に、図3を用いて、出品システム1による出品処理について説明する。まず、端末装置10は、例えば、サーバ装置50から提供される出品画面を介して、利用者がオークションサイトに出品する商品C1が描出された画像CPをサーバ装置50に送信する(ステップS21)。
続いて、サーバ装置50は、端末装置10から送信された画像CPを特定装置100に送信する(ステップS22)。これにより、特定装置100は、商品C1が描出された画像CPを受け付ける。
そして、特定装置100は、画像CPに描出された商品C1が属する分類を特定する(ステップS23)。具体的には、特定装置100は、入力データとして画像CPを学習器Leに入力し、入力データに対する出力データの再現誤差に基づいて商品C1が属する分類を特定する。
その後、特定装置100は、特定した商品C1が属する分類をサーバ装置50に通知する(ステップS24)。例えば、特定装置100は、画像CPに描出された商品C1が属する分類を「ノートパソコン」と特定した場合には、「ノートパソコン」という分類に関する情報をサーバ装置50に通知する。
そして、サーバ装置50は、特定装置100から通知された分類に基づいて商品C1のラベル付けを実行する(ステップS25)。例えば、サーバ装置50は、「ノートパソコン」という分類が通知された場合には、商品C1のカテゴリを「ノートパソコン」に設定する。これにより、サーバ装置50は、商品C1のラベルを適切に設定してオークションに出品することができる。
〔3.特定装置の構成〕
次に、図4を用いて、実施形態に係る特定装置100の構成について説明する。図4は、実施形態に係る特定装置100の構成例を示す図である。図4に示すように、特定装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、特定装置100は、特定装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110について)
通信部110は、例えば、NIC等によって実現される。通信部110は、ネットワークと有線又は無線で接続され、ネットワークを介して、各種のサーバ装置や端末装置との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、学習器情報記憶部121を有する。
(学習器情報記憶部121について)
学習器情報記憶部121は、学習器(例えば、DNN)に関する情報を記憶する。具体的には、学習器情報記憶部121は、DNN(例えば、オートエンコーダ)に含まれる入力層、中間層および出力層のノードや、ノード間の結合係数に関する情報を記憶する。例えば、学習器情報記憶部121は、図1に示す学習器Leを記憶する。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、特定装置100内部の記憶装置に記憶されている各種プログラム(特定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
制御部130は、図4に示すように、受付部131と、生成部132と、算出部133と、特定部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図4に示した構成に限られず、後述する生成処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図4に示した接続関係に限られず、他の接続関係であってもよい。
(受付部131について)
受付部131は、入力データを受け付ける。具体的には、受付部131は、被写体が描出された画像を受け付ける。例えば、受付部131は、販売者がオークションサイトに商品を出品する際に、出品する商品が描出された画像を端末装置10から受け付ける。また、受付部131は、学習器の学習を行う際には、所定の分類の被写体が描出された画像を受け付ける。なお、この場合、受付部131は、所定の分類の特徴を学習するのに十分な数の画像を受け付ける。
(生成部132について)
生成部132は、学習器(例えば、DNN)を生成する。具体的には、生成部132は、入力データを入力した場合に出力する出力データが所定の分類の特徴情報を再現するノード間の結合係数を算出し、算出した結合係数をノード間に設定することでオートエンコーダを生成する。一例としては、生成部132は、バックプロパゲーション法や教師あり学習によりDNNに含まれるノード間の結合係数を算出する。
例えば、生成部132は、受付部131によって「ノートパソコン」が描出された画像を入力した場合に出力する出力データが「ノートパソコン」の分類の特徴情報を再現するノード間の結合係数を算出する。そして、生成部132は、算出した結合係数をノード間に設定することでオートエンコーダを生成する。これにより、生成部132は、所定の分類に属する被写体が描出された画像が受け付けられた場合に、被写体を再現する出力データを出力する学習器を生成することができる。例えば、生成部132は、ノートパソコンが描出された画像を入力した場合に、ノートパソコンを再現した画像である出力データを出力する学習器を生成する。なお、生成部132は、例えば、ネットオークションで用いられる商品の各種の分類に対応する学習器をそれぞれ生成する。そして、生成部132は、生成した各学習器を学習器情報記憶部121に格納する。
(算出部133について)
算出部133は、出力データの再現誤差を算出する。具体的には、算出部133は、所定の分類の特徴情報を再現する学習器に対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの再現誤差を算出する。
例えば、算出部133は、まず、学習器情報記憶部121に記憶された学習器であって各種の分類の特徴を学習した各学習器に入力データを入力する。続いて、算出部133は、各学習器から出力された出力データの再現誤差をそれぞれ算出する。ここで、算出部133は、例えば、入力データと出力データとの間の誤差が小さいほど再現誤差を低く算出する。すなわち、算出部133は、出力データが入力データを正確に再現しているほど再現誤差を低く算出する。なお、算出部133は、生成部132によって生成された学習器に限らず、他から取得した学習器を用いて算出処理を行ってもよい。
(特定部134について)
特定部134は、受付部131によって受け付けられた入力データが属する分類を特定する。具体的には、特定部134は、算出部133によって算出された再現誤差に基づいて入力データが属する分類を特定する。例えば、特定部134は、算出部133によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を入力データが属する分類として特定する。特徴が類似するオートエンコーダほど入力データを最も高い精度で再現する出力データを出力すると考えられるからである。
そして、特定部134は、例えば、入力データが属する分類として特定した分類をサーバ装置50に通知する。これにより、サーバ装置50は、サーバ装置50から通知された分類を用いて、例えば、販売者がオークションサイトに出品する商品のラベル付けを適切に行うことができる。
〔4.生成処理手順〕
次に、図5を用いて、実施形態に係る特定装置100による生成処理の手順について説明する。図5は、実施形態に係る特定装置100による生成処理手順を示すフローチャートである。
図5に示すように、特定装置100は、入力データを受け付ける(ステップS101)。例えば、特定装置100は、入力データとして所定の分類に属する商品が描出された画像を、商品が属する分類の特徴を学習するのに十分な枚数受け付ける。そして、特定装置100は、入力データを受け付けていない場合には(ステップS101;No)、入力データを受け付けるまで待機する。例えば、特定装置100は、商品が属する分類の特徴を学習するのに十分な枚数が集まるまで画像を受け付ける。
一方、特定装置100は、入力データを受け付けた場合(ステップS101;Yes)、受け付けた入力データを学習器に入力する(ステップS102)。例えば、特定装置100は、入力データとして所定の分類に属する商品が描出された画像を学習器に入力する。
その後、特定装置100は、受け付けられた入力データに基づいて、入力データを入力した場合に入力データを再現する出力データを出力する学習器を生成する。具体的には、特定装置100は、入力データを入力した場合に出力する出力データが所定の分類の特徴情報を再現するノード間の結合係数を算出する(ステップS103)。例えば、特定装置100は、バックプロパゲーション法により結合係数を算出する。一例としては、特定装置100は、出力データの誤差が最小となる結合係数を算出する。
そして、特定装置100は、所定の分類の特徴を学習した学習器を生成する(ステップS104)。例えば、特定装置100は、算出した結合係数をノード間に設定することで、所定の分類の特徴を学習した学習器を生成する。そして、特定装置100は、生成した学習器を格納する(ステップS105)。なお、特定装置100は、例えば、ネットオークションで用いられる商品の各種の分類において上記のステップS101〜S105の処理を実行し、各種の分類に対応する学習器をそれぞれ生成する。
〔5.特定処理手順〕
次に、図6を用いて、実施形態に係る特定装置100による特定処理の手順について説明する。図6は、実施形態に係る特定装置100による特定処理手順を示すフローチャートである。
図6に示すように、特定装置100は、入力データを受け付ける(ステップS201)。例えば、特定装置100は、入力データとして販売者がネットオークションに出品する商品が描出された画像を受け付ける。そして、特定装置100は、入力データを受け付けていない場合には(ステップS201;No)、入力データを受け付けるまで待機する。
一方、特定装置100は、入力データを受け付けた場合(ステップS201;Yes)、受け付けた入力データを各学習器に入力する(ステップS202)。例えば、特定装置100は、各種の分類の特徴を学習した学習器を学習器情報記憶部121から取得する。そして、特定装置100は、取得した各学習器に販売者がオークションに出品する商品が描出された画像をそれぞれ入力する。
その後、特定装置100は、出力データの再現誤差を算出する(ステップS203)。具体的には、特定装置100は、各学習器が出力した出力データの再現誤差をそれぞれ算出する。
そして、特定装置100は、算出した再現誤差に基づいて入力データが属する分類を特定する(ステップS204)。例えば、特定装置100は、算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を入力データが属する分類として特定する。
そして、特定装置100は、特定した分類をサーバ装置50に通知する(ステップS205)。その後、サーバ装置50は、特定装置100から通知された分類に基づいて入力データのラベル付けを実行する。これにより、サーバ装置50は、例えば、オークションサイトに出品する商品に適切なラベルを付けることができる。
〔6.変形例〕
上述した実施形態に係る特定装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の特定装置100の他の実施形態について説明する。
〔6−1.人の分類を特定〕
上記実施形態では、特定装置100は、商品の分類の特徴情報を再現する学習器を用いて、入力データである画像に描出された商品が属する分類を特定する例を示した。ここで、特定装置100は、各種の特徴を学習した学習器を用いて、各種の分類を特定してもよい。
具体的には、特定装置100は、人が属する分類の特徴情報を再現する学習器に対して、人の動きを入力した場合に出力する出力データの人の動きに対する再現誤差を算出し、算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を人が属する分類として特定する。
初めに、特定装置100によって所定の人が属する分類の特徴情報を再現する学習器を生成する処理について説明する。例えば、特定装置100は、まず、歩数計やスマートフォンなどを人に持たせることで各時刻における人の動きに関する情報を人が所属する組織の業種ごとに取得する。すなわち、特定装置100は、人の動きを時系列なデータとして取得する。
そして、特定装置100は、取得した人の動きに関する情報を用いて、人の動きの特徴を学習する学習器(例えば、オートエンコーダ)を生成する。すなわち、人の行動パターンを学習した学習器を生成する。例えば、特定装置100は、人の動きの特徴を学習する学習器を人が所属する組織の業種ごとに生成する。一例としては、特定装置100は、飲食業、製造業、漁業といった各種の業種ごとに人の動きの特徴を学習した学習器を生成する。なお、特定装置100は、人が所属する組織の業種ごとに限らず、性別や役職などといった各種のユーザ属性ごとに学習器を生成してもよい。
次に、特定装置100が学習器を用いて人が属する分類を特定する特定処理について説明する。特定装置100は、まず、入力データとして特定対象の人の動きを受け付ける。そして、特定装置100は、生成した学習器を用いて、人が所属する組織の業種を特定する。例えば、特定装置100は、まず、入力データを各学習器に入力する。一例としては、特定装置100は、入力データとして「午前10時〜午前11時までのAさんの動き」を示すベクトルを各学習器に入力する。
そして、特定装置100は、人が属する分類の特徴情報を再現する各学習器に対して、受け付けられた人の動きを入力した場合に出力する出力データの入力データに対する再現誤差を算出する。例えば、特定装置100は、出力データが表すベクトルと入力データが表すベクトルとの間の誤差に基づいて再現誤差を算出する。
そして、特定装置100は、算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を人が属する分類として特定する。例えば、特定装置100は、最も低い再現誤差となる出力データを出力する学習器が飲食業に対応する場合、人の分類を「飲食業」として特定する。なお、特定装置100は、利用者の行動、思考、属性などから利用者のラベル付けを行ってもよい。
このように、特定装置100は、入力データとして人の動きを受け付ける。また、特定装置100は、所定の人が属する分類の特徴情報を再現する学習器に対して、受付部131によって受け付けられた人の動きを入力した場合に出力する出力データの入力データに対する再現誤差を算出する。また、特定装置100は、算出部133によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を人が属する分類として特定する。
これにより、特定装置100は、入力データに対して入力データが属する適切な分類を特定することができるので、人に適切なラベルを付けることができる。例えば、特定装置100は、業種や役職ごとに分類したラベルを人に対して適切に付けることができるので、マーケティングなどにおけるデータ分析に活用することができる。一例としては、特定装置100は、ビッグデータのサンプルとして活用することができるので、分析の精度を高めることができる。
なお、特定装置100は、利用者の友人関係の特徴の共通性を特定してもよい。この場合、特定装置100は、友人関係の特徴を学習した学習器を生成する。例えば、特定装置100は、友人が属するユーザ属性ごとに特徴を学習した学習器を生成する。その後、特定装置100は、入力データとして利用者の友人に関する情報を学習器に入力する。続いて、特定装置100は、入力データに対して学習器が出力する出力データに基づいて利用者の友人関係の特徴を特定する。
〔6−2.分類を提案〕
上記実施形態では、特定装置100は、算出部133によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を入力データが属する分類として特定し、特定した分類を商品のラベルとして付ける例を示した。
ここで、特定装置100は、再現誤差に応じて入力データが属する分類を提案してもよい。例えば、特定装置100は、ネットオークションに商品を出品する販売者に対して、算出部133によって算出された再現誤差が所定の閾値より低い分類を商品が属するカテゴリとして提案する。続いて、販売者は、提案されたカテゴリのうち商品に最も適したカテゴリを選択する。そして、サーバ装置50は、販売者によって選択されたカテゴリを商品のラベルとして付けてネットオークションに出品する。
このように、特定装置100は、再現誤差に応じて入力データが属する分類を提案する。これにより、特定装置100は、機械的に特定された分類の候補から販売者が商品のカテゴリを選択することができるので、販売者の希望を反映したカテゴリを商品に付けることができる。このため、特定装置100は、販売者のラベル付けにかかる手間を軽減することができるとともに、販売者の利便性を高めることができる。
〔6−3.オートエンコーダ〕
上記実施形態では、特定装置100は、所定の分類の特徴情報を再現する学習器に対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの入力データに対する再現誤差を算出する例を示した。
ここで、特定装置100は、特徴情報の次元数を削減した後に特徴情報を再現する学習器に対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの再現誤差を算出してもよい。例えば、特定装置100は、まず、中間層に含まれるノード群の層のうち中心の層が最も少ないノード数となるオートエンコーダを生成する。すなわち、特定装置100は、入力された入力データの情報の次元数を中間層の中心まで序所に削減し、その後に次元数を元に戻すオートエンコーダを生成する。具体的には、特定装置100は、出力データが入力データを高い精度で再現するようにノード間の結合係数を補正することでオートエンコーダを生成する。ここで、特定装置100は、例えば、入力データの画像自体を再現するのではなく、画像に描出された被写体を再現するオートエンコーダを生成する。一例としては、特定装置100は、画像に描出された被写体を再現するオートエンコーダを生成する。
そして、特定装置100は、生成したオートエンコーダに対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの入力データに対する再現誤差を算出する。
このように、特定装置100は、特徴情報の次元数を削減した後に特徴情報を再現する学習器に対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの入力データに対する再現誤差を算出する。
これにより、特定装置100は、画像に描出された被写体を再現するオートエンコーダを生成することができるので、出力データの再現精度を高めることができる。このため、特定装置100は、入力データの分類を特定する精度を高めることができる。
〔6−4.DNN〕
上記実施形態では、特定装置100は、入力層、中間層および出力層によって構成される学習器を生成する例を示した。ここで、特定装置100は、各種の層に任意の数のノード群を含む学習器を生成してもよい。例えば、特定装置100は、中間層に複数のノード群が含まれる多段の学習器を生成する。また、学習器に含まれるノード群は、任意の数のノードによって構成されてもよい。
〔6−5.適用対象〕
上記実施形態では、特定装置100は、ネットオークションに出品する商品の分類を特定する画像認識の適用例を示した。ここで、特定装置100は、商品の分類に限らず、各種の認識に適用してもよい。例えば、特定装置100は、音声を対象とする音声認識に適用する。一例としては、特定装置100は、入力データとして音声データを入力することで話者の分類を学習する学習器を生成する。これにより、特定装置100は、音声データに含まれる音声を発した話者の性別や年齢、国籍などといった分類を特定することができる。
〔6−6.装置構成〕
上記実施形態では、特定装置100は、サーバ装置50と一体となって構成されてもよい。この場合、特定装置100は、学習器を用いて特定した分類に基づいて商品のラベル付けを行う。また、特定装置100は、学習器を生成する生成処理は行わず、算出部133と、特定部134とによる特定処理のみを行う特定装置であってもよい。この場合、特定装置は、少なくとも生成部132を有しない。そして、特定装置は、生成部132を有する生成装置によって生成された学習器を用いて分類を特定し、特定した分類をサーバ装置50等に通知する。
〔6−7.その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図4に示した受付部131および生成部132は統合されてもよい。
〔6−8.ハードウェア構成〕
また、上述してきた実施形態に係る特定装置100は、例えば図7に示すような構成のコンピュータ1000によって実現される。以下、特定装置100を例に挙げて説明する。図7は、特定装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網500を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを通信網500を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る特定装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔7.効果〕
上述してきたように、実施形態に係る特定装置100は、受付部131と、算出部133と、特定部134とを有する。受付部131は、入力データを受け付ける。算出部133は、所定の分類の特徴情報を再現する学習器に対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの再現誤差を算出する。特定部134は、算出部133によって算出された再現誤差に基づいて入力データが属する分類を特定する。
また、実施形態に係る特定装置100において、特定部134は、算出部133によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を前記入力データが属する分類として特定する。
また、実施形態に係る特定装置100において、受付部131は、入力データとして商品が描出された画像を受け付ける。算出部133は、所定の商品が属する分類の特徴情報を再現する学習器に対して、受付部131によって受け付けられた画像を入力した場合に出力する出力データの再現誤差を算出する。特定部134は、算出部133によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を商品が属する分類として特定する。
また、実施形態に係る特定装置100において、生成部132は、入力データを入力した場合に出力する出力データが所定の分類の特徴情報を再現するノード間の結合係数を算出し、算出した結合係数をノード間に設定することで学習器を生成する。
これにより、実施形態に係る特定装置100は、入力データが属する適切な分類を特定することができるので、適切なラベルを付けることができる。例えば、特定装置100は、被写体が描出された画像が入力された場合に画像に描出された被写体が属する分類を特定することができる。このため、特定装置100は、例えば、インターネットオークションにおいて出品者が新規に出品する商品が描出された画像を受け付けた場合に商品が属するカテゴリを特定することができる。
また、特定装置100は、例えば、インターネットオークションで出品する商品に対して適切なラベルを付けることができるので、不適切なラベルが付いた商品を減らすことができる。このため、特定装置100は、出品者やオークションの利用者の利便性を向上させることができる。
また、特定装置100は、商品の画像を学習器に入力するだけで商品に対して適切なラベルを付けることができるので、出品者がラベルを検討する手間を減らすことができる。このため、特定装置100は、出品者の出品作業における利便性を向上させることができる。
また、変形例に係る特定装置100において、受付部131は、入力データとして人の動きを受け付ける。算出部133は、所定の人が属する分類の特徴情報を再現する学習器に対して、受付部131によって受け付けられた人の動きを入力した場合に出力する出力データの入力データに対する再現誤差を算出する。特定部134は、算出部133によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を人が属する分類として特定する。
これにより、変形例に係る特定装置100は、入力データが属する適切な分類を特定することができるので、人に適切なラベルを付けることができる。例えば、特定装置100は、業種や役職ごとに分類したラベルを人に対して適切に付けることができるので、マーケティングなどにおけるデータ分析に活用することができる。一例としては、特定装置100は、ビッグデータのサンプルとして活用することができるので、分析の精度を高めることができる。
また、変形例に係る特定装置100において、算出部133は、特徴情報の次元数を削減した後に特徴情報を再現する学習器に対して、受付部131によって受け付けられた入力データを入力した場合に出力する出力データの入力データに対する再現誤差を算出する。
これにより、変形例に係る特定装置100は、画像に描出された被写体を再現するオートエンコーダを生成することができるので、出力データの再現精度を高めることができる。このため、特定装置100は、入力データの分類を特定する精度を高めることができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
1 出品システム
10 端末装置
50 サーバ装置
100 特定装置
121 学習器情報記憶部
131 受付部
132 生成部
133 算出部
134 特定部

Claims (8)

  1. 入力データを受け付ける受付部と、
    所定の分類の特徴情報を再現する学習器に対して、前記受付部によって受け付けられた入力データを入力した場合に出力する出力データの前記入力データに対する再現誤差を算出する算出部と、
    前記算出部によって算出された再現誤差に基づいて前記入力データが属する分類を特定する特定部と
    を備えたことを特徴とする特定装置。
  2. 前記特定部は、
    前記算出部によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を前記入力データが属する分類として特定する
    ことを特徴とする請求項1に記載の特定装置。
  3. 前記受付部は、
    前記入力データとして商品が描出された画像を受け付け、
    前記算出部は、
    所定の商品が属する分類の特徴情報を再現する学習器に対して、前記受付部によって受け付けられた画像を入力した場合に出力する出力データと前記画像との間の再現誤差を算出し、
    前記特定部は、
    前記算出部によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を前記商品が属する分類として特定する
    ことを特徴とする請求項1または2に記載の特定装置。
  4. 前記受付部は、
    前記入力データとして人の動きを受け付け、
    前記算出部は、
    所定の人が属する分類の特徴情報を再現する学習器に対して、前記受付部によって受け付けられた人の動きを入力した場合に出力する出力データの前記人の動きに対する再現誤差を算出し、
    前記特定部は、
    前記算出部によって算出された再現誤差のうち最も低い再現誤差となる出力データを出力する学習器に対応する分類を前記人が属する分類として特定する
    ことを特徴とする請求項1〜3のいずれか一つに記載の特定装置。
  5. 前記入力データを入力した場合に出力する出力データが所定の分類の特徴情報を再現するノード間の結合係数を算出し、算出した結合係数をノード間に設定することで前記学習器を生成する生成部
    をさらに備えることを特徴とする請求項1〜4のいずれか一つに記載の特定装置。
  6. 前記算出部は、
    前記特徴情報の次元数を削減した後に当該特徴情報を再現する学習器に対して、前記受付部によって受け付けられた入力データを入力した場合に出力する出力データの前記入力データに対する再現誤差を算出する
    ことを特徴とする請求項1〜5のいずれか一つに記載の特定装置。
  7. 特定装置が実行する特定方法であって、
    入力データを受け付ける受付工程と、
    所定の分類の特徴情報を再現する学習器に対して、前記受付工程によって受け付けられた入力データを入力した場合に出力する出力データの前記入力データに対する再現誤差を算出する算出工程と、
    前記算出工程によって算出された再現誤差に基づいて前記入力データが属する分類を特定する特定工程と
    を含んだことを特徴とする特定方法。
  8. 入力データを受け付ける受付手順と、
    所定の分類の特徴情報を再現する学習器に対して、前記受付手順によって受け付けられた入力データを入力した場合に出力する出力データの前記入力データに対する再現誤差を算出する算出手順と、
    前記算出手順によって算出された再現誤差に基づいて前記入力データが属する分類を特定する特定手順と
    をコンピュータに実行させることを特徴とする特定プログラム。
JP2014126554A 2014-06-19 2014-06-19 特定装置、特定方法及び特定プログラム Active JP5993897B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014126554A JP5993897B2 (ja) 2014-06-19 2014-06-19 特定装置、特定方法及び特定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014126554A JP5993897B2 (ja) 2014-06-19 2014-06-19 特定装置、特定方法及び特定プログラム

Publications (2)

Publication Number Publication Date
JP2016004549A JP2016004549A (ja) 2016-01-12
JP5993897B2 true JP5993897B2 (ja) 2016-09-14

Family

ID=55223746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014126554A Active JP5993897B2 (ja) 2014-06-19 2014-06-19 特定装置、特定方法及び特定プログラム

Country Status (1)

Country Link
JP (1) JP5993897B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9805306B1 (en) 2016-11-23 2017-10-31 Accenture Global Solutions Limited Cognitive robotics analyzer
JP6545728B2 (ja) 2017-01-11 2019-07-17 株式会社東芝 異常検知装置、異常検知方法、および異常検知プログラム
TWI748035B (zh) 2017-01-20 2021-12-01 日商半導體能源硏究所股份有限公司 顯示系統及電子裝置
WO2018138603A1 (en) * 2017-01-26 2018-08-02 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and electronic device including the semiconductor device
JP7075358B2 (ja) * 2017-01-26 2022-05-25 株式会社半導体エネルギー研究所 半導体装置、及び電子機器
JP7208889B2 (ja) * 2017-03-09 2023-01-19 株式会社半導体エネルギー研究所 放送システム
JP6981760B2 (ja) * 2017-03-10 2021-12-17 株式会社半導体エネルギー研究所 半導体装置
WO2018179338A1 (ja) * 2017-03-31 2018-10-04 三菱電機株式会社 機械学習装置及び画像認識装置
JP6941282B2 (ja) 2017-09-04 2021-09-29 日本電気株式会社 情報処理システム、情報処理方法及び記憶媒体
US10726525B2 (en) * 2017-09-26 2020-07-28 Samsung Electronics Co., Ltd. Image denoising neural network architecture and method of training the same
JP6962123B2 (ja) * 2017-10-04 2021-11-05 株式会社豊田中央研究所 ラベル推定装置及びラベル推定プログラム
US20210073615A1 (en) * 2018-04-12 2021-03-11 Nippon Telegraph And Telephone Corporation Neural network system, neural network method, and program
JP7056406B2 (ja) * 2018-06-22 2022-04-19 日本電信電話株式会社 センサノード及びデータセンタとして機能する装置、センサネットワーク、通信方法及びプログラム
JP6757378B2 (ja) 2018-08-28 2020-09-16 株式会社モルフォ 画像識別装置、画像識別方法及び画像識別プログラム
JP7322411B2 (ja) * 2019-01-24 2023-08-08 カシオ計算機株式会社 画像分類装置、画像分類方法及びプログラム
JP2024161741A (ja) * 2023-05-08 2024-11-20 AxrossInvestors合同会社 情報処理システム、方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267604A (ja) * 2004-02-18 2005-09-29 Fuji Xerox Co Ltd 動作分類支援装置および動作分類装置

Also Published As

Publication number Publication date
JP2016004549A (ja) 2016-01-12

Similar Documents

Publication Publication Date Title
JP5993897B2 (ja) 特定装置、特定方法及び特定プログラム
US11200611B2 (en) Computer vision for unsuccessful queries and iterative search
US20220092635A1 (en) Adaptive real time modeling and scoring
US10354184B1 (en) Joint modeling of user behavior
JP6523498B1 (ja) 学習装置、学習方法および学習プログラム
US20210383259A1 (en) Dynamic workflow optimization using machine learning techniques
US11875241B2 (en) Aspect pre-selection using machine learning
US20230252991A1 (en) Artificial Assistant System Notifications
JP6823612B2 (ja) 予測装置、予測方法、及び予測プログラム
JP7231322B2 (ja) 学習装置、学習方法、学習プログラム及びプログラム
JP6344995B2 (ja) 特定装置、特定方法及び特定プログラム
JP2019020980A (ja) 推定装置、推定方法、推定プログラム、及びモデル
JP2021119526A (ja) 生成装置、生成方法、及び生成プログラム
JP6050284B2 (ja) 抽出装置、抽出方法及び抽出プログラム
KR20210060579A (ko) 동적 링크 미리보기 생성
JP6043755B2 (ja) 生成装置、生成方法及び生成プログラム
JP6092160B2 (ja) 表示制御装置、表示制御方法及び表示制御プログラム
JP2019036087A (ja) 生成装置、生成方法、生成プログラム、学習データ、及びモデル
JP7208286B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP7198900B2 (ja) 生成装置、生成方法、及び生成プログラム
JP2020035072A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2024074021A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Preethi et al. Sales Prediction of FMCG Products in E-Commerce Platform
CN114445167A (zh) 用于项目的列表的状况预测
JP2024061038A (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160822

R150 Certificate of patent or registration of utility model

Ref document number: 5993897

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250