[go: up one dir, main page]

JP7225416B2 - 画像処理装置、携帯端末、画像処理方法及びプログラム - Google Patents

画像処理装置、携帯端末、画像処理方法及びプログラム Download PDF

Info

Publication number
JP7225416B2
JP7225416B2 JP2021542745A JP2021542745A JP7225416B2 JP 7225416 B2 JP7225416 B2 JP 7225416B2 JP 2021542745 A JP2021542745 A JP 2021542745A JP 2021542745 A JP2021542745 A JP 2021542745A JP 7225416 B2 JP7225416 B2 JP 7225416B2
Authority
JP
Japan
Prior art keywords
image
recognition
recognizer
emphasized
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021542745A
Other languages
English (en)
Other versions
JPWO2021039437A1 (ja
Inventor
真司 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Toyama Chemical Co Ltd
Original Assignee
Fujifilm Toyama Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Toyama Chemical Co Ltd filed Critical Fujifilm Toyama Chemical Co Ltd
Publication of JPWO2021039437A1 publication Critical patent/JPWO2021039437A1/ja
Application granted granted Critical
Publication of JP7225416B2 publication Critical patent/JP7225416B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)

Description

本発明は画像処理装置、携帯端末、画像処理方法及びプログラムに係り、特に認識対象物に付加された刻印又は印字を認識する技術に関する。
従来、刻印が付加された薬剤の種類を正確に認識することができる薬剤認識装置が提案されている(特許文献1)。
特許文献1に記載の薬剤認識装置は、刻印が付加された薬剤に対して薬剤の周囲を囲む複数の照明方向から照明可能な照明部が、薬剤を照明する照明方向を順番に切り替える。撮影部により、照明部の照明方向が切り替わる毎に薬剤の撮影を繰り返し行う。特徴画像抽出部が、撮影部により取得された照明方向毎の撮影画像(薬剤画像)を解析して、薬剤画像毎に刻印の影に対応する特徴画像を抽出する。特徴画像統合部が、特徴画像抽出部により抽出された照明方向毎の特徴画像を統合して統合画像を生成する。認識部が、特徴画像統合部により生成された統合画像に含まれる刻印を認識して、刻印の認識結果に基づき薬剤の種類を認識する。
特開2015-68765号公報
特許文献1に記載の薬剤認識装置は、刻印が強調された統合画像を取得することができるが、薬剤に対する照明方向がそれぞれ異なる複数の照明部を必要とするため、装置が大型化する。
また、特許文献1に記載の薬剤認識装置は、複数の照明部を順次点灯し、照明方向毎の薬剤画像を、時間をずらして複数回撮影するため、撮影時間が長くなる。更に複数回の撮影中に薬剤が移動するおそれがあり、この場合には良好な統合画像が生成できなくなるという問題がある。
本発明はこのような事情に鑑みてなされたもので、認識対象物に付加された刻印又は印字が強調された画像を簡単に取得することができる画像処理装置、携帯端末、画像処理方法及びプログラムを提供することを目的とする。
上記目的を達成するために本発明の一の態様に係る画像処理装置は、刻印又は印字が付加された複数の異なる認識対象物の学習データセットであって、認識対象物の刻印又は印字が強調されていない第1画像と刻印又は印字が強調された第2画像とをセットとする学習用の学習データセットにより機械学習が行われた認識器と、刻印又は印字が付加された任意の認識対象物の画像であって、刻印又は印字が強調されていない第3画像を認識器に入力させる画像入力部と、第3画像が認識器に入力された場合に認識器から得られる認識結果を出力する画像出力部と、を備える。
本発明の一の態様によれば、上記の学習データセットにより機械学習が行われた認識器を構築することで、刻印又は印字が付加された任意の認識対象物の画像を認識器に入力すると、その刻印又は印字を示す認識結果を出力することができる。
本発明の他の態様に係る画像処理装置において、認識結果は、任意の認識対象物に付加された刻印又は印字が強調された第4画像である。
本発明の更に他の態様に係る画像処理装置において、第3画像と第4画像とを合成し、刻印又は印字が強調された第5画像を生成する画像生成部を備えることが好ましい。
本発明の更に他の態様に係る画像処理装置において、画像出力部は、認識結果を表示部に出力し、認識結果を表示部に表示させることが好ましい。
本発明の更に他の態様に係る画像処理装置において、認識対象物は薬剤である。
本発明の更に他の態様に係る画像処理装置において、画像出力部は、認識結果を薬剤認識装置に出力することが好ましい。
本発明の更に他の態様に係る画像処理装置において、認識器は、学習データセットの第1画像を入力画像とし、第2画像を出力画像として機械学習を行った畳み込みニューラルネットワークで構成されることが好ましい。
本発明の更に他の態様に係る画像処理装置において、学習データセットに含まれる第2画像は、認識対象物への光の照明方向がそれぞれ異なる認識対象物の複数の画像に基づいて、認識対象物に付加された刻印又は印字を強調する強調処理が施された画像を含むことが好ましい。
本発明の更に他の態様に係る画像処理装置において、画像入力部は、任意の認識対象物を含む画像を撮影するカメラ部と、カメラ部により撮影された撮影画像から認識対象物に対応する領域を抽出する画像抽出部とを含み、画像抽出部により抽出した画像を第3画像として認識器に入力させることが好ましい。
更に他の態様に係る発明は、上記の画像処理装置を備えた携帯端末である。
本発明の更に他の態様に係る画像処理方法は、刻印又は印字が付加された複数の異なる認識対象物の学習データセットであって、認識対象物の刻印又は印字が強調されていない第1画像と刻印又は印字が強調された第2画像とをセットとする学習用の学習データセットを準備するステップと、学習データセットにより認識器に機械学習を行わせるステップと、刻印又は印字が付加された任意の認識対象物の画像であって、刻印又は印字が強調されていない第3画像を、機械学習が行われた認識器に入力させるステップと、画像出力部が、第3画像が認識器に入力された場合に認識器から得られる認識結果を出力するステップと、を含む。
本発明の更に他の態様に係る画像処理方法において、認識結果は、任意の認識対象物に付加された刻印又は印字が強調された第4画像であることが好ましい。
本発明の更に他の態様に係る画像処理方法において、画像生成部が、第3画像と第4画像とを合成し、刻印又は印字が強調された第5画像を生成するステップを含むことが好ましい。
本発明の更に他の態様に係る画像処理方法において、認識結果を出力するステップは、認識結果を表示部に出力し、認識結果を表示部に表示させることが好ましい。
本発明の更に他の態様に係る画像処理方法において、認識対象物は薬剤である。
本発明の更に他の態様に係る画像処理方法において、認識結果を出力するステップは、認識結果を薬剤認識装置に出力することが好ましい。
本発明の更に他の態様に係る画像処理方法において、学習データセットに含まれる第2画像は、認識対象物への光の照明方向がそれぞれ異なる認識対象物の複数の画像に基づいて、認識対象物に付加された刻印又は印字を強調する強調処理が施された画像を含むことが好ましい。
本発明の更に他の態様に係るプログラムは、コンピュータにインストールされることにより、そのコンピュータを上記の画像処理装置として機能させる。
本発明によれば、認識対象物に付加された刻印又は印字が強調された画像を簡単に取得することができる。
図1は、本発明に係る携帯端末を含む薬剤識別システムの実施形態を示すシステム構成図である。 図2は、図1に示した薬剤識別システムを構成するスマートフォンの外観図である。 図3は、図2に示したスマートフォンの内部構成を示すブロック図である。 図4は、図1に示した薬剤識別システムの電気的な構成を示すブロック図である。 図5は、機械学習装置を含む画像処理装置のハードウエア構成を示すブロック図である。 図6は、図5に示したデータベースに保存される学習データセットの一例を示す図である。 図7は、図5に示した画像処理装置の主要な構成部分である機械学習装置の機能を示す機能ブロック図である。 図8は、本発明に係る画像処理方法の実施形態を示すフローチャートであり、特に機械学習装置での学習フェーズの処理を示す図である。 図9は、本発明に係る画像処理方法の実施形態を示すフローチャートであり、特にスマートフォンによる薬剤の認識フェーズの処理を示す図である。
以下、添付図面に従って本発明に係る画像処理装置、携帯端末、画像処理方法及びプログラムの好ましい実施形態について説明する。
[薬剤識別システムの構成]
図1は、本発明に係る携帯端末を含む薬剤識別システムの実施形態を示すシステム構成図である。
図1に示すように、薬剤識別システムは、カメラ付き携帯端末であるスマートフォン100と、薬剤識別装置として機能するサーバ200とから構成され、スマートフォン100とサーバ200とはインターネット、LAN(Local Area Network)等のネットワーク2を介してデータ通信可能に接続されている。
スマートフォン100は、カメラ部を有し、カメラ部により認識対象物である薬剤10を撮影する。スマートフォン100は、撮影した薬剤10の画像(第3画像)を処理する、本発明に係る画像処理装置を備え、その画像処理装置による画像処理後の画像(第4画像)を表示部に表示し、又はネットワーク2を介してサーバ200に送信する。尚、画像処理装置の詳細については後述する。
サーバ200は、スマートフォン100からアップロードされた薬剤10の第4画像に基づいて薬剤10の識別を行い、その識別結果(例えば、薬剤名、商品名、略称又はこれらの組合せからなる薬剤識別情報)を、薬剤10の第4画像を送信したスマートフォン100に送信する。
ところで、薬剤(錠剤)の表面には、薬剤の種別を識別するための識別コード情報が付されている。この識別コード情報は、一般に、刻印又は印字(印刷)によって付される。
サーバ200は、薬剤に付された識別コード情報を利用することで、薬剤の識別力を向上させることができる。
尚、薬剤に付された刻印とは、薬剤の表面に陥没領域である溝を形成することによって識別コード情報が形成されたものをいう。溝は、表面を掘って形成されたものに限定されず、表面を押圧することで形成されたものでもよい。また、刻印は、割線等の識別機能を伴わないものを含んでもよい。
また、薬剤に付された印字とは、薬剤の表面に接触又は非接触で可食性インク等を付与することによって識別コード情報が形成されたものをいう。ここでは、印字によって付されたとは、印刷によって付されたと同義である。
<スマートフォンの構成>
図2に示すスマートフォン100は、平板状の筐体102を有し、筐体102の一方の面に表示部としての表示パネル121と、入力部としての操作パネル122とが一体となって形成される表示部120が設けられる。表示パネル121は液晶パネルから構成されており、本例の表示部120は液晶ディスプレイである。
また、その筐体102は、スピーカ131と、マイクロホン132と、操作部140と、カメラ部141とを備える。カメラ部141は、表示部120と同じ面側に設けられたカメラ(インカメラ)と、表示部120と反対の面側に設けられたカメラ(図示しないアウトカメラ)のうちの少なくとも一方を含む。
図3は、図2に示したスマートフォン100の内部構成を示すブロック図である。
図3に示すようにスマートフォン100は、主たる構成要素として、無線通信部110と、表示部120と、通話部130と、操作部140と、カメラ部141と、記憶部150と、外部入出力部160(画像出力部)と、GPS(global positioning system)受信部170と、モーションセンサ部180と、電源部190と、主制御部101とを備える。また、スマートフォン100の主たる機能として、基地局装置と移動通信網とを介した移動無線通信を行う無線通信機能を備える。
無線通信部110は、主制御部101の指示に従って、移動通信網に接続された基地局装置との間で無線通信を行う。その無線通信が使用されて、音声データ及び画像データ等の各種ファイルデータや電子メールデータなどの送受信、及びウェブデータやストリーミングデータなどの受信が行われる。
表示部120は、表示パネル121の画面上に配設された操作パネル122を備えたいわゆるタッチパネル付きディスプレイであり、主制御部101の制御により、画像(静止画及び動画)や文字情報などを表示して視覚的にユーザに情報を伝達し、また表示した情報に対するユーザ操作を検出する。
表示パネル121は、LCD(Liquid Crystal Display)を表示デバイスとして用いる。尚、表示パネル121は、LCDに限らず、例えば、OLED(organic light emitting diode)でもよい。
操作パネル122は、表示パネル121の表示面上に表示される画像が視認可能な状態で設けられ、ユーザの指や尖筆によって操作される1又は複数の座標を検出するデバイスである。そのデバイスがユーザの指や尖筆によって操作されると、操作パネル122は、操作に起因して発生する検出信号を主制御部101に出力する。次いで、主制御部101は、受信した検出信号に基づいて、表示パネル121上の操作位置(座標)を検出する。
通話部130は、スピーカ131及びマイクロホン132を備え、マイクロホン132を通じて入力されたユーザの音声を主制御部101にて処理可能な音声データに変換して主制御部101に出力したり、無線通信部110或いは外部入出力部160により受信された音声データを復号してスピーカ131から出力したりする。
操作部140は、キースイッチなどを用いたハードウエアキーであって、ユーザからの指示を受け付ける。例えば、図2に示すように、操作部140は、スマートフォン100の筐体102の側面に搭載され、指などで押下されるとスイッチオン状態となり、指を離すとバネなどの復元力によってスイッチオフ状態となる押しボタン式のスイッチである。
記憶部150は、主制御部101の制御プログラムや制御データ、通信相手の名称や電話番号などを対応づけたアドレスデータ、送受信した電子メールのデータ、ウェブブラウジングによりダウンロードしたウェブデータ、及びダウンロードしたコンテンツデータ等を記憶し、またストリーミングデータなどを一時的に記憶する。
また、記憶部150は、内部記憶部151と着脱自在な外部メモリスロットを有する外部記憶部152とにより構成される。尚、記憶部150を構成する内部記憶部151及び外部記憶部152のそれぞれは、フラッシュメモリタイプ、ハードディスクタイプ、マルチメディアカードマイクロタイプ、カードタイプのメモリ、RAM(Random Access Memory)、或いはROM(Read Only Memory)などの格納媒体を用いて実現される。
外部入出力部160は、スマートフォン100に連結される全ての外部機器とのインターフェースの役割を果たし、通信等(例えば、USB(Universal Serial Bus)、IEEE1394など)又はネットワーク(例えば、無線LAN(Local Area Network)、ブルートゥース(Bluetooth)(登録商標)により他の外部機器に直接的又は間接的に接続する。
GPS受信部170は、主制御部101の指示に従って、GPS衛星ST1、ST2~STnから送信されるGPS信号を受信し、受信した複数のGPS信号に基づく測位演算処理を実行し、スマートフォン100の緯度、経度及び高度によって特定される位置情報(GPS情報)を取得する。GPS受信部170は、無線通信部110及び/又は外部入出力部160(例えば、無線LAN)から位置情報を取得できる場合には、その位置情報を用いて位置を検出することもできる。
モーションセンサ部180は、例えば、3軸の加速度センサなどを備え、主制御部101の指示に従って、スマートフォン100の物理的な動きを検出する。スマートフォン100の物理的な動きを検出することにより、スマートフォン100の動く方向や加速度が検出される。その検出の結果は、主制御部101に出力される。
電源部190は、主制御部101の指示に従って、スマートフォン100の各部に、バッテリ(図示しない)に蓄えられる電力を供給する。
主制御部101は、マイクロプロセッサを備え、記憶部150が記憶する制御プログラムや制御データに従って動作し、スマートフォン100の各部を統括して制御する。また、主制御部101は、無線通信部110を通じて音声通信及びデータ通信を行うために、通信系の各部を制御する移動通信制御機能と、ソフトウエア処理機能とを備える。
ソフトウエア処理機能は、記憶部150が記憶するソフトウエア(プログラム)に従って主制御部101が動作することにより実現される。ソフトウエア処理機能は、例えば、外部入出力部160を制御することで電子メールの送受信を行う電子メール機能、及びウェブページを閲覧するウェブブラウジング機能の他、スマートフォン100を本発明に係る画像処理装置として機能させる。スマートフォン100を本発明に係る画像処理装置として機能させるソフトウエア(本発明に係るプログラム)は、薬剤識別装置として機能するサーバ200又はサーバ200を運営する事業者のサイト等から対応するソフトウエアをダウンロードすることによりスマートフォン100にインストールすることができる。
また、主制御部101は、受信データやダウンロードしたストリーミングデータなどの画像データ(静止画や動画のデータ)に基づいて、映像を表示部120に表示する等の画像処理機能を備える。
更に、主制御部101は、表示部120に対する表示制御と、操作部140や操作パネル122を通じたユーザ操作を検出する操作検出制御とを実行する。
カメラ部141は、主制御部101の制御により、撮像によって得た画像データを例えばJPEG(Joint Photographic Experts Group)などの圧縮した画像データに変換し、その画像データを記憶部150に記録したり、外部入出力部160や無線通信部110を通じて出力したりすることができる。
また、カメラ部141は、スマートフォン100の各種機能に利用することができる。本例では、薬剤を識別する場合、薬剤の撮影に利用される。カメラ部141からの画像をソフトウエア内で利用することもできる。
<薬剤識別システムの電気的な構成>
図4は、図1に示した薬剤識別システムの電気的な構成を示すブロック図である。
スマートフォン100には、本発明に係るプログラム(アプリケーション)がインストールされており、スマートフォン100の主制御部101は、このアプリケーションを実行することにより、画像抽出部101A、認識器101B、画像生成部101C、及び通信制御部101Dとして機能する。
カメラ部141及び画像抽出部101Aは、薬剤の画像(第3画像)を認識器101Bに入力させる画像入力部として機能する。カメラ部141により撮影された薬剤の撮影画像は、主制御部101に入力される。主制御部101の画像抽出部は、入力した撮影画像から認識対象物である薬剤に対応する領域を抽出し、抽出した領域の画像(薬剤画像)を認識器101Bに入力させる。薬剤画像の抽出(切り出し)は、薬剤の外形を検出し、薬剤の外形にしたがって切り出すことが好ましく、例えば、薬剤の外形が内接する矩形領域を切り出すことができる。
認識器101Bは、深層学習モデルの一つである畳み込みニューラルネットワーク(CNN:Convolution Neural Network)を適用することができる。認識器101Bは、刻印又は印字が付加された複数の異なる薬剤の学習データセットであって、薬剤の刻印又は印字が強調されていない画像(第1画像)と、薬剤の刻印又は印字が強調された画像(第2画像)とをセットとする学習用の学習データセットにより機械学習が行われたものである。尚、認識器101Bは、認識器101B自体が学習機能を有する必要はなく、外部の機械学習装置により機械学習が行われたモデル(CNN)のパラメータを取得することで、学習済みモデルとして構成されたものでもよい。
図5は、機械学習装置を含む画像処理装置300のハードウエア構成を示すブロック図である。
図5に示す画像処理装置300としては、パーソナルコンピュータ又はワークステーションを使用することができる。本例の画像処理装置300は、主として画像入力部312と、データベース314と、記憶部316と、操作部318と、CPU(Central Processing Unit)320と、RAM(Random Access Memory)322と、ROM(Read Only Memory)324と、表示部326とから構成されている。
画像入力部312は、刻印又は印字が付加された認識対象物(本例では「薬剤」)を撮影した画像を入力し、また、データベース314に保存する学習データセット等を入力する部分である。
データベース314は、学習データセットを記憶する記憶部である。
図6は、図5に示したデータベース314に保存される学習データセットの一例を示す図である。
学習データセットは、種類の異なる複数の薬剤の画像(第1画像25)と、第1画像25に対応する各薬剤の刻印又は印字が強調された画像(第2画像27)とがセットになっている。第1画像25と第2画像27は、それぞれ学習モデルの機械学習時に使用される入力画像と正解データである。第1画像25は、薬剤を撮影することで収集することができる。一般に第1画像25における刻印は鮮明に写っていない。
第2画像27は、薬剤の刻印又は印字を示す画像である。第2画像27は、第1画像25を表示部326に表示させ、ユーザが操作部318を使用して、表示部326の画面上で刻印部分又は印字部分を塗りつぶすことで取得することができる。
また、第2画像は、手動で作成されるものに限らず、特許文献1等に記載の薬剤認識装置により生成される統合画像(刻印又は印字を強調する強調処理が施された画像)を使用することができる。即ち、第2画像27は、薬剤への光の照明方向がそれぞれ異なる薬剤の複数の画像に基づいて、薬剤に付加された刻印又は印字を強調する強調処理が施された画像を使用することができる。
図7は、図5に示した画像処理装置300の主要な構成部分である機械学習装置350の機能を示す機能ブロック図であり、図5に示したCPU320、記憶部316、RAM322、ROM324等のハードウエアにより構成される。
図7において、機械学習装置350は、主として認識器352と、認識器352に機械学習させる学習部として機能する損失値算出部354及びパラメータ制御部356とを備えている。
本例の認識器352は、CNNのモデルが適用される。認識器352は、複数のレイヤー構造を有し、複数のパラメータを保持している。認識器352は、パラメータが初期値から最適値に更新されることで、未学習モデルから学習済みモデルに変化しうる。認識器352のパラメータの初期値は、任意の値でもよいし、例えば、画像の分類等を行う画像系の学習済みモデルのパラメータを適用してもよい。後者の場合、図6に示した学習データセットによる転移学習を行うことで、比較的少ない学習データセットで良好な機械学習を行うことが可能である。
この認識器352は、入力層352Aと、畳み込み層とプーリング層から構成された複数セットを有する中間層352Bと、出力層352Cとを備え、各層は複数の「ノード」が「エッジ」で結ばれる構造となっている。
学習フェーズでは、入力層352Aには、学習データセット(図6)の第1画像25が入力画像として入力される。
中間層352Bは、畳み込み層とプーリング層とを1セットとする複数セットを有し、入力層352Aから入力した第1画像25から特徴を抽出する部分である。畳み込み層は、前の層で近くにあるノードにフィルタ処理し(フィルタを使用した畳み込み演算を行い)、「特徴マップ」を取得する。プーリング層は、畳み込み層から出力された特徴マップを縮小して新たな特徴マップとする。「畳み込み層」は、画像からのエッジ抽出等の特徴抽出の役割を担い、「プーリング層」は抽出された特徴が、平行移動などによる影響を受けないようにロバスト性を与える役割を担う。尚、中間層352Bには、畳み込み層とプーリング層とを1セットとする場合に限らず、畳み込み層が連続する場合や正規化層も含まれる。また、最終段の畳み込み層は、入力画像と同じサイズの特徴マップ(画像)であって、薬剤の特徴(刻印等)を示す特徴マップを出力する部分である。
出力層352Cは、認識器352の認識結果(本例では、刻印等が強調された画像)を出力する部分である。
損失値算出部354は、認識器352の出力層352Cから出力される認識結果(出力画像)と、第1画像25とペアの第2画像27(正解データ)とを取得し、両者間の損失値を算出する。損失値の算出方法は、例えば、ジャッカード係数やダイス係数を用いることが考えられる。
パラメータ制御部356は、損失値算出部354により算出された損失値を元に、誤差逆伝播法により、正解データと認識器352の出力との特徴量空間での距離を最小化させ、又は類似度を最大化させるべく、認識器352のパラメータ(各畳み込み層のフィルタの係数等)を調整する。
このパラメータの調整処理を繰り返し行い、損失値算出部354により算出される損失値が収束するまで繰り返し学習を行う。
このようにしてデータベース314に格納された学習データセットを使用し、パラメータが最適化された学習済みの認識器352を作成する。
認識フェーズでは、学習済みの認識器352は、画像入力部312により取得された任意の薬剤の画像(第3画像)を入力画像とし、入力画像から薬剤の刻印等を認識し、認識結果(第4画像)を画像出力部360に出力する。
図4に戻って、スマートフォン100の認識器101Bは、図7に示した機械学習装置350から、学習済みの認識器352のパラメータと同じパラメータを取得し、取得したパラメータが設定されることで学習済みの認識器352と同じ認識機能を有すものとなる。
画像生成部101Cは、カメラ部141により撮影され、画像抽出部101Aにより抽出された薬剤の第3画像(刻印又は印字が強調されていない認識対象の薬剤の画像)と、認識器101Bにより認識された認識結果(第4画像)とを合成し、薬剤の刻印又は印字が強調された合成画像(第5画像)を生成する。
ここで、第4画像は、図6に示した第2画像27と同様に、薬剤の刻印又は印字のみを示す画像であり、刻印部分又は印字部分の輝度が高い画像である。したがって、画像生成部101Cは、第3画像から第4画像を減算することで、薬剤の刻印又は印字部分が黒く強調された第5画像を生成することができる。尚、輝度の低い第3画像(例えば、黒い薬剤を撮影した画像)の場合、画像生成部101Cは、第3画像に第4画像を加算することで、薬剤の刻印又は印字部分が白く強調された第5画像を生成することができる。
画像出力部として機能する表示制御部(図示せず)は、認識器101Bによる認識結果(第4画像)、又は第4画像を含む第5画像を表示部120に出力し、表示部120に表示させる。
これにより、ユーザは、スマートフォン100で薬剤を撮影することで、スマートフォン100の表示部120に第4画像又は第5画像を表示させることができ、第4画像又は第5画像により薬剤に付加された刻印又は印字を容易に視認することができる。尚、薬剤を動画撮影する場合には、動画の第4画像又は第5画像を表示部120に表示させることも可能である。
また、認識器101Bによる認識結果(第4画像)、又は第4画像を含む第5画像は、薬剤に付加された刻印又は印字が強調されているため、薬剤の鑑別又は監査を行うのに好適である。
本例では、画像出力部として機能する通信制御部101D及び無線通信部110は、認識器101Bによる認識結果(第4画像)、又は第4画像を含む第5画像を、ネットワーク2を介してサーバ200に送信し、第4画像又は第5画像に基づいてサーバ200により識別された、識別対象の薬剤の識別結果をネットワーク2を介して取得する。
<サーバ200>
図4に示すサーバ200は、薬剤識別装置として機能するものであり、主として通信部210、CPU(Central Processing Unit)220、薬剤DB(database)230、メモリ240、及び薬剤識別部250から構成されている。
CPU220は、サーバ200の各部を統括制御する部分であり、スマートフォン100から送信された薬剤の第4画像又は第5画像を受け付ける画像受付部として通信部210を機能させ、受け付けた第4画像又は第5画像に基づいて薬剤識別部250により薬剤の識別処理を実行させる。
薬剤DB230は、薬剤の名前等の薬剤識別情報と関連付けて薬剤の画像(薬剤の表側及び裏側の薬剤画像)を登録及び管理する部分である。薬剤DB230に登録された薬剤(登録薬剤)の薬剤画像は、識別対象の薬剤が、登録薬剤のうちのいずれの登録薬剤に対応するかを識別するためのテンプレート画像として使用される。
メモリ240は、薬剤識別サービスを提供するプログラムが格納される記憶部、及びCPU220の作業領域となる部分を含む。
薬剤識別部250は、通信部210を介して受け付けた識別対象の薬剤の画像(第4画像又は第5画像)と、薬剤DB230に登録された登録薬剤のテンプレート画像とのテンプレートマッチングを行い、マッチング度合が最大となる登録薬剤、又はマッチング度合が高い上位の複数の登録薬剤の薬剤識別情報(登録薬剤の画像を含む)等の識別結果を取得する。
CPU220は、薬剤識別部250による薬剤の識別結果を、第4画像又は第5画像を送信したスマートフォン100に通信部210を介して送信する。
尚、第4画像又は第5画像を生成するスマートフォン100の機能をサーバ200に持たせ、サーバ200により生成された第4画像又は第5画像をスマートフォン100に送信したり、薬剤の識別結果をスマートフォン100に送信するようにしてもよい。この場合、スマートフォン100は、識別対象の薬剤の画像を撮影し、撮影した薬剤の画像をそのままサーバ200に送信することで、刻印又は印字が強調された画像をサーバ200から取得し、あるいは撮影した薬剤の認識結果をサーバ200から取得することができる。
<画像処理方法>
図8及び図9は、それぞれ本発明に係る画像処理方法の実施形態を示すフローチャートである。
図8は、図7に示した機械学習装置350での学習フェーズの処理を示している。
図8において、刻印又は印字が付加された複数の異なる薬剤の学習データセットを準備する(ステップS10)。学習データセットは、図6に示したように刻印又は印字が強調されていない第1画像25と、刻印又は印字が強調された第2画像27とをセットとする機械学習用の学習データセットであり、データベース314(図5)に保存される。
図7を使用して説明したように機械学習装置350は、データベース314に保存された学習データセットにより認識器352に機械学習を行わせる(ステップS12)。
これにより、パラメータが最適化された学習済みの認識器252が作成される。
図9は、図4等に示したスマートフォン100による薬剤の認識フェーズの処理を示している。
本例のスマートフォン100は、学習済みの認識器252のパラメータと同じパラメータが設定された認識器101Bを備えている。この認識器101Bは、学習済みの認識器252と同じ認識機能を有している。
図9において、画像入力部から刻印又は印字が付加された任意の認識対象である薬剤の画像(第3画像)を、入力画像として認識器101Bに入力させる(ステップS20)。即ち、画像入力部として機能するカメラ部141により認識対象の薬剤を撮影し、撮影画像から薬剤に対応する領域の画像(薬剤画像)を抽出し、抽出した薬剤画像(第3画像)を認識器101Bに入力させる。
認識器101Bは、入力する第3画像に対する認識結果として、認識対象の薬剤に付加された刻印又は印字を示す画像(第4画像)を出力する(ステップS22)。
画像生成部101Cは、第3画像(薬剤画像)と認識器101Bから出力される第4画像とを合成し、薬剤の刻印又は印字が強調された合成画像(第5画像)を生成する(ステップS24)。
画像出力部として機能する表示制御部は、ステップS24で生成された第5画像を表示部120に出力し、認識対象の薬剤の刻印又は印字が強調された第5画像を表示部120に表示させる(ステップS26)。
これにより、ユーザは、スマートフォン100で薬剤を撮影することで、スマートフォン100の表示部120に第5画像を表示させることができ、第5画像により薬剤に付加された刻印又は印字を容易に視認することができる。
また、画像出力部として機能する通信制御部101D及び無線通信部110は、ステップS24で生成された第5画像を、ネットワーク2を介してサーバ200に送信する(ステップS28)。
サーバ200は、第5画像に基づいて認識対象の薬剤の名前等の薬剤識別情報等の識別結果を取得し、取得した識別結果をスマートフォン100に送信し、スマートフォン100は、サーバ200から薬剤の識別結果を受信する(ステップS30)。
スマートフォン100の表示制御部は、サーバ200から受信した薬剤の識別結果を表示部120に出力し、薬剤の識別結果を表示部120に表示させる(ステップS32)。
これにより、ユーザは、スマートフォン100で薬剤を撮影することで、スマートフォン100の表示部120に薬剤の薬剤名等の識別結果を表示させることができる。
[その他]
本実施形態の画像処理装置は、薬剤認識装置に組み込むことが可能であり、これにより薬剤認識装置を小型化及び安価にすることが可能である。
また、本発明に係る携帯端末は、スマートフォンに限らず、カメラ機能を有するタブレット端末、携帯電話機、PDA(Personal Digital Assistants)等でもよい。
更に本実施形態では、薬剤を認識対象物としたが、これに限らず、本発明は、刻印が付加された金属部品、貴金属等の他の認識対象物の認識にも適用できる。
また、本発明に係る画像処理装置を実現するハードウエアは、各種のプロセッサ(processor)で構成できる。各種プロセッサには、プログラムを実行して各種の処理部として機能する汎用的なプロセッサであるCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device;PLD)、ASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。画像処理装置を構成する1つの処理部は、上記各種プロセッサのうちの1つで構成されていてもよいし、同種又は異種の2つ以上のプロセッサで構成されてもよい。例えば、1つの処理部は、複数のFPGA、あるいは、CPUとFPGAの組み合わせによって構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアントやサーバなどのコンピュータに代表されるように、1つ以上のCPUとソフトウエアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip;SoC)などに代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウエア的な構造として、上記各種プロセッサを1つ以上用いて構成される。更に、これらの各種のプロセッサのハードウエア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)である。
更に本発明は、コンピュータにインストールされることにより、コンピュータを本発明に係る画像処理装置として機能させるプログラム及びこのプログラムが記録された記憶媒体を含む。
また、本発明は上述した実施形態に限定されず、本発明の精神を逸脱しない範囲で種々の変形が可能であることは言うまでもない。
2 ネットワーク
10 薬剤
25 第1画像
27 第2画像
100 スマートフォン
101 主制御部
101A 画像抽出部
101B 認識器
101C 画像生成部
101D 通信制御部
102 筐体
110 無線通信部
120 表示部
121 表示パネル
122 操作パネル
130 通話部
131 スピーカ
132 マイクロホン
140 操作部
141 カメラ部
150 記憶部
151 内部記憶部
152 外部記憶部
160 外部入出力部
170 GPS受信部
180 モーションセンサ部
190 電源部
200 サーバ
210 通信部
220 CPU
230 薬剤DB
240 メモリ
250 薬剤識別部
252 認識器
300 画像処理装置
312 画像入力部
314 データベース
316 記憶部
318 操作部
316 記憶部
320 CPU
322 RAM
324 ROM
326 表示部
350 機械学習装置
352 認識器
352A 入力層
352B 中間層
352C 出力層
354 損失値算出部
356 パラメータ制御部
360 画像出力部
S10~S32 ステップ

Claims (17)

  1. 刻印又は印字が付加された複数の異なる認識対象物の学習データセットであって、前記認識対象物の前記刻印又は印字が強調されていない第1画像と前記刻印又は印字が強調された第2画像とをセットとする学習用の前記学習データセットにより機械学習が行われた認識器と、
    刻印又は印字が付加された任意の認識対象物の画像であって、前記刻印又は印字が強調されていない第3画像を前記認識器に入力させる画像入力部と、
    前記第3画像が前記認識器に入力された場合に前記認識器から得られる認識結果を出力する画像出力部と、を備え、
    前記学習データセットに含まれる前記第2画像は、前記認識対象物への光の照明方向がそれぞれ異なる前記認識対象物の複数の画像に基づいて、前記認識対象物に付加された刻印又は印字を強調する強調処理が施された画像を含み、
    前記認識結果は、前記任意の認識対象物に付加された前記刻印又は印字が強調された第4画像である、
    画像処理装置。
  2. 刻印又は印字が付加された複数の異なる認識対象物の学習データセットであって、前記認識対象物の前記刻印又は印字が強調されていない第1画像と前記刻印又は印字が強調された第2画像とをセットとする学習用の前記学習データセットにより機械学習が行われた認識器と、
    刻印又は印字が付加された任意の認識対象物の画像であって、前記刻印又は印字が強調されていない第3画像を前記認識器に入力させる画像入力部と、
    前記第3画像が前記認識器に入力された場合に前記認識器から得られる認識結果を出力する画像出力部と、を備え、
    前記学習データセットに含まれる前記第2画像は、前記第1画像の刻印部分又は印字部分をユーザ操作により塗りつぶした画像であり、
    前記認識結果は、前記任意の認識対象物に付加された前記刻印又は印字が強調された第4画像である、
    画像処理装置。
  3. 前記第3画像と前記第4画像とを合成し、前記刻印又は印字が強調された第5画像を生成する画像生成部を備えた請求項1又は2に記載の画像処理装置。
  4. 前記画像出力部は、前記認識結果を表示部に出力し、前記認識結果を前記表示部に表示させる請求項1から3のいずれか1項に記載の画像処理装置。
  5. 前記認識対象物は薬剤である請求項1から4のいずれか1項に記載の画像処理装置。
  6. 前記画像出力部は、前記認識結果を薬剤認識装置に出力する請求項5に記載の画像処理装置。
  7. 前記認識器は、前記学習データセットの前記第1画像を入力画像とし、前記第2画像を出力画像として機械学習を行った畳み込みニューラルネットワークで構成される請求項1から6のいずれか1項に記載の画像処理装置。
  8. 前記画像入力部は、任意の認識対象物を含む画像を撮影するカメラ部と、前記カメラ部により撮影された撮影画像から前記認識対象物に対応する領域を抽出する画像抽出部とを含み、前記画像抽出部により抽出した画像を前記第3画像として前記認識器に入力させる請求項1からのいずれか1項に記載の画像処理装置。
  9. 請求項1からのいずれか1項に記載の画像処理装置を備えた携帯端末。
  10. 刻印又は印字が付加された複数の異なる認識対象物の学習データセットであって、前記認識対象物の前記刻印又は印字が強調されていない第1画像と前記刻印又は印字が強調された第2画像とをセットとする学習用の前記学習データセットを準備するステップと、
    前記学習データセットにより認識器に機械学習を行わせるステップと、
    刻印又は印字が付加された任意の認識対象物の画像であって、前記刻印又は印字が強調されていない第3画像を、前記機械学習が行われた前記認識器に入力させるステップと、
    画像出力部が、前記第3画像が前記認識器に入力された場合に前記認識器から得られる認識結果を出力するステップと、を含み、
    前記学習データセットに含まれる前記第2画像は、前記認識対象物への光の照明方向がそれぞれ異なる前記認識対象物の複数の画像に基づいて、前記認識対象物に付加された刻印又は印字を強調する強調処理が施された画像を含み、
    前記認識結果は、前記任意の認識対象物に付加された前記刻印又は印字が強調された第4画像である、
    画像処理方法。
  11. 刻印又は印字が付加された複数の異なる認識対象物の学習データセットであって、前記認識対象物の前記刻印又は印字が強調されていない第1画像と前記刻印又は印字が強調された第2画像とをセットとする学習用の前記学習データセットを準備するステップと、
    前記学習データセットにより認識器に機械学習を行わせるステップと、
    刻印又は印字が付加された任意の認識対象物の画像であって、前記刻印又は印字が強調されていない第3画像を、前記機械学習が行われた前記認識器に入力させるステップと、
    画像出力部が、前記第3画像が前記認識器に入力された場合に前記認識器から得られる認識結果を出力するステップと、を含み、
    前記学習データセットに含まれる前記第2画像は、前記第1画像の刻印部分又は印字部分をユーザ操作により塗りつぶした画像であり、
    前記認識結果は、前記任意の認識対象物に付加された前記刻印又は印字が強調された第4画像である、
    画像処理方法。
  12. 画像生成部が、前記第3画像と前記第4画像とを合成し、前記刻印又は印字が強調された第5画像を生成するステップを含む請求項10又は11に記載の画像処理方法。
  13. 前記認識結果を出力するステップは、前記認識結果を表示部に出力し、前記認識結果を前記表示部に表示させる請求項10から12のいずれか1項に記載の画像処理方法。
  14. 前記認識対象物は薬剤である請求項10から12のいずれか1項に記載の画像処理方法。
  15. 前記認識結果を出力するステップは、前記認識結果を薬剤認識装置に出力する請求項14に記載の画像処理方法。
  16. コンピュータにインストールされることにより、該コンピュータを請求項1からのいずれか1項に記載の画像処理装置として機能させるプログラム。
  17. 非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に該コンピュータを請求項1からのいずれか1項に記載の画像処理装置として機能させる記録媒体。
JP2021542745A 2019-08-27 2020-08-14 画像処理装置、携帯端末、画像処理方法及びプログラム Active JP7225416B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019154363 2019-08-27
JP2019154363 2019-08-27
PCT/JP2020/030872 WO2021039437A1 (ja) 2019-08-27 2020-08-14 画像処理装置、携帯端末、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2021039437A1 JPWO2021039437A1 (ja) 2021-03-04
JP7225416B2 true JP7225416B2 (ja) 2023-02-20

Family

ID=74684564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021542745A Active JP7225416B2 (ja) 2019-08-27 2020-08-14 画像処理装置、携帯端末、画像処理方法及びプログラム

Country Status (2)

Country Link
JP (1) JP7225416B2 (ja)
WO (1) WO2021039437A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024190416A1 (ja) * 2023-03-10 2024-09-19 富士フイルムメディカル株式会社 薬剤識別装置、薬剤識別方法及びプログラム、学習済みモデル並びに学習装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049974A (ja) 2015-09-04 2017-03-09 キヤノン株式会社 識別器生成装置、良否判定方法、およびプログラム
JP2018027242A (ja) 2016-08-18 2018-02-22 安川情報システム株式会社 錠剤検知方法、錠剤検知装置および錠剤検知プログラム
US20180260665A1 (en) 2017-03-07 2018-09-13 Board Of Trustees Of Michigan State University Deep learning system for recognizing pills in images
WO2018190394A1 (ja) 2017-04-14 2018-10-18 株式会社湯山製作所 薬剤仕分装置、仕分容器、及び薬剤返却方法
WO2019039016A1 (ja) 2017-08-25 2019-02-28 富士フイルム株式会社 薬剤検査支援装置、画像処理装置、画像処理方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049974A (ja) 2015-09-04 2017-03-09 キヤノン株式会社 識別器生成装置、良否判定方法、およびプログラム
JP2018027242A (ja) 2016-08-18 2018-02-22 安川情報システム株式会社 錠剤検知方法、錠剤検知装置および錠剤検知プログラム
US20180260665A1 (en) 2017-03-07 2018-09-13 Board Of Trustees Of Michigan State University Deep learning system for recognizing pills in images
WO2018190394A1 (ja) 2017-04-14 2018-10-18 株式会社湯山製作所 薬剤仕分装置、仕分容器、及び薬剤返却方法
WO2019039016A1 (ja) 2017-08-25 2019-02-28 富士フイルム株式会社 薬剤検査支援装置、画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
JPWO2021039437A1 (ja) 2021-03-04
WO2021039437A1 (ja) 2021-03-04

Similar Documents

Publication Publication Date Title
US10339664B2 (en) Signal detection, recognition and tracking with feature vector transforms
CN109409161B (zh) 图形码识别方法、装置、终端及存储介质
JP7106688B2 (ja) 薬剤識別システム、薬剤識別装置、薬剤識別方法及びプログラム
JP6884248B2 (ja) プリント用画像生成プログラム
US9104261B2 (en) Method and apparatus for notification of input environment
CN113538321B (zh) 基于视觉的体积测量方法及终端设备
JP7657244B2 (ja) 薬剤識別装置、薬剤識別方法及びプログラム、薬剤載置台、照明装置、並びに学習装置、出力物の製造方法
CN110991457B (zh) 二维码处理方法、装置、电子设备及存储介质
CN110717060A (zh) 图像mask的过滤方法、装置及存储介质
JP7225416B2 (ja) 画像処理装置、携帯端末、画像処理方法及びプログラム
CN112053360B (zh) 图像分割方法、装置、计算机设备及存储介质
KR20070112148A (ko) 전자펜에 대한 방법, 컴퓨터 프로그램 제품, 및 전자펜
CN110378318B (zh) 文字识别方法、装置、计算机设备及存储介质
CN113744172B (zh) 文档图像的处理方法及装置、训练样本的生成方法及装置
CN114897725B (zh) 图像降噪方法、装置、设备及存储介质
JP2013041413A (ja) 記入支援システム、サーバ装置、記入支援装置、及びプログラム
JP7741044B2 (ja) 薬剤識別装置、薬剤識別方法及びプログラム
CN114612282B (zh) 水印检测模型训练方法、水印去除方法、装置及电子设备
CN118014896A (zh) 图像处理模型的生成方法、装置、设备及存储介质
KR20230055311A (ko) 콘텐트를 식별하기 위한 전자 장치 및 방법
EP4390846A1 (en) Electronic apparatus and method for identifying content
WO2024190416A1 (ja) 薬剤識別装置、薬剤識別方法及びプログラム、学習済みモデル並びに学習装置
JP2024000578A (ja) 画像補正装置、文字認識装置、画像補正方法、文字認識方法、プログラム及び記録媒体
CN108664244B (zh) 基于位置编码的界面生成方法及系统
HK40035791A (en) Method and device for segmenting image, computer apparatus and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230208

R150 Certificate of patent or registration of utility model

Ref document number: 7225416

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250