CN108205664A - 一种食物识别方法及装置、存储介质、计算机设备 - Google Patents
一种食物识别方法及装置、存储介质、计算机设备 Download PDFInfo
- Publication number
- CN108205664A CN108205664A CN201810017522.0A CN201810017522A CN108205664A CN 108205664 A CN108205664 A CN 108205664A CN 201810017522 A CN201810017522 A CN 201810017522A CN 108205664 A CN108205664 A CN 108205664A
- Authority
- CN
- China
- Prior art keywords
- food
- terminal
- data
- shooting
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 197
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004927 fusion Effects 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 8
- 241000208340 Araliaceae Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 238000010411 cooking Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 5
- 241001269238 Data Species 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 235000013527 bean curd Nutrition 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 235000015067 sauces Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000037213 diet Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种食物识别方法及装置、存储介质、计算机设备,所述方法包括:确定食物的拍摄路径;指示终端按照所述拍摄路径进行移动;在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;基于所述视频数据对所述食物进行识别。
Description
技术领域
本发明涉及识别技术,尤其涉及一种食物识别方法及装置、存储介质、计算机设备。
背景技术
随着人工智能以及大数据技术的快速发展,越来越多的产品开始向智能化发展,较之非智能化产品,智能化产品多有功能更加强大,用户体验更加舒适等特点。针对人们的日常健康管理,食物与饮食作为健康的入口,是健康管理主要的监控对象之一,如何便捷快速的定位饮食信息是健康管理的一大难题。
目前,对食物进行识别的方式较多是对食物的图像进行识别,然而,这种识别方式具有识别准确低的缺点,如何准确地识别出食物的信息有待解决。
发明内容
为解决上述技术问题,本发明实施例提供了一种食物识别方法及装置、存储介质、计算机设备。
本发明实施例提供的食物识别方法,包括:
确定食物的拍摄路径;
指示终端按照所述拍摄路径进行移动;
在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
基于所述视频数据对所述食物进行识别。
本发明实施例中,所述确定食物的拍摄路径之前,所述方法还包括:
检测食物的位置;
基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径;
指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
本发明实施例中,所述检测食物的位置,包括:
对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
基于所述图像数据,确定所述食物的位置。
本发明实施例中,所述方法还包括:
对所述食物进行拍摄的过程中,采集传感器数据,所述传感器数据用于表示所述终端的位姿信息;
记录所述视频数据中的每帧图像数据对应的传感器数据。
本发明实施例中,所述基于所述视频数据对所述食物进行识别,包括:
将所述视频数据中的每帧图像数据与对应的传感器数据按照时间顺序进行加权融合,得到融合时序数据;
将所述融合时序数据输入视频识别模型中,以对所述食物进行识别。
本发明实施例中,所述视频识别模型至少包括:长短期记忆(LSTM,Long Short-Term Memory)模型。
本发明实施例中,所述方法还包括:
在所述终端移动的过程中,根据所述视频数据中与当前时刻对应的图像数据以及当前时刻对应的传感器数据,计算所述终端当前时刻对应的运动参数和位姿参数;
基于所述终端当前时刻对应的运动参数和位姿参数,更新所述拍摄路径。
本发明实施例提供的食物识别装置,所述装置包括:
第一确定单元,用于确定食物的拍摄路径;
第一指示单元,用于指示终端按照所述拍摄路径进行移动;
拍摄单元,用于在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
识别单元,用于基于所述视频数据对所述食物进行识别。
本发明实施例中,所述装置还包括:
检测单元,用于检测食物的位置;
生成单元,用于基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径;
第二指示单元,用于指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
本发明实施例中,所述检测单元包括:
所述拍摄单元,用于对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
第二确定单元,用于基于所述图像数据,确定所述食物的位置。
本发明实施例中,所述装置还包括:
采集单元,用于对所述食物进行拍摄的过程中,采集传感器数据,所述传感器数据用于表示所述终端的位姿信息;
存储单元,用于记录所述视频数据中的每帧图像数据对应的传感器数据。
本发明实施例中,所述识别单元,用于将所述视频数据中的每帧图像数据与对应的传感器数据按照时间顺序进行加权融合,得到融合时序数据;将所述融合时序数据输入视频识别模型中,以对所述食物进行识别。
本发明实施例中,所述视频识别模型至少包括:LSTM模型。
本发明实施例中,所述装置还包括:
更新单元,用于在所述终端移动的过程中,根据所述视频数据中与当前时刻对应的图像数据以及当前时刻对应的传感器数据,计算所述终端当前时刻对应的运动参数和位姿参数;基于所述终端当前时刻对应的运动参数和位姿参数,更新所述拍摄路径。
本发明实施例提供的存储介质,其上存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述的食物识别方法。
本发明实施例提供的计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可执行指令,所述处理器执行所述计算机可执行指令时实现上述的食物识别方法。
本发明实施例的技术方案中,通过对食物进行拍摄,得到食物的一系列视频数据,对该一系列视频数据进行识别,得到食物的信息,由于视频数据是在终端移动的过程中拍摄得到,因而视频数据中包括食物处于不同视角的图像数据,对这些不同视角的图像数据进行识别,能大大提高识别准确度。
附图说明
图1为本发明实施例的食物识别方法的流程示意图一;
图2为本发明实施例的食物识别方法的流程示意图二;
图3为本发明实施例的预调整路径移的示意图;
图4为本发明实施例的食物识别方法的流程示意图;
图5为本发明实施例的拍摄路径的示意图;
图6为本发明实施例的食物识别装置的结果组成示意图一;
图7为本发明实施例的食物识别装置的结果组成示意图二;
图8为本发明实施例的计算机设备的结构组成示意图。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明实施例。
本发明实施例中的终端可以指手机、平板电脑、掌上电脑、游戏机、相机等移动设备。终端上至少具有拍摄装置和处理装置,其中,拍摄装置用于提供拍摄功能,拍摄装置可以是任意类型的摄像头;处理装置用于提供识别处理功能,处理装置可以包括但不限于微处理器(MCU,Micro Controller Unit)或可编程逻辑器件(FPGA,Field ProgrammableGate Array)等的处理装置。此外,终端还可以包括更多的装置,例如用于存储数据的存储器、用于实现通信功能的传输装置、用于实现显示功能的显示器。本发明实施例的技术方案应用于终端中,以下对本发明实施例的技术方案进行描述。
图1为本发明实施例的食物识别方法的流程示意图一,如图1所示,所述食物识别方法包括以下步骤:
步骤101:确定食物的拍摄路径。
本发明实施例中,食物的种类不做限制,食物可以是未经加工的食物,例如苹果。也可以是通过某种特殊烹饪方法加工过的食物,例如麻婆豆腐。
本发明实施例中,食物的拍摄路径可以根据预设的策略来确定。以下列举出几种策略:
策略一:终端为用户提供多种选项,每种选项对应一种拍摄路径;用户可以选择自己需要的拍摄路径。
策略二:终端粗略检测食物的信息,根据检测到的食物的信息来适应性选择合适的拍摄路径。
策略三:终端提供拍摄路径的若干个设置选项,由用户自定义拍摄路径。
步骤102:指示终端按照所述拍摄路径进行移动。
在一实施方式中,终端的移动通过用户来控制,具体地,用户手持终端,在终端的显示屏上显示有拍摄路径,此外,还可以显示有终端相对于拍摄路径的位置。进一步,在显示屏上显示有箭头,用于指引用户朝哪个方向移动终端,与此同时,指引了终端按照拍摄路径进行移动。这里,指示终端按照所述拍摄路径进行移动,包括两个部分:1)指示终端的位置移动;2)指示终端的姿态改变(即终端的朝向改变)。
在一实施方式中,可以指示终端围绕食物进行水平360度的转动。
步骤103:在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据。
本发明实施例中,在终端按照拍摄路径移动的过程中,实时对食物进行拍摄,得到视频数据。
拍摄路径是由一系列连续的位置组成,包括起始位置,若干连续的中间位置,以及终点位置。假设拍摄路径由位置1、位置2、位置3、位置4组成,终端在位置1处拍摄得到一帧图像1,终端在位置2处拍摄得到一帧图像2,终端在位置3处拍摄得到一帧图像3,终端在位置4处拍摄得到一帧图像4。图像1、图像2、图像3以及图像4按时间顺序形成了视频。
可见,视频数据是由一系列按照时间顺序排列的图像数据组成。由于终端的移动,导致视频中不同的图像数据是从不同的视角对食物进行拍摄得到。
步骤104:基于所述视频数据对所述食物进行识别。
本发明实施例中,可以将视频数据输入视频识别模型,通过视频识别模型对视频数据进行处理,得到食物的信息。这里,食物的信息包括但不局限于:食物的名称、食物的来源、食物的种类、食物的烹饪方式等等。
图2为本发明实施例的食物识别方法的流程示意图二,如图2所示,所述食物识别方法包括以下步骤:
步骤201:检测食物的位置。
本发明实施例中,食物的种类不做限制,食物可以是未经加工的食物,例如苹果。也可以是通过某种特殊烹饪方法加工过的食物,例如麻婆豆腐。
本发明实施例中,检测食物的位置可以通过以下方式来实现:
1)对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
2)基于所述图像数据,确定所述食物的位置。
上述方案中,可以打开终端的摄像头对取景区域进行拍摄,并对拍摄得到的图像数据进行特征分析,确定出食物的位置。这里,食物的位置是指食物在图像中的位置,也即食物在拍摄画面中的位置。
步骤202:基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径。
初始时,终端的位置可能不在拍摄路径的初始位置,需要将终端移动至拍摄路径的初始位置。应理解,终端的位置包含两个信息:一个是位置坐标,另一个是朝向。终端在不同位置上拍摄得到的画面是不同的。
例如:参照图3,终端在位置1朝向角度1拍摄了食物,食物的位置在拍摄画面的右上角。终端按照预调整路径移动到位置2后(这其中包括位置坐标的改变和角度的改变),食物的位置在拍摄画面的中间。
步骤203:指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
本发明实施例中,可以通过在拍摄画面上显示箭头来指示终端朝哪个方向移动。终端移动至拍摄路径的初始位置时,对应的拍摄画面就是食物的第一帧图像。
步骤204:确定食物的拍摄路径。
本发明实施例中,食物的拍摄路径可以根据预设的策略来确定。以下列举出几种策略:
策略一:终端为用户提供多种选项,每种选项对应一种拍摄路径;用户可以选择自己需要的拍摄路径。
策略二:终端粗略检测食物的信息,根据检测到的食物的信息来适应性选择合适的拍摄路径。
策略三:终端提供拍摄路径的若干个设置选项,由用户自定义拍摄路径。
步骤205:指示终端按照所述拍摄路径进行移动。
在一实施方式中,终端的移动通过用户来控制,具体地,用户手持终端,在终端的显示屏上显示有拍摄路径,此外,还可以显示有终端相对于拍摄路径的位置。进一步,在显示屏上显示有箭头,用于指引用户朝哪个方向移动终端,与此同时,指引了终端按照拍摄路径进行移动。这里,指示终端按照所述拍摄路径进行移动,包括两个部分:1)指示终端的位置移动;2)指示终端的姿态改变(即终端的朝向改变)。
在一实施方式中,可以指示终端围绕食物进行水平360度的转动。
步骤206:在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据。
本发明实施例中,在终端按照拍摄路径移动的过程中,实时对食物进行拍摄,得到视频数据。
拍摄路径是由一系列连续的位置组成,包括起始位置,若干连续的中间位置,以及终点位置。假设拍摄路径由位置1、位置2、位置3、位置4组成,终端在位置1处拍摄得到一帧图像1,终端在位置2处拍摄得到一帧图像2,终端在位置3处拍摄得到一帧图像3,终端在位置4处拍摄得到一帧图像4。图像1、图像2、图像3以及图像4按时间顺序形成了视频。
可见,视频数据是由一系列按照时间顺序排列的图像数据组成。由于终端的移动,导致视频中不同的图像数据是从不同的视角对食物进行拍摄得到。
步骤207:基于所述视频数据对所述食物进行识别。
本发明实施例中,可以将视频数据输入视频识别模型,通过视频识别模型对视频数据进行处理,得到食物的信息。这里,食物的信息包括但不局限于:食物的名称、食物的来源、食物的种类、食物的烹饪方式等等。
图4为本发明实施例的食物识别方法的流程示意图三,如图4所示,所述食物识别方法包括以下步骤:
步骤401:检测食物的位置。
本发明实施例中,食物的种类不做限制,食物可以是未经加工的食物,例如苹果。也可以是通过某种特殊烹饪方法加工过的食物,例如麻婆豆腐。
本发明实施例中,检测食物的位置可以通过以下方式来实现:
1)对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
2)基于所述图像数据,确定所述食物的位置。
上述方案中,可以打开终端的摄像头对取景区域进行拍摄,并对拍摄得到的图像数据进行特征分析,确定出食物的位置。这里,食物的位置是指食物在图像中的位置,也即食物在拍摄画面中的位置。
步骤402:基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径。
初始时,终端的位置可能不在拍摄路径的初始位置,需要将终端移动至拍摄路径的初始位置。应理解,终端的位置包含两个信息:一个是位置坐标,另一个是朝向。终端在不同位置上拍摄得到的画面是不同的。
例如:参照图3,终端在位置1朝向角度1拍摄了食物,食物的位置在拍摄画面的右上角。终端按照预调整路径移动到位置2后(这其中包括位置坐标的改变和角度的改变),食物的位置在拍摄画面的中间。
步骤403:指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
本发明实施例中,可以通过在拍摄画面上显示箭头来指示终端朝哪个方向移动。终端移动至拍摄路径的初始位置时,对应的拍摄画面就是食物的第一帧图像。
步骤404:确定食物的拍摄路径。
本发明实施例中,食物的拍摄路径可以根据预设的策略来确定。以下列举出几种策略:
策略一:终端为用户提供多种选项,每种选项对应一种拍摄路径;用户可以选择自己需要的拍摄路径。
策略二:终端粗略检测食物的信息,根据检测到的食物的信息来适应性选择合适的拍摄路径。
策略三:终端提供拍摄路径的若干个设置选项,由用户自定义拍摄路径。
步骤405:指示终端按照所述拍摄路径进行移动。
在一实施方式中,终端的移动通过用户来控制,具体地,用户手持终端,在终端的显示屏上显示有拍摄路径,此外,还可以显示有终端相对于拍摄路径的位置。进一步,在显示屏上显示有箭头,用于指引用户朝哪个方向移动终端,与此同时,指引了终端按照拍摄路径进行移动。这里,指示终端按照所述拍摄路径进行移动,包括两个部分:1)指示终端的位置移动;2)指示终端的姿态改变(即终端的朝向改变)。
在一实施方式中,参照图5,可以指示终端围绕食物进行水平360度的转动。
步骤406:在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据。
本发明实施例中,在终端按照拍摄路径移动的过程中,实时对食物进行拍摄,得到视频数据。
拍摄路径是由一系列连续的位置组成,包括起始位置,若干连续的中间位置,以及终点位置。假设拍摄路径由位置1、位置2、位置3、位置4组成,终端在位置1处拍摄得到一帧图像1,终端在位置2处拍摄得到一帧图像2,终端在位置3处拍摄得到一帧图像3,终端在位置4处拍摄得到一帧图像4。图像1、图像2、图像3以及图像4按时间顺序形成了视频。
可见,视频数据是由一系列按照时间顺序排列的图像数据组成。由于终端的移动,导致视频中不同的图像数据是从不同的视角对食物进行拍摄得到。
步骤407:对所述食物进行拍摄的过程中,采集传感器数据,所述传感器数据用于表示所述终端的位姿信息;记录所述视频数据中的每帧图像数据对应的传感器数据。
本发明实施例中,传感器数据包括但不局限于陀螺仪数据。在实时拍摄的过程中,也一并实时采集传感器数据。例如:在时刻T1,采集到的图像数据为P1,传感器数据为S1,在时刻T2,采集到的图像数据为P2,传感器数据为S2,在时刻T3,采集到的图像数据为P3,传感器数据为S3,依此类推。可见,无论是图像数据,还是传感器数据都是基于时间的时序数据。
步骤408:在所述终端移动的过程中,根据所述视频数据中与当前时刻对应的图像数据以及当前时刻对应的传感器数据,计算所述终端当前时刻对应的运动参数和位姿参数;基于所述终端当前时刻对应的运动参数和位姿参数,更新所述拍摄路径,执行步骤405。
本发明实施例中,可以基于视觉处理算法对当前时刻对应的图像数据进行处理,得到图像数据的尺度不变特征变换(SIFT,Scale-Invariant Feature Transform)特征,基于图像数据的SIFT特征确定终端当前所处的环境,进而可以确定出当前时刻对应的运动参数和位姿参数。当然,也可以基于当前时刻对应的传感器数据,直接获取所述终端当前时刻对应的运动参数和位姿参数。为了保证提高计算精度,可以结合两种类型的数据来共同确定终端当前时刻对应的运动参数和位姿参数。如果终端移动的时候偏移了之前规划好的拍摄路径,就需要更新拍摄路径。本发明实施例可以较好的基于终端的实施运动情况,更新后续的拍摄路径。
步骤409:将所述视频数据中的每帧图像数据与对应的传感器数据按照时间顺序进行加权融合,得到融合时序数据。
本发明实施例中,对于同一时刻对应的每帧图像数据和传感器数据进行加权融合,可以得到该时刻对应的融合数据。全部时刻的融合数据按照时间顺序形成了融合时序数据。
本发明实施例中,加权融合的处理过程包括:将图像数据与相应的权值相乘,将传感器数据与相应的权值相乘;将相乘得到的两个结果相加,得到融合数据。本发明实施例中,图像数据、传感器数据以及相应的权值,均可以通过相应的矩阵来表示。
步骤410:将所述融合时序数据输入视频识别模型中,以对所述食物进行识别。
这里,所述视频识别模型至少包括:LSTM模型。应理解,所述视频识别模型还可以是深度学习模型等其他视频识别模型。
本发明实施例中,可以将融合时序数据输入视频识别模型,通过视频识别模型对融合时序数据进行处理,得到食物的信息。这里,食物的信息包括但不局限于:食物的名称、食物的来源、食物的种类、食物的烹饪方式等等。
图6为本发明实施例的食物识别装置的结果组成示意图一,如图6所示,所述食物识别装置包括:
第一确定单元601,用于确定食物的拍摄路径;
第一指示单元602,用于指示终端按照所述拍摄路径进行移动;
拍摄单元603,用于在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
识别单元604,用于基于所述视频数据对所述食物进行识别。
本领域技术人员应当理解,图6所示的食物识别装置中的各单元的实现功能可参照前述食物识别方法的相关描述而理解。图6所示的食物识别装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图7为本发明实施例的食物识别装置的结果组成示意图二,如图7所示,所述食物识别装置包括:
第一确定单元601,用于确定食物的拍摄路径;
第一指示单元602,用于指示终端按照所述拍摄路径进行移动;
拍摄单元603,用于在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
识别单元604,用于基于所述视频数据对所述食物进行识别。
在一实施方式中,所述装置还包括:
检测单元605,用于检测食物的位置;
生成单元606,用于基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径;
第二指示单元607,用于指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
在一实施方式中,所述检测单元605包括:
所述拍摄单元603,用于对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
第二确定单元608,用于基于所述图像数据,确定所述食物的位置。
在一实施方式中,所述装置还包括:
采集单元609,用于对所述食物进行拍摄的过程中,采集传感器数据,所述传感器数据用于表示所述终端的位姿信息;
存储单元610,用于记录所述视频数据中的每帧图像数据对应的传感器数据。
在一实施方式中,所述识别单元604,用于将所述视频数据中的每帧图像数据与对应的传感器数据按照时间顺序进行加权融合,得到融合时序数据;将所述融合时序数据输入视频识别模型中,以对所述食物进行识别。
在一实施方式中,所述视频识别模型至少包括:LSTM模型。
在一实施方式中,所述装置还包括:
更新单元611,用于在所述终端移动的过程中,根据所述视频数据中与当前时刻对应的图像数据以及当前时刻对应的传感器数据,计算所述终端当前时刻对应的运动参数和位姿参数;基于所述终端当前时刻对应的运动参数和位姿参数,更新所述拍摄路径。
本领域技术人员应当理解,图7所示的食物识别装置中的各单元的实现功能可参照前述食物识别方法的相关描述而理解。图7所示的食物识别装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
本发明实施例上述装置如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
相应地,本发明实施例还提供一种存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本发明实施例的上述食物识别方法。
图8为本发明实施例的计算机设备的结构组成示意图,如图8所示,所述计算机设备包括存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机可执行指令,所述处理器802执行所述计算机可执行指令时实现如下方法步骤:
确定食物的拍摄路径;
指示终端按照所述拍摄路径进行移动;
在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
基于所述视频数据对所述食物进行识别。
以上涉及计算机设备的描述,与上述方法描述是类似的,同方法的有益效果描述,不做赘述。
本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和智能设备,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个第二处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (16)
1.一种食物识别方法,其特征在于,所述方法包括:
确定食物的拍摄路径;
指示终端按照所述拍摄路径进行移动;
在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
基于所述视频数据对所述食物进行识别。
2.根据权利要求1所述的食物识别方法,其特征在于,所述确定食物的拍摄路径之前,所述方法还包括:
检测食物的位置;
基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径;
指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
3.根据权利要求2所述的食物识别方法,其特征在于,所述检测食物的位置,包括:
对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
基于所述图像数据,确定所述食物的位置。
4.根据权利要求1所述的食物识别方法,其特征在于,所述方法还包括:
对所述食物进行拍摄的过程中,采集传感器数据,所述传感器数据用于表示所述终端的位姿信息;
记录所述视频数据中的每帧图像数据对应的传感器数据。
5.根据权利要求4所述的食物识别方法,其特征在于,所述基于所述视频数据对所述食物进行识别,包括:
将所述视频数据中的每帧图像数据与对应的传感器数据按照时间顺序进行加权融合,得到融合时序数据;
将所述融合时序数据输入视频识别模型中,以对所述食物进行识别。
6.根据权利要求5所述的食物识别方法,其特征在于,所述视频识别模型至少包括:长短期记忆LSTM模型。
7.根据权利要求4所述的食物识别方法,其特征在于,所述方法还包括:
在所述终端移动的过程中,根据所述视频数据中与当前时刻对应的图像数据以及当前时刻对应的传感器数据,计算所述终端当前时刻对应的运动参数和位姿参数;
基于所述终端当前时刻对应的运动参数和位姿参数,更新所述拍摄路径。
8.一种食物识别装置,其特征在于,所述装置包括:
第一确定单元,用于确定食物的拍摄路径;
第一指示单元,用于指示终端按照所述拍摄路径进行移动;
拍摄单元,用于在所述终端移动的过程中,对所述食物进行拍摄,得到视频数据;
识别单元,用于基于所述视频数据对所述食物进行识别。
9.根据权利要求8所述的食物识别装置,其特征在于,所述装置还包括:
检测单元,用于检测食物的位置;
生成单元,用于基于所述食物的位置以及所述拍摄路径的初始位置,生成预调整路径;
第二指示单元,用于指示所述终端按照所述预调整路径进行移动,以使得所述终端位于所述拍摄路径的初始位置。
10.根据权利要求9所述的食物识别装置,其特征在于,所述检测单元包括:
所述拍摄单元,用于对取景区域进行拍摄,得到所述取景区域对应的图像数据,其中,所述食物位于所述取景区域;
第二确定单元,用于基于所述图像数据,确定所述食物的位置。
11.根据权利要求8所述的食物识别装置,其特征在于,所述装置还包括:
采集单元,用于对所述食物进行拍摄的过程中,采集传感器数据,所述传感器数据用于表示所述终端的位姿信息;
存储单元,用于记录所述视频数据中的每帧图像数据对应的传感器数据。
12.根据权利要求11所述的食物识别装置,其特征在于,所述识别单元,用于将所述视频数据中的每帧图像数据与对应的传感器数据按照时间顺序进行加权融合,得到融合时序数据;将所述融合时序数据输入视频识别模型中,以对所述食物进行识别。
13.根据权利要求12所述的食物识别装置,其特征在于,所述视频识别模型至少包括:LSTM模型。
14.根据权利要求11所述的食物识别装置,其特征在于,所述装置还包括:
更新单元,用于在所述终端移动的过程中,根据所述视频数据中与当前时刻对应的图像数据以及当前时刻对应的传感器数据,计算所述终端当前时刻对应的运动参数和位姿参数;基于所述终端当前时刻对应的运动参数和位姿参数,更新所述拍摄路径。
15.一种存储介质,其上存储有计算机可执行指令,其特征在于,该计算机可执行指令被处理器执行时实现权利要求1-7任一项所述的方法步骤。
16.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可执行指令,其特征在于,所述处理器执行所述计算机可执行指令时实现权利要求1-7任一项所述的方法步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810017522.0A CN108205664B (zh) | 2018-01-09 | 2018-01-09 | 一种食物识别方法及装置、存储介质、计算机设备 |
PCT/CN2018/122855 WO2019137186A1 (zh) | 2018-01-09 | 2018-12-21 | 一种食物识别方法及装置、存储介质、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810017522.0A CN108205664B (zh) | 2018-01-09 | 2018-01-09 | 一种食物识别方法及装置、存储介质、计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108205664A true CN108205664A (zh) | 2018-06-26 |
CN108205664B CN108205664B (zh) | 2021-08-17 |
Family
ID=62605310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810017522.0A Active CN108205664B (zh) | 2018-01-09 | 2018-01-09 | 一种食物识别方法及装置、存储介质、计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108205664B (zh) |
WO (1) | WO2019137186A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019137186A1 (zh) * | 2018-01-09 | 2019-07-18 | 美的集团股份有限公司 | 一种食物识别方法及装置、存储介质、计算机设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929658A (zh) * | 2019-11-28 | 2020-03-27 | 青岛海尔智能技术研发有限公司 | 图像识别方法、图像识别装置及冰箱 |
CN114885098A (zh) * | 2022-04-27 | 2022-08-09 | 广东美的厨房电器制造有限公司 | 视频拍摄方法、视频拍摄装置、可读存储介质和烹饪器具 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102033549A (zh) * | 2009-09-30 | 2011-04-27 | 三星电子(中国)研发中心 | 显示设备的视角调整装置 |
CN103826071A (zh) * | 2014-03-11 | 2014-05-28 | 深圳市中安视科技有限公司 | 用于立体识别和连续跟踪的三维摄像方法 |
CN104269003A (zh) * | 2014-09-12 | 2015-01-07 | 李龙龙 | 一种食物识别方法、装置及系统 |
US20150324645A1 (en) * | 2014-05-12 | 2015-11-12 | Lg Electronics Inc. | Eyewear-type terminal and method of controlling the same |
CN105141942A (zh) * | 2015-09-02 | 2015-12-09 | 小米科技有限责任公司 | 3d图像合成方法及装置 |
CN105580052A (zh) * | 2013-07-02 | 2016-05-11 | 豪夫迈·罗氏有限公司 | 食物体积和碳水化合物的估计 |
CN106203466A (zh) * | 2016-06-23 | 2016-12-07 | 珠海市魅族科技有限公司 | 食物识别的方法和装置 |
CN106203493A (zh) * | 2016-07-04 | 2016-12-07 | 何广森 | 一种食物识别装置及识别方法 |
CN106791392A (zh) * | 2016-12-20 | 2017-05-31 | 美的集团股份有限公司 | 食物信息的获取方法、获取装置和终端 |
CN206303795U (zh) * | 2016-08-30 | 2017-07-07 | 九阳股份有限公司 | 一种智能料理平台 |
CN107239777A (zh) * | 2017-05-13 | 2017-10-10 | 大连理工大学 | 一种基于多视角图模型的餐具检测和识别方法 |
US20170323174A1 (en) * | 2014-02-12 | 2017-11-09 | Microsoft Technology Licensing, Llc | Food logging from images |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104282041A (zh) * | 2014-09-30 | 2015-01-14 | 小米科技有限责任公司 | 三维建模方法及装置 |
CN107133650A (zh) * | 2017-05-10 | 2017-09-05 | 合肥华凌股份有限公司 | 冰箱的食物识别方法、装置及冰箱 |
CN107357424B (zh) * | 2017-06-29 | 2021-05-18 | 联想(北京)有限公司 | 一种手势操作的识别方法、设备及计算机可读存储介质 |
CN108205664B (zh) * | 2018-01-09 | 2021-08-17 | 美的集团股份有限公司 | 一种食物识别方法及装置、存储介质、计算机设备 |
-
2018
- 2018-01-09 CN CN201810017522.0A patent/CN108205664B/zh active Active
- 2018-12-21 WO PCT/CN2018/122855 patent/WO2019137186A1/zh active Application Filing
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102033549A (zh) * | 2009-09-30 | 2011-04-27 | 三星电子(中国)研发中心 | 显示设备的视角调整装置 |
CN105580052A (zh) * | 2013-07-02 | 2016-05-11 | 豪夫迈·罗氏有限公司 | 食物体积和碳水化合物的估计 |
US20170323174A1 (en) * | 2014-02-12 | 2017-11-09 | Microsoft Technology Licensing, Llc | Food logging from images |
CN103826071A (zh) * | 2014-03-11 | 2014-05-28 | 深圳市中安视科技有限公司 | 用于立体识别和连续跟踪的三维摄像方法 |
US20150324645A1 (en) * | 2014-05-12 | 2015-11-12 | Lg Electronics Inc. | Eyewear-type terminal and method of controlling the same |
CN104269003A (zh) * | 2014-09-12 | 2015-01-07 | 李龙龙 | 一种食物识别方法、装置及系统 |
CN105141942A (zh) * | 2015-09-02 | 2015-12-09 | 小米科技有限责任公司 | 3d图像合成方法及装置 |
CN106203466A (zh) * | 2016-06-23 | 2016-12-07 | 珠海市魅族科技有限公司 | 食物识别的方法和装置 |
CN106203493A (zh) * | 2016-07-04 | 2016-12-07 | 何广森 | 一种食物识别装置及识别方法 |
CN206303795U (zh) * | 2016-08-30 | 2017-07-07 | 九阳股份有限公司 | 一种智能料理平台 |
CN106791392A (zh) * | 2016-12-20 | 2017-05-31 | 美的集团股份有限公司 | 食物信息的获取方法、获取装置和终端 |
CN107239777A (zh) * | 2017-05-13 | 2017-10-10 | 大连理工大学 | 一种基于多视角图模型的餐具检测和识别方法 |
Non-Patent Citations (2)
Title |
---|
FANYU KONG ET AL: "DietCam: Multi-view regular shape food recognition with a camera phone", 《PERVASIVE AND MOBILE COMPUTING 19》 * |
丁伟利等: "基于区域颜色特征的食物类别识别算法", 《电子科技》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019137186A1 (zh) * | 2018-01-09 | 2019-07-18 | 美的集团股份有限公司 | 一种食物识别方法及装置、存储介质、计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108205664B (zh) | 2021-08-17 |
WO2019137186A1 (zh) | 2019-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11775059B2 (en) | Method for determining human eye close degrees, method for controlling eyes, device, and storage medium | |
CN105519097B (zh) | 用于显示画中画的系统、装置和方法 | |
EP3739502A1 (en) | Image processing method, apparatus, storage medium, and electronic device | |
JP2020518078A (ja) | 車両損失査定画像を取得するための方法および装置、サーバ、ならびに端末デバイス | |
CN104781849A (zh) | 单眼视觉同时定位与建图(slam)的快速初始化 | |
CN110192168A (zh) | 一种无人机拍照方法、图像处理方法和装置 | |
EP3332285A1 (en) | Gaze direction mapping | |
CN109035330A (zh) | 箱体拟合方法、设备和计算机可读存储介质 | |
CN107479712B (zh) | 基于头戴式显示设备的信息处理方法及装置 | |
CN107395957B (zh) | 拍照方法、装置、存储介质及电子设备 | |
CN113449696A (zh) | 一种姿态估计方法、装置、计算机设备以及存储介质 | |
CN109451240B (zh) | 对焦方法、装置、计算机设备和可读存储介质 | |
US11790041B2 (en) | Method and system for reducing false positives in object detection neural networks caused by novel objects | |
CN108182746A (zh) | 控制系统、方法和装置 | |
CN106096043B (zh) | 一种拍照方法和移动终端 | |
TW201541407A (zh) | 辨識二維影像產生三維資訊之方法 | |
CN108205664A (zh) | 一种食物识别方法及装置、存储介质、计算机设备 | |
CN110267010A (zh) | 图像处理方法、装置、服务器及存储介质 | |
CN108416832A (zh) | 媒体信息的显示方法、装置和存储介质 | |
JP2010123019A (ja) | 動作認識装置及び方法 | |
CN110049180A (zh) | 拍摄姿势推送方法和装置、智能终端 | |
CN107479715A (zh) | 利用手势控制实现虚拟现实交互的方法和装置 | |
CN118708742A (zh) | 智能穿搭推荐方法、装置及存储介质 | |
KR102569505B1 (ko) | 실시간 자동 신체 인식 기능을 탑재한 모바일 장비용 인공지능 자세추정 시스템 및 방법 | |
US20150071494A1 (en) | Method and apparatus for processing images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |