KR102483507B1 - 비디오 컨텐츠의 기계-기반 객체 인식 - Google Patents
비디오 컨텐츠의 기계-기반 객체 인식 Download PDFInfo
- Publication number
- KR102483507B1 KR102483507B1 KR1020197013525A KR20197013525A KR102483507B1 KR 102483507 B1 KR102483507 B1 KR 102483507B1 KR 1020197013525 A KR1020197013525 A KR 1020197013525A KR 20197013525 A KR20197013525 A KR 20197013525A KR 102483507 B1 KR102483507 B1 KR 102483507B1
- Authority
- KR
- South Korea
- Prior art keywords
- metadata
- video content
- product
- video
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 claims abstract description 27
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 10
- 230000002452 interceptive effect Effects 0.000 abstract description 16
- 238000010801 machine learning Methods 0.000 description 24
- 230000009471 action Effects 0.000 description 13
- 238000012549 training Methods 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000010079 rubber tapping Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 5
- 238000003825 pressing Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000719239 Oligoplites altus Species 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241001441726 Tetraodontiformes Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
- G06Q30/0643—Graphical representation of items or shoppers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G06K9/6273—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/237—Communication with additional data server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
- H04N21/4316—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4722—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
- H04N21/4725—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content using interactive regions of the image, e.g. hot spots
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/47815—Electronic shopping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/858—Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Human Computer Interaction (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
Abstract
Description
도 1a는 일 실시예에 따른, 텔레비전, 컴퓨터, 모바일 디바이스 또는 다른 미디어 플레이어를 통해 비디오 컨텐츠를 제공하는 데 사용되는 시스템의 다이어그램이다.
도 1b는 일 실시예에 따른, 도 1a에 도시된 시스템의 동작을 예시하는 블록 다이어그램이다.
도 2는 일 실시예에 따른, 실시간, 기계-기반 객체 인식을 위한 시스템의 블록 다이어그램이다.
도 3은 일 실시예에 따른, 실시간 이미지 인식을 위한 기계 학습 모델의 아키텍처의 예이다.
도 4a는 일 실시예에 따른, 실시간 이미지 인식 엔진을 구현하기 위한 기계-학습 모델의 트레이닝을 예시하는 흐름도이다.
도 4b는 일 실시예에 따른, 실시간 이미지 인식 엔진을 구현하기 위한 기계-학습 모델의 테스팅 및 검증을 예시하는 흐름도이다.
도 5는 일 실시예에 따른, 비디오 프레임에 대한 실시간 이미지 인식 엔진에 의해 생성된 경계 박스들의 예이다.
도 6a-도 6f는 일 실시예에 따른, 도 1a의 시스템에 의해 제공된 오버레이드 비디오 플레이어 인터페이스를 예시한다.
도 7a-도 7g는 일 실시예에 따른, 컴퓨터 데스크톱 상에 인접 레이아웃 인터페이스를 사용하는 것을 예시한다.
도 8a-도 8e는 일 실시예에 따른, 모바일 디바이스(예컨대, 스마트 폰) 상에 인접 레이아웃 인터페이스를 사용하는 것을 예시한다.
도 9a 및 도 9b는 일 실시예에 따른, 오버레이드 비디오 플레이어와 통합된 인접 레이아웃 인터페이스의 상이한 도면들을 도시한다.
도 10a-도 10c는 일 실시예에 따른, 데스크톱 또는 모바일 디바이스 상에 디스플레이된 비디오 컨텐츠 상에 메타데이터를 오버레이하는 상호작용 인터페이스를 예시한다.
도 11a-도 11d는 일 실시예에 따른, 스마트 텔레비전 상에 디스플레이된 비디오 컨텐츠 상에 메타데이터를 오버레이하는 상호작용 인터페이스를 예시한다.
도 12a-도 12c는 일 실시예에 따른, 도 11a-도 11d의 상호작용 인터페이스를 갖는 음성 제어부를 예시한다.
Claims (20)
- 방법에 있어서,
전자 디바이스에 의해, 비디오 컨텐츠에 대한 사용자로부터의 요청을 수신하는 단계;
상기 전자 디바이스에 의해, 비디오 서버에게 상기 비디오 컨텐츠를 요청하는 단계;
상기 전자 디바이스에 의해, 메타데이터 서버에게 상기 비디오 컨텐츠에 나타나 있는 사람과 연관된 객체에 관한 메타데이터를 요청하는 단계 - 상기 메타데이터의 개별 피스(piece)들은 상기 비디오 컨텐츠의 개별 프레임들과 정렬됨 - ;
상기 전자 디바이스의 디스플레이를 통해, 상기 사용자에게 상기 비디오 컨텐츠의 제1 프레임을 디스플레이하는 단계 - 상기 제1 프레임은 상기 사람 및 상기 객체를 보여주는 것임 - ;
상기 전자 디바이스의 디스플레이를 통해, 상기 사용자에게 상기 비디오 컨텐츠의 제2 프레임을 디스플레이하는 단계 - 상기 제2 프레임은 상기 객체를 보여주지 않고 상기 사람을 보여주는 것임 - ;
상기 전자 디바이스에 의해, 상기 비디오 컨텐츠의 상기 제2 프레임을 디스플레이하는 동안 상기 사람과 연관된 객체에 관한 메타데이터에 대한 상기 사용자로부터의 요청을 수신하는 단계; 및
상기 메타데이터에 대한 상기 사용자로부터의 요청에 응답하여, 상기 전자 디바이스의 디스플레이를 통해, 상기 비디오 컨텐츠와 함께 상기 객체에 관한 제1 피스의 메타데이터를 디스플레이하는 단계 - 상기 제1 피스의 메타데이터는 상기 제1 프레임과 정렬됨 -
를 포함하는, 방법. - 제1항에 있어서,
상기 메타데이터를 수신하는 것은, 상기 비디오 컨텐츠에 나타나 있는 모든 사람이 착용한 객체들에 대한 제품 식별 정보를 수신하는 것을 포함하는 것인, 방법. - 제2항에 있어서,
상기 메타데이터를 수신하는 것은, 상기 비디오 컨텐츠에 나타나 있는 모든 사람이 착용한 객체들을 획득하기 위한 링크들을 수신하는 것을 포함하는 것인, 방법. - 제3항에 있어서,
상기 제1 피스의 메타데이터를 디스플레이하는 단계는, 상기 객체를 획득하기 위한 대응 링크를 디스플레이하는 단계를 포함하고, 상기 대응 링크는 상기 객체를 획득하기 위한 웹사이트로 상기 사용자를 동적으로 재지향(redirect)시키는 것인, 방법. - 제1항에 있어서,
상기 메타데이터를 수신하는 것은, 상기 비디오 컨텐츠에 나타나 있는 상기 사람과 연관된 상기 객체와 유사한 객체를 획득하기 위한 링크를 수신하는 것을 포함하는 것인, 방법. - 제1항에 있어서,
상기 사용자로부터 요청을 수신하는 것은, 상기 전자 디바이스의 마이크로폰을 통해, 자연어 음성 커맨드 또는 자연어 음성 질의(query)를 수신하는 것을 포함하는 것인, 방법. - 제1항에 있어서,
상기 사용자로부터 요청을 수신하는 것은, 상기 전자 디바이스의 디스플레이의 플레이바(play bar) 영역 근방에서, 커서 이동 또는 터치스크린 상의 터치 중 적어도 하나를 검출하는 것을 포함하는 것인, 방법. - 제1항에 있어서,
상기 전자 디바이스에 의해, 상기 비디오 컨텐츠의 프레임을 상기 사용자에게 디스플레이하기 전에 상기 전자 디바이스의 메모리에 상기 객체에 관한 메타데이터를 저장하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 비디오 컨텐츠를 디스플레이하는 동안 상기 전자 디바이스에 의해, 상기 비디오 컨텐츠의 제2 프레임에 나타나 있는 다른 사람과 연관된 다른 객체에 관한 메타데이터를 요청하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 메타데이터에 대한 상기 사용자로부터의 요청에 응답하여, 상기 전자 디바이스에 의해, 상기 비디오 컨텐츠의 재생을 일시중지하는 단계를 더 포함하는, 방법. - 방법에 있어서,
전자 디바이스에 의해, 비디오 컨텐츠에 대한 사용자로부터의 요청을 수신하는 단계;
상기 전자 디바이스에 의해 구현되는 비디오 플레이어에 의해, 비디오 서버에게 상기 비디오 컨텐츠를 요청하는 단계;
상기 비디오 플레이어로부터 상기 전자 디바이스에 의해 구현되는 비디오 이벤트 심(shim)에 이벤트 메시지를 전송하는 단계 - 상기 이벤트 메시지는 상기 비디오 컨텐츠의 재생이 시작되었음을 표시함 - ;
상기 비디오 이벤트 심으로부터 상기 전자 디바이스에 의해 구현되는 메타데이터 제어기에 통지 메시지를 전송하는 단계 - 상기 통지 메시지는 상기 비디오 컨텐츠의 재생이 시작되었음을 표시함 - ;
상기 통지 메시지에 응답하여, 상기 전자 디바이스에 의해 구현되는 상기 메타데이터 제어기에 의해, 메타데이터 서버에게 상기 비디오 컨텐츠에 나타나 있는 제품에 관한 메타데이터를 요청하는 단계 - 상기 메타데이터의 각각의 피스들은 상기 비디오 컨텐츠의 각각의 프레임들과 시간 상 정렬됨 - ;
상기 메타데이터 제어기에 의해, 상기 메타데이터 서버로부터 상기 메타데이터를 수신하는 단계 - 상기 메타데이터는 상기 비디오 컨텐츠의 지속기간(duration) 내의 일 시간에 대응하는 기준 타임스탬프를 포함함 - ;
상기 메타데이터 제어기에 의해, 상기 전자 디바이스의 메모리에 상기 메타데이터를 캐싱(cache)하는 단계 - 상기 메타데이터의 캐싱은, 재생 동안 네트워크 트래픽을 감소시키고, 네트워크 연결성의 중단이 사용자 요청들에 응답한 상기 메타데이터의 리트리벌(retrieval) 및 디스플레이를 중단하는 가능성을 감소 또는 제거함 - ;
상기 메타데이터 제어기에 의해, 상기 비디오 컨텐츠의 재생 상태에 기초하여 상기 메타데이터를 큐잉(queue)하는 단계;
상기 전자 디바이스의 디스플레이를 통해, 상기 비디오 컨텐츠의 제1 프레임 - 상기 제1 프레임은 상기 제품의 이미지를 포함함 - 을 상기 사용자에게 디스플레이하는 단계;
상기 전자 디바이스에 의해, 상기 제품에 관한 메타데이터에 대한 상기 사용자로부터의 요청을 수신하는 단계; 및
상기 제품에 관한 메타데이터에 대한 상기 사용자로부터의 요청을 수신하는 것에 응답하여, (i) 상기 제품의 가용성(availability), 상기 제품의 가격, 관계, 또는 실시간 인터넷 경매에 기초하여, 웹사이트로부터 상기 제품을 구매하기 위한 링크를 동적으로 할당하고, (ii) 상기 전자 디바이스의 디스플레이를 통해 상기 비디오 컨텐츠와 함께 상기 제품에 관한 제1 피스의 메타데이터를 디스플레이하는 단계 - 상기 제1 피스의 메타데이터는 비디오 컨텐츠와 시간 상 정렬되며, 상기 웹사이트로부터 상기 제품을 구매하기 위한 링크를 포함함 -
를 포함하는, 방법. - 제11항에 있어서,
상기 사용자로부터 요청을 수신하는 것은,
상기 전자 디바이스의 마이크로폰을 통해 자연어 음성 커맨드 또는 자연어 음성 질의를 수신하는 것 또는
상기 전자 디바이스의 디스플레이의 플레이바 영역 근방에서 커서 이동 또는 터치스크린 상의 터치 중 적어도 하나를 검출하는 것
중 적어도 하나를 포함하는 것인, 방법. - 제11항에 있어서,
상기 비디오 컨텐츠의 프레임들은 1 내지 4의 초당 프레임(frames per second: fps)의 레이트(rate)로 메타데이터로 태그(tag)되고,
상기 비디오 컨텐츠를 디스플레이하는 것은, 적어도 24 fps의 재생 속력으로 상기 비디오 컨텐츠를 플레이하는 것을 포함하는 것인, 방법. - 제11항에 있어서,
상기 비디오 컨텐츠를 디스플레이하면서, 상기 전자 디바이스에 의해, 상기 비디오 컨텐츠의 제2 프레임에 나타나 있는 다른 제품에 관한 메타데이터를 요청하는 단계를 더 포함하는, 방법. - 제11항에 있어서,
상기 사용자로부터의 요청에 응답하여, 상기 전자 디바이스에 의해, 상기 비디오 컨텐츠의 재생을 일시중지하는 단계를 더 포함하는, 방법. - 제11항에 있어서,
상기 메타데이터 서버에서, 상기 제품에 관한 메타데이터에 대한 상기 전자 디바이스로부터의 요청을 수신하는 단계;
상기 메타데이터 서버에 의해, 메타데이터 데이터베이스가 상기 메타데이터를 갖지 않는다고 결정하는 단계;
상기 메타데이터 데이터베이스가 상기 메타데이터를 갖지 않는다는 결정에 응답하여, 상기 메타데이터 서버에 의해, 상기 비디오 컨텐츠에 나타나 있는 제품의 아이덴티티에 대한 질의를 객체 인식 서버에 전송하는 단계;
상기 메타데이터 서버에 의해, 상기 객체 인식 서버로부터 상기 비디오 컨텐츠에 나타나 있는 제품의 아이덴티티를 수신하는 단계;
상기 메타데이터 서버에 의해, 상기 제품의 아이덴티티에 기반하여 상기 제품에 관한 메타데이터를 획득하는 단계; 및
상기 메타데이터 서버에 의해, 상기 사용자에게 디스플레이하기 위한 메타데이터를 상기 전자 디바이스에 제공하는 단계
를 더 포함하는, 방법. - 제16항에 있어서,
상기 객체 인식 서버는 적어도 하나의 뉴럴 네트워크를 구현하고,
상기 방법은, 상기 적어도 하나의 뉴럴 네트워크에 의해, 상기 비디오에 나타나 있는 제품을 인식하는 단계를 더 포함하는, 방법. - 제17항에 있어서,
상기 적어도 하나의 뉴럴 네트워크로, 상기 비디오 컨텐츠에 나타나 있는 제품을 표현하는 임베딩(embedding)을 생성하는 단계;
상기 비디오에 나타나 있는 객체를 표현하는 임베딩의, 객체 데이터베이스에 저장된 복수의 임베딩들과의 비교를 수행하는 단계 - 상기 복수의 임베딩들 중 각각의 임베딩들은 복수의 객체들 중 각각의 객체들을 표현함 - ; 및
상기 비교에 기초하여, 상기 복수의 객체들 중에서 제2 객체 - 상기 제2 객체는 상기 제품임 - 와 동일하거나 유사한 제1 객체를 식별하는 단계
를 더 포함하는, 방법. - 방법에 있어서,
전자 디바이스에 의해, 비디오 컨텐츠에 대한 사용자로부터의 요청을 수신하는 단계;
상기 전자 디바이스에 의해 구현되는 비디오 플레이어에 의해, 비디오 서버에게 상기 비디오 컨텐츠를 요청하는 단계;
상기 비디오 플레이어로부터 상기 전자 디바이스에 의해 구현되는 비디오 이벤트 심(shim)에 이벤트 메시지를 전송하는 단계 - 상기 이벤트 메시지는 상기 비디오 컨텐츠의 재생이 시작되었음을 표시함 - ;
상기 비디오 이벤트 심으로부터 상기 전자 디바이스에 의해 구현되는 메타데이터 제어기에 통지 메시지를 전송하는 단계 - 상기 통지 메시지는 상기 비디오 컨텐츠의 재생이 시작되었음을 표시함 - ;
상기 통지 메시지에 응답하여, 상기 전자 디바이스에 의해 구현되는 상기 메타데이터 제어기에 의해, 메타데이터 서버에게 상기 비디오 컨텐츠에 나타나 있는 제품에 관한 메타데이터를 요청하는 단계;
상기 메타데이터 제어기에 의해, 상기 메타데이터 서버로부터 상기 메타데이터를 수신하는 단계 - 상기 메타데이터는 상기 비디오 컨텐츠의 지속기간(duration) 내의 일 시간에 대응하는 기준 타임스탬프를 포함함 - ;
상기 메타데이터 제어기에 의해, 상기 전자 디바이스의 메모리에 상기 메타데이터를 캐싱(cache)하는 단계 - 상기 메타데이터의 캐싱은, 재생 동안 네트워크 트래픽을 감소시키고, 네트워크 연결성의 중단이 사용자 요청들에 응답한 상기 메타데이터의 리트리벌 및 디스플레이를 중단하는 가능성을 감소 또는 제거함 - ;
상기 메타데이터 제어기에 의해, 상기 비디오 컨텐츠의 재생 상태에 기초하여 상기 메타데이터를 큐잉(queue)하는 단계;
상기 전자 디바이스의 디스플레이를 통해, 상기 비디오 컨텐츠를 상기 사용자에게 제1 레이트로 디스플레이하는 단계 - 상기 비디오 컨텐츠는 상기 제품의 이미지를 보여주는 적어도 하나의 프레임을 포함함 - ;
상기 전자 디바이스에 의해, 상기 제품에 관한 메타데이터에 대한 상기 사용자로부터의 요청을 수신하는 단계 - 상기 비디오 컨텐츠의 프레임들은 상기 제1 레이트보다 낮은 제2 레이트로 메타데이터로 태그됨 - ; 및
상기 비디오 컨텐츠의 프레임들의 타임 스탬프들에 적어도 부분적으로 기초하여, 상기 제품에 관한 메타데이터를 상기 비디오 컨텐츠의 프레임들과 정렬하는 단계; 및
상기 사용자로부터의 요청에 응답하여, 상기 전자 디바이스의 디스플레이를 통해, 상기 비디오 컨텐츠와 함께 상기 제품에 관한 메타데이터를 디스플레이하는 단계
를 포함하는, 방법. - 제19항에 있어서,
상기 전자 디바이스의 메모리에 상기 메타데이터를 캐시하는 단계는,
상기 비디오 컨텐츠를 세그먼트들로 나누는 단계;
상기 비디오 컨텐츠의 세그먼트들의 각 세그먼트의 시작부에서, 그 세그먼트에 대한 메타데이터를 압축된 포맷으로 다운로드하는 단계; 및
상기 메타데이터를 다운로드하는 빈도 보다 더 빠른 빈도로, 메타데이터 인터페이스를 해당 세그먼트에 대한 메타데이터로 업데이트하는 단계
를 포함하는 것인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662423495P | 2016-11-17 | 2016-11-17 | |
US62/423,495 | 2016-11-17 | ||
PCT/US2017/062284 WO2018094201A1 (en) | 2016-11-17 | 2017-11-17 | Machine-based object recognition of video content |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190088974A KR20190088974A (ko) | 2019-07-29 |
KR102483507B1 true KR102483507B1 (ko) | 2022-12-30 |
Family
ID=62146712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197013525A Active KR102483507B1 (ko) | 2016-11-17 | 2017-11-17 | 비디오 컨텐츠의 기계-기반 객체 인식 |
Country Status (4)
Country | Link |
---|---|
US (3) | US11317159B2 (ko) |
EP (1) | EP3542256A4 (ko) |
KR (1) | KR102483507B1 (ko) |
WO (1) | WO2018094201A1 (ko) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11080777B2 (en) * | 2014-03-31 | 2021-08-03 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
US11004139B2 (en) | 2014-03-31 | 2021-05-11 | Monticello Enterprises LLC | System and method for providing simplified in store purchases and in-app purchases using a use-interface-based payment API |
US10511580B2 (en) | 2014-03-31 | 2019-12-17 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
US12008629B2 (en) | 2014-03-31 | 2024-06-11 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
US11915303B2 (en) | 2014-03-31 | 2024-02-27 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
WO2018094201A1 (en) | 2016-11-17 | 2018-05-24 | Painted Dog, Inc. | Machine-based object recognition of video content |
CN108259973B (zh) | 2017-12-20 | 2020-06-09 | 海信视像科技股份有限公司 | 智能电视及电视画面截图的图形用户界面的显示方法 |
US11924515B2 (en) | 2019-02-14 | 2024-03-05 | Lg Electronics Inc. | Display device and operation method therefor |
US11676063B2 (en) * | 2019-03-28 | 2023-06-13 | International Business Machines Corporation | Exposing payload data from non-integrated machine learning systems |
US10779046B1 (en) * | 2019-08-28 | 2020-09-15 | Coupang Corp. | Automated generation of video-based electronic solicitations |
CN110620949B (zh) * | 2019-09-17 | 2022-02-08 | 北京字节跳动网络技术有限公司 | 热点推荐弹窗的控制方法、装置、介质及电子设备 |
JP7401892B2 (ja) * | 2019-09-30 | 2023-12-20 | 株式会社Mission Group | Ec統合型メタメディアの制作方法、配信システム、及び配信方法 |
US20230111817A1 (en) * | 2021-01-13 | 2023-04-13 | Mack Craft | Fingerprinted media triggering virtual repository |
US11461393B1 (en) | 2019-12-09 | 2022-10-04 | Amazon Technologies, Inc. | Automated identification and mapping of objects in video content |
US11776047B1 (en) * | 2019-12-09 | 2023-10-03 | Amazon Technologies, Inc. | Semantic video segmentation to identify objects appearing in video content |
US12096064B2 (en) * | 2019-12-23 | 2024-09-17 | Lg Electronics Inc. | Display device and method for operating same |
US11049176B1 (en) * | 2020-01-10 | 2021-06-29 | House Of Skye Ltd | Systems/methods for identifying products within audio-visual content and enabling seamless purchasing of such identified products by viewers/users of the audio-visual content |
KR102686864B1 (ko) * | 2020-01-28 | 2024-07-22 | 라인플러스 주식회사 | 컨텐츠에 관한 부가 정보를 제공하는 방법, 장치, 및 컴퓨터 프로그램 |
US20210326967A1 (en) * | 2020-04-15 | 2021-10-21 | DroppTV Holdings, Inc. | Shopping directly from user screen while viewing video content or in augmented or virtual reality |
US11051067B1 (en) | 2020-08-14 | 2021-06-29 | Global Sports & Entertainment Marketing, LLC | Interactive video overlay |
US12273594B2 (en) * | 2021-01-28 | 2025-04-08 | Comcast Cable Communications, Llc | Systems and methods for determining secondary content |
CN115086734A (zh) * | 2021-03-12 | 2022-09-20 | 北京字节跳动网络技术有限公司 | 一种基于视频的信息展示方法、装置、设备及介质 |
US11263385B1 (en) * | 2021-03-24 | 2022-03-01 | Ebay Inc. | Web browser extension for linking images to webpages |
CN113301441B (zh) * | 2021-05-21 | 2023-02-03 | 北京字跳网络技术有限公司 | 应用程序的交互方法、装置和电子设备 |
CN114470765A (zh) * | 2022-01-28 | 2022-05-13 | 网易(杭州)网络有限公司 | 物品展示的交互方法、装置、设备及存储介质 |
CN114546565A (zh) * | 2022-02-24 | 2022-05-27 | 北京字跳网络技术有限公司 | 信息展示方法、装置、电子设备、存储介质和程序产品 |
US20240037145A1 (en) * | 2022-08-01 | 2024-02-01 | Google Llc | Product identification in media items |
US20240040201A1 (en) * | 2022-08-01 | 2024-02-01 | Google Llc | Media item and product pairing |
CN119948513A (zh) * | 2022-09-23 | 2025-05-06 | 苹果公司 | 用于实现动态交互式按需用户界面订购的技术 |
US20240104639A1 (en) * | 2022-09-23 | 2024-03-28 | Apple Inc. | Techniques for implementing dynamic interactive on-demand user interface ordering |
US12238366B2 (en) * | 2023-03-24 | 2025-02-25 | Roku, Inc. | Real-time objects insertion into content based on frame identifiers |
WO2024243647A1 (en) * | 2023-05-31 | 2024-12-05 | Referboard Marketing Pty Ltd | Content matching system |
CN116774879A (zh) * | 2023-06-27 | 2023-09-19 | 北京有竹居网络技术有限公司 | 用于搜索的方法、装置、设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060117352A1 (en) * | 2004-09-30 | 2006-06-01 | Yoichiro Yamagata | Search table for metadata of moving picture |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7809192B2 (en) * | 2005-05-09 | 2010-10-05 | Like.Com | System and method for recognizing objects from images and identifying relevancy amongst images and information |
WO2008086189A2 (en) | 2007-01-04 | 2008-07-17 | Wide Angle Llc | Relevancy rating of tags |
US20080295129A1 (en) * | 2007-05-21 | 2008-11-27 | Steven Laut | System and method for interactive video advertising |
US7840415B2 (en) | 2007-07-30 | 2010-11-23 | Eric Schifone | Method and platform for providing an interactive internet computer-driven/IP based streaming video/audio apparatus |
US7987098B2 (en) | 2007-07-30 | 2011-07-26 | Eric Schifone | Interactive computerized communication apparatus and method |
US8875212B2 (en) * | 2008-04-15 | 2014-10-28 | Shlomo Selim Rakib | Systems and methods for remote control of interactive video |
US8312486B1 (en) | 2008-01-30 | 2012-11-13 | Cinsay, Inc. | Interactive product placement system and method therefor |
US20110191809A1 (en) | 2008-01-30 | 2011-08-04 | Cinsay, Llc | Viral Syndicated Interactive Product System and Method Therefor |
US8745657B2 (en) * | 2008-02-13 | 2014-06-03 | Innovid Inc. | Inserting interactive objects into video content |
WO2009137368A2 (en) | 2008-05-03 | 2009-11-12 | Mobile Media Now, Inc. | Method and system for generation and playback of supplemented videos |
US20100082653A1 (en) | 2008-09-29 | 2010-04-01 | Rahul Nair | Event media search |
US7756758B2 (en) * | 2008-12-08 | 2010-07-13 | Hsn Lp | Method and system for improved E-commerce shopping |
US9336528B2 (en) | 2008-12-16 | 2016-05-10 | Jeffrey Beaton | System and method for overlay advertising and purchasing utilizing on-line video or streaming media |
US8458053B1 (en) | 2008-12-17 | 2013-06-04 | Google Inc. | Click-to buy overlays |
US8984406B2 (en) * | 2009-04-30 | 2015-03-17 | Yahoo! Inc! | Method and system for annotating video content |
US9838744B2 (en) * | 2009-12-03 | 2017-12-05 | Armin Moehrle | Automated process for segmenting and classifying video objects and auctioning rights to interactive sharable video objects |
US9264785B2 (en) * | 2010-04-01 | 2016-02-16 | Sony Computer Entertainment Inc. | Media fingerprinting for content determination and retrieval |
US8682739B1 (en) | 2010-07-30 | 2014-03-25 | Amazon Technologies, Inc. | Identifying objects in video |
US10674230B2 (en) * | 2010-07-30 | 2020-06-02 | Grab Vision Group LLC | Interactive advertising and marketing system |
US20120167145A1 (en) * | 2010-12-28 | 2012-06-28 | White Square Media, LLC | Method and apparatus for providing or utilizing interactive video with tagged objects |
US8984562B2 (en) * | 2011-01-13 | 2015-03-17 | Verizon Patent And Licensing Inc. | Method and apparatus for interacting with a set-top box using widgets |
US20130019268A1 (en) | 2011-02-11 | 2013-01-17 | Fitzsimmons Michael R | Contextual commerce for viewers of video programming |
US9762967B2 (en) * | 2011-06-14 | 2017-09-12 | Comcast Cable Communications, Llc | System and method for presenting content with time based metadata |
US8792684B2 (en) * | 2011-08-11 | 2014-07-29 | At&T Intellectual Property I, L.P. | Method and apparatus for automated analysis and identification of a person in image and video content |
DE202012013660U1 (de) | 2011-08-29 | 2019-04-18 | Aibuy, Inc. | Container Software zum viralen Kopieren von einem Endpunkt zum Anderen |
US9607330B2 (en) | 2012-06-21 | 2017-03-28 | Cinsay, Inc. | Peer-assisted shopping |
US9185441B2 (en) * | 2013-03-15 | 2015-11-10 | Matthew A. Pequignot | Upstream/downstream network and/or content delivery apparatus and methods |
CN105580012A (zh) | 2013-09-11 | 2016-05-11 | 辛赛股份有限公司 | 视频内容的动态绑定 |
CN105579997A (zh) | 2013-09-27 | 2016-05-11 | 辛赛股份有限公司 | 补充内容的n-层复制 |
CN105580042B (zh) | 2013-09-27 | 2022-03-11 | 艾拜公司 | 用于支持与内容供应相关联的关系的装置和方法 |
JP6685911B2 (ja) | 2013-10-10 | 2020-04-22 | アイバイ,インコーポレイテッド | ピア支援電子商取引ショッピングの装置及び方法 |
US20150245103A1 (en) * | 2014-02-24 | 2015-08-27 | HotdotTV, Inc. | Systems and methods for identifying, interacting with, and purchasing items of interest in a video |
US10728603B2 (en) | 2014-03-14 | 2020-07-28 | Aibuy, Inc. | Apparatus and method for automatic provisioning of merchandise |
WO2016004330A1 (en) * | 2014-07-03 | 2016-01-07 | Oim Squared Inc. | Interactive content generation |
US10885570B2 (en) | 2014-12-31 | 2021-01-05 | Aibuy, Inc. | System and method for managing a product exchange |
WO2016109810A1 (en) | 2014-12-31 | 2016-07-07 | Cinsay, Inc. | System and method for managing a product exchange |
US9633019B2 (en) * | 2015-01-05 | 2017-04-25 | International Business Machines Corporation | Augmenting an information request |
US11120478B2 (en) * | 2015-01-12 | 2021-09-14 | Ebay Inc. | Joint-based item recognition |
US20160225053A1 (en) * | 2015-01-29 | 2016-08-04 | Clear Research Corporation | Mobile visual commerce system |
US10354290B2 (en) * | 2015-06-16 | 2019-07-16 | Adobe, Inc. | Generating a shoppable video |
CN105869007A (zh) * | 2015-11-25 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 一种视频购物的实现方法及系统 |
WO2018094201A1 (en) | 2016-11-17 | 2018-05-24 | Painted Dog, Inc. | Machine-based object recognition of video content |
-
2017
- 2017-11-17 WO PCT/US2017/062284 patent/WO2018094201A1/en unknown
- 2017-11-17 EP EP17872039.7A patent/EP3542256A4/en not_active Ceased
- 2017-11-17 KR KR1020197013525A patent/KR102483507B1/ko active Active
-
2019
- 2019-05-10 US US16/409,144 patent/US11317159B2/en active Active
-
2022
- 2022-03-23 US US17/702,139 patent/US11966967B2/en active Active
-
2024
- 2024-04-11 US US18/633,140 patent/US20240403946A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060117352A1 (en) * | 2004-09-30 | 2006-06-01 | Yoichiro Yamagata | Search table for metadata of moving picture |
Also Published As
Publication number | Publication date |
---|---|
EP3542256A4 (en) | 2020-07-01 |
US11966967B2 (en) | 2024-04-23 |
US11317159B2 (en) | 2022-04-26 |
KR20190088974A (ko) | 2019-07-29 |
EP3542256A1 (en) | 2019-09-25 |
US20220217444A1 (en) | 2022-07-07 |
WO2018094201A1 (en) | 2018-05-24 |
US20240403946A1 (en) | 2024-12-05 |
US20200134320A1 (en) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11966967B2 (en) | Machine-based object recognition of video content | |
US11051067B1 (en) | Interactive video overlay | |
US10783215B2 (en) | Digital image and content display systems and methods | |
TWI744368B (zh) | 播放處理方法、裝置和設備 | |
TWI578774B (zh) | Data exchange method and device based on online video | |
US10440435B1 (en) | Performing searches while viewing video content | |
US20120167146A1 (en) | Method and apparatus for providing or utilizing interactive video with tagged objects | |
US20130042261A1 (en) | Electronic video media e-wallet application | |
US20150317354A1 (en) | Intent based search results associated with a modular search object framework | |
US20150317365A1 (en) | Modular search object framework | |
KR20140107253A (ko) | 관련 콘텐츠를 관찰하기 위한 제스처 기반 태깅 기법 | |
US9589296B1 (en) | Managing information for items referenced in media content | |
EP2940607A1 (en) | Enhanced search results associated with a modular search object framework | |
US11468675B1 (en) | Techniques for identifying objects from video content | |
WO2015107424A1 (en) | System and method for product placement | |
KR20170013369A (ko) | 검색 정보를 표시하는 방법, 장치 및 컴퓨터 프로그램 | |
US20130325600A1 (en) | Image-Content Matching Based on Image Context and Referrer Data | |
US20200226380A1 (en) | Augmented reality experience for shopping | |
KR101690528B1 (ko) | 검색 정보를 표시하는 방법, 장치 및 컴퓨터 프로그램 | |
KR101701952B1 (ko) | 검색 정보를 표시하는 방법, 장치 및 컴퓨터 프로그램 | |
WO2024243647A1 (en) | Content matching system | |
CN119624555A (zh) | 商品交易和评论发布方法、装置、计算设备及存储介质 | |
CN119441570A (zh) | 一种交互方法、装置、电子设备以及存储介质 | |
HK1173879B (en) | Method and device for interacting based on online videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20190510 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20201102 Comment text: Request for Examination of Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20211202 Patent event code: PE09021S01D |
|
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20220620 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221005 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20221228 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20221228 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |