KR101452562B1 - 비디오 이미지에서 텍스트를 검출하는 방법 - Google Patents
비디오 이미지에서 텍스트를 검출하는 방법 Download PDFInfo
- Publication number
- KR101452562B1 KR101452562B1 KR1020117005003A KR20117005003A KR101452562B1 KR 101452562 B1 KR101452562 B1 KR 101452562B1 KR 1020117005003 A KR1020117005003 A KR 1020117005003A KR 20117005003 A KR20117005003 A KR 20117005003A KR 101452562 B1 KR101452562 B1 KR 101452562B1
- Authority
- KR
- South Korea
- Prior art keywords
- text
- region
- feature
- area
- height
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
Description
도 1은 본 발명의 특정 실시예에 따른, 텍스트 로컬화 프로세스의 예시적인 흐름도이다.
도 2는, 도 2a 및 도 2b로 이루어져 있고, 본 발명의 특정 실시예에 따른 방식으로의 처리 전후의 예시적인 이미지이다.
도 3은 본 발명의 특정 실시예에 따른 예시적인 구현의 병합 그룹에서 사용되는 파라미터를 나타낸 도면이다.
도 4는 본 발명의 특정 실시예에 따른 방식으로 도 2b의 세그먼트화된 이미지의 처리 후의 추출된 영역의 일부를 나타낸 도면이다.
도 5는, 도 5a 및 도 5b로 이루어져 있고, 본 발명의 특정 실시예에 따른 방식으로 사용되는 스트로크 폭 파라미터를 나타낸 도면이다.
도 6은, 도 6a 내지 도 6f로 이루어져 있고, 본 발명의 특정 실시예에 따른 몇가지 예에 대한 이진화 결과를 나타낸 도면.
시스템 | 정밀도 | 재현율 | f |
Hinnerk Becker | 0.62 | 0.67 | 0.62 |
Alex Chen | 0.60 | 0.60 | 0.58 |
본 발명의 알고리즘 | 0.58 | 0.45 | 0.51 |
Ashida | 0.55 | 0.46 | 0.50 |
Claims (18)
- 비디오 이미지에서 텍스트를 검출하는 방법으로서,
이미지 프로세서에서, 텍스트를 포함할 수 있는 비디오 프레임을 수신하는 단계;
상기 비디오 프레임을 유사한 컬러를 가지는 영역으로 세그먼트화하는 단계 -
컬러 유사성은 로서 정의되며,
여기서 및 은 2개의 영역의 평균 컬러이고, Tcolor 는 병합 임계값임 - ;
유사한 컬러를 가지는 영역으로부터 가능성이 높은 비텍스트 영역을 식별하고 가능성이 높은 비텍스트 영역을 버리는 단계;
컬러가 유사하고 수평 위치가 임계값 내에 있는 영역을 병합하는 단계;
특징 추출 프로세스를 수행하여 스트로크 폭 특징, 에지 특징 및 필 팩터 특징을 추출함으로써 특징을 사용하여 영역을 기술하는 단계; 및
OCR 소프트웨어에 의한 처리를 위해 나머지 영역을 학습된 이진 분류기를 통과시켜 이진화된 최종 텍스트 영역을 획득하는 단계
를 포함하는 방법. - 제1항에 있어서, 이진화된 최종 텍스트 영역을 광학 문자 판독기를 통과시키는 단계를 더 포함하는 방법.
- 비디오 이미지에서 텍스트를 검출하는 방법으로서,
이미지 프로세서에서, 텍스트를 포함할 수 있는 비디오 프레임을 수신하는 단계;
상기 비디오 프레임을 유사한 컬러를 가지는 영역으로 세그먼트화하는 단계 -
컬러 유사성은 로서 정의되며,
여기서 및 은 2개의 영역의 평균 컬러이고, Tcolor는 병합 임계값임 - ;
유사한 컬러를 가지는 영역으로부터 가능성이 높은 비텍스트 영역을 식별하고 가능성이 높은 비텍스트 영역을 버리는 단계;
컬러가 유사하고 수평 위치가 임계값 내에 있는 영역을 병합하는 단계;
특징 추출 프로세스를 수행하여 스트로크 폭 특징, 에지 특징 및 필 팩터 특징을 추출함으로써 특징을 사용하여 영역을 기술하는 단계;
추출된 특징들을 특징 벡터들로서 표현하는 단계; 및
OCR 소프트웨어에 의한 처리를 위해 나머지 영역을 학습된 이진 분류기를 통과시켜 이진화된 최종 텍스트 영역을 획득하는 단계를 포함하고,
상기 학습된 이진 분류기는, 을 사용하여 영역이 텍스트인지 여부를 출력하는 지지 벡터 기계(SVM) 분류기 엔진을 사용하여 각 특징을 분류하고, 여기서 (xi, yi)는 학습 샘플의 특징 벡터 및 검증 자료 라벨(groundtruth label)이고, x는 분류될 영역의 특징 벡터들이며, αi 및 b는 [단, 이고, 여기서 e는 모든 1의 벡터이고, Q는 1x1 반한정 행렬(semi-definite matrix)이며, 임]으로서 정의되는 최적화 문제의 해를 구함으로써 얻어지는 파라미터이고, K는 분류 출력을 획득하는 으로서 정의되며, 여기서 2σ2 은 0이 아닌 숫자로서 1은 텍스트의 존재를 나타내고, -1은 텍스트의 부존재를 나타내는, 방법. - 제1항에 있어서, 세그먼트화하는 단계가, 이웃 픽셀의 컬러 차를 계산하는 단계, 픽셀의 컬러 차에 따라 픽셀을 정렬하는 단계, 및 영역이 발생되도록 임계값보다 작은 컬러 차를 가지는 픽셀을 병합하는 단계를 포함하는 방법.
- 제1항에 있어서, 이진 분류기가 지지 벡터 기계(SVM) 기반 분류기를 포함하는 방법.
- 제1항에 있어서, 스트로크 폭 값이 임계값 내에 있는 경우 스트로크 폭이 다른 스트로크 폭과 유사한 것으로 간주되는 방법.
- 제1항에 있어서, 스트로크 폭 특징이 스트로크 폭의 표준 편차가 임계값 내에 있는 이미지에서의 이웃의 퍼센트 또는 수직으로 유사한 스트로크 폭을 가지는 이웃의 퍼센트를 나타내는 특징 값을 포함하는 방법.
- 제1항에 있어서, 스트로크 폭 특징이 수평 스트로크 폭의 표준 편차가 임계값 내에 있거나, 그룹으로 클러스터링되고 각각의 그룹에서의 수평 스트로크 폭의 표준 편차가 임계값 내에 있는 행의 퍼센트 또는 유사한 스트로크 폭을 갖는 행 또는 유사한 스트로크 폭의 클러스터의 퍼센트를 표현하는 특징 값을 포함하는 방법.
- 제1항에 있어서, 스트로크 폭 특징이 현재의 스트로크 폭과 현재의 스트로크로부터 이웃 스트로크까지의 거리의 평균 비를 포함하는 방법.
- 제1항에 있어서, 스트로크 폭 특징이 가장 빈번하게 나오는 2개의 스트로크 폭의 비를 포함하는 방법.
- 제1항에 있어서, 에지 특징이 후보 영역에서의 에지의 평탄성, 에지의 균일성 및 에지의 양의 측정치이고, 에지의 평탄성은 동일한 방향을 가지는 이웃의 퍼센트로 표현되고, 에지의 균일성은 가장 자주 나오는 에지 방향의 주파수로서 계산되며, 에지의 양은 총 에지의 길이 대 상기 후보 영역의 면적의 비에 의해 측정되는 방법.
- 제1항에 있어서, 필 팩터 특징이 후보 이미지 전체 및 이웃끼리 둘다에서 추출되는 방법.
- 제1항에 있어서, 가능성이 높은 비텍스트 영역이,
(1) region_height가 어떤 임계값 T_low보다 작거나 region_height가 어떤 임계값 T_high보다 큰 경우, 또는
(2) region_area이 어떤 임계값 T_area보다 작은 경우, 또는
(3) 영역이 이미지 경계의 4개의 측면 중 하나와 접촉하고 그의 높이가 임계값 T보다 큰 경우, 또는
(4) 으로서, 여기서 Bounding Box Area는 0이 아닌 숫자이며, 정의된 fill_factor가 임계값보다 낮은 경우,
영역이 가능성이 높은 비텍스트 영역으로 간주되는 것에 의해 결정되는 방법. - 제1항에 있어서, 복수의 이진화 방법을 사용하여 이진화가 수행되며, 각각의 이진화된 출력이 광학 문자 판독기에 의해 처리되어, 결합되는 다수의 출력을 생성하는 방법
- 비디오 이미지에서 텍스트를 검출하는 방법으로서,
통계적 영역 병합을 사용하여 세그먼트화하고, 명확히 텍스트가 아닌 영역을 제거하며, 하기와 같이 정의되는 높이 유사성, 컬러 유사성, 영역 거리 및 수평 정렬의 기준에 기초하여 영역을 그룹화하는 것에 의해 이미지를 전처리하는 단계 -
높이 유사성은 로서 정의되며,
여기서 HEIGHT1 및 HEIGHT2는 2개의 영역의 높이이고 min(HEIGHT1, HEIGHT2)는 0이 아닌 숫자이고 Theight_sim는 높이 유사성 임계값이며;
컬러 유사성은 로서 정의되며,
여기서 및 은 2개의 영역의 평균 컬러이고 Tcolor는 병합 임계값이며;
영역 거리는 Dregion < Tregion로서 정의되고,
여기서 Dregion은 2개의 영역의 수평 거리이고 Tregion은 영역 거리 임계값이며;
수평 정렬은 Dtop < Talign 또는 Dbottom < Talign으로서 정의되고, 여기서 Dtop 및 Dbottom은 상부 경계 및 하부 경계 사이의 수직 거리이고 Talign은 수평 정렬 임계값임 -;
각각의 나머지 영역을 기술하기 위해 특징 추출 프로세스를 수행하는 단계 - 각각의 특징은 영역의 스트로크 폭 특징, 에지 특징 및 필 팩터 특징으로 표현됨 -; 및
분류 출력을 획득하기 위해 을 사용하여 영역이 텍스트인지 여부를 출력하는 지지 벡터 기계(SVM) 분류기 엔진을 사용하여 각 특징을 분류하는 단계 -
여기서 (xi, yi)는 학습 샘플의 특징 벡터 및 검증 자료 라벨(groundtruth label)이고, x는 분류될 영역의 특징 벡터들이며, αi 및 b는 [단, 이고, 여기서 e는 모든 1의 벡터이고, Q는 1x1 반한정 행렬(semi-definite matrix)이며, 임]으로서 정의되는 최적화 문제의 해를 구함으로써 얻어지는 파라미터이고, K는 분류 출력을 획득하는 으로서 정의되며, 여기서 2σ2 은 0이 아닌 숫자로서 1은 텍스트의 존재를 나타내고, -1은 텍스트의 부존재를 나타냄 - 를 포함하는 비디오 이미지에서 텍스트를 검출하는 방법. - 제15항에 있어서, 필 팩터 특징이 후보 이미지 전체 및 이웃끼리 둘다에서 추출되는 비디오 이미지에서 텍스트를 검출하는 방법.
- 제15항에 있어서, 전처리하는 단계가,
(1) region_height가 어떤 임계값 T_low보다 작거나 region_height가 어떤 임계값 T_high보다 큰 경우, 또는
(2) region_area이 어떤 임계값 T_area보다 작은 경우, 또는
(3) 영역이 이미지 경계의 4개의 측면 중 하나와 접촉하고 그의 높이가 임계값 T보다 큰 경우, 또는
(4) 로서, 여기서 Bounding Box Area는 0이 아닌 숫자이며, 정의된 fill_factor가 임계값보다 낮은 경우,
영역이 가능성이 높은 비텍스트 영역으로 간주되고 추가적으로 처리되지 않도록 배제되는 것에 의해, 영역을 제거하는 동작을 하는 비디오 이미지에서 텍스트를 검출하는 방법. - 제15항에 있어서, 복수의 이진화 방법을 사용하여 이진화가 수행되며, 각각의 이진화된 출력이 광학 문자 판독기에 의해 처리되어, 결합되는 다수의 출력을 생성하는 비디오 이미지에서 텍스트를 검출하는 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US19099208P | 2008-09-03 | 2008-09-03 | |
US61/190,992 | 2008-09-03 | ||
US12/380,394 US8320674B2 (en) | 2008-09-03 | 2009-02-26 | Text localization for image and video OCR |
US12/380,394 | 2009-02-26 | ||
PCT/US2009/055496 WO2010027933A1 (en) | 2008-09-03 | 2009-08-31 | Text localization for image and video ocr |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110056380A KR20110056380A (ko) | 2011-05-27 |
KR101452562B1 true KR101452562B1 (ko) | 2014-10-21 |
Family
ID=41725535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117005003A Expired - Fee Related KR101452562B1 (ko) | 2008-09-03 | 2009-08-31 | 비디오 이미지에서 텍스트를 검출하는 방법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8320674B2 (ko) |
EP (1) | EP2321767A1 (ko) |
JP (1) | JP5588987B2 (ko) |
KR (1) | KR101452562B1 (ko) |
CN (1) | CN102144236B (ko) |
CA (1) | CA2735824A1 (ko) |
MX (1) | MX2011002293A (ko) |
WO (1) | WO2010027933A1 (ko) |
Families Citing this family (94)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8306327B2 (en) * | 2008-12-30 | 2012-11-06 | International Business Machines Corporation | Adaptive partial character recognition |
JP4998496B2 (ja) * | 2009-03-16 | 2012-08-15 | 富士ゼロックス株式会社 | 画像処理装置、情報処理装置および画像読取装置 |
US20110082735A1 (en) * | 2009-10-06 | 2011-04-07 | Qualcomm Incorporated | Systems and methods for merchandising transactions via image matching in a content delivery system |
US8989491B2 (en) * | 2009-12-31 | 2015-03-24 | Tata Consultancy Services Limited | Method and system for preprocessing the region of video containing text |
US8526732B2 (en) * | 2010-03-10 | 2013-09-03 | Microsoft Corporation | Text enhancement of a textual image undergoing optical character recognition |
US8509534B2 (en) * | 2010-03-10 | 2013-08-13 | Microsoft Corporation | Document page segmentation in optical character recognition |
US8660371B2 (en) * | 2010-05-06 | 2014-02-25 | Abbyy Development Llc | Accuracy of recognition by means of a combination of classifiers |
US9076068B2 (en) * | 2010-10-04 | 2015-07-07 | Datacolor Holding Ag | Method and apparatus for evaluating color in an image |
KR101506446B1 (ko) * | 2010-12-15 | 2015-04-08 | 에스케이 텔레콤주식회사 | 움직임정보 병합을 이용한 부호움직임정보생성/움직임정보복원 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
CN102622724A (zh) * | 2011-01-27 | 2012-08-01 | 鸿富锦精密工业(深圳)有限公司 | 外观专利图像切割方法及系统 |
WO2013054348A2 (en) * | 2011-07-20 | 2013-04-18 | Tata Consultancy Services Limited | A method and system for differentiating textual information embedded in streaming news video |
JP5842441B2 (ja) | 2011-07-29 | 2016-01-13 | ブラザー工業株式会社 | 画像処理装置およびプログラム |
JP5776419B2 (ja) * | 2011-07-29 | 2015-09-09 | ブラザー工業株式会社 | 画像処理装置、画像処理プラグラム |
JP5796392B2 (ja) | 2011-07-29 | 2015-10-21 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプラグラム |
JP5853470B2 (ja) | 2011-07-29 | 2016-02-09 | ブラザー工業株式会社 | 画像処理装置、画像処理プラグラム |
FI20115821A0 (fi) * | 2011-08-24 | 2011-08-24 | Syslore Oy | Laite ja menetelmä kuljetusobjektissa olevien kiinnostusalueiden havaitsemiseen |
US8494284B2 (en) | 2011-11-21 | 2013-07-23 | Nokia Corporation | Methods and apparatuses for facilitating detection of text within an image |
US9349066B2 (en) | 2012-01-06 | 2016-05-24 | Qualcomm Incorporated | Object tracking and processing |
WO2013106346A1 (en) * | 2012-01-09 | 2013-07-18 | Qualcomm Incorporated | Ocr cache update |
RU2609069C2 (ru) * | 2012-01-31 | 2017-01-30 | Хьюлетт-Паккард Дивелопмент Компани, Л.П. | Обнаружение текста в изображениях графических пользовательских интерфейсов |
US20130205213A1 (en) * | 2012-02-06 | 2013-08-08 | edX Inc. | Caption-based navigation for a video player |
US8897565B1 (en) | 2012-06-29 | 2014-11-25 | Google Inc. | Extracting documents from a natural scene image |
CN103577817B (zh) * | 2012-07-24 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 表单识别方法与装置 |
US20140193029A1 (en) * | 2013-01-08 | 2014-07-10 | Natalia Vassilieva | Text Detection in Images of Graphical User Interfaces |
CN103049750B (zh) * | 2013-01-11 | 2016-06-15 | 广州广电运通金融电子股份有限公司 | 字符识别方法 |
US8712566B1 (en) * | 2013-03-14 | 2014-04-29 | Zazzle Inc. | Segmentation of a product markup image based on color and color differences |
KR101449257B1 (ko) * | 2013-03-26 | 2014-10-08 | 현대자동차주식회사 | 각인 문자 인식 장치 및 그 방법과 이를 이용한 문자의 각인 깊이 검출 시스템 |
US9148675B2 (en) * | 2013-06-05 | 2015-09-29 | Tveyes Inc. | System for social media tag extraction |
US9213907B2 (en) | 2013-06-28 | 2015-12-15 | Google Inc. | Hierarchical classification in credit card data extraction |
US9171224B2 (en) * | 2013-07-04 | 2015-10-27 | Qualcomm Incorporated | Method of improving contrast for text extraction and recognition applications |
US9292763B2 (en) * | 2013-07-25 | 2016-03-22 | Analog Devices Global | System, method, and medium for image object and contour feature extraction |
US9076056B2 (en) * | 2013-08-20 | 2015-07-07 | Adobe Systems Incorporated | Text detection in natural images |
US9762950B1 (en) | 2013-09-17 | 2017-09-12 | Amazon Technologies, Inc. | Automatic generation of network pages from extracted media content |
KR20150037061A (ko) | 2013-09-30 | 2015-04-08 | 삼성전자주식회사 | 디스플레이장치 및 그 제어방법 |
US10297287B2 (en) | 2013-10-21 | 2019-05-21 | Thuuz, Inc. | Dynamic media recording |
CN103595861A (zh) * | 2013-10-23 | 2014-02-19 | 南京邮电大学 | 一种终端识别电话号码自动拨号或发送短信的方法 |
US9560449B2 (en) | 2014-01-17 | 2017-01-31 | Sony Corporation | Distributed wireless speaker system |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
US9866986B2 (en) | 2014-01-24 | 2018-01-09 | Sony Corporation | Audio speaker system with virtual music performance |
US9426551B2 (en) | 2014-01-24 | 2016-08-23 | Sony Corporation | Distributed wireless speaker system with light show |
US9369801B2 (en) | 2014-01-24 | 2016-06-14 | Sony Corporation | Wireless speaker system with noise cancelation |
US9232335B2 (en) | 2014-03-06 | 2016-01-05 | Sony Corporation | Networked speaker system with follow me |
US9483997B2 (en) | 2014-03-10 | 2016-11-01 | Sony Corporation | Proximity detection of candidate companion display device in same room as primary display using infrared signaling |
US9496922B2 (en) | 2014-04-21 | 2016-11-15 | Sony Corporation | Presentation of content on companion display device based on content presented on primary display device |
US9583149B2 (en) | 2014-04-23 | 2017-02-28 | Daniel Stieglitz | Automated video logging methods and systems |
US9696414B2 (en) | 2014-05-15 | 2017-07-04 | Sony Corporation | Proximity detection of candidate companion display device in same room as primary display using sonic signaling |
US10070291B2 (en) | 2014-05-19 | 2018-09-04 | Sony Corporation | Proximity detection of candidate companion display device in same room as primary display using low energy bluetooth |
US9036083B1 (en) * | 2014-05-28 | 2015-05-19 | Gracenote, Inc. | Text detection in video |
CN104036292A (zh) * | 2014-06-12 | 2014-09-10 | 西安华海盈泰医疗信息技术有限公司 | 一种医学影像数字胶片中文字区域提取方法及提取系统 |
US9904956B2 (en) | 2014-07-15 | 2018-02-27 | Google Llc | Identifying payment card categories based on optical character recognition of images of the payment cards |
US9235757B1 (en) * | 2014-07-24 | 2016-01-12 | Amazon Technologies, Inc. | Fast text detection |
US10433030B2 (en) | 2014-10-09 | 2019-10-01 | Thuuz, Inc. | Generating a customized highlight sequence depicting multiple events |
US10419830B2 (en) | 2014-10-09 | 2019-09-17 | Thuuz, Inc. | Generating a customized highlight sequence depicting an event |
US10536758B2 (en) | 2014-10-09 | 2020-01-14 | Thuuz, Inc. | Customized generation of highlight show with narrative component |
US11863848B1 (en) | 2014-10-09 | 2024-01-02 | Stats Llc | User interface for interaction with customized highlight shows |
US9830508B1 (en) | 2015-01-30 | 2017-11-28 | Quest Consultants LLC | Systems and methods of extracting text from a digital image |
CN104657468B (zh) * | 2015-02-12 | 2018-07-31 | 中国科学院自动化研究所 | 基于图像与文本的视频的快速分类方法 |
CN104751142B (zh) * | 2015-04-01 | 2018-04-27 | 电子科技大学 | 一种基于笔划特征的自然场景文本检测方法 |
US9864734B2 (en) * | 2015-08-12 | 2018-01-09 | International Business Machines Corporation | Clickable links within live collaborative web meetings |
CN105095899B (zh) * | 2015-08-23 | 2018-10-09 | 华南理工大学 | 一种图片中相关文本的自动框选方法 |
US9552527B1 (en) * | 2015-08-27 | 2017-01-24 | Lead Technologies, Inc. | Apparatus, method, and computer-readable storage medium for determining a rotation angle of text |
HK1210371A2 (en) | 2015-11-20 | 2016-04-15 | 衍利行資產有限公司 | A method and system for analyzing a piece of text |
US9693168B1 (en) | 2016-02-08 | 2017-06-27 | Sony Corporation | Ultrasonic speaker assembly for audio spatial effect |
US9826332B2 (en) | 2016-02-09 | 2017-11-21 | Sony Corporation | Centralized wireless speaker system |
US9501696B1 (en) | 2016-02-09 | 2016-11-22 | William Cabán | System and method for metadata extraction, mapping and execution |
US9826330B2 (en) | 2016-03-14 | 2017-11-21 | Sony Corporation | Gimbal-mounted linear ultrasonic speaker assembly |
US9693169B1 (en) | 2016-03-16 | 2017-06-27 | Sony Corporation | Ultrasonic speaker assembly with ultrasonic room mapping |
US9794724B1 (en) | 2016-07-20 | 2017-10-17 | Sony Corporation | Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating |
US10075791B2 (en) | 2016-10-20 | 2018-09-11 | Sony Corporation | Networked speaker system with LED-based wireless communication and room mapping |
US9854362B1 (en) | 2016-10-20 | 2017-12-26 | Sony Corporation | Networked speaker system with LED-based wireless communication and object detection |
US9924286B1 (en) | 2016-10-20 | 2018-03-20 | Sony Corporation | Networked speaker system with LED-based wireless communication and personal identifier |
US10652592B2 (en) | 2017-07-02 | 2020-05-12 | Comigo Ltd. | Named entity disambiguation for providing TV content enrichment |
US10417516B2 (en) | 2017-08-24 | 2019-09-17 | Vastec, Inc. | System and method for preprocessing images to improve OCR efficacy |
US10572760B1 (en) * | 2017-11-13 | 2020-02-25 | Amazon Technologies, Inc. | Image text localization |
US11138438B2 (en) | 2018-05-18 | 2021-10-05 | Stats Llc | Video processing for embedded information card localization and content extraction |
US11025985B2 (en) | 2018-06-05 | 2021-06-01 | Stats Llc | Audio processing for detecting occurrences of crowd noise in sporting event television programming |
US11264048B1 (en) | 2018-06-05 | 2022-03-01 | Stats Llc | Audio processing for detecting occurrences of loud sound characterized by brief audio bursts |
CN109271999B (zh) * | 2018-09-06 | 2020-12-22 | 北京京东尚科信息技术有限公司 | 图像的处理方法、装置和计算机可读存储介质 |
US10623859B1 (en) | 2018-10-23 | 2020-04-14 | Sony Corporation | Networked speaker system with combined power over Ethernet and audio delivery |
CN109284751A (zh) * | 2018-10-31 | 2019-01-29 | 河南科技大学 | 基于频谱分析和svm的文字定位的非文本滤除方法 |
GB2596452A (en) * | 2019-02-17 | 2021-12-29 | Vizetto Inc | Systems and methods for generating documents from video content |
US11176410B2 (en) * | 2019-10-27 | 2021-11-16 | John Snow Labs Inc. | Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition |
US11521400B2 (en) | 2019-12-06 | 2022-12-06 | Synamedia Limited | Systems and methods for detecting logos in a video stream |
CN111062365B (zh) * | 2019-12-30 | 2023-05-26 | 上海肇观电子科技有限公司 | 识别混合排版文字的方法、设备、芯片电路和计算机可读存储介质 |
US20230145252A1 (en) * | 2020-01-24 | 2023-05-11 | Oswego Innovations Two Inc. | Portable tire scanners and related methods and systems |
CN111798542B (zh) * | 2020-09-10 | 2020-12-22 | 北京易真学思教育科技有限公司 | 模型训练方法、数据处理方法及装置、设备、存储介质 |
US11494944B2 (en) | 2020-11-18 | 2022-11-08 | Disney Enterprises, Inc. | Automatic low contrast detection |
US11544828B2 (en) | 2020-11-18 | 2023-01-03 | Disney Enterprises, Inc. | Automatic occlusion detection |
JP2022092119A (ja) * | 2020-12-10 | 2022-06-22 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
CN112949755B (zh) * | 2021-03-29 | 2022-09-13 | 中国科学院合肥物质科学研究院 | 一种基于图像结构信息的ocr数据合成方法 |
CN113362319A (zh) * | 2021-06-30 | 2021-09-07 | 深圳市创想三维科技股份有限公司 | 基于图像处理的激光打印方法和装置、激光打印机、计算机可读存储介质 |
US12080089B2 (en) | 2021-12-08 | 2024-09-03 | International Business Machines Corporation | Enhancing machine translation of handwritten documents |
US12008829B2 (en) | 2022-02-16 | 2024-06-11 | Vastec, Inc. | System and method for improved OCR efficacy through image segmentation |
US12148231B2 (en) * | 2022-08-08 | 2024-11-19 | Capital One Services, Llc | Systems and methods for extracting in-video moving text in live video streams |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6614930B1 (en) * | 1999-01-28 | 2003-09-02 | Koninklijke Philips Electronics N.V. | Video stream classifiable symbol isolation method and system |
US20050201619A1 (en) * | 2002-12-26 | 2005-09-15 | Fujitsu Limited | Video text processing apparatus |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3361124B2 (ja) | 1991-07-30 | 2003-01-07 | ゼロックス・コーポレーション | テキストを含む2次元画像上での画像処理方法と画像処理装置 |
US6400996B1 (en) | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
EP0631683B1 (en) * | 1992-03-20 | 2001-08-01 | Commonwealth Scientific And Industrial Research Organisation | An object monitoring system |
US5262860A (en) | 1992-04-23 | 1993-11-16 | International Business Machines Corporation | Method and system communication establishment utilizing captured and processed visually perceptible data within a broadcast video signal |
DE69519980T2 (de) | 1994-12-28 | 2001-06-07 | Siemens Corp. Research, Inc. | Verfahren und Gerät zur Detektion und Interpretation von Untertiteln in digitalen Videosignalen |
JP2007058882A (ja) * | 1996-09-27 | 2007-03-08 | Fujitsu Ltd | パターン認識装置 |
US6175844B1 (en) * | 1997-05-29 | 2001-01-16 | Adobe Systems Incorporated | Ordering groups of text in an image |
US6587586B1 (en) | 1997-06-12 | 2003-07-01 | Siemens Corporate Research, Inc. | Extracting textual information from a video sequence |
US6658662B1 (en) | 1997-06-30 | 2003-12-02 | Sun Microsystems, Inc. | Retrieving information from a broadcast signal |
US6249283B1 (en) | 1997-07-15 | 2001-06-19 | International Business Machines Corporation | Using OCR to enter graphics as text into a clipboard |
US6219453B1 (en) | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
US6100941A (en) | 1998-07-28 | 2000-08-08 | U.S. Philips Corporation | Apparatus and method for locating a commercial disposed within a video data stream |
US6204842B1 (en) | 1998-10-06 | 2001-03-20 | Sony Corporation | System and method for a user interface to input URL addresses from captured video frames |
GB2352915A (en) | 1999-08-06 | 2001-02-07 | Television Monitoring Services | A method of retrieving text data from a broadcast image |
US6469749B1 (en) | 1999-10-13 | 2002-10-22 | Koninklijke Philips Electronics N.V. | Automatic signature-based spotting, learning and extracting of commercials and other video content |
US8528019B1 (en) | 1999-11-18 | 2013-09-03 | Koninklijke Philips N.V. | Method and apparatus for audio/data/visual information |
US6470094B1 (en) * | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
WO2001072040A2 (en) | 2000-03-21 | 2001-09-27 | Koninklijke Philips Electronics N.V. | System and method for automatic content enhancement of multimedia output device |
US6674900B1 (en) * | 2000-03-29 | 2004-01-06 | Matsushita Electric Industrial Co., Ltd. | Method for extracting titles from digital images |
JP3923243B2 (ja) * | 2000-07-24 | 2007-05-30 | 独立行政法人科学技術振興機構 | カラー文書画像からの文字抽出方法 |
AU2001293001A1 (en) | 2000-09-22 | 2002-04-02 | Sri International | Method and apparatus for portably recognizing text in an image sequence of scene imagery |
US20020083464A1 (en) | 2000-11-07 | 2002-06-27 | Mai-Ian Tomsen | System and method for unprompted, context-sensitive querying during a televison broadcast |
US6778700B2 (en) | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
JP2003101774A (ja) * | 2001-09-25 | 2003-04-04 | Ricoh Co Ltd | 画像処理装置 |
AU2002351310A1 (en) | 2001-12-06 | 2003-06-23 | The Trustees Of Columbia University In The City Of New York | System and method for extracting text captions from video and generating video summaries |
US7073193B2 (en) | 2002-04-16 | 2006-07-04 | Microsoft Corporation | Media content descriptions |
KR100483451B1 (ko) | 2002-05-27 | 2005-04-15 | 주식회사 아이큐브 | 컨텐츠 파일과 네비게이션 정보의 편집처리방법 및 그 방법에 의하여 정보가 기록된 기록매체 |
US20040117405A1 (en) | 2002-08-26 | 2004-06-17 | Gordon Short | Relating media to information in a workflow system |
CN1714566A (zh) | 2002-11-22 | 2005-12-28 | 皇家飞利浦电子股份有限公司 | 用于接收包含可以用于编程所述接收的文本信息的信号的设备 |
RU2234734C1 (ru) | 2002-12-17 | 2004-08-20 | Аби Софтвер Лтд. | Способ многоэтапного анализа информации растрового изображения |
US7139033B2 (en) | 2003-02-19 | 2006-11-21 | Sharp Laboratories Of America, Inc. | System and method for television frame capture and display |
US8285727B2 (en) | 2003-03-06 | 2012-10-09 | Thomson Licensing S.A. | Simplified searching for media services using a control device |
EP1463301A1 (en) * | 2003-03-19 | 2004-09-29 | Thomson Licensing S.A. | Method for identification of tokens in video sequences |
US7921449B2 (en) | 2003-03-27 | 2011-04-05 | Sony Corporation | Smooth still image capture |
US20050246747A1 (en) | 2003-03-31 | 2005-11-03 | Matsushita Electric Industrial Co., Ltd. | Utilization of data broadcasting technology with handheld control apparatus |
KR100487538B1 (ko) | 2003-05-01 | 2005-05-03 | 주식회사 알티캐스트 | Tv 플라자 기능을 갖는 셋톱박스를 이용한 정보브라우징 방법 |
WO2005027508A1 (en) | 2003-09-12 | 2005-03-24 | Koninklijke Philips Electronics, N.V. | Start up method for a television apparatus |
US20060008260A1 (en) | 2004-01-12 | 2006-01-12 | Yu-Chi Chen | Disk player, display control method thereof, data analyzing method thereof |
US8132204B2 (en) | 2004-04-07 | 2012-03-06 | Visible World, Inc. | System and method for enhanced video selection and categorization using metadata |
US20060053470A1 (en) | 2004-04-30 | 2006-03-09 | Vulcan Inc. | Management and non-linear presentation of augmented broadcasted or streamed multimedia content |
US20060047704A1 (en) | 2004-08-31 | 2006-03-02 | Kumar Chitra Gopalakrishnan | Method and system for providing information services relevant to visual imagery |
US7716714B2 (en) | 2004-12-01 | 2010-05-11 | At&T Intellectual Property I, L.P. | System and method for recording television content at a set top box |
US20060179453A1 (en) | 2005-02-07 | 2006-08-10 | Microsoft Corporation | Image and other analysis for contextual ads |
US7570816B2 (en) * | 2005-03-31 | 2009-08-04 | Microsoft Corporation | Systems and methods for detecting text |
US7607582B2 (en) | 2005-04-22 | 2009-10-27 | Microsoft Corporation | Aggregation and synchronization of nearby media |
US7734092B2 (en) * | 2006-03-07 | 2010-06-08 | Ancestry.Com Operations Inc. | Multiple image input for optical character recognition processing systems and methods |
JP2008079190A (ja) | 2006-09-25 | 2008-04-03 | Olympus Corp | テレビジョン画像キャプチャシステム |
US20080091713A1 (en) * | 2006-10-16 | 2008-04-17 | Candelore Brant L | Capture of television metadata via OCR |
TWI351877B (en) | 2006-11-28 | 2011-11-01 | Mstar Semiconductor Inc | System and method for tv frame capture and printin |
-
2009
- 2009-02-26 US US12/380,394 patent/US8320674B2/en not_active Expired - Fee Related
- 2009-08-31 JP JP2011526127A patent/JP5588987B2/ja not_active Expired - Fee Related
- 2009-08-31 CA CA2735824A patent/CA2735824A1/en not_active Abandoned
- 2009-08-31 MX MX2011002293A patent/MX2011002293A/es active IP Right Grant
- 2009-08-31 KR KR1020117005003A patent/KR101452562B1/ko not_active Expired - Fee Related
- 2009-08-31 CN CN200980134487XA patent/CN102144236B/zh not_active Expired - Fee Related
- 2009-08-31 EP EP09812088A patent/EP2321767A1/en not_active Withdrawn
- 2009-08-31 WO PCT/US2009/055496 patent/WO2010027933A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6614930B1 (en) * | 1999-01-28 | 2003-09-02 | Koninklijke Philips Electronics N.V. | Video stream classifiable symbol isolation method and system |
US20050201619A1 (en) * | 2002-12-26 | 2005-09-15 | Fujitsu Limited | Video text processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
WO2010027933A1 (en) | 2010-03-11 |
WO2010027933A9 (en) | 2010-11-04 |
JP2012502359A (ja) | 2012-01-26 |
EP2321767A1 (en) | 2011-05-18 |
CN102144236B (zh) | 2013-08-21 |
CN102144236A (zh) | 2011-08-03 |
CA2735824A1 (en) | 2010-03-11 |
US8320674B2 (en) | 2012-11-27 |
US20100054585A1 (en) | 2010-03-04 |
MX2011002293A (es) | 2011-05-24 |
JP5588987B2 (ja) | 2014-09-10 |
KR20110056380A (ko) | 2011-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101452562B1 (ko) | 비디오 이미지에서 텍스트를 검출하는 방법 | |
Shivakumara et al. | A laplacian approach to multi-oriented text detection in video | |
US7379594B2 (en) | Methods and systems for automatic detection of continuous-tone regions in document images | |
US9064316B2 (en) | Methods of content-based image identification | |
Jamil et al. | Edge-based features for localization of artificial Urdu text in video images | |
Zhang et al. | A novel text detection system based on character and link energies | |
Shivakumara et al. | A gradient difference based technique for video text detection | |
Wang et al. | Natural scene text detection with multi-channel connected component segmentation | |
Phan et al. | Recognition of video text through temporal integration | |
Liu et al. | A novel multi-oriented chinese text extraction approach from videos | |
JP5796107B2 (ja) | テキスト検出の方法及び装置 | |
Sanketi et al. | Localizing blurry and low-resolution text in natural images | |
Wu et al. | Contour restoration of text components for recognition in video/scene images | |
Song et al. | Text region extraction and text segmentation on camera-captured document style images | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
Liu et al. | Detection and segmentation text from natural scene images based on graph model | |
Arai et al. | Text extraction from TV commercial using blob extraction method | |
CN106407969A (zh) | 一种健壮的复杂背景视频文本定位和抽取方法 | |
Chen et al. | Video-text extraction and recognition | |
Nor et al. | Image segmentation and text extraction: application to the extraction of textual information in scene images | |
Al-Asadi et al. | Arabic-text extraction from video images | |
Xu et al. | Extracting text information for content-based video retrieval | |
Samuel et al. | Automatic Text Segmentation and Recognition in Natural Scene Images Using Msocr | |
Fan et al. | Text detection in images based on grayscale decomposition and stroke extraction | |
Jang et al. | Automatic text extraction in news images using morphology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20110302 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
AMND | Amendment | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20120229 Comment text: Request for Examination of Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20130716 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20131213 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20130716 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
AMND | Amendment | ||
PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20131213 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20130916 Comment text: Amendment to Specification, etc. Patent event code: PX09012R01I Patent event date: 20120229 Comment text: Amendment to Specification, etc. |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20140211 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
PX0701 | Decision of registration after re-examination |
Patent event date: 20140919 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20140611 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20140115 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20131213 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20130916 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20120229 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20141013 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20141013 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20180724 |