[go: up one dir, main page]

KR20050041761A - 샷 전환 프레임 검출방법 - Google Patents

샷 전환 프레임 검출방법 Download PDF

Info

Publication number
KR20050041761A
KR20050041761A KR1020030077029A KR20030077029A KR20050041761A KR 20050041761 A KR20050041761 A KR 20050041761A KR 1020030077029 A KR1020030077029 A KR 1020030077029A KR 20030077029 A KR20030077029 A KR 20030077029A KR 20050041761 A KR20050041761 A KR 20050041761A
Authority
KR
South Korea
Prior art keywords
shot
shot change
frames
frame detection
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
KR1020030077029A
Other languages
English (en)
Inventor
나원
백중환
홍승범
Original Assignee
학교법인 정석학원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 학교법인 정석학원 filed Critical 학교법인 정석학원
Priority to KR1020030077029A priority Critical patent/KR20050041761A/ko
Publication of KR20050041761A publication Critical patent/KR20050041761A/ko
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은 영상 처리와 관련된 것으로, 특히 샷 전환 프레임을 검출하는 방법에 관한 것으로서, 학습 동영상에서 다수의 샷 전환 프레임 검출파라미터에 따른 인접한 두 프레임간의 특성 변화량을 획득하는 단계와, 샷 전환 프레임 검출파라미터별로 샷 전환 프레임들의 수가 최대가 되도록 하는 임계치를 설정하는 단계와, 다수의 샷 전환 프레임 검출파라미터와 검출 파라미터별로 설정된 임계치를 이용하여 이진 분류 트리 생성하는 단계와, 생성된 이진 분류 트리를 이용하여 해당 동영상에서 샷 전환 프레임 검출하는 단계를 포함하는 것을 특징으로 한다.

Description

샷 전환 프레임 검출방법{Method of detecting shot change frames}
본 발명은 영상 처리기술에 관련된 것으로, 좀더 상세하게는 동영상에서 샷이 전환되는 프레임을 검출하는 샷 전환 프레임 검출방법에 관한 것이다.
얼마 전까지만 해도 영화, 개인용 비디오를 포함하는 동영상은 주로 VTR, TV를 통해서 감상하였다. 그러나 전기전자기술이 발달하면서 DVR, PVR, 컴퓨터 뿐 만 아니라 점차 휴대폰을 통해서 동영상을 감상할 수 있게 되었다. 이에 따라 최근에는 사용자가 동영상을 편리하게 검색 및 감상할 수 있도록 쉽고 빠르게 원하는 화면정보를 검출할 수 있는 검출기술들이 급증하고 있다.
현재 제안된 검출기술 중에는 전체 동영상에서 중요한 키 프레임(key frame)만을 검출하는 기술이 있다. 일반적으로 프레임은 전체 동영상을 이루는 기본 화면정보를, 샷은 하나의 카메라 동작이 끝나고 다른 카메라로 넘어가기까지의 프레임들의 집합을 의미한다. 보통 하나의 샷 내부의 인접한 두 프레임간에는 그 내용이나 픽셀의 밝기, 히스토그램 특성에 있어 높은 유사성을 가지는 반면, 샷이 전환되는 부분의 인접한 두 프레임은 화면을 이루는 내용도 다르고, 픽셀의 밝기, 히스토그램 또한 다르다. 기존에 제안된 키 프레임 검출기술은 인접한 두 프레임 간의 픽셀 밝기 차이나 히스토그램 특성 변화와 같은 단일 특성을 선택적으로 이용하여 샷이 전환되는 프레임을 검출하여 이를 표시해줌으로써 사용자에게 동영상의 전체 내용을 빨리 알 수 있도록 하는 기술이다.
여기서, 인접한 두 프레임간의 픽셀 밝기 비교방식은 배경이 고정되어 있고, 카메라가 거의 움직이지 않거나 느리게 움직일 때 얻어지는 동영상에 적용할 경우 검출 성능이 현저히 높다. 한편, 인접한 두 프레임간의 히스토그램 비교방식은 객체 혹은 카메라가 빨리 움직이거나 회전을 할 때 얻어지는 동영상에 적용할 경우 검출 성능이 현저히 높다. 그러나 인접한 두 프레임 간의 픽셀 밝기 비교방식은 객체 혹은 카메라가 빨리 움직이거나 회전을 할 때 얻어지는 동영상에 적용할 경우에, 인접한 두 프레임 간의 히스토그램 비교방식은 배경이 고정되어 있고 카메라가 거의 움직이지 않거나 느리게 움직일 때 얻어지는 동영상에 적용할 경우에 샷 전환 프레임검출 성능이 현저히 저하된다.
이에 종래에는 기존에 제안된 키 프레임 검출기술들을 사용하여 다양한 카메라 촬영 및 편집방법에 의해 제작된 동영상에서 샷이 전환되는 프레임을 검출할 경우 그 검출성능에 대해 사용자가 신뢰할 수 없다는 문제점이 발생하게 되었다.
본 발명은 상기와 같은 배경에서 제안된 것으로서, 기존에 제안된 키 프레임 검출기술들을 사용하여 다양한 카메라 촬영 및 편집방법에 의해 제작된 동영상에서 샷 전환 프레임을 검출할 경우 그 검출성능에 대해 사용자가 신뢰할 수 있는 샷 전환 프레임 검출방법을 제공함에 그 목적이 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 일 양상에 따른 샷 전환 프레임 검출방법은, 학습 동영상에서 다수의 샷 전환 프레임 검출파라미터에 따른 인접한 두 프레임간의 특성 변화량을 획득하는 단계와, 샷 전환 프레임 검출파라미터별로 샷 전환 프레임들의 수가 최대가 되도록 하는 임계치를 설정받는 단계와, 다수의 샷 전환 프레임 검출파라미터와 검출파라미터별로 설정된 임계치를 이용하여 이진 분류 트리 생성하는 단계와, 생성된 이진 분류 트리를 이용하여 해당 동영상에서 샷 전환 프레임 검출하는 단계를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 전술한, 그리고 추가적인 양상을 기술되는 바람직한 실시예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
도 1 은 본 발명에 따른 동영상에서 샷 전환 프레임을 검출하는 과정을 도시하며, 도 2 는 본 발명에 따른 동영상에서 샷 전환 프레임 검출파라미터별로 검출되지 못한 샷 전환 프레임과 샷 전환으로 잘못 판정된 프레임의 예를 도시한 그래프이고, 도 3 은 본 발명의 일시시예에 따른 이진 분류 트리를 도시한 것이다. 이하, 도1 내지 도3을 참조하여 설명하기로 한다.
도1을 참조하면, 먼저 임의의 동영상에서 샷 전환 프레임을 검출하기 위해서는 학습 동영상에서 다수의 샷 전환 프레임 검출파라미터에 따른 인접한 두 프레임간의 특성 변화량을 획득하여야 한다(S10). 본 발명의 바람직한 실시예에 있어서, 상기 다수의 샷 전환 프레임 검출파라미터는 인접한 두 프레임간의 전체 영역 픽셀 밝기 차이에 관한 특징변수(LPD)와, 전체 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(IHD)와, 국부 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(LHL)와, 전체 영역 색상 히스토그램 차이에 관한 특징변수(HHD)와, 밝기 성분을 이용한 전체 영역 블록의 유사성에 관한 특징변수(LLR)를 포함한다.
상기 전체 영역 픽셀 밝기 차이에 관한 특징변수(LPD)는 배경이 고정되어 있고, 카메라가 거의 움직이지 않거나 느리게 움직일 때 얻어지는 동영상에 적용할 경우 검출 성능이 뛰어나며, 하기 수학식 1을 근거하여 산출한다.
여기서, N과 M은 영상의 가로와 세로의 크기를 나타내고, 은 m번째 프레임의 점 에서의 밝기 값이다.
전체 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(IHD)와, 국부 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(LHL)와, 전체 영역 색상 히스토그램 차이에 관한 특징변수(HHD)는 각 프레임에서 픽셀의 밝기 혹은 컬러의 분포를 구한 후 인접한 두 개의 히스토그램 분포를 비교하는 방식이다. 이 방식은 카메라의 회전(rotation), 이동(tilt, pan), 그리고 객체의 빠른 이동에 안정된 성능을 나타낸다. 그러나 상기 히스토그램 기반 기법은 프레임의 밝기/컬러 분포만을 이용하게 되므로 위치 정보가 사라지는 단점을 가지고 있다. 따라서 두 프레임 사이에 히스토그램 분포가 비슷한 경우 샷을 놓치는 경우가 발생한다. 이와 같은 문제점을 해결하기 위해 국부 히스토그램 방식을 사용하며, 이 방식은 전체 프레임을 소정 개수의 균등한 블록들로 나누고, 각 블록에 대응하는 인접한 프레임의 블록 사이에서 히스토그램 분포를 비교하여 유사성을 구하게 된다. 따라서 히스토그램 방식은 밝기/컬러의 분포가 변화하는 컷의 경우에 뛰어난 성능을 발휘한다. 전체 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(IHD)는 하기 수학식 2를 근거하여 산출하며, 국부 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(LHL)는 하기 수학식 3을 근거하여 산출한다.
여기서, 는 m번째 프레임의 히스토그램을 나타내고, B는 최대 밝기 값이다.
여기서, |BS|는 블록내의 픽셀 수이다.
본 실시예에 있어서, 상기 국부 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(LHL)는 영상 전체를 16개의 블록들로 균등하게 분할하여, 블록들간의 유사도를 측정한다. 이 측정된 유사도들 중, 유사도가 낮은 8개의 블록들을 사용하여 장면 전환점을 검출한다. 여기서, 제외된 상위 블록 8개는 부분적으로 발생하는 객체의 움직임을 제거하기 위함이다.
밝기 성분을 이용한 전체 영역 블록의 유사성에 관한 특징변수(LLR)은 인접한 프레임들을 소정 개의 블록으로 나눈 후 인접한 블록들 사이의 유사도 함수(likelihood ratio)를 이용하여 유사도를 측정하는 블록 기반 방식이다. 이 방식은 블록 단위로 적용하기 때문에 움직임에 덜 민감하게 반응한다. 또한 임의의 모양을 가진 객체가 변화하는 컷에 뛰어난 성능을 발휘한다. 구현 방식은 한 프레임을 동일한 블록 단위들로 중복이 되지 않도록 나눈다. 그리고 각 블록별로 평균과 분산을 구하고, 인접한 프레임에 대응하는 블록의 주변 블록들과 유사도를 검사하여 가장 높은 유사도를 갖는 블록의 유사도 함수를 얻는다. 이 때 얻어진 유사도 함수의 결과가 일정한 임계 값보다 크게 되면 가중치를 1로 설정하고, 그 이하가 되면 가중치를 0으로 설정하여 전체 프레임에 대한 유사도를 검사한다. 밝기 성분을 이용한 전체 영역 블록의 유사성에 관한 특징변수(LLR)은 하기 수학식 4를 근거하여 산출한다.
여기서, 는 i번째 블록의 평균과 분산을 의미한다.
전술한 다섯 가지의 샷 전환 프레임 검출파라미터별로 학습 동영상에서 다수의 인접한 두 프레임간의 특징 변화량을 획득한 후 각 검출파라미터별로 임계치를 설정하여야 한다(S12). 본 실시예에서, 임계치는 학습 동영상을 이용하여 실험을 통해 설정하는데, 사용한 학습 동영상은 영화 메트릭스(The Matrix)와 미션 임파서블(The Mission Impossible)이다. 각 학습 동영상은 초당 15프레임이고 영상 크기는 320 ×240이다. 두 학습 동영상 내에는 다양한 편집 기술이 포함되지 않고, 카메라 이동(pan, tilt, zoom)과 컷에 의한 편집만으로 이루어져 있다. 본 실시예에서 두 학습 동영상의 전체 프레임과 발생한 샷 전환점 수는 직접 확인을 통해 얻어냈으며 그 결과는 하기 표1과 같다. 여기서, SC(Shot Change)는 샷 전환점을 나타내고, NSC(No Shot Change)는 샷 전환점이 아닌 프레임을 나타낸다.
시퀀스 종류 전체 프레임 수 SC NSC
매트릭스 2167 48 2119
미션 임파서블 2429 30 2399
이후, 본 실시예에서 각 샷 전환 프레임 검출파라미터별로 이진 분류 시 샷 전환이 아닌 프레임의 수가 최대가 되도록 임계치를 설정하는 것이 바람직하다. 본 실시예에서는 도2a 내지 도2e에서 도시된 바와 같이, 샷 전환 프레임 검출파라미터별로 LPD의 임계치는 0.051, HHD의 임계치는 0.154, IHD의 임계치는 0.162, LLR의 임계치는 2.2, LHL의 임계치는 0.17로 설정된다. 본 실시예에서는 각 샷 전환 프레임 검출파라미터별 검출성능 평가를 위해 사용된 recall지수, precision 지수 및 평가 지수(EI: Evaluation Index)를 하기 수학식 5와 같이 정의한다.
precision=
EI=(recall+precision)/2
여기서, SC는 학습 동영상에 존재하는 전체 샷 전환점의 수이다. SM은 각 샷 전환 프레임 검출파라미터에서 검출하지 못한(MD: Missed Detection) 샷 전환점의 수이고, SF는 샷 전환점으로 잘못 판정된(FA: False Alarm) 프레임 수이다. 그리고 EI는 1에 근사할수록 성능이 우수하다.
매트릭스 LPD IHD LHL HHD LLR
SC SM SF SM SF SM SF SM SF SM SF
48 4 48 3 39 3 34 3 25 3 37
re./pr. 92 50 94 55 94 59 94 66 94 56
EI 71 74.5 76.5 80 75
미션임파셔블 LPD IHD LHL HHD LLR
SC SM SF SM SF SM SF SM SF SM SF
30 0 6 1 5 0 4 1 8 0 1
re./pr. 100 83 97 86 100 88 97 79 100 97
EI 92 91.5 94 88 99
표 2에서 샷 전환 프레임 검출파라미터별로 EI의 값이 최대가 되도록 실험적으로 임계치를 설정하였다. "매트릭스"의 경우 EI를 기준으로 인접한 전체 영역 색상 히스토그램 차이에 관한 특징변수(HHD)가 가장 좋은 성능을 발휘하는 반면, 인접한 두 프레임간의 전체 영역 픽셀 밝기 차이에 관한 특징변수(LPD)는 성능이 떨어짐을 알 수 있다. 또한 미션 임파서블은 밝기 성분을 이용한 전체 영역 블록의 유사성에 관한 특징변수(LLR)가 좋은 성능을 발휘하는 반면, 전체 영역 색상 히스토그램 차이에 관한 특징변수(HHD)은 성능이 떨어진다. 여기서 알 수 있듯이, 두 학습 동영상 중 미션 임파서블은 단일 기법만으로도 우수한 성능을 발휘한다. 하지만, 매트릭스는 단일 기법만으로는 뛰어난 성능을 발휘가 어렵다.
도2를 참조하면, 두 학습 동영상 상에서 각 샷 전환 프레임 검출파라미터별로 검출되지 못한 샷 전환 프레임과 샷 전환으로 잘못 판정된 프레임을 확인할 수 있다. 각 샷 전환 프레임 검출파라미터를 살펴보면, HHD와 LHL에 의해 샷 전환점 A와 C는 정확하게 찾았지만, 검출파라미터에 따라 LPD는 C에서 검출되지 못한 샷 전환 프레임가 발생하였고, IHD는 D와 F에서 샷 전환으로 잘못 판정된 프레임이 발생하였다. 그리고 LLR은 E에서 샷 전환으로 잘못 판정된 프레임이 발생한다.
이와 같이, 동일 시퀀스에 대하여 각각의 검출 기법을 독립적으로 실행하였을 때의 결과는 각 성능에 따라 상이한 결과가 나타나지만, 여러 개의 특징들을 동시에 적용하게 되면, 각 방식간의 관계(relation)가 나타남을 볼 수 있다. 예로, 두 개의 IHD와 LLR을 동시에 적용하였을 때, IHD에 의해 샷 전환으로 A, C, D, 그리고 F가 검출된다. 반면, LLR에 의해서는 A, C, 그리고 E에서 샷 전환이 검출된다. 즉, 두 방식을 이용하여 IHD를 먼저 적용한 후 LLR을 적용하게 되면, 샷 전환점인 A와 C를 정확하게 찾을 수 있을 것이다.
이 후 각 샷 전환 프레임 검출파라미터별로 임계치가 설정되면, 샷 전환 프레임 검출파라미터와 샷 전환 프레임 검출파라미터별로 설정된 임계치를 이용하여 샷 전환 프레임을 찾기 위한 최적의 이진 분류 트리를 생성하여야 한다(S14).
본 실시예에서 각 이진 분류 트리에는 분류결과 샷 전환이 아닌 프레임들의 수가 최대가 되도록 하는 샷 전환 프레임 검출파라미터 및 임계치가 순차적으로 설정되는 것이 바람직하다.
도3 을 참조하면, 첫 번째 이진 분류에는 샷 전환이 아닌 프레임들의 수를 2058개나 분류해 낼 수 있는 LHL이 놓인다. 이때의 임계 값은 0.165이다. 이 임계 값에 따라 샷 전환 프레임의 수는 0으로써 검출된다. 이어, 샷 전환이 아닌 프레임들인 2058을 제외한 나머지 109 개의 프레임들에 대해서 다른 샷 전환 프레임 검출 파라미터들을 이용하여 샷 전환 프레임인지 아닌지에 대해서 다시 판단을 한다. 이러한 판단을 위해, 다음 이진 분류 가지에서도 분류결과 샷 전환이 아닌 프레임들의 수가 최대가 되도록 하는 샷 전환 프레임 검출파라미터 및 임계치가 설정된다. 본 실시예에서는 LLR을 이용된다. 상기 LLR에 대한 임계치는 1.791로 설정되고, 이 임계치를 초과하지 않는 프레임들의 수는 26개인 것으로 판단된다. 다음 이진 분류 가지에서는 109개 중 26개를 제외한 83개의 프레임들에 대해 HHD가 이용된다. 이 HHD를 위한 임계 값은 0.075로 설정된다. 나머지 83개의 프레임들 중 이 0.075를 넘지 않는, 즉 샷 전환이 아닌 프레임들의 수는 7개로 판단된다. 다음,이진 분류 가지에는 83개의 프레임들 중, 7개를 제외한 나머지 76개의 프레임들을 나머지 특징 파라미터를 이용하여 샷 전환 프레임인지 아닌지 판단을 하여 샷 전환 프레임들의 수가 48개로 판단되고, nsc 프레임들의 수는 28개로 최종적으로 판단되지만, 다수결의 원칙에 따라 sc 클래스가 우위에 있으므로, 76개의 프레임들의 수는 sc 클래스로 분류된다. 상기 이진 분류 트리의 생성은 불순물이 발생하지 않거나 정지 조건(stopping criterion)을 만족할 때까지 최대 이진 분류 트리(maximal tree)로써 생성된다.
샷 전환 프레임 검출파라미터별로 설정된 임계치를 이용하여 샷 전환 프레임을 찾기 위한 최적의 이진 분류 트리를 생성하였으면, 이를 이용하여 샷 전환 프레임을 모르는 임의의 동영상에서 샷 전환 프레임을 검출한다(S14).
표5는 학습동영상으로 매트릭스를 사용하고 미션 임파서블에서 샷 전환 프레임 검출파라미터별로 특징 변화량을 획득한 후 도3과 같이 분류된 이진 분류 트리를 사용하여, 드롭케이스(drop-case)방식에 따른 노드별 통계(표 5a) 및 분류 결과(표 5b)를 나타낸 것이다.
샷 전환 프레임 검출파라미터별 분류결과 예측결과 분류에 따른 프레임수
Response Prob N Correct
노드 1 NSC 0.957 2324 1.0 2324
2 NSC 0.029 70 1.0 70
3 - 0 0 0 0
4 SC 0.014 35 0.857 35
실제 분류 프레임클래스 예상 분류 프레임 클래스 분류에 따른 프레임수
SC NSC
SC 30 0 30
NSC 5 2394 2394
총계 35 2394 2429
정확도 1.000 0.998
전체 정확도 0.999
표 6은 학습동영상으로 매트릭스를 사용하고 임의의 다큐멘터리 영상에서 샷 전환 프레임 검출파라미터별로 특징 변화량을 획득한 후 도3과 같이 분류된 이진 분류 트리를 사용하여, 드롭케이스(drop-case)방식에 따른 노드별 통계(표 6a) 및 분류 결과(표 6b)를 나타낸 것이다.
샷 전환 프레임 검출파라미터별 분류결과 예측결과 분류에 따른 프레임수
Response Prob N Correct
노드 1 NSC 0.859 2331 1.0 2331
2 NSC 0.127 345 0.991 345
3 - 0 0 0 0
4 SC 0.015 41 0.829 41
실제 분류 프레임클래스 예상 분류 프레임 클래스 분류에 따른 프레임수
SC NSC
SC 34 3 37
NSC 7 2672 2679
총계 41 2675 2716
정확도 0.919 0.997
전체 정확도 0.958
표 5a와 표 6a는 도 3의 이진 분류 트리에 시험 샘플 데이터를 하나씩 드롭(drop)하여 각 최종 노드에서 수집된 데이터를 나타낸다. 각 노드별로 수집된 정보를 통계적으로 분류하기 위해 네 가지 항목으로 분석한다. 첫 번째로 "Response" 는 각 노드별로 수집된 데이터의 예측 클래스를 나타낸다. 두 번째 "Prob(probability)"는 전체 데이터 샘플 중 각 노드에 수집된 데이터의 발생 빈도를 나타낸다. 세 번째 항목 "N"은 각 노드에 수집된 샘플 수를 의미하고, 마지막 항목 "Correct"는 수집된 데이터를 클래스별로 나누었을 때, 클래스 순수도(purity)를 측정하는 것이다. 위의 표 5a를 이용하여 각 항목을 살펴보면, 노드 1에 수집된 수(N)는 2324개이고, 이 결과 중 nsc 클래스에 속하는 것이 2324개로 "Correct"가 1.0임을 나타낸다. 따라서, 노드 1의 "Response"는 nsc 클래스로 예측한다는 것을 나타낸다. 또한, "Prob"는 전체 프레임 수가 2429중 2324개가 노드 1에서 분류된 것이므로, 0.957의 결과가 산출되었다. 노드 2에서 수집된 수(N)는 70개이고, "Correct"가 1.0이고, 역시 nsc 클래스로 예측한다. 노드 3은 수집된 수가 0개이므로 클래스를 예측할 수 없는 것으로 나타내고, 나머지 노드 4는 수집된 수가 35개이며, 정확도가 0.857로 sc 클래스로 예측한다.
표 5b와 표 6b는 각 표5a와 표6a에 의해 분류된 결과를 샷 전환(sc) 프레임과 샷 전환이 아닌(nsc) 프레임 클래스별로 정리한 결과이다. 샷 전환(sc) 프레임과 샷 전환이 아닌(nsc) 프레임 클래스별 분류 정확도(Correct)를 계산하였다. 따라서 미션 임파서블의 경우 샷 전환(sc) 프레임과 샷 전환이 아닌(nsc) 프레임 클래스 분류 능력은 각각 1.0과 0.998이고, 전체 정확성은 0.999이다. 그리고, 다큐멘터리 영상은 0.919, 0.997, 그리고 0.958이 계산되었다. 이는 교차 검증 결과인 샷 전환(sc) 프레임과 샷 전환이 아닌(nsc) 프레임 클래스 각각 89.6%와 98.7%의 분류 확률보다 높다. 따라서, 이진 분류 트리가 트리 생성 과정에 전혀 개입하지 않은 샘플 시퀀스에 대해서도 샷 전환점을 잘 검출하는 것을 볼 수 있다. 위의 실험을 통하여 단일 특징에 의한 결과와 본 발명에서 제안한 방식의 성능을 표 7에서 비교하였다.
샷 전환 프레임 검출파라미터별 분류결과 이진 분류 결과
구분 recall precision EI recall precision EI
매트릭스 HHD 94 66 80 100 63 81.5
미션임파서블 LLR 100 97 98.5 100 99 99.5
다큐멘터리 LHL 100 86 93 92 99 95.5
표 7에서 EI의 경우 평균 2% 성능 향상을 나타냄을 알 수 있다. 하지만, 제미션 임파서블의 경우 EI의 성능은 비슷하지만 precision의 경우에 본 발명에서 제안한 방식이 개선되었음을 알 수 있다.
이상에서와 같이 본 발명에서는 임의의 동영상에 쉽게 적용할 수 있도록 다수의 샷 전환 프레임 검출 파라미터를 사용하고 이진 분류 트리를 생성함으로써, 기존에 제안된 키 프레임 검출기술들을 사용하여 다양한 카메라 촬영 및 편집방법에 의해 제작된 동영상에서 샷 전환 프레임을 검출할 경우 그 검출성능에 대해 사용자가 신뢰할 수 있는 효과가 있다.
본 발명은 첨부된 도면을 참조하여 바람직한 실시예를 중심으로 기술되었지만 당업자라면 이러한 기재로부터 본 발명의 범주를 벗어남이 없이 많은 다양한 자명한 변형이 가능하다라는 것은 명백하다. 따라서, 이러한 많은 변형예들을 포함하도록 기술된 특허청구범위에 의해서 해석되어져야 할 것이다.
도 1 은 본 발명에 따른 동영상에서 샷 전환 프레임을 검출하는 과정을 도시한다.
도 2 는 본 발명에 따른 동영상에서 샷 전환 프레임 검출파라미터별로 검출되지 못한 샷 전환 프레임과 샷 전환으로 잘못 판정된 프레임의 예를 도시한 그래프이다.
도 3 은 본 발명의 일시시예에 따른 이진 분류 트리를 도시한 것이다.

Claims (3)

  1. 학습 동영상에서 다수의 샷 전환 프레임 검출파라미터에 따른 인접한 두 프레임간의 특성 변화량을 획득하는 단계와;
    상기 샷 전환 프레임 검출파라미터별로 샷 전환 프레임들의 수가 최대가 되도록 하는 임계치를 설정하는 단계와;
    상기 다수의 샷 전환 프레임 검출파라미터와 검출 파라미터별로 설정된 임계치를 이용하여 이진 분류 트리 생성하는 단계와;
    생성된 이진 분류 트리를 이용하여 시험 동영상에서 샷 전환 프레임을 검출하는 단계;
    를 포함하는 것을 특징으로 하는 샷 전환 프레임 검출방법.
  2. 청구항 1에 있어서, 상기 다수의 샷 전환 프레임 검출파라미터에 따른 다수의 인접한 두 프레임간의 특징 변화량을 획득하는 단계가:
    인접한 두 프레임간의 전체 영역 픽셀 밝기 차이에 관한 특징변수(LPD)와, 전제 영역 픽셀 밝기 히스토그램차이에 관한 특징변수(IHD)와, 국부 영역 픽셀 밝기 히스토그램 차이에 관한 특징변수(LHL)와, 전역 색상 히스토그램 차이에 관한 특징변수(HHD)와, 밝기 성분을 이용한 전역 블록의 유사성에 관한 특징변수(LLR)를 포함하는 다수의 샷 전환 프레임 검출파라미터를 이용하는 것을 특징으로 하는 샷 전환 프레임 검출방법.
  3. 청구항 1 또는 청구항 2에 있어서, 상기 이진 분류 트리 생성 단계가:
    각 이진 분류 트리에는 분류결과 샷 전환이 아닌 프레임들의 수가 최대가 되도록 하는 샷 전환 프레임 검출파라미터 및 임계치가 순차적으로 설정되는 것을 특징으로 하는 장면 샷 전환 프레임 검출방법.
KR1020030077029A 2003-10-31 2003-10-31 샷 전환 프레임 검출방법 Ceased KR20050041761A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030077029A KR20050041761A (ko) 2003-10-31 2003-10-31 샷 전환 프레임 검출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030077029A KR20050041761A (ko) 2003-10-31 2003-10-31 샷 전환 프레임 검출방법

Publications (1)

Publication Number Publication Date
KR20050041761A true KR20050041761A (ko) 2005-05-04

Family

ID=37243179

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030077029A Ceased KR20050041761A (ko) 2003-10-31 2003-10-31 샷 전환 프레임 검출방법

Country Status (1)

Country Link
KR (1) KR20050041761A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101313285B1 (ko) * 2011-06-03 2013-09-30 주식회사 에이치비솔루션 하이퍼 비디오 정보 파일 제작장치 및 제작방법, 그 기록매체
KR101449533B1 (ko) * 2013-01-28 2014-10-13 군산대학교산학협력단 지역적 정보를 이용한 장면 전환 검출방법
KR101709085B1 (ko) 2015-12-16 2017-02-23 서강대학교산학협력단 컨볼루션 신경망을 이용한 샷 경계 검출 방법 및 장치
KR20200057099A (ko) * 2015-01-26 2020-05-25 알리바바 그룹 홀딩 리미티드 얼굴 생체 내 검출 방법 및 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101313285B1 (ko) * 2011-06-03 2013-09-30 주식회사 에이치비솔루션 하이퍼 비디오 정보 파일 제작장치 및 제작방법, 그 기록매체
KR101449533B1 (ko) * 2013-01-28 2014-10-13 군산대학교산학협력단 지역적 정보를 이용한 장면 전환 검출방법
KR20200057099A (ko) * 2015-01-26 2020-05-25 알리바바 그룹 홀딩 리미티드 얼굴 생체 내 검출 방법 및 장치
KR101709085B1 (ko) 2015-12-16 2017-02-23 서강대학교산학협력단 컨볼루션 신경망을 이용한 샷 경계 검출 방법 및 장치

Similar Documents

Publication Publication Date Title
JP4720705B2 (ja) プログラム、検出方法、及び検出装置
US8316301B2 (en) Apparatus, medium, and method segmenting video sequences based on topic
US7916173B2 (en) Method for detecting and selecting good quality image frames from video
EP1580757A2 (en) Extracting key-frames from a video
US20070217765A1 (en) Method and its application for video recorder and player
US6456660B1 (en) Device and method of detecting motion vectors
Karaman et al. Comparison of static background segmentation methods
US20080253617A1 (en) Method and Apparatus for Determining the Shot Type of an Image
US20100158362A1 (en) Image processing
CN101543075A (zh) 视频序列中渐变的检测
KR20050087987A (ko) 앵커 샷 결정방법 및 결정장치.
Patel et al. Shot detection using pixel wise difference with adaptive threshold and color histogram method in compressed and uncompressed video
KR20050041761A (ko) 샷 전환 프레임 검출방법
JP4330914B2 (ja) 動物体検出装置および動物体検出方法
KR20050033075A (ko) 비디오 이미지들의 시퀀스에서 콘텐트 속성을 검출하는 유닛 및 방법
Lu et al. An accumulation algorithm for video shot boundary detection
KR101617428B1 (ko) 디지털 영상에서 손상 영역을 검출하는 방법 및 장치
Zhao et al. BUPT at TRECVID 2007: Shot Boundary Detection.
KR20010081373A (ko) 영상 신호의 움직임 검출 장치 및 방법
Li et al. Model based video segmentation
Koprinska et al. Video segmentation of MPEG compressed data
Kim et al. An adaptive shot change detection algorithm using an average of absolute difference histogram within extension sliding window
Patel et al. Scene-Change Detection using Locality Preserving Projections
Amudha et al. Video shot detection using saliency measure
JP4662169B2 (ja) プログラム、検出方法、及び検出装置

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20031031

PA0201 Request for examination
PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20051017

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20060428

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20051017

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I