CN1497973A - 用于记录和/或再现数字数据的装置及其控制方法 - Google Patents
用于记录和/或再现数字数据的装置及其控制方法 Download PDFInfo
- Publication number
- CN1497973A CN1497973A CNA2003101013104A CN200310101310A CN1497973A CN 1497973 A CN1497973 A CN 1497973A CN A2003101013104 A CNA2003101013104 A CN A2003101013104A CN 200310101310 A CN200310101310 A CN 200310101310A CN 1497973 A CN1497973 A CN 1497973A
- Authority
- CN
- China
- Prior art keywords
- gop
- picture
- predictive coding
- macro block
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/745—Browsing; Visualisation therefor the internal structure of a single video sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/7864—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
- G11B27/327—Table of contents
- G11B27/329—Table of contents on a disc [VTOC]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/781—Television signal recording using magnetic recording on disks or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种数字数据记录和/或再现装置及其控制方法,该数字数据记录和/或再现装置和方法能够记录和再现按照压缩格式的输入的数字广播节目。数字数据记录和/或再现装置包括:控制器,用于计算数字数据的画面组的双向预测编码画面的前向运动补偿插入宏块的数量、以及后向运动补偿插入宏块的数量,并且依据计算得到的数量,检测场景变化的发生点;以及视频索引产生器,用于通过对离每一个GOP的场景变化检测点最近的帧内编码画面进行解码、再现图像、以及对再现的图像进行排列,产生视频索引。通过检测广播节目的压缩区域中的场景变化,提供了导航功能,而不需要对压缩的广播节目的所有帧进行解码,并且产生检测到的场景变化点的图像的视频索引。
Description
技术领域
本发明涉及一种用于记录和/或再现诸如数字音频/视频(A/V)数据之类的数据的装置、以及控制方法,更具体地说,本发明涉及一种用于记录和/或再现诸如数字A/V数据之类的数据的装置、以及控制方法,其中,该装置为了搜索接收到的并且存储于其中的数据,检测场景变化点(scene change point),并且使用所检测的场景变化点来产生导航数据(navigation data)。
背景技术
通常,诸如A/V数据记录和/或再现装置的数据记录和/或再现装置的“导航”功能(navigation function)指的是从当前的数据再现点移动到用户所选择的另一点,并且从用户所选择的点重新开始(resume)再现,或者根据用户的要求,重新排列记录的A/V数据的再现顺序,从而可以按照重新排列的顺序来进行再现。因此,“导航数据”指的是为了实现导航功能而提供的附加信息,并且包括:数据行(data row)时间搜索表,该表包括与A/V数据的再现位置和对应的A/V数据的再现时间的相对应的信息;以及节目表(program table),该表包括制造商预先设置的再现顺序重新排列信息。
当再现数字卫星广播或者来自诸如光盘的二维介质的数字高分辨率广播的A/V数据时,所谓的场景变化信息通常被用于使用户能够进行搜索功能来跳过一些场景、或者跳到他所期望的场景并且重新开始再现的功能。
特别地,场景变化信息是用于与导航数据一起记录/再现A/V数据的A/V数据记录和/或再现装置的再现过程所需要的信息。例如,观众可以把近几天的某广播台的所有TV(电视)节目记录在单一的盘上。用户可能想要跳过节目的某些部分,而不是从第一部分开始观看所有记录的节目,这就是用户在这样的情形下所需要的场景变化信息。
场景变化信息指的是与指向整个节目区域的特定位置的指针相关的信息。当观众输入诸如“搜索命令”的命令时,即需要按照向前或者向后的方向跳过某些场景时,指针从当前被再现的位置移动到观众所请求的新的再现位置。可以依据几个标准来再现场景变化信息。
用于从A/V内容搜索的记录介质中检测场景变化的一种现有的方法为:按照像素区域中的图像的复杂度进行离散余弦变换(DCT),并且依据因而得到的信息来检测场景变化。此现有方法的主要缺点在于:以下的连续的过程,即对按照MPEG格式的压缩图像进行解码、恢复图像、再次DCT计算、以及对场景变化的实时检测需要非常大量的计算。因此,需要具有足够的能力来处理所需要的计算的系统。
至于将数字多媒体运动画面分段为多个有意义的部分的检测算法,主要存在两种方法。一种方法是使用参考图像的像素数据,另一种方法是使用图像帧的运动补偿。最简单的方法是利用两个相邻帧的像素数据之间的差别。即,如果确定此差别等于或者大于预定的阈值,则确定存在场景变化。虽然此技术可能对于具有相当小的运动的画面比较有效,但是对于具有较大的运动的画面,会存在相当多的错误。由于这些原因,使用运动补偿的方法更为有效。然而,此方法的缺点在于:对于各个帧的运动矢量,该方法需要进行复杂的计算。虽然对于此方法,可以使用相位匹配,但是,这需要大量的计算和内存来进行快速傅立叶变换(FFT)。
如以上所描述的,场景变化检测所需要的如此复杂的计算阻碍了上述方法在具有相当低的容量的系统例如卫星广播接收机等中的应用。
发明内容
因此,本发明的目的是提出一种用于记录和/或再现诸如数字A/V数据之类的数据的装置、以及控制方法,其中,所述的装置能够检测压缩区域中的场景变化点,因而可以不需要大量计算地检测场景变化点。
因此,已经提出的本发明用于解决在传统系统中出现的上述问题,因此,本发明的一个方面是提出一种诸如数字A/V数据记录和/或再现装置的数据记录和/或再现装置,用于记录和/或再现按照压缩格式的输入的数字广播节目。所述的装置包括:控制器,用于计算数字A/V数据的画面组(GOP)的双向预测编码画面中的前向运动补偿插入宏块(macroblock)、以及后向运动补偿插入宏块的数量,并且依据计算的数量,检测场景变化的发生点。所述的装置还包括视频索引(video index)产生器,用于通过对离检测到的每一个GOP的场景变化点最近的帧内(infraframe)编码画面进行解码、再现图像、并且对再现的图像进行排列,从而产生视频索引。
此外,还设置有:记录介质,所述的记录介质包括存储诸如数字A/V数据的数字数据的数据存储区、以及用于存储视频索引的视频索引存储区,以及视频索引显示器,用于显示视频索引,其中,再现的图像按照时间顺序排列。恢复的图像被最小化,并且按照时间顺序,以图标的形式排列。
当确定GOP的第一双向预测编码画面的后向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值时,控制器检测在第一双向预测编码画面中的场景变化。当确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值时,控制器检测在第二双向预测编码画面中的场景变化。当确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及第二双向预测编码画面的前向运动补偿插入宏块的数量等于或者大于预定的阈值时,控制器检测位于第二双向预测编码画面之后的帧内编码画面或者帧内前向预测编码画面中的场景变化。
控制器控制该装置,从而当输入选择信号来在显示的视频索引的恢复图像中选择预定的图像时,可以从选择的位置再现记录的数字广播节目。
本发明的另一实施例提出了一种用于记录和再现数字广播节目的数字数据记录和/或再现装置,例如数字A/V数据记录和/或再现装置的控制方法。所述的方法包括步骤:将输入的视频节目数据划分为多个画面组(GOP);计算每一个GOP的双向预测编码画面的前向运动补偿插入宏块的数量、以及后向运动补偿插入宏块的数量;依据前向和后向运动补偿插入宏块的计算得到的数量,检测场景变化的发生点;并且对离检测到场景变化点的帧最近的帧内编码画面进行解码,从而恢复图像,并且按照使恢复的图像以时间顺序排列的方式来产生视频索引。
场面变化点检测步骤通过确定运动补偿插入宏块的数量低于预定的阈值,确定在GOP中存在具有场景变化的帧。场景变化点检测步骤通过确定前向运动补偿插入宏块的数量和后向运动补偿插入宏块的数量之间的差大于预定的阈值,确定在GOP中存在具有场景变化的帧。
场景变化点检测步骤通过确定GOP的第一双向预测编码画面的后向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值,从而确定在GOP的第一双向预测编码画面中存在场景变化。场景变化检测步骤通过确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值,从而确定在GOP的第二双向预测表面画面中存在场景变化。场景变化点检测步骤通过确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的前向运动补偿插入宏块的数量等于或者大于预定的阈值,从而确定在GOP的第二双向预测编码画面后面的帧内编码画面、或者帧内前向预测编码画面中存在场景变化。
视频索引产生步骤按照对在从整个视频节目中检测到场景变化点的帧内编码画面进行解码、再现、图标化、以及排列的方式,产生视频索引。
所述的方法还包括显示视频索引的步骤,在该步骤中,通过接收到的视频索引请求信号,将场景变化点的图标按照时间顺序排列。当输入选择信号来在显示的视频索引的恢复图像中选择预定的图像时,从选择的位置再现记录的数字广播节目。当在再现数字广播期间,输入“跳过”信号时,从最近的场景变化点的图标处再现该节目。
附图说明
参考附图,通过描述本发明的优选实施例,本发明的上述目的和其他特征将变得更加明显,
图1是依据本发明的一个实施例的数字广播接收机的方框图;
图2是图1中的场景变化检测器的方框图;
图3A到3C是示出A/V数据的画面组(GOP)的示意图;以及
图4是示出用于图1中的数字广播接收机的控制方法的流程图。
具体实施方式
下面将参考附图,详细描述本发明的特定实施例。
图1是通过实例,示出作为依据本发明的作为诸如数字A/V数据记录和/或者再现装置的数字数据记录和/或再现装置的数字广播接收机、或者机顶盒的方框图。
参考图1,依据本发明的实施例的数字广播接收机包括:网络接口模块(NIM)110、解复用器(DEMUX)120、预缓冲器130、场景变化检测器140、记录介质、MPEG解码器170、位缓冲器160、视频编码器(video encoder)180、脉冲编码调制器(PCM)190。
NIM110将从卫星接收到的节目数据解调为数字信号。在本实例中,数字信号是几个频道的广播节目的合成信号。DEMUX120依据用户的选择,从广播节目中选择节目数据,并且将选择的数据传输到广播接收器。如果用户没有选择对他/她选择的节目进行记录,则将选择的节目数据传输到MPEG解码器170,然而,如果用户选择记录该节目,则将该节目数据临时存储在预缓冲器130中。在预缓冲器130中积累的数据通过场景变化检测器140,存储到记录介质中。优选的是,使用硬盘150作为记录介质。
如果用户输入再现命令来再现存储于硬盘150中的节目,则将节目数据传输到位缓冲器160,并且然后将该节目数据施加到MPEG解码器170。然后,MPEG解码器170对MPEG数据进行解码,从而使解码后的MPEG数据中的视频数据通过视频编码器180,输出到TV屏幕,而使音频数据经由PCM190,通过扬声器来输出。
同时,场景变化检测器140产生视频索引,所述的视频索引由接收到的广播节目中存在场景变化的点的图像组成。视频索引是执行导航功能的导航数据的一个实例。现在参考图2,场景变化检测器140包括:控制器141,用于从输入视频数据中检测场景变化点;以及视频索引产生器142,用于对离检测到的场景变化点最近的帧内编码画面进行解码,从而产生其中按照时间顺序排列再现的图像的视频索引。
硬盘150或者记录介质包括:A/V数据记录区151,其中记录通过场景变化检测器140的节目的A/V数据;以及视频索引存储区152,其中存储在视频索引产生器142中产生的视频索引。
当通过用户接口输入视频索引请求信号时,在视频索引显示器153上显示在视频索引存储区152中存储的视频索引。最好按照使作为图标的检测到的场景变化点的图像依据时间顺序排列的形式来显示视频索引。对于视频索引显示器153,使用通过其输出视频数据的、诸如TV屏幕的屏幕。
视频索引只显示场景变化的发生点的图像,因此,该视频索引向用户提供能够有效地帮助用户进行搜索的信息。
同时,考虑到接收到的广播节目都处于按照MPEG格式的压缩形式,依据本发明的一个实施例对场景变化点的检测使用画面组(GOP)的双向预测编码画面的宏块类型,并且不对所有的帧进行解码。
下面将参考图3A到3C描述以上的方面,图3A到3C是示出GOP的帧内编码画面、或者帧内前向预测编码画面、以及双向预测编码画面的示意图。
如图3A到3C所示,在GOP的特定部分中场景发生变化主要存在三种情况。S2表示发生场景变化的画面。
图3A示出了第一种情况,其中,场景变化发生在第一双向预测编码画面(B1)。在这种情况下,存在后向运动补偿。图3B示出了第二种情况,其中,场景变化发生在第二双向预测编码画面(B2)。在这种情况下,运动补偿方向在场景发生变化的双向预测编码画面(B2)的前面和后面相反地改变。最后,在图3C中示出了第三种情况,其中,场景变化发生在第二双向预测编码画面(B2)后面的帧内编码画面(I2)或者帧内前向预测编码画面(P2)。在这种情况下,进行前向运动补偿。如所描述的,通过使用宏块类型信息,检测场景变化点。
图4是示出通过使用GOP的双向预测编码画面的宏块类型来检测场景变化点的场景变化检测算法的流程图。通过使用场景变化检测算法,进行检测场景变化、给输入图像建立索引、以及记录和再现这些图像的过程。下面将参考图1、2和4,对这些过程进行详细描述。
首先,通过NIM110输入广播信号,并且将该广播信号施加到DEMUX120,从而依据用户选择,通过DEMUX120选择复用的广播节目的其中之一。如果存在针对选择的节目的记录命令,则通过预缓冲器130将该节目数据输入到场景变化检测器140。
由于输入到场景变化检测器140的节目数据处于按照MPEG格式的压缩形式,因此,为了简化对处于压缩区中的场景变化点的计算,对GOP(画面组)单元中的双向预测编码画面的运动补偿插入宏块的数量Nint进行计算。
后向或者前向插入宏块的数量表示双向预测编码画面与前一个或者后一个帧内编码画面、或者与帧内前向预测编码画面的相关性。换句话说,如果插入宏块的数量Nint小于预定的阈值,则可以确定存在场景变化。同时,对于在GOP某部分中的场景变化,插入宏块更大地朝向特定的方向,例如更大地朝着向后、或者更大地朝着前向的方向进行运动补偿。因此,在操作S20中,如果插入宏块的数量Nint等于或者小于阈值T0,则确定对应的GOP包括场景变化点。在操作S30中,如果前向和后向运动补偿插入宏块的数量之间的差Ndif等于或者大于阈值T1,则确定在对应的GOP的某部分中存在场景变化。Nint等于或者大于T0、或者Ndif等于或者小于T1,则表示在对应的GOP中不存在场景变化,因此,在操作S70中,对下一个GOP进行场景变化检测。
在操作S40中,如果包括场景变化的GOP的第一双向预测编码画面的后向运动补偿插入宏块的数量NB1、以及包括场景变化的GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量NB2等于或者大于阈值T2,则表示在两个双向预测编码画面中的后向运动补偿都较大。换句话说,参考图3A所示的在两个双向预测编码画面中都较大的后向运动补偿,在操作S41中,可以确定场景变化发生在第一双向预测编码画面中。假定GOP的第一双向预测编码画面为帧号“t”,则可以确定场景变化发生在帧号“t”。
在操作S50中,如果第一双向预测编码画面的前向运动补偿插入宏块的数量NF1等于或者大于阈值T2,以及第二后向预测编码画面的后向运动补偿插入宏块的数量NB2等于或者大于阈值T2,则表示如图3B所示,在第一双向预测编码画面中的前向运动补偿较大,而在第二双向预测编码画面中的后向运动补偿较大。由于在第一双向预测编码画面中的前向运动补偿较大,并且在第二双向预测编码画面中的后向运动补偿较大,因此,在操作S51,可以确定场景变化发生在第二双向预测编码画面中。换句话说,确定场景变化已经发生在帧号t+1。
在操作S60中,如果第一双向预测编码画面的前向运动补偿插入宏块的数量NF1的数量等于或者大于阈值T2,以及第二双向预测编码画面的前向运动补偿插入宏块的数量NF2等于或者大于阈值T2,则在第一和第二双向预测编码画面中的后向运动补偿都较大。因此,在操作S61中,如图3C所示,可以确定场景变化发生于跟在双向预测编码画面之后的帧内编码画面或者帧内前向预测编码画面中。换句话说,确定场景变化已经发生在帧号t+2中。
如以上所描述的,通过检测各个GOP的场景变化点,可以检测整个节目中的场景变化点。将检测到的场景变化点记录在头位置信息(headerposition information)中。即,将头类型信息包括在头位置信息中的前两个比特中,以便表示它是场景变化头、画面头、还是GOP头。通过使用头类型信息,视频索引产生器142产生视频索引。即,对离每一个场景变化点最近的帧内编码画面进行编码,从而可以恢复场景变化点的图像,并且使被恢复的图像按照时间顺序排列。将被恢复的图像最小化为图标的形式,并且按照图标形式排列。将产生的视频索引存储在硬盘150的视频索引存储区域152中,并且将节目数据存储在A/V存储区151中。
当接收到通过用户接口输入的视频索引请求信号时,在诸如屏幕的视频索引显示器153上显示存储的视频索引。通过观看按照时间顺序排列的视频索引的恢复图像,用户定位他/她想要观看的点,并且选择对应的图标。当输入选择信号时,控制器141从由用户选择的点,开始再现节目。
在节目再现期间,当输入前跳或者快进命令时,将再现从当前点跳到下一个最近的图像图标,然后重新开始再现。此外,当在节目再现期间,输入后跳或者倒退(rewind)命令时,再现从当前点跳到前一个最近的图像图标,然后重新开始再现。图像图标的跳过点(skipping point)对应于输入跳过信号的数量。如果输入自动搜索信号,可以通过在场景变化点的跳跃,进行再现。
按照如下方式执行节目的再现。
首先,当用户通过使用在硬盘150上记录的特定节目的视频索引,输入再现信号时,将存储在A/V存储区151中的节目数据读取到位缓冲器160,然后将该数据输入到MPEG解码器170。MPEG解码器170对压缩的MPEG数据进行解码,以便将恢复的A/V数据分别通过视频编码器输出到TV屏幕,以及通过PCM输出到扬声器。
对于按照MPEG-2格式压缩、并且由300个宏块且尺寸为320×240的3000个帧组成的广播流,通过使用依据本发明的实施例的场景变化检测算法,进行场景变化点的检测。作为检测的结果,检测到24次场景变化,而实际发生了26次场景变化,因此,精确度为92.3%,并且具有零个错误。
依据本发明的优选实施例,通过检测在广播节目的压缩区域中的场景变化,提供了导航功能,而不需要对压缩的广播节目中的所有帧进行解码。因此,不需要高质量的系统和存储空间来进行大量的计算,而是对场景变化进行检测,并且将在存储接收到的节目期间实时地检测到的场景变化点与视频索引一起进行存储。因此,可以有效地存储大量的多媒体数据,并且增加了用户友好度。
虽然已经对本发明的几个实施例进行了描述,本领域的技术人员将会理解:本发明不应该局限于所描述的实施例,而是在不脱离由所附权利要求所限定的本发明的精神和范围的情况下,可以进行各种改变和修改。
Claims (18)
1.一种用于记录和再现按照压缩格式的输入的数字广播节目的数字数据记录和/或再现装置,包括:
控制器,用于计算数字数据的画面组(GOP)的双向预测编码画面的前向运动补偿插入宏块、以及后向运动补偿插入宏块的数量,并且依据计算得到的数量,检测场景变化的发生点;以及
视频索引产生器,用于通过对离每一个GOP的场景变化的检测点最近的帧内编码画面进行解码、再现图像、以及对再现的图像进行排列,从而产生视频索引。
2.根据权利要求1所述的数字数据记录和/或再现装置,其特征在于:还包括记录介质,所述的记录介质包括:用于存储数字数据的数据存储区;以及用于存储视频索引的视频索引存储区。
3.根据权利要求1所述的数字数据记录和/或再现装置,其特征在于:还包括视频索引显示器,用于显示视频索引,其中,再现的图像按照时间顺序排列。
4.根据权利要求3所述的数字数据记录和/或再现装置,其特征在于:对恢复的图像进行最小化,并且按照图标的形式排列。
5.根据权利要求1所述的数字数据记录和/或再现装置,其特征在于:控制器通过确定GOP的第一双向预测编码画面的后向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值,检测在第一双向预测编码画面中的场景变化。
6.根据权利要求1所述的数字数据记录和/或再现装置,其特征在于:控制器通过确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值,检测在第二双向预测编码画面中的场景变化。
7.根据权利要求1所述的数字数据记录和/或再现装置,其特征在于:控制器通过确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及第二双向预测编码画面的前向运动补偿插入宏块的数量等于或者大于预定的阈值,检测在第二双向预测编码画面的后面的帧内编码画面、或者帧内前向预测编码画面中的场景变化。
8.根据权利要求1所述的数字数据记录和/或再现装置,其特征在于:控制器进行控制,从而当输入选择信号来在显示的视频索引的被恢复的图像中选择预定的图像时,可以从选择的位置再现记录的数字广播节目。
9.一种用于记录和再现数字广播节目的数字数据记录和/或再现装置的控制方法,包括步骤:
将输入的视频节目数据划分为多个画面组(GOP),并且计算每一个GOP的双向预测编码画面的前向运动补偿插入宏块的数量、以及后向运动补偿插入宏块的数量;
依据计算得到的前向和后向运动补偿插入宏块的数量,检测场景变化的发生点;
对离检测到场景变化点的帧最近的帧内编码画面进行解码,从而恢复图像;以及
以被恢复的图像按照时间顺序排列的方式,产生视频索引。
10.根据权利要求9所述的控制方法,其特征在于:场景变化点检测步骤通过确定运动补偿插入宏块的数量小于预定的阈值,确定在GOP中存在具有场景变化的帧。
11.根据权利要求9所述的控制方法,其特征在于:场景变化点检测步骤通过确定前向运动补偿插入宏块的数量和后向运动补偿插入宏块的数量之间的差大于预定的阈值,确定在GOP中存在具有场景变化的帧。
12.根据权利要求9所述的控制方法,其特征在于:场景变化点检测步骤通过确定GOP的第一双向预测编码画面的后向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值,确定在GOP的第一双向预测编码画面中存在场景变化。
13.根据权利要求9所述的控制方法,其特征在于:场景变化点检测步骤通过确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的后向运动补偿插入宏块的数量等于或者大于预定的阈值,确定在GOP的第二双向预测编码画面中存在场景变化。
14.根据权利要求9所述的控制方法,其特征在于:场景变化点检测步骤通过确定GOP的第一双向预测编码画面的前向运动补偿插入宏块的数量、以及GOP的第二双向预测编码画面的前向运动补偿插入宏块的数量等于或者大于预定的阈值,确定在GOP的第二双向预测编码画面后面的帧内编码画面或者帧内前向预测编码画面中存在场景变化。
15.根据权利要求9所述的控制方法,其特征在于:视频索引产生步骤按照对从整个视频节目中检测到的场景变化点上的帧内编码画面进行解码、再现、图标化、以及排列的方式,产生视频索引。
16.根据权利要求15所述的控制方法,其特征在于:还包括当接收到视频索引请求信号时,显示其中场景变化点的图标按照时间顺序排列的视频索引的步骤。
17.根据权利要求16所述的控制方法,其特征在于:当输入选择信号来在显示的视频索引的恢复图象中选择预定的图像时,从选择的位置再现记录的数字广播节目。
18.根据权利要求15所述的控制方法,其特征在于:当在再现数字广播期间输入跳过信号时,从场景变化点的最近的图标再现节目。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR200262378 | 2002-10-14 | ||
KR1020020062378A KR100794797B1 (ko) | 2002-10-14 | 2002-10-14 | 디지털 a/v 데이터의 기록/재생 장치 및 그 제어방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1497973A true CN1497973A (zh) | 2004-05-19 |
CN1284366C CN1284366C (zh) | 2006-11-08 |
Family
ID=32041005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003101013104A Expired - Fee Related CN1284366C (zh) | 2002-10-14 | 2003-10-14 | 用于记录和/或再现数字数据的装置及其控制方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7305171B2 (zh) |
EP (1) | EP1411522A3 (zh) |
KR (1) | KR100794797B1 (zh) |
CN (1) | CN1284366C (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1955964B (zh) * | 2005-10-28 | 2010-09-29 | 乐金电子(中国)研究开发中心有限公司 | 视频检索方法 |
CN1972420B (zh) * | 2005-09-13 | 2011-01-19 | 索尼株式会社 | 信息处理装置和方法 |
CN1574930B (zh) * | 2003-05-23 | 2011-05-18 | Lg电子有限公司 | 再现视频内容的装置及方法 |
US8064750B2 (en) | 2004-10-12 | 2011-11-22 | Hitachi, Ltd. | Picture reproducing apparatus |
CN102318203A (zh) * | 2008-11-12 | 2012-01-11 | 汤姆逊许可证公司 | 光变编码 |
US9210431B2 (en) | 2008-11-13 | 2015-12-08 | Thomson Licensing | Multiple thread video encoding using GOP merging and bit allocation |
CN105744270A (zh) * | 2014-12-10 | 2016-07-06 | 中国移动通信集团公司 | 一种带云台的视频编码方法及装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100643273B1 (ko) * | 2004-05-27 | 2006-11-10 | 삼성전자주식회사 | 비디오 워터마킹 방법 및 장치와, 비디오 워터마킹을 이용한 비디오 콘텐츠 보호방법 및 장치 |
JP2006014091A (ja) * | 2004-06-28 | 2006-01-12 | Matsushita Electric Ind Co Ltd | 画像音声ストリーム処理装置 |
US20060258308A1 (en) * | 2005-05-10 | 2006-11-16 | Fassbender Charles J | Electronic device for interleaving program segments and skipping program breaks from two radio/TV broadcasts |
US20080013829A1 (en) * | 2006-03-28 | 2008-01-17 | Stebbings David W | System and method for the identification of motional media in players and recorders without Internet access |
KR100796392B1 (ko) * | 2006-06-15 | 2008-01-22 | 삼성전자주식회사 | 스포츠 동영상에서의 네비게이션 정보 생성 방법 및 그장치 |
JP4719889B2 (ja) * | 2006-08-03 | 2011-07-06 | 国立大学法人電気通信大学 | カット点検出システムおよび該カット点検出システムを用いたショット識別システム、カット点検出方法、並びにカット点検出プログラム |
US20110216828A1 (en) * | 2008-11-12 | 2011-09-08 | Hua Yang | I-frame de-flickering for gop-parallel multi-thread viceo encoding |
CN104184712A (zh) * | 2013-05-24 | 2014-12-03 | 成都林海电子有限责任公司 | 一种具有加密解密机的vsat信关站及加密解密机的加密解密方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0530463A (ja) * | 1991-07-19 | 1993-02-05 | Toshiba Corp | 動画像管理装置 |
JPH08249348A (ja) * | 1995-03-13 | 1996-09-27 | Hitachi Ltd | 映像検索方法および装置 |
US5774593A (en) * | 1995-07-24 | 1998-06-30 | University Of Washington | Automatic scene decomposition and optimization of MPEG compressed video |
EP0780844A3 (en) | 1995-12-21 | 2002-03-20 | Siemens Corporate Research, Inc. | Cut browsing and editing apparatus |
JP3599909B2 (ja) | 1996-07-30 | 2004-12-08 | 三洋電機株式会社 | 動画像符号化装置 |
JP3599942B2 (ja) | 1997-02-13 | 2004-12-08 | 三洋電機株式会社 | 動画像符号化方法、及び動画像符号化装置 |
JP2001526859A (ja) | 1997-05-16 | 2001-12-18 | ザ トラスティーズ オブ コロンビア ユニヴァーシティ イン ザ シティ オブ ニューヨーク | ワールドワイドウェブ上の圧縮映像の指示及び編集方法及びアーキテクチュア |
KR100249829B1 (ko) * | 1997-11-25 | 2000-03-15 | 이계철 | 엠펙-2 비트열 상에서 계층적 구조를 갖는 장면전환 검출 방법 |
US7035526B2 (en) | 2001-02-09 | 2006-04-25 | Microsoft Corporation | Advancing playback of video data based on parameter values of video data |
KR100480028B1 (ko) * | 2002-05-07 | 2005-03-30 | 엘지전자 주식회사 | 장면 변화 신택스 엘리먼트 추가에 의한 b 픽쳐의 개선된다이렉트 예측 방법 |
-
2002
- 2002-10-14 KR KR1020020062378A patent/KR100794797B1/ko not_active IP Right Cessation
-
2003
- 2003-10-14 US US10/683,457 patent/US7305171B2/en not_active Expired - Fee Related
- 2003-10-14 EP EP03023076A patent/EP1411522A3/en not_active Withdrawn
- 2003-10-14 CN CNB2003101013104A patent/CN1284366C/zh not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1574930B (zh) * | 2003-05-23 | 2011-05-18 | Lg电子有限公司 | 再现视频内容的装置及方法 |
US8064750B2 (en) | 2004-10-12 | 2011-11-22 | Hitachi, Ltd. | Picture reproducing apparatus |
CN1972420B (zh) * | 2005-09-13 | 2011-01-19 | 索尼株式会社 | 信息处理装置和方法 |
CN1955964B (zh) * | 2005-10-28 | 2010-09-29 | 乐金电子(中国)研究开发中心有限公司 | 视频检索方法 |
CN102318203A (zh) * | 2008-11-12 | 2012-01-11 | 汤姆逊许可证公司 | 光变编码 |
CN102318203B (zh) * | 2008-11-12 | 2014-10-08 | 汤姆逊许可证公司 | 用于编码包含光变的视频帧的方法及设备 |
US9210431B2 (en) | 2008-11-13 | 2015-12-08 | Thomson Licensing | Multiple thread video encoding using GOP merging and bit allocation |
CN105744270A (zh) * | 2014-12-10 | 2016-07-06 | 中国移动通信集团公司 | 一种带云台的视频编码方法及装置 |
CN105744270B (zh) * | 2014-12-10 | 2019-01-01 | 中国移动通信集团公司 | 一种带云台的视频编码方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US7305171B2 (en) | 2007-12-04 |
KR20040033334A (ko) | 2004-04-28 |
KR100794797B1 (ko) | 2008-01-21 |
EP1411522A2 (en) | 2004-04-21 |
US20040131331A1 (en) | 2004-07-08 |
CN1284366C (zh) | 2006-11-08 |
EP1411522A3 (en) | 2004-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8457478B2 (en) | Method and apparatus for receiving, storing, and presenting multimedia programming without indexing prior to storage | |
KR100447200B1 (ko) | Pvr 지원 비디오 디코딩 시스템 | |
CN1208957C (zh) | 分层索引图像的方法及其设备 | |
CN1284366C (zh) | 用于记录和/或再现数字数据的装置及其控制方法 | |
US20070297685A1 (en) | Method and device for condensed image recording and reproduction | |
CN1149922A (zh) | 以非标准速度重放的数字盒式录象机 | |
CN1418010A (zh) | 记录数字广播节目并基于时间重放该节目的方法及其设备 | |
US20060039469A1 (en) | Scalable video compression based on remaining battery capacity | |
CN1229557A (zh) | 记录和重放电视图象的方法及设备 | |
CN1153457C (zh) | 用于特技播放的数字录像带的记录和重放方法及其装置 | |
KR100302027B1 (ko) | 최소하나의테이프헤드를가진디지탈비디오레코더및이레코더를이용한화상데이타기록방법 | |
US6373905B1 (en) | Decoding apparatus and decoding method | |
KR100187349B1 (ko) | 압축텔레비전신호기록재생장치 | |
CN1288906C (zh) | 低速重放数字广播节目的方法 | |
KR100535296B1 (ko) | 디지털방식으로코딩된비디오필름의원래의데이터를재생하는방법및그방법을수행하는장치 | |
JPH10336585A (ja) | 動画像記録/再生装置および動画像記録/再生方法 | |
CN1848936A (zh) | 记录装置 | |
JP2008283276A (ja) | 撮像装置 | |
CN1571500A (zh) | 控制数字视频数据的比特率的方法和装置 | |
JP3176020B2 (ja) | マルチチャネル記録再生装置 | |
JP2003299022A (ja) | 映像データ蓄積、再生システム及び映像データ蓄積、再生方法 | |
JP2004112104A (ja) | 符号化ビットストリームの記録方法及び記録装置 | |
JPH09172607A (ja) | 記録装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20061108 Termination date: 20181014 |
|
CF01 | Termination of patent right due to non-payment of annual fee |