CN103686344B - 增强视频系统及方法 - Google Patents
增强视频系统及方法 Download PDFInfo
- Publication number
- CN103686344B CN103686344B CN201310569431.5A CN201310569431A CN103686344B CN 103686344 B CN103686344 B CN 103686344B CN 201310569431 A CN201310569431 A CN 201310569431A CN 103686344 B CN103686344 B CN 103686344B
- Authority
- CN
- China
- Prior art keywords
- video
- input video
- enhancing
- information
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000002708 enhancing effect Effects 0.000 claims abstract description 164
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 10
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 claims description 6
- 230000032683 aging Effects 0.000 claims description 5
- 238000005728 strengthening Methods 0.000 claims description 5
- 230000000750 progressive effect Effects 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 2
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000002452 interceptive effect Effects 0.000 description 9
- 230000003993 interaction Effects 0.000 description 8
- 238000003860 storage Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000003362 replicative effect Effects 0.000 description 5
- 230000004069 differentiation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000000275 quality assurance Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010068052 Mosaicism Diseases 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8227—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种增强视频系统及方法,该方法用于向至少一用户提供增强视频系统。所述方法包括接受第一输入视频,接收第一输入视频从而获取与输入视频关联的多维信息,该方法还包括获取基于用户行为的用户推荐信息,创建基于关联输入视频和用户推荐的多维信息的增强视频信息,进一步地,该方法还包括关联增强视频信息和第一输入视频,从而创建第一输入视频的增强视频,并向用户播放该增强视频。
Description
技术领域
本发明涉及视频技术,尤其涉及增强视频播放技术及交互系统。
背景技术
现在视频已经成为互联网的主要交互手段。但是,人们的视频交互由于视频结构的复杂性仍受到很大的限制。图1所示是利用现有技术处理视频的方式,正如图1所示,视频结构被划分成场景,进而可以分为镜头,再分为帧,帧可进一步划分为对象。
但有时候,上述视频结构不必然反映视频的其它信息,例如,标题的故事情节结构有时候比视频结构更重要。另外,上述视频结构往往缺少视频和观众的社会方面信息。
本发明公开的方法和系统是针对解决一个或多个上面所述的问题或者其它问题。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供增强视频播放技术及交互系统,旨在解决目前问题。
本发明的技术方案如下:
本公开一方面包括针对至少一个用户的增强视频服务的方法。该方法包括接收第一输入视频,处理所接收的第一输入视频从而获取与第一输入视频相关联的多维信息。该方法还包括获取基于用户行为的用户推荐信息,创建基于与第一输入视频和用户推荐信息相关联的多维信息的增强视频信息,进一步的,所述方法还包括关联增强视频信息与第一输入视频,创建第一输入视频的增强视频,并向用户播放增强视频。
本公开另一方面包括用于向至少一个用户提供增强视频服务的增强视频系统。所述增强视频系统包括增强视频处理模块、推荐模块、增强视频发生器和增强视频渲染器。增强视频处理模块用于接收第一输入视频,通过处理所接收的视频获取与所述输入视频相关联的多维信息。推荐模块用于获取基于用户行为的用户推荐信息。进一步的,增强视频发生器用于基于与输入视频和用户推荐信息相关联的多维信息来创建增强视频信息。也用于关联增强视频信息与第一输入视频来创建第一输入视频的增强视频。增强视频渲染器用于向用户播放增强视频。
本领域技术人员可通过公开的说明书、权利要求书、说明书附图来理解本公开的其它方面。
附图说明
图1所示为一现有的视频处理方法。
图2所示的是结合本发明实施例的一典型环境。
图3所示的是与本发明实施例对应的一典型计算系统。
图4所示的是与本发明实施例对应的一典型增强视频系统。
图5所示的是与本发明实施例对应的一典型的增强视频系统创建过程。
图6所示的是与本发明实施例对应的一典型增强视频使用方案。
图7所示的是与本发明实施例对应的另一典型增强视频使用方案。
图8所示的是与本发明实施例对应的另一典型增强视频使用方案。
图9所示的是与本发明实施例对应的一典型增强视频操作过程。
具体实施方式
下面将结合实施例和附图对本发明进行详细的说明,在任何可能的情况下,整个附图中,相同的附图标记用于指代附图中相同或相近的部分。
如图2所示的是与本发明实施例对应的一个典型环境200。如图2所示,环境200包括电视机(TV)202、终端设备204、服务器206、用户208和通信网络210。其它设备也可能包含其中。
电视机202可包括任何适当类型的电视机,例如等离子电视机、LCD电视机、背投电视机、非智能电视机或智能电视机。电视机202还可包括其它计算系统,例如个人电脑(PC)、平板电脑或手持电脑或者是智能手机等。进一步地,电视机202可以是任何适当的能在一个或多个频道提供多个节目的内容呈现设备。
终端设备204可包括任何适当类型的终端,例如智能手机、笔记本电脑、平板电脑、个人计算机,或任何有线或无线终端设备。
进一步地,服务器206可包括任何适当形式的服务器计算机或用于向用户208提供增强视频内容的多个服务器计算机。服务器206也可针对环境200中的各组成部分进行通信、数据存储、数据处理。电视机202、终端设备204和服务器206之间可通过一个或多个通信网络210进行通信连接,例如有限电视网络、电话网络和/或卫星网络等。
用户208可与电视机202通过一遥控器进行交互,从而观看各种节目和执行各节目间的交互,或者如果电视机202中设置有运动传感器或深度摄像头,用户可仅使用手或身体姿势来控制电视机202。用户208可以是单个用户或者多个用户,例如家庭全体成员一起观看电视节目或其它视频节目。
同时,用户也可通过对终端设备204的访问或交互来使电视机202显示相同或不同的视频节目。例如,环境200可支持多屏幕(N-screen)配置,用户208可在同一设备上或不同设备上访问多个屏幕来观看视频节目或与视频节目相关的信息。换言之,电视机202和终端设备204仅仅是用来实现节目播放功能,只要用户208能够访问多个设备进行观看、交互、实现设备间的转换,任意数量的电视机、电脑或者终端设备均可用于多屏幕配置。
电视机202,终端设备204和/或服务器206可在任何适当的计算平台上实现。图3所示的是一能执行电视机202、终端设备204和/或服务器206功能的典型计算系统300的框图。
如图3所示,计算系统300可包括处理器302、存储介质304、显示器306、通信模块308、数据库310和外围设备312。某些设备可能被省略,其它设备也可包含其中。
处理器302可包括任何适当的处理器或处理器组。进一步地,处理器302可包括用于多线程或并行处理的多个核心。存储介质304可包括存储模组,例如ROM,RAM,闪存模组和大容量存储器,例如CD-ROM和硬盘等等。存储介质304可存储用于执行各种进程的计算机程序,该计算机程序可被处理器302执行。
进一步地,外围设备312可包括各种传感器和I/O设备,例如键盘和鼠标,通信模块308可包括用以通过通信网络建立连接的目标网络接口设备。数据库310可包括一个或多个用于存储目标数据,对存储数据进行某些操作的数据库,例如数据库检索。
电视机202、终端设备204和/或服务器206可实现增强视频系统向用户208提供个性化视频服务功能,图4所示的是与本发明实施例对应的一典型增强视频系统400。
如图4所示,增强视频系统400包括视频渲染器402、视频内容数据库404、增强视频数据库406、增强视频变换器408、增强视频渲染器410、增强视频发生器412、推荐系统414、用户行为分析模块416、众包系统(Crowdsourcing System)418、提取和检测模块420和识别和检索模块422。某些组件可能被省略,其它组件也可包含其中。
来自任何适当类型视频资源的一输入视频被提供给所述增强视频系统400。提取和检测模块420包括用于从输入视频进行对象提取的对象提取模块、用于从输入视频进行集锦提取的集锦提取模块、用于发现用户兴趣点的热点标题检测模块。
进一步地,识别和检索模块422包括用于处理所述提取和检测模块420所提供的信息的某些功能单元。例如,识别和检索模块422可包括对象识别单元、图像检索单元和信息/广告检索单元,所述信息/广告检索单元用于执行对象识别和图像/消息/广告检索从而查找到最匹配的视觉对象或热点标题。提取和检测模块420和识别和检索模块422可被统称为增强视频处理模块,其用于接收输入视频并获取关于输入视频的多维信息。
为提高系统的精确性,众包系统418在检测/识别兴趣点工作加入质量保证(QA)过程。进一步地,用户行为分析模块416可监视用户间的交互,检测用户的情绪,评估用户行为模式(例如使用遥控器的模式,上网模式或观看视频节目模式),从而确定用户的行为与他/她的偏好之间的关系,用户行为分析模块416的用户分析结果可输出到其它模块或单元,例如推荐系统414。
推荐系统414可拼凑所有相关的与兴趣点对应的个性化推荐信息。进一步地,增强视频发生器412通过将上述附加信息(即,增强视频信息)与输入视频相关联创建一对应于输入视频的增强视频。这里所述增强视频涉及一种交互式视频格式方案,该方案能够使用户与视频在多个不同维度或方面进行交互。例如,增强视频信息可使用户在对象层面、故事线索层面和社交层面的三个维度进行互动。用户、用户好友和家庭成员在社交层面的互动可丰富视频,使其成为难忘的个人体验。也就是说,增强视频使得用户可访问、控制和/或调整在输入视频、输入视频的故事线索、与输入视频关联的个人与商业等方面中的对象。
增强视频可经由增强视频渲染器410进行播放,增强视频渲染器也可处理包括多屏幕系统(包含多个显示单元的计算机系统,例如多屏互动系统)设置在内的所有场景显示设置操作。
进一步地,存储增强视频数据库可被增强视频系统400用于进一步增强其它类似输入视频。具体的说,视频内容数据库404接收并存储有来自于各种资源(资源1,资源2……资源n)的视频。视频渲染器402可播放视频内容数据库404中的输入视频。
进一步地,针对一输入视频,增强视频变换器408可检测在增强视频数据库406中是否已经存在与输入视频相匹配的相应增强视频。任何适当的匹配标准均可使用。例如,对增强视频的视频部分与输入视频间的相似性超过一预设阈值时,或者当两个视频的某些指纹类型对比时,进行匹配度的检测。进一步地,针对两个视频的匹配可以连续执行,以便从现有的增强视频中产生相应的增强视频信息。
上述匹配或部分匹配成功后,增强视频变换器408可将匹配或部分匹配的增强视频信息与输入视频进行关联,从而创建增强视频并发送所创建的增强视频到增强视频渲染器410中播放带有增强视频信息的输入视频,即增强输入视频。
在实际操作中,增强视频系统400(例如各种组件,处理器302等等)可执行某些进程,用以向用户提供增强视频服务。图5所示的是一典型的增强视频产生过程500。
图5所示的是,开始后,输入视频被提供给增强视频系统400(S502),增强视频系统400(例如提取与检测模块420)处理所接收到的输入视频,获取与该输入视频相关联的对象信息(S504)。具体为,增强视频系统400使用代表各种类别的训练模型对输入视频进行对象检测用以检测受关注的对象,例如人脸、汽车、皮包、布料等。
进一步地,系统400对输入视频进行对象识别,从而识别所检测到的对象。若系统400识别出所检测到的对象,将统一资源定位符URL与所识别的对象及对应典型用户针对所识别对象的需求的信息进行关联,该信息包括搜索信息、推荐信息和采购信息等;
若系统400未识别所检测到的对象,系统400使用图像检索引擎从数据库或网络上查找与所检测的对象特征类似的对象,将所查找到的特征类似对象与URL及对应该特征类似对象的信息进行关联。另外,系统400也可使用广告检索引擎通过关键字匹配等将相关广告与所检测到的对象建立链接。
进一步地,系统400(例如集锦提取模块)可提取视频集锦,所述视频集锦是一组用户喜欢或感兴趣的视频片段,即视频的重要时刻。这些集锦可在用户观看输入视频后再次被访问。视频集锦可代表输入视频的故事线索。
系统400(例如热点标题检测模块)也可提取热点标题,例如反映视频字幕中某些话题的主旨。如果视频字幕不可用,从输入视频的图像序列中进行光学字符识别(OCR)处理提取内嵌字幕,或者进行语音检测和语音文本转换来获取字幕。
获取字幕之后,执行自然语言处理(NLP)将语句拆解为字词,然后字词经过一模板过滤,筛选出关键字,然后将关键字发送到维基网站(Wikis)或其它信息检索引擎来比较它们的社会关注度或社会知名度,例如一关键字是否在社会网络环境中被讨论过或广泛使用过,或者是否存在针对此关键字创建的维基页面。最后,筛选出排名最高关键字作为热点标题。系统400也会从信息检索引擎获取相关联的URL。
同时,系统400也可获取用户行为(S506)。用户行为包括逻辑运算(例如删除、跨页面导航),和物理操作(例如按压按钮,切换遥控器)等。用户行为可反映出用户的喜好或兴趣,系统会对用户行为历史进行深度挖掘以得到兴趣点(S508),因而上述信息可在创建或选择性呈现增强视频信息时加以利用。
此外,系统400可使用众包机制(例如向任意网络用户提交一公开性问题以便某些用户对该问题进行回答)激励网络志愿者来帮助加强通过上述方法自动产生的增强视频信息的质量保证。众包系统对志愿者支付一定的酬劳,从而激励志愿者工作。
基于所获取的部分或全部信息,例如对象、关键字、集锦、热点标题和用户兴趣及偏好,系统400可向用户在输入视频上推荐更多的项目(S510).然后,系统400在输入视频上生成增强视频信息。增强视频信息可包括全部或部分上述信息,例如对象、关键字、集锦、热点标题和用户兴趣及偏好,和针对广告、采购、搜索和社交的推荐项目(S512)。也就是说,增强视频信息可包括与输入视频有关的,对象层面的、故事线索层面和/或社交层面的多维信息。
之后,系统400可将增强视频信息与输入视频关联,从而产生输入视频的增强视频(S514)。
所提供的输入视频的视频序列用V={F1, F2, …, Fn}表示,其中,n是帧的总数,相应的增强视频可表示为{V, R}。其中增强视频信息R={R1, R2, …, Rn},其中每个R i 可表示为下列列表中一些或全部的信息:
·对象类型, 对象边界框 {Lx, Ly, Rx, Ry}, URL
·关键字, URL
·集锦帧部分
·热点标题
·推荐项目
因此,增强视频是输入视频的一个超集,包括能在输入视频上直接进行交互的附加信息,其是在不改变输入视频比特流的情况下,通过在视频层顶层添加关联信息层来实现。换言之,增强视频信息和输入视频可被分开存储,和/或可以在分别的数据流中播放。
进一步地,因为该消息层不受限于任何特定输入视频或特定用户,可灵活地包括不同层面不同量的信息,该消息层还是可分级的。消息层的可分级性至少表现在以下几个方面。
个人兴趣的可分级性:为实现个性化要求,针对不同的用户或用户群,各种消息的优先次序是不同的,因此当网络带宽受限时,系统可向观众仅传送有趣的消息。进一步地,基于用户的兴趣层面,信息按渐进顺序组织从而使个人兴趣可分级性得以实现。
时效性的可分级性:从增强视频的创建来看,有些信息可能通过自动进程产生,而有些信息则可能通过后期制作产生。因此,时效性要求高的信息可被及时的增加、删除,甚至被改变整个时间轴。
商业价值的可分级性:顾名思义,信息可根据商业价值设置优先级。
在推荐进程中,推荐项目顺序依据时效性和商业价值处理,从而使数据顺序组织方式只要是基于渐进方式,其可分级性便可实现。
进一步地,增强视频产生后,系统400可将增强视频储存在数据库中(S516)。系统400也可向用户播放该增强视频。因为增强视频包括实际的视频和增强视频信息,如果用户不进行选择或者不具有偏好操作,系统400可基于用户配置或默认配置确定一特定方式来呈现视频和增强视频信息。
例如,系统400可在电视机屏幕上播放视频,同时在另一单独屏幕上显示相应的增强视频信息,例如一移动终端屏幕。即所谓的多画面播放。或者系统400可在画中画模式或叠加模式中在同一屏幕上播放视频和显示增强视频信息。其它显示形式也可采用。
进一步地,系统400可分别向用户呈现视频和增强视频信息。例如,系统400可首先向用户播放视频,然后向用户显示增强视频信息,或者可先向用户显示增强视频信息,然后播放视频。任何适当方法均可采用。
播放也可是交互式的,在此交互播放期间,用户可与处于对象层面、故事线索层面和/或社交层面的系统400进行交互。图6所示的是一使用场景的增强视频。
如图6所示,输入视频是左边图上一拎着包的模特的场景,增强视频包括沿时间轴的3个连续帧(F1、F2、F3),每一帧包含对象和相关信息,上下文信息反映故事线索结构,社交评论和指纹信息(例如带标签的方框)。
尽管通过人为处理可获得筛选后结果,增强视频仍通过自动进程产生,自动进程可使用前述的方法例如视频语义对象提取、视频集锦提取、关键字和热点标题检测、人类行为分析、图像和对象检索、新闻和信息检索和个性化推荐等等来创建增强视频。
图7所示的是增强视频的播放方案。如图7所示的是使用多画面播放方法,视频节目在电视机上显示,另一方面,增强视频信息的消息层在移动设备上显示,该消息层与电视上显示的节目是同步的。
图8所示的是另一增强视频播放方案。如图8所示,一移动设备在视频播放结束后用于获取增强视频信息(带有对象/信息列表)。在这两种情况下,所显示的增强视频信息给予用户直接与视频中对象交互的机会,从而使得用户能完成对信息、采购或者社交等的搜寻。
增强视频信息创建以后,系统400对其他类似的视频使用有效的增强视频信息。图9所示的是与本发明实施例对应的一典型增强视频操作过程
如图9所示,系统400从多个视频资源中接收一输入视频(S902)。接收到输入视频后,系统400确定是否存在与该输入视频相对应的增强视频(S904)。
内容可有多种变化或者拷贝呈现多种显示方式。例如,视频标题可有许多不同的形式显示,例如某人录制的一分辨率甚至可能都不相同的模糊或低质量版本视频,或者中间插有广告和因为各种原因去除一些帧的版本等等,但是,系统400仅执行一次增强视频创建过程,然后将其自动部署到全部拷贝/演变版本上并使其适应于所有显示器。即增强视频变换器。换言之,使用增强视频变换机制,一组现有增强视频的演变版本可自动地、实时地与现有视频的拷贝/演变版本匹配,与各种播放条件匹配,代替了原来的针对每个拷贝和方案创建增强视频的方法。
也就是说,增强视频变换器用于增强视频和增强视频中包含的视频流的演变版本的同步。具体实施过程中,系统400进行视频拷贝的检索,确定输入视频是否是现有增强视频的拷贝或部分拷贝,即复制视频。
若输入视频不是现有视频的拷贝或部分拷贝,系统400创建一针对输入视频的增强视频,处理完成。另一方面,若输入视频是现有视频的拷贝或部分拷贝,系统400对输入视频与增强视频进行进一步匹配,以便增强视频信息能够用正确的时间戳对应等来重新覆盖该拷贝。
更为具体的是,基于Needleman-Wunsch 算法的TIRI-DCT用于查找现有视频与复制视频之间的对应时间戳。这里,增强视频用A=a 1 a 2 …a m 表示,复制视频用B=b 1 b 2 …b n 表示,其中a i (i=1, …, m) 和b j (j=1, …n)是每个视频帧的时空指纹。视频帧之间的图像相似度根据指纹间的相似度进行计算。并且,部分片段被定义为A i 和 B j ,其是分别包含A和B的第i和j个元素,即,A i =a 1 a 2 …a i 和B j =b 1 b 2 …b j (1≤i≤n and 1≤j≤n);定义S(i, j)是A i 和 B j .数列中最大值。
动态规划算法排列A和B如下:
开始:
S(i, j) 的0th行: S(0, j) = d × j, j=0, 1, 2, …, n
S(i, j)的0th列: S(i, 0) = d × i, i=1, 2, …, n
循环( 1<i≤n 和1<j≤n):
S(i, j) = 最大值[S(i-1, j-1) + 相似度(a i , b j ), S(i, j-1) + d, S(i-1,j) + d] (1)
在上述说明中,d代表视频帧与空白帧之间的相似度(即,无视频帧),该d可合理设为0或者一负值;相似度(a i , b j )表示a i 和 b j 指纹之间的相似度(其等于当a i 或b j 对应于空白帧时的d),相似度(a i , b j )通过计算两指纹向量间的欧几里德距离得出。
通过时间信息代表图像(temporally informative representative image)TIRI-DCT获取指纹。首先,TIRI图像通过双边滤波器将相邻帧(时间域)插入到当前帧来产生,然后图像被划分成N×N大小的重叠区块,其中N是区块的尺寸,每个区块使用2D-DCT进行处理。将每个区块的主要DCT系数用向量表示,即可得到当前帧的指纹向量。
当增强视频与复制视频间的相似度高于阈值时,系统400确定增强视频和复制视频匹配或部分匹配(S906,是),该进程继续。另一方面,如果输入视频与现有的增强视频完全不匹配(S906,否),系统400可进一步创建一对应于输入视频的新的增强视频(S908),进程完成。
一旦获取到相应的匹配,针对信息层用匹配的时间戳代替原始时间表,从而为复制视频导出增强视频信息(S910)。导出的增强视频信息随之与输入视频关联,从而创建输入视频的增强视频(S912)。这样,增强视频变换器模块可从数据资源中获取复制视频,并动态产生关联的增强视频信息层,当视频和信息层在同一显示器中呈现时,获取增强视频用户历史记录。然后,复制视频和关联的增强视频信息向用户播放(S914).
另外,系统400也可调整某些增强视频信息的优先级(S916)。例如,系统400基于使用数据及商业广告和用户喜好的因素赋予目标源信息更高的优先级。
通过本发明公开的系统和方法,可实现有益的个性化内容传送及交互应用。本发明的系统和方法提供一增强视频(丰富的视频),一个新的视频娱乐体验方案。在增强视频播放体验过程中,用户可与视频内容进行交互,从而搜索信息,完成买卖交易,获取服务体验。另一方面,增强视频根据交互过程学习了解用户的喜好,向用户提供个性化服务。因此,进行增强视频创建、部署和适应的自动化过程可被应用到异构网络与支持增强视频变换技术的终端中。针对众多视频内容版本,增强视频创建进程只需要其中之一即可,然后利用变化技术对创建的增强视频进行转换,使其适应于相同视频内容的其他版本。
本发明公开的系统和方法可进一步扩展到其它具有显示功能的设备例如手机、平板电脑、PC机、手表等上,从而使用户获得独一无二的交互体验。对本领域普通技术人员来说,根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (19)
1.一种向至少一个用户提供增强视频服务的方法,包括:
接收第一输入视频;
处理所接收到的第一输入视频,获取与第一输入视频相关联的多维信息;
获取基于用户行为的用户推荐信息;
创建基于所述多维信息的增强视频信息,所述增强视频信息与第一输入视频以及所述用户推荐信息相关联;
将增强视频信息与第一输入视频整合成增强视频,并向用户播放所述增强视频;
所述方法还包括:
从多个视频资源中接收第二输入视频;
确定所述第二输入视频是否与已创建增强视频的第一输入视频匹配;
当确定所述第二输入视频与第一输入视频匹配或部分匹配时,从所述第一输入视频的增强视频中导出所述第二输入视频的增强视频信息;将导出的增强视频信息与所述第二输入视频相关联从而创建一针对所述第二输入视频的增强视频;并向用户播放所述第二输入视频的增强视频。
2.根据权利要求1的方法,其中,所述多维信息包括所述第一输入视频中的对象信息、所述第一输入视频的故事线索和所述第一输入视频的社交信息。
3.根据权利要求1的方法,其中,处理所述第一输入视频进一步包括:
对所述第一输入视频进行对象提取,用以检测所述第一输入视频中的对象;
对所检测到的对象进行对象识别;
当所检测到的对象被识别时,将统一资源定位符URL与所识别的对象及对应典型用户针对所识别对象的需求的信息进行关联,该信息包括搜索信息、推荐信息和采购信息;
当所检测到的对象未被识别时,通过网络检索查找与所检测的对象特征类似的对象,将所查找到的特征类似对象与URL及对应该特征类似对象的信息进行关联。
4.根据权利要求3的方法,进一步包括:
提取所述第一输入视频的视频集锦来表现所述第一输入视频的故事线索。
5.根据权利要求4的方法,进一步包括:
提取所述第一输入视频的标题中的关键字;
将所述关键字发送到信息检索引擎,比较其社会关注度和社会知名度;选取最高排名的关键字作为所述第一输入视频的热点标题。
6.根据权利要求5的方法,其中,提取所述第一输入视频的标题中的关键字进一步包括:
当所述第一输入视频包含字幕时,从所述第一输入视频的字幕中提取第一输入视频的关键字;
当所述第一输入视频不包含字幕时,通过光学字符识别(OCR)处理提取所述第一输入视频的内嵌字幕,从所述第一输入视频的字幕中提取第一输入视频的关键字。
7.根据权利要求1的方法,其中,创建增强视频信息进一步包括:
按照渐进顺序组织所述增强视频信息以便实现个人兴趣的可分级性;
在推荐项目的渐进顺序中依据时效性和商业价值处理,以便实现时效性的可分级性和商业价值的可分级性。
8.根据权利要求1的方法,其中,向用户播放所述增强视频进一步包括:
在第一屏幕上播放所述第一输入视频;在不同于第一屏幕的第二屏幕上显示与所述第一输入视频同步的增强视频信息。
9.根据权利要求1的方法,其中,向用户播放所述增强视频进一步包括:
在一屏幕上播放所述第一输入视频;播放所述第一输入视频之后在该屏幕上显示所述增强视频信息。
10.根据权利要求1的方法,所述方法进一步包括:
当确定所述第二输入视频与第一输入视频完全不匹配时,对应所述第二输入视频创建一新的增强视频。
11.根据权利要求1的方法,其中,确定所述第二输入视频是否与第一输入视频匹配进一步包括:
确定所述第二输入视频是所述第一输入视频的拷贝或部分拷贝;基于所述第二输入视频与第一输入视频的指纹对二者进行匹配。
12.根据权利要求11的方法,其中,从所述第一输入视频的增强视频中导出所述第二输入视频的增强视频信息进一步包括:
在所述第一输入视频的增强视频信息中,使用原始时间戳替换视频时限相匹配的时间戳,从而从所述第一输入视频的增强视频中导出所述第二输入视频的增强视频信息。
13.一种向至少一个用户提供增强视频服务的增强视频系统,包括:
增强视频处理模块,用于接收第一输入视频并进行处理,获取与输入视频相关联的多维信息;
推荐模块,用于获取基于用户行为的用户推荐信息;
增强视频发生器,用于基于与输入视频和用户推荐信息相关联的多维信息来创建增强视频信息,同时用于将所述增强视频信息与所述第一输入视频相关联从而创建第一输入视频的增强视频;
增强视频渲染器,用于向用户播放所述增强视频;
所述的增强视频系统还包括:
视频内容模块,用于从多个视频资源中接收第二输入视频;
增强视频变换器,用于确定所述第二输入视频是否与已创建增强视频的第一输入视频匹配;
当确定所述第二输入视频与第一输入视频匹配或部分匹配时,从所述第一输入视频的增强视频中导出所述第二输入视频的增强视频信息;将导出的增强视频信息与所述第二输入视频相关联从而创建一针对所述第二输入视频的增强视频;并向用户播放所述第二输入视频的增强视频。
14.根据权利要求13所述的增强视频系统,其中,所述多维信息包括所述第一输入视频中的对象信息、所述第一输入视频的故事线索和所述第一输入视频的相关社交信息。
15.根据权利要求13所述的增强视频系统,其中,为处理输入视频,所述增强视频处理模块进一步用于:
对所述第一输入视频进行对象提取,用以检测所述第一输入视频中的对象;
对所检测到的对象进行对象识别;
当所检测到的对象被识别时,将统一资源定位符URL与所识别的对象及用以迎合对所识别对象的典型用户需求的相关信息进行关联,所述相关信息包括搜索信息、推荐信息和采购信息;
当所检测到的对象未被识别时,通过网络检索类似的对象与URL及所述相关信息进行关联。
16.根据权利要求15所述的增强视频系统,进一步包括:
提取所述第一输入视频的视频集锦来表现所述第一输入视频的故事线索;
提取所述第一输入视频的标题中的关键字;
将所述关键字发送到信息检索引擎,比较其社会关注度和社会知名度;选取最高排名的关键字作为所述第一输入视频的热点标题。
17.根据权利要求13所述的增强视频系统,其中,所述增强视频变换器进一步用于:
当确定所述第二输入视频与第一输入视频完全不匹配时,对应所述第二输入视频创建一新的增强视频。
18.根据权利要求13所述的增强视频系统,其中,为确定所述第二输入视频是否与第一输入视频匹配,所述增强视频变换器进一步用于:
确定所述第二输入视频是所述第一输入视频的拷贝或部分拷贝;基于所述第二输入视频与第一输入视频的指纹对二者进行匹配。
19.根据权利要求18所述的增强视频系统,其中,为从所述第一输入视频的增强视频中导出针对所述第二输入视频的增强视频信息,所述增强视频变换器进一步用于:
在所述第一输入视频的增强视频信息中,使用原始时间戳替换视频时限相匹配的时间戳,从而从所述第一输入视频的增强视频中导出所述第二输入视频的增强视频信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/955,129 | 2013-07-31 | ||
US13/955,129 US9100701B2 (en) | 2013-07-31 | 2013-07-31 | Enhanced video systems and methods |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103686344A CN103686344A (zh) | 2014-03-26 |
CN103686344B true CN103686344B (zh) | 2017-08-08 |
Family
ID=50322412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310569431.5A Active CN103686344B (zh) | 2013-07-31 | 2013-11-13 | 增强视频系统及方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9100701B2 (zh) |
CN (1) | CN103686344B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150095330A1 (en) * | 2013-10-01 | 2015-04-02 | TCL Research America Inc. | Enhanced recommender system and method |
US10834480B2 (en) * | 2014-08-15 | 2020-11-10 | Xumo Llc | Content enhancer |
US11212584B2 (en) * | 2014-10-10 | 2021-12-28 | ThinkAnalytics | Content recommendation system |
US9699491B1 (en) * | 2014-10-10 | 2017-07-04 | ThinkAnalytics | Content recommendation engine |
US9906837B1 (en) * | 2015-11-19 | 2018-02-27 | ThinkAnalytics | Binge content recommendation system |
CN104853249A (zh) * | 2015-05-12 | 2015-08-19 | 天脉聚源(北京)传媒科技有限公司 | 一种节目推荐方法及终端 |
CN106341735A (zh) | 2015-07-07 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种信息推送方法和装置 |
CN105704138A (zh) * | 2016-03-14 | 2016-06-22 | 浪潮(苏州)金融技术服务有限公司 | 利用多维化技术在流媒体数据中植入第三方信息的方法 |
ES2648368B1 (es) * | 2016-06-29 | 2018-11-14 | Accenture Global Solutions Limited | Recomendación de vídeo con base en el contenido |
WO2018023257A1 (zh) * | 2016-07-31 | 2018-02-08 | 杨洁 | 频道推荐技术的数据采集方法和电视机 |
CN107888974A (zh) * | 2016-09-30 | 2018-04-06 | 北京视连通科技有限公司 | 一种基于场景或特定对象的即时视频合成方法与系统 |
CN107820133B (zh) * | 2017-11-21 | 2020-08-28 | 三星电子(中国)研发中心 | 在电视机提供虚拟现实视频的方法、电视机和系统 |
US10360946B1 (en) * | 2018-08-24 | 2019-07-23 | GameCommerce, Inc. | Augmenting content with interactive elements |
US11082724B2 (en) | 2019-08-21 | 2021-08-03 | Dish Network L.L.C. | Systems and methods for targeted advertisement insertion into a program content stream |
US11122335B2 (en) | 2019-11-22 | 2021-09-14 | TCL Research America Inc. | Wishing television |
CN111901625B (zh) * | 2020-08-10 | 2022-03-25 | 杭州当虹科技股份有限公司 | 一种基于视频叠加补充增强信息同步推送关联内容的方法 |
CN114125527A (zh) * | 2020-08-28 | 2022-03-01 | 荣耀终端有限公司 | 视频播放方法和设备 |
US11418848B2 (en) | 2020-08-31 | 2022-08-16 | TCL Research America Inc. | Device and method for interactive video presentation |
US11711573B1 (en) | 2022-04-22 | 2023-07-25 | TCL Research America Inc. | 1-click reversible story |
WO2024081178A1 (en) * | 2022-10-10 | 2024-04-18 | Loop Now Technologies, Inc. | Dynamic population of contextually relevant videos in an ecommerce environment |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102232220A (zh) * | 2010-10-29 | 2011-11-02 | 华为技术有限公司 | 一种视频兴趣物体提取与关联的方法及系统 |
CN102265633A (zh) * | 2008-12-24 | 2011-11-30 | 维里逊专利及许可公司 | 提供有关视频节目的动态信息 |
CN102714709A (zh) * | 2010-01-21 | 2012-10-03 | 爱立信电视公司 | 通过媒体内容的上下文对准目标的广告 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7483624B2 (en) * | 2002-08-30 | 2009-01-27 | Hewlett-Packard Development Company, L.P. | System and method for indexing a video sequence |
US7809192B2 (en) * | 2005-05-09 | 2010-10-05 | Like.Com | System and method for recognizing objects from images and identifying relevancy amongst images and information |
US20090235312A1 (en) * | 2008-03-11 | 2009-09-17 | Amir Morad | Targeted content with broadcast material |
US8583725B2 (en) * | 2010-04-05 | 2013-11-12 | Microsoft Corporation | Social context for inter-media objects |
WO2011137246A1 (en) * | 2010-04-28 | 2011-11-03 | Individual Digital, Inc. | System and method for an individual data marketplace and monetization |
US20120201472A1 (en) * | 2011-02-08 | 2012-08-09 | Autonomy Corporation Ltd | System for the tagging and augmentation of geographically-specific locations using a visual data stream |
CN102547480A (zh) | 2012-01-29 | 2012-07-04 | 北京明日时尚信息技术有限公司 | 交互式视频广告平台的实现方法 |
WO2014040169A1 (en) * | 2012-09-14 | 2014-03-20 | Broadbandtv, Corp. | Intelligent supplemental search engine optimization |
KR20140047226A (ko) * | 2012-10-10 | 2014-04-22 | 한국전자통신연구원 | 이슈 일지를 제공하는 단말기, 이슈 일지를 생성하는 서버 및 이슈 일지 제공 및 생성 방법 |
-
2013
- 2013-07-31 US US13/955,129 patent/US9100701B2/en active Active
- 2013-11-13 CN CN201310569431.5A patent/CN103686344B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102265633A (zh) * | 2008-12-24 | 2011-11-30 | 维里逊专利及许可公司 | 提供有关视频节目的动态信息 |
CN102714709A (zh) * | 2010-01-21 | 2012-10-03 | 爱立信电视公司 | 通过媒体内容的上下文对准目标的广告 |
CN102232220A (zh) * | 2010-10-29 | 2011-11-02 | 华为技术有限公司 | 一种视频兴趣物体提取与关联的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103686344A (zh) | 2014-03-26 |
US9100701B2 (en) | 2015-08-04 |
US20150037009A1 (en) | 2015-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103686344B (zh) | 增强视频系统及方法 | |
CN110740387B (zh) | 一种弹幕编辑方法、智能终端及存储介质 | |
CN109905782B (zh) | 一种控制方法及装置 | |
KR101382499B1 (ko) | 영상 태깅 방법 및 이를 사용하는 영상 재생 장치. | |
US9253511B2 (en) | Systems and methods for performing multi-modal video datastream segmentation | |
CN104822074B (zh) | 一种电视节目的推荐方法及装置 | |
CN111930994A (zh) | 视频编辑的处理方法、装置、电子设备及存储介质 | |
US20140052696A1 (en) | Systems and methods for visual categorization of multimedia data | |
CN103052953A (zh) | 信息处理设备、信息处理方法和程序 | |
CN105874451A (zh) | 用于呈现对应于点播媒体内容的补充信息的方法、系统和介质 | |
CN103069414A (zh) | 信息处理设备、信息处理方法和程序 | |
CN105872717A (zh) | 视频处理方法及系统、视频播放器与云服务器 | |
CN111432282B (zh) | 一种视频推荐方法及装置 | |
CN113194346A (zh) | 一种显示设备 | |
CN112449253A (zh) | 交互式视频生成 | |
US20170013309A1 (en) | System and method for product placement | |
CN114372172A (zh) | 生成视频封面图像的方法、装置、计算机设备及存储介质 | |
JP4932779B2 (ja) | Tv番組と連動した動画対応広告装置及び方法 | |
CN113688260B (zh) | 视频推荐方法和装置 | |
CN112165626B (zh) | 图像处理方法、资源获取方法、相关设备及介质 | |
KR102261221B1 (ko) | 영상정보 획득 시스템 및 영상정보 표시 방법 | |
CN106713973A (zh) | 搜索节目的方法及装置 | |
CN113891157A (zh) | 视频播放方法、装置、电子设备、存储介质及程序产品 | |
US20140189769A1 (en) | Information management device, server, and control method | |
WO2023000950A1 (zh) | 显示设备及媒资内容推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Address after: TCL Technology Building No. 17 three road 516006 in Guangdong province Huizhou City Zhongkai high tech Development Zone Huifeng 23 floor Applicant after: TCL Group Co., Ltd. Address before: TCL Technology Building 17 No. three road weatherite Zhongkai High-tech Development Zone in Shenzhen City, Guangdong province 516006 23 floor Applicant before: TCL Group Co., Ltd. |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |