[go: up one dir, main page]

CN113836351A - 一种同源视频片段的确定方法、装置及电子设备 - Google Patents

一种同源视频片段的确定方法、装置及电子设备 Download PDF

Info

Publication number
CN113836351A
CN113836351A CN202010966936.5A CN202010966936A CN113836351A CN 113836351 A CN113836351 A CN 113836351A CN 202010966936 A CN202010966936 A CN 202010966936A CN 113836351 A CN113836351 A CN 113836351A
Authority
CN
China
Prior art keywords
video
frame
frame sequence
matched
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010966936.5A
Other languages
English (en)
Inventor
韩振
吕逸良
潘玉霖
唐铭谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010966936.5A priority Critical patent/CN113836351A/zh
Publication of CN113836351A publication Critical patent/CN113836351A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种同源视频片段的确定方法,包括:获得待匹配视频的帧序列,并获得候选视频的帧序列;根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组;根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。

Description

一种同源视频片段的确定方法、装置及电子设备
技术领域
本申请涉及计算机技术领域,具体涉及一种同源视频片段的确定方法、装置及电子设备,本申请同时还涉及一种视频编码方法、装置及电子设备。
背景技术
随着多媒体技术的迅猛发展,短视频、网剧、网络综艺等视频数据的数量伴随着传统的视频内容在网络中快速增长,并得到了广泛传播。
伴随着视频数量增长和视频形式的丰富,同源视频的数量也急剧增加,确定同源视频的同时,还需要准确的判断所述同源视频中的同源视频片段。因此,如何在不同形式的视频中,快速、准确的获得同源视频中的同源视频片段成为一个亟需解决的问题。
发明内容
本申请提供一种同源视频片段的确定方法,以解决现有中无法快速、准确的获得同源视频片段的问题。本申请同时提供一种同源视频片段的确定装置及电子设备。本申请同时还提供一种视频帧编码方法、装置及电子设备。
本申请提供一种同源视频片段的确定方法,包括:
获得待匹配视频的帧序列,并获得候选视频的帧序列;
根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;
根据所述候选视频的帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;
根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
可选的,所述获得待匹配视频的帧序列,并获得所述候选视频的帧序列,包括:
获得所述待匹配视频,并获得与所述待匹配视频对应的候选视频;
对所述待匹配视频进行帧采样,获得所述待匹配视频的帧序列;
对所述候选视频进行帧采样,获得所述候选视频的帧序列。
可选的,所述根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组,包括:
对所述待匹配视频的帧序列中的视频帧进行特征提取处理,获得所述待匹配视频的帧序列中的视频帧的中间特征;
根据所述待匹配视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述待匹配视频的帧序列中的待匹配视频帧的第一实值特征,以生成所述第一实值特征组。
可选的,根据所述候选视频的帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组,包括:
对所述候选视频的帧序列中的视频帧进行特征提取处理,获得所述候选视频的帧序列中的视频帧的中间特征;
根据所述候选视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述候选视频的帧序列中的候选视频帧的第二实值特征,以生成所述第二实值特征组。
可选的,所述根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段,包括:
将所述待匹配视频的帧序列中的待匹配视频帧与所述候选视频的帧序列中的候选视频帧组成视频帧对;
获取所述视频帧对中所述待匹配视频帧的第一实值特征和所述候选视频帧的第二实值特征;
根据所述第一实值特征和所述第二实值特征,确定所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度;
根据所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
可选的,还包括:获取所述待匹配视频的帧序列中各待匹配视频帧在所述待匹配视频中的时间戳;获取所述候选视频的帧序列中各候选视频帧在所述候选视频中的时间戳;
所述根据所述视频帧对中的待匹配视频帧和候选视频之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段,包括:
根据所述视频帧对中的待匹配视频帧和候选视频帧的时间戳之间的差值,对所述视频帧对进行分组;
根据各组视频帧对中所述待匹配视频帧和所述候选视频帧的相似度的平均值,获得所述各组视频帧对的相似度;
获得相似度大于预设相似度阈值的视频帧对组;
根据所述相似度大于预设相似度阈值的视频帧对组中的候选视频帧的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
可选的,所述根据所述视频帧对中的待匹配视频帧和候选视频之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段,包括:
根据所述待匹配视频帧在所述待匹配视频中的时间戳和所述候选视频帧在所述候选视频中的时间戳,构建与所述视频帧对对应的相似度矩阵;
通过预设相似度阈值将待匹配视频帧和所述候选视频的相似度进行二值化处理,获得所述视频帧对对应的的得分矩阵;
确定所述得分矩阵的连通区域;
根据所述连通区域对应的候选视频帧在所述候选视频中的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。8、根据权利要求2所述的同源视频片段的确定方法,其特征在于,包括:
所述待匹配视频和所述候选视频是根据用户通过用户交互界面输入的视频内容获得的;
确定所述候选视频中与所述待匹配视频对应的同源视频片段之后,所述方法还包括:向所述用户交互界面发送所述同源视频片段。
本申请还提供一种同源视频片段的确定装置,包括:
帧序列获取单元,用于获得待匹配视频的帧序列作为待匹配视频帧序列,并获得候选视频的帧序列作为候选视频帧序列;
实值特征获取单元,用于根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组;根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组;
同源视频片段确定单元,用于根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
本申请还提供一种电子设备,包括:
显示器;
处理器;
存储器,用于获得待匹配视频的帧序列作为待匹配视频帧序列,并获得候选视频的帧序列作为候选视频帧序列;根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组;根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组;根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
本申请还提供一种视频帧编码方法,包括:
获取目标视频的帧序列;
根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
可选的,所述根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
对所述目标视频的帧序列中的视频帧进行特征提取,获得所述目标视频的帧序列中的视频帧对应的中间特征;
根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
可选的,所述对所述帧序列进行图像特征提取,获得所述帧序列中各视频帧对应的中间特征,包括:
将所述目标视频的帧序列输入到中间特征提取模型,获得所述帧序列中各视频帧对应的中间特征。
可选的,所述根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
将目标视频的帧序列中各视频帧对应的中间特征,输入序列特征编码器,获得编码后的帧序列;其中,所述预设的序列特征编码器,用于根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码;编码后的视频帧信息中包括所述视频帧本身对应的信息以及与所述视频帧对应的上下文信息。
本申请还提供一种视频帧编码装置,包括:
帧序列获取单元,用于获取目标视频的帧序列。
帧序列编码单元,用于根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
本申请还提供一种电子设备,包括:
显示器;
处理器;
存储器,用于获取目标视频的帧序列;根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
本申请还提供一种用于同源视频片段的确定方法,包括:
接收用户的同源视频确定的请求;
接收用户发送的待匹配视频的帧序列以及候选视频的帧序列;
根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;
根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;
根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果;
向用户反馈所述同源视频确定结果。
本申请还提供一种用于同源视频片段的确定系统,包括:
请求单元,用于接收用户的同源视频确定的请求;
接收单元,用于接收用户发送的待匹配视频的帧序列以及候选视频的帧序列;
第一处理单元,用于根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;
第二处理单元,用于根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;
确定单元,根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果;
反馈单元,用于向用户反馈所述同源视频确定结果。
可选的,包括:所述请求单元、接收单元和反馈单元设置于客户端;
所述第一处理单元、第二处理单元和确定单元设置于服务端。
本申请还提供一种用于同源视频片段的确定方法,包括:
接收用户的同源视频确定的请求;
接收用户发送的第一视频的帧序列和第二视频的帧序列;
根据所述第一视频的帧序列中的帧信息以及所述第一视频的帧序列中的相邻帧之间的上下文信息,获得所述第一视频的帧序列对应的第一实值特征组;
根据所述第二视频的帧序列中的帧信息以及所述第二视频的帧序列中的相邻帧之间的上下文信息,获得所述第二视频的帧序列对应的第二实值特征组;
根据所述第一实值特征组和所述第二实值特征组,确定所述第一视频中与所述第二视频中的同源视频确定结果;
向用户反馈所述同源视频确定结果。
与现有技术相比,本申请具有以下优点:
本申请提供了一种同源视频片段的确定方法,包括:获得待匹配视频的帧序列,并获得候选视频的帧序列;根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。本申请确定候选视频中与待匹配视频对应的同源视频片段时,根据待匹配视频帧的序列中的帧信息以及待匹配视频帧序列中相邻帧之间的上下文联系,以及候选视频帧序列中的帧信息以及候选视频帧序列中相邻帧之间的上下文联系,对待匹配视频帧序列和候选视频进行实值特征提取,提高了待匹配视频帧和候选视频帧的特征描述能力,并进一步的通过待匹配视频帧序列和候选视频帧序列对应的实值特征实现了同源视频片段的确定。
附图说明
图1为本申请第一实施例提供的同源视频片段的确定方法流程图;
图2为本申请第一实施例提供的第一种确定同源视频片段起止时间的方法流程图;
图3为本申请第一实施例提供的第二种确定同源视频片段起始时间的方法流程图;
图4为本申请第二实施例所述的同源视频片段的确定装置结构示意图;
图5为本申请第三实施例提供的电子设备的结构示意图;
图6为本申请第四实施例提供的视频帧编码方法流程图;
图7为本申请第五实施例提供的视频帧编码装置的结构示意图;
图8为本申请第六实施例提供的电子设备的结构示意图;
图9为本申请第一实施例所示的得分矩阵变换示意图;
图10为本申请第一实施例提供的使用场景示意图;
图11为本申请第七实施例提供的用于同源视频片段的确定方法的流程图;
图12为本申请第八实施例提供的用于同源视频片段的确定系统结构示意图;
图13为本申请第九实施例提供的用于同源视频片段的确定方法的流程图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是,本申请能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此,本申请不受下面公开的具体实施例的限制。
在本申请实施例中,分别提供一种同源视频片段的确定方法、装置、电子设备,以及一种视频帧编码方法、装置、电子设备。在下面的实施例中逐一进行详细说明。
同源视频,是指对源视频进行颜色变化、水平翻转、时空裁剪、空间裁剪、转码、增/减字幕等不同的变化之后得到新视频,则所述新视频为所述源视频的同源视频。
同源视频片段,是指新视频中与所述原视频同源的视频片段。
本申请第一实施例提供一种同源视频片段的确定方法,请参看图1,其为本申请第一实施例提供的同源视频片段的确定方法流程图。本申请第一实施例所述的同源视频片段的确定方法包括如下步骤:
步骤S101,获得待匹配视频的帧序列,并获得候选视频的帧序列。
本申请第一实施例的目的在于确定候选视频中与待匹配视频同源视频片段,即,找到候选视频中的同源视频片段。在本申请第一实施例中,待匹配视频可以看为一个基准视频,即,以所述待匹配视频为基准确定所述候选视频中的同源视频片段。所述待匹配视频和所述候选视频可以为长视频也可以为短视频,本申请第一实施例对此不做限定。
为了得到所述待匹配视频的帧序列,以及所述候选视频的帧序列,在获得所述待匹配视频以及与所述待匹配视频对应的候选视频之后,还需要对待匹配视频以及候选视频分别进行帧采样,以获得所述待匹配视频帧序列以及所述候选视频帧序列。
所述待匹配视频的帧序列以及候选视频的帧序列是确定所述候选视频中的同源视频片段的关键。为了使所述待匹配视频的帧序列以及候选视频的帧序列能够描述所述待匹配视频和所述候选视频所传达的信息。还需要进一步对待匹配视频帧序列以及候选视频帧序列进行特征提取。
步骤S102,根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组。
所述待匹配视频帧序列中的帧信息,用于指示待匹配视频帧的图像信息,所述待匹配视频帧序列中相邻帧之间的上下文信息,则通过相邻的帧信息获取,为了获得待匹配视频帧序列中的帧信息,可以对所述待匹配视频帧序列中的视频帧进行特征提取处理,获得所述待匹配视频帧序列中的视频帧的中间特征,所述视频帧的中间特征就是用于指示视频帧的帧信息。
本领域技术人员可以采用任何一种适当的方式获得所述待匹配视频帧序列中的视频帧的中间特征。例如,使用中间特征提取模型(backbone model)对所述待匹配视频帧序列进行特征提取处理以获得所述待匹配视频帧序列中各个视频帧对应的中间特征。中间特征提取模型可以是CNN卷积神经网络模型等。
获取所述待匹配视频帧序列中视频帧的中间特征后,待匹配视频的视频帧也就具备了表达视频帧图像信息的能力,但此时的帧信息只能表达单帧信息。为了避免最后得到的同源视频出现单帧相似而同源视频片段表达的内容不同的现象,还需要进一步提高所述帧信息的表达能力。
因此,在获取所述待匹配视频帧序列中的视频帧的中间特征之后,还需要根据所述待匹配视频帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述待匹配视频帧序列中的待匹配视频帧的第一实值特征,以生成所述第一实值特征组。
在本实施例中,所述第一实值特征组由待匹配视频帧序列中的各个视频帧对应的第一实值特征组成,所述第一实值特征用于指示对应的待匹配视频帧的帧信息以及待匹配视频帧的相邻帧的帧信息,即,所述第一实值特征既能体现所述第一实值特征对应的视频帧的帧信息,又能体现该视频帧对应的某个视频片段的信息。
例如:所述待匹配视频帧序列包括视频帧1~6,获得所述视频帧1~6对应的中间特征后,可以根据所述视频帧1的中间特征,以及视频帧2和视频帧3的中间特征获取所述视频帧1对应的第一实值特征,这样,所述视频帧1对应的第一实值特征既能体现所述视频帧1本身的帧信息,又能体现视频片段1~3的信息;同样的,可以根据视频帧2的中间特征,以及所述视频帧1和视频帧3的中间特征,获取所述视频帧2对应的实值特征,这样,所述视频帧2对应的第一实值特征既能体现所述视频帧2本身的帧信息,又能体现视频片段1~3的信息。为了获取所述待匹配视频帧的第一实值特征组,可以将所述待匹配视频帧序列的中间特征输入到由Transformer或者RNN或者3D卷积网络构成的序列特征编码器中。
步骤S103,根据所述候选视频帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组。
同样的,提取所述待匹配视频帧序列的第一实值特征组后,还需要提取所述候选视频帧序列对应的第二实值特征组。
所述获得所述候选视频帧序列对应的第二实值特征组的方法与上述获取待匹配视频帧序列对应的第一实值特征组的方法相同,即,对所述候选视频帧序列中的视频帧进行特征提取处理,获得所述候选视频帧序列中的视频帧的中间特征;
根据所述候选视频帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述候选视频帧序列中的候选视频帧的第二实值特征,以生成所述第二实值特征组。
需要说明的是,本申请第一实施例中,获得所述待匹配视频帧序列对应的第一实值特征组和获得所述候选视频帧序列对应的第二实值特征组之间并不存在先后顺序,无论是先获得所述第一实值特征组还是先或的第二实值特征组对本申请第一实施例提供的同源视频片段的确定并没有影响。
步骤S104,根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
获取所述第一实值特征组和所述第二实值特征组后,还需要将所述待匹配视频帧序列中的待匹配视频帧与所述候选视频帧序列中的候选视频帧组成视频帧对。
例如:所述待匹配视频帧序列中包含待匹配视频帧a~f,所述候选视频帧序列中包含候选视频帧A~F,则由所述待匹配视频帧和所述候选视频帧组成的视频针对可以表示为:
Figure BDA0002682685510000101
确定所述视频帧对后,还需要获取所述视频帧对中所述待匹配视频帧的第一实值特征和所述候选视频帧的第二实值特征;根据所述第一实值特征和所述第二实值特征,确定所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度。具体是,根据所述视频帧对中包含的待匹配视频帧对应的第一实值特征和候选视频帧对应的第二实值特征,确定所述视频对中的待匹配视频帧和候选视频帧的相似度。
例如:以上述视频帧对(A,a)为例,上述确定所述视频针对中的待匹配视频帧和候选视频帧的相似度可以进一步具体为,获取所述候选视频帧序列中视频帧A的第二实值特征,以及待匹配视频帧序列中视频帧a的第一实值特征,根据所述第一实值特征和所述第二实值特征确定所述视频帧对中视频帧A和视频帧a的相似度。
所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度是确定所述候选视频中与所述待匹配视频对应的同源视频片段的前提条件。
为了准确的得到同源视频片段的起止时间,还需要进一步获取所述待匹配视频帧序列中各待匹配视频帧在所述待匹配视频中的时间戳,以及候选视频帧序列中各候选视频帧在所述候选视频中的时间戳。
在具体应用的过程中,考虑到候选视频中可能会存在连续时长不同,以及存在快慢放的情况,本申请第一实施例提供两种不同的方法以确定同源视频片段起止时间。
第一种,对于连续时长超过一定阈值的,且无快慢放的情况的候选视频。
请参看图2,其为本申请第一实施例提供的第一种确定同源视频片段起止时间的方法流程图。
所述方法包括以下步骤:
步骤S201,根据所述视频帧对中的待匹配视频帧和候选视频帧的时间戳之间的差值,对所述视频帧对进行分组;
候选视频的快慢放是与待匹配视频做比较而言的。上述根据时间戳之间的差值对所述视频帧进行分组实际上就是对视频片段进行分组。
假设所述待匹配视频帧序列中包含待匹配视频帧a~f,所述候选视频帧序列中包含候选视频帧A~F。且所述待匹配视频帧a~f对应的时间戳为1~6,所述候选视频帧A~F对应的时间戳也为1~6。
如下表所示:
待匹配视频帧时间戳 1 2 3 4 5 6
待匹配视频帧 a b c d e f
候选视频帧 A B C D E F
候选视频帧时间戳 1 2 3 4 5 6
根据表格可以很直观的看出,所述时间戳之差为1的视频帧对包括(B,a)、(C,b)、(D,c)、(E,d)、(F,e);所述时间戳之差为2的视频帧对包括(C,a)、(D,b)、(E,c)、(F,d);……。
则上述时间戳之差为1的视频帧对对应的视频片段分别为,待匹配视频中时间戳为1~5的视频片段,以及候选视频中时间戳为1~6的视频片段;上述时间戳之差为2的视频帧对对应的视频片段分别为,待匹配视频中时间戳为1~4的视频片段,以及候选视频中时间戳为3~6的视频片段。由此可见,本实施例所述的根据所述视频对中的待匹配视频帧和候选视频帧的时间戳之间的差值,对所述视频帧进行分组,实质上就是对视频片段进行分组。
步骤S202,根据各视频帧对中所述待匹配视频帧和所述候选视频的相似度的平均值,获得所述视频帧对组的相似度;
对所述视频片段进行分组之后,还需要对各组视频片段进行相似度判断,具体的,获得时间戳之差相同的各个视频对中的待匹配视频帧和候选视频帧的相似度,并获得每组视频帧对的相似度的平均值。
例如:时间戳之差为1的视频帧对(B,a)中视频帧B和视频帧a的相似度为1、视频帧对(C,b)中视频帧C和视频帧b的相似度为1、视频帧对(D,c)中视频帧D和视频帧c的相似度为0、视频帧对(E,d)中视频帧E和视频帧d的相似度为0、视频帧对(F,e)中视频帧F和视频帧e的相似度为1,则对应时间戳之差为1这组视频帧对的相似度为3÷5=0.6。
步骤S203,获得相似度大于预设相似度阈值的视频帧对组。
通过预设相似度阈值的方式,确定视频针对组,进而确定候选视频中的同源视频片段。
步骤S204,根据所述相似度大于预设相似度阈值的视频帧对组中的候选视频帧的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
前文提到了对所述视频帧进行分组,实质上就是对视频片段进行分组。因此,确定所述相似度大于预设阈值的视频帧对组就是确定与相似度大于预设阈值的视频片段。
具体的,获得相似度大于预设相似度阈值的视频帧对组中的候选视频帧的最小的时间戳和最大的时间戳,以最小的时间戳为同源视频片段的起点,最大的时间戳为同源视频片段的终点。
第二种,对于连续时长未超过一定阈值的,且存在快慢放的情况的候选视频。
请参看图3,其为本申请第一实施例提供的第二种确定同源视频片段起始时间的方法流程图。
所述方法包括以下步骤:
步骤S301,根据所述待匹配视频帧在所述待匹配视频中的时间戳和所述候选视频帧在所述候选视频中的时间戳,构建与所述视频帧对对应的相似度矩阵。
本方法依然利用各个视频帧对中待匹配视频帧和候选视频帧的相似度。所述与所述视频帧对对应的相似度矩阵,就是由待匹配视频帧序列中每个待匹配视频帧、以及候选视频帧序列中每个候选视频帧的相似度组成的矩阵。
步骤S302,通过预设相似度阈值将待匹配视频帧和所述候选视频帧的相似度进行二值化处理,获得所述视频帧对对应的的得分矩阵。
所述二值化处理就是将待匹配视频帧和候选视频帧的相似度统一成0或1两个数值。具体的,是将大于预设相似度阈值的待匹配视频帧和候选视频帧的相似度变为1,将小于相似度阈值的待匹配视频帧和候选视频帧的相似度变为0。
获得二值化处理的相似度矩阵之后,可以根据史密斯-沃特曼算法(SmithWaterman algorithm),将所述二值化处理的相似度矩阵转化为初始得分矩阵,再基于所述史密斯-沃特曼算法填充整个得分矩阵。
史密斯-沃特曼算法是一种进行局部序列比对的算法,在本申请第一实施例中,可以利用所述史密斯-沃特曼算法找到待匹配视频帧序列和候选视频帧序列中具有高相似度的片段。
步骤S303,确定所述得分矩阵的连通区域。
所述连通区域即从得分矩阵中得分最高的视频帧对开始,根据得分来源回溯至上一得分位置,如此反复直至得分为0的视频帧。通过上述方法对得分位置的回溯所得到的区域即为连通区域。
如图9所示,其为本申请第一实施例所示的得分矩阵变换示意图,假设所述待匹配视频帧序列中有9个待匹配视频帧,所述候选视频帧序列中有8个候选视频帧,则对所述二值化矩阵进行史密斯-沃特曼算法运算后会根据算法所指示的路径填充整个得分矩阵。
进一步的,为了获得所述连通区域,需要从填充矩阵中获得数值最大的视频帧对开始,顺着填充路径倒序查找连通区域,直至得分为0的视频帧对。
步骤S304,根据所述连通区域对应的候选视频帧在所述候选视频中的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
获得所述连通区域后,获得连通区域中得分为0的视频帧对中的候选视频帧的时间戳,以及得分最高的视频帧对中的候选视频帧的时间戳,根据所述时间戳,确定所述候选视频帧中与所述待匹配视频同源的视频片段。
需要说明的是,上述示出的根据史密斯-沃特曼算法确定所述同源视频帧中与所述待匹配视频同源的视频片段的方法指示本申请的一个优选方式,在其他实施方式中,可以采用不同的算法,例如,动态时间规整算法(Dynamic Time Warping)及其各类变式方法。但这些应属于对本申请第一实施例所述的方法的简单变换,不偏离本申请的核心,都在本申请的保护范围之内。
上述示出的对两种确定所述同源视频片段起始时间的方法,按照不同视频的情况使用不同的方法确定了同源视频片段的起始时间,增强了同源视频片段的匹配效果,也控制可视频时间的复杂程度对确定起始时间的影响。
下面结合一个具体使用场景,对本申请第一实施例所述的同源视频片段的确定方法的实现过程进行如下说明:
在本使用场景中,所述同源视频片段的确定方法配置与服务端。当然,在其他实施例中,该方法也可以配置于终端设备,本实施例对此不做限制。
如图10所示,其为本申请第一实施例提供的使用场景示意图。
用户可以通过终端设备等交互界面上传待匹配视频和候选视频,或者输入待匹配视频和待匹配视频的名称、ID或者URL等。根据用户输入的内容生成同源视频片段的确定请求。
服务端获取该请求,根据所述确定请求对所述待匹配视频以及候选视频进行帧采样,获得所述待匹配视频帧序列和候选视频帧序列。
根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组。
根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组。
根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
确定所述候选视频中与所述待匹配视频对应的同源视频片段之后,所述服务器向所述用户交互界面发送所述同源视频片段。
综上所述,本申请第一实施例提供的同源视频片段的确定方法,在确定候选视频中与待匹配视频对应的同源视频片段时,根据待匹配视频帧序列中的帧信息以及待匹配视频帧序列中相邻帧之间的上下文联系,以及候选视频帧序列中的帧信息以及候选视频帧序列中相邻帧之间的上下文联系,对待匹配视频帧序列和候选视频进行实值特征提取,提高了待匹配视频帧和候选视频帧的特征描述能力,并进一步的通过待匹配视频帧序列和候选视频帧序列对应的实值特征实现了同源视频片段的确定。
上述实施例介绍了一种同源视频片段的确定方法,与之相应的,本申请第二实施例提供一种同源视频片段的确定装置,由于装置实施例基本相似与上述方法实施例,所以描述的比较简单,相关之处参见上述方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
请参考图4,其为本申请第二实施例所述的同源视频片段的确定装置结构示意图。该装置包括:
帧序列获取单元401,用于获得待匹配视频的帧序列作为待匹配视频帧序列,并获得候选视频的帧序列作为候选视频帧序列。
特征获取单元402,用于根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组;根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组。
同源视频片段确定单元403,用于根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
可选的,所述获得待匹配视频的帧序列作为待匹配视频帧序列,并获得所述候选视频的帧序列作为候选视频帧序列,包括:
获得所述待匹配视频,并获得与所述待匹配视频对应的候选视频;对所述待匹配视频进行帧采样,获得所述待匹配视频帧序列;对所述候选视频进行帧采样,获得所述候选视频帧序列。
可选的,所述特征获取单元402,包括:
中间特征获取子单元,用于对所述待匹配视频帧序列中的视频帧进行特征提取处理,获得所述待匹配视频帧序列中的视频帧的中间特征;对所述候选视频帧序列中的视频帧进行特征提取处理,获得所述候选视频帧序列中的视频帧的中间特征;
实值特征获取子单元,用于根据所述待匹配视频帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述待匹配视频帧序列中的待匹配视频帧的第一实值特征,以生成所述第一实值特征组;根据所述候选视频帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述候选视频帧序列中的候选视频帧的第二实值特征,以生成所述第二实值特征组。
可选的,所述同源视频片段确定单元403,包括:
相似度确定子单元,用于将所述待匹配视频帧序列中的待匹配视频帧与所述候选视频帧序列中的候选视频帧组成视频帧对;获取所述视频帧对中所述待匹配视频帧的第一实值特征和所述候选视频帧的第二实值特征;根据所述第一实值特征和所述第二实值特征,确定所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度。
相似度比较子单元,用于根据所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
可选的,所述同源视频片段的确定装置,还包括:
时间戳获取子单元,用于获取所述待匹配视频帧序列中各待匹配视频帧在所述待匹配视频中的时间戳;获取所述候选视频帧序列中各候选视频帧在所述候选视频中的时间戳。
所述相似度比较子单元,用于根据所述视频帧对中的待匹配视频帧和候选视频帧的时间戳之间的差值,对所述视频帧对进行分组;根据各组视频帧对中所述待匹配视频帧和所述候选视频帧的相似度的平均值,获得所述各组视频帧对的相似度;获得相似度大于预设相似度阈值的视频帧对;根据所述相似度大于预设相似度阈值的视频帧对组中的候选视频帧的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
所述相似度比较子单元,还用于根据所述各待匹配视频帧在所述待匹配视频中的时间戳和所述各候选视频帧在所述候选视频中的时间戳,构建与所述视频帧对对应的相似度矩阵;通过预设相似度阈值将待匹配视频帧和所述候选视频的相似度进行二值化处理,获得所述视频帧对对应的的得分矩阵;确定所述得分矩阵的连通区域;根据所述连通区域对应的各候选视频帧在所述候选视频中的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
在上述实施例中,分别提供了一种同源视频片段的确定方法,以及一种同源视频片段的确定装置,与之相应的,本申请第三实施例还提供一种电子设备。由于电子设备基本相似与上述方法实施例和装置实施例,所以描述的比较简单,相关之处参见上述方法实施例和装置实施例的部分说明即可。下述描述的电子设备实施例仅仅是示意性的。
请参考图5,其为本申请第三实施例提供的电子设备的结构示意图。
所述电子设备,包括:显示器501;处理器502;存储器503;
所述存储器503,用于获得待匹配视频的帧序列作为待匹配视频帧序列,并获得候选视频的帧序列作为候选视频帧序列;根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组;根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组;根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
本申请第四实施例提供一种视频帧编码方法,由于所述第四实施例基本相似于第一实施例,所以描述得比较简单,相关之处参见第一实施例的部分说明即可。下述描述的第四实施例仅仅是示意性的。
请参看图6,其为本申请第四实施例提供的视频帧编码方法流程图,本申请第四实施例所述的视频编码方法包括如下步骤:
步骤S601,获取目标视频的帧序列。
步骤S602,根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
可选的,所述根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
对所述目标视频的帧序列中的视频帧进行特征提取,获得所述目标视频的帧序列中的视频帧对应的中间特征;
根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
可选的,所述对所述帧序列进行图像特征提取,获得所述帧序列中各视频帧对应的中间特征,包括:
将所述目标视频的帧序列输入到中间特征提取模型,获得所述帧序列中各视频帧对应的中间特征。
可选的,所述根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
将目标视频的帧序列中各视频帧对应的中间特征,输入序列特征编码器,获得编码后的帧序列;其中,所述预设的序列特征编码器,用于根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码;编码后的视频帧信息中包括所述视频帧本身对应的信息以及与所述视频帧对应的上下文信息。
可以理解的,由于编码后的各个视频帧对应到的信息中包含了所述视频帧本身对应的信息以及与所述视频帧对应的上下文信息,也就是说,通过所述序列特征编码器编码后的视频帧信息中包含了视频帧的实值特征。
为了增强所述序列特征编码器的编码能力,使编码后的视频帧能够准确的描述所述视频帧本身对应的信息以及与所述视频帧对应的上下文信息,还需要在对所述序列特征编码器进行训练。
训练的过程需要对所述目标视频进行同源变换,即对所述目标视频中的每一个视频帧使用随机指定的同源变换的组合(例如:旋转、翻转、裁剪、平移、颜色变换等等),得到与所述目标视频序列以及与之对应的同源视频帧序列。
获得所述同源视频帧序列之后,分别将所述同源视频帧序列和所述目标帧序列输入中间特征提取模型(例如:backbone model或Resnet-50神经网络模型等)提取同源视频帧序列中各视频帧对应的中间特征,以及目标视频帧序列中各视频帧对应的中间特征。
获得所述同源视频帧序列中各视频帧对应的中间特征后,顺着所述同源视频帧序列,对所述视频帧序列中各视频帧对应的中间特征进行切分,将所述视频帧对应的中间特征随机切分为连续N帧的组。
同样的,获得所述目标视频帧序列中各视频帧对应的中间特征后,顺着所述目标视频帧序列,对所述目标视频帧序列中各视频帧对应的中间特征进行切分,将所述目标视频帧对应的中间特征随机切分为连续N帧的组。
将每一组分别送入所述序列特征编码器,序列特征编码器将综合考虑每一组内视频帧本身的中间特征,以及组内其他视频帧的中间特征,按照视频帧序列对所述视频帧进行编码,编码后的视频帧信息中既包括视频帧本身对应的信息,也包括所述视频帧所在组的其他视频帧的信息。
前文提到了对所述视频帧进行编码后,所述视频帧对应的信息中包含了视频帧的实值特征。提高所述序列特征编码器的辨识能力,只需判断实值特征相同的目标视频帧和同源视频帧对应的时间戳是否相同,将时间戳相同的、且具备相同实值特征的目标视频帧和同源视频帧作为正样本,其他的目标视频帧和同源视频帧作为负样本,根据所述正样本和负样本对所述序列特征编码器进行训练。
综上所述,本申请第四实施例提供的视频帧编码方法,得到目标视频帧序列之后,进一步挖掘所述目标视频帧序列中的相邻帧之间的上下文信息,对所述目标视频帧序列进行编码,提高了所述视频帧的特征描述能力。
上述实施例介绍了一种视频帧编码方法,与之相应的,本申请第五实施例提供一种视频帧编码装置,由于装置实施例基本相似与上述方法实施例,所以描述的比较简单,相关之处参见上述方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
请参考图7,其为本申请第五实施例提供的视频帧编码装置的结构示意图。该装置包括:
帧序列获取单元701,用于获取目标视频的帧序列。
帧序列编码单元702,用于根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
可选的,所述帧序列编码单元702,包括:
中间特征提取子单元,用于对所述目标视频的帧序列中的视频帧进行特征提取,获得所述目标帧帧序列中的视频帧对应的中间特征。
中间特征编码子单元,用于根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
可选的,所述对所述帧序列进行图像特征提取,获得所述帧序列中各视频帧对应的中间特征,包括:将所述目标视频的帧序列输入到中间特征提取模型,获得所述帧序列中各视频帧对应的中间特征。
可选的,所述根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
将目标视频的帧序列中各视频帧对应的中间特征,输入序列特征编码器,获得编码后的帧序列;其中,所述预设的序列特征编码器,用于根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码;编码后的视频帧信息中包括所述视频帧本身对应的信息以及与所述视频帧对应的上下文信息。
在上述实施例中,分别提供了一种视频帧编码方法,以及一种视频帧编码装置,与之相应的,本申请第六实施例还提供一种电子设备。由于电子设备基本相似与上述方法实施例和装置实施例,所以描述的比较简单,相关之处参见上述方法实施例和装置实施例的部分说明即可。下述描述的电子设备实施例仅仅是示意性的。
请参考图8,其为本申请第六实施例提供的电子设备的结构示意图。
所述电子设备,包括:显示器801;处理器802;存储器803.
所述存储器803,用于获取目标视频的帧序列;根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
本申请第七实施例提供一种用于同源视频片段的确定方法,该实施例基本相似与上述第一实施例,所以描述的比较简单,相关之处参见本申请第一实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
请参考图11,其为本申请第七实施例提供的用于同源视频片段的确定方法的流程图,所述方法包括如下步骤:
步骤S1101,接收用户的同源视频确定的请求。
步骤S1102,接收用户发送的待匹配视频的帧序列以及候选视频的帧序列。
另外,考虑到当前多数应用程序存在需要付费才能启用相关功能的情况,还可以根据用户个人账户的信息,判断所述用户是否拥有访问付费功能的访问权限。在接收所述用户发送的同源视频确定的请求或接收用户发送的待匹配视频的帧序列以及候选视频的帧序列时,还可以同时接收所述用户的个人账户信息,以判断所述用户是否拥有有访问付费功能的访问权限。若上述判断结果为是,则执行步骤1103。
步骤S1103,根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组。
步骤S1104,根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组。
步骤S1105,根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果。
若上述判断所述用户是否拥有有访问付费功能的访问权限的判断结果为否,则对所述待匹配视频帧序列中的帧信息进行特征提取处理,获得所述待匹配视频帧序列中的视频帧的第一中间特征组;同时对所述勾选同源视频帧序列中的帧信息进行特征提取,获得所述候选视频帧序列中的视频帧的第二中间特征组;根据所述第一中间特征组和所述第二中间特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果。
需要说明的是,上述示出的判断所述用户是否拥有访问付费功能的访问权限的过程指示本申请的一个可选方式,在其实施方式中,可以不采用上述判断方法,但这些应属于对本系统的简单变换,不偏离本申请的核心,都在本申请的保护范围之内。
步骤S1106,向用户反馈所述同源视频确定结果。
本申请第八实施例提供一种用于同源视频片段的确定系统,该实施例基本相似与上述第七实施例,所以描述的比较简单,相关之处参见本申请第一实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
请参考图12,其为本申请第八实施例提供的用于同源视频片段的确定系统结构示意图,包括:
请求单元1201,用于接收用户的同源视频确定的请求。
接收单元1202,用于接收用户发送的待匹配视频的帧序列以及候选视频的帧序列。
第一处理单元1203,用于根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组。
第二处理单元1204,用于根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组。
确定单元1205,根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果。
反馈单元1206,用于向用户反馈所述同源视频确定结果。
可选的,所述请求单元、接收单元和反馈单元设置于客户端;所述第一处理单元、第二处理单元和确定单元设置于服务端。
当然,在具体使用场景中,上述单元也可以根据实际情况进行配置,例如:上述单元也可以全部配置与客户端或服务端。但这些应属于对本系统的简单变换,不偏离本申请的核心,都在本申请的保护范围之内。
本申请第九实施例提供一种用于同源视频片段的确定方法,该实施例基本相似与上述第一实施例,所以描述的比较简单,相关之处参见本申请第一实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
请参考图13,其为本申请第九实施例提供的用于同源视频片段的确定方法的流程图,所述方法包括如下步骤:
步骤1301,接收用户的同源视频确定的请求。
步骤1302,接收用户发送的第一视频的帧序列和第二视频的帧序列。
步骤1303,根据所述第一视频的帧序列中的帧信息以及所述第一视频的帧序列中的相邻帧之间的上下文信息,获得所述第一视频的帧序列对应的第一实值特征组。
步骤1304,根据所述第二视频的帧序列中的帧信息以及所述第二视频的帧序列中的相邻帧之间的上下文信息,获得所述第二视频的帧序列对应的第二实值特征组。
步骤1305,根据所述第一实值特征组和所述第二实值特征组,确定所述第一视频中与所述第二视频中的同源视频确定结果。
在本实施例中,上述确定所述第一视频中与所述第二视频中的同源视频确定结果,即确定第一视频和所述第二视频的同源视频片段。
可以理解的,本申请第九实施例中所述的第一视频和所述第二视频只是一个相对的概念,例如:假设所述第一视频为待匹配视频,所述第二视频为候选视频,上述同源视频确定结果则为,确定所述所述候选视频中与所述待匹配视频同源的同源视频片段。
当然,所述第一视频和所述第二视频也可以分别为候选视频和待匹配视频,但其确定结果并不会发生变化。
步骤1306,向用户反馈所述同源视频确定结果。本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为系统或电子设备。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (20)

1.一种同源视频片段的确定方法,其特征在于,包括:
获得待匹配视频的帧序列,并获得候选视频的帧序列;
根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;
根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;
根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
2.根据权利要求1所述的同源视频片段的确定方法,其特征在于,所述获得待匹配视频的帧序列,并获得所述候选视频的帧序列,包括:
获得所述待匹配视频,并获得与所述待匹配视频对应的候选视频;
对所述待匹配视频进行帧采样,获得所述待匹配视频的帧序列;
对所述候选视频进行帧采样,获得所述候选视频的帧序列。
3.根据权利要求1所述的同源视频片段的确定方法,其特征在于,所述根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组,包括:
对所述待匹配视频的帧序列中的视频帧进行特征提取处理,获得所述待匹配视频的帧序列中的视频帧的中间特征;
根据所述待匹配视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述待匹配视频的帧序列中的待匹配视频帧的第一实值特征,以生成所述第一实值特征组。
4.根据权利要求1所述的同源视频片段的确定方法,其特征在于,根据所述候选视频的帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组,包括:
对所述候选视频的帧序列中的视频帧进行特征提取处理,获得所述候选视频的帧序列中的视频帧的中间特征;
根据所述候选视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,获得所述候选视频的帧序列中的候选视频帧的第二实值特征,以生成所述第二实值特征组。
5.根据权利要求1所述的同源视频片段的确定方法,其特征在于,所述根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段,包括:
将所述待匹配视频的帧序列中的待匹配视频帧与所述候选视频的帧序列中的候选视频帧组成视频帧对;
获取所述视频帧对中所述待匹配视频帧的第一实值特征和所述候选视频帧的第二实值特征;
根据所述第一实值特征和所述第二实值特征,确定所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度;
根据所述视频帧对中的待匹配视频帧和候选视频帧之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
6.根据权利要求5所述的同源视频片段的确定方法,其特征在于,还包括:获取所述待匹配视频的帧序列中各待匹配视频帧在所述待匹配视频中的时间戳;获取所述候选视频的帧序列中各候选视频帧在所述候选视频中的时间戳;
所述根据所述视频帧对中的待匹配视频帧和候选视频之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段,包括:
根据所述视频帧对中的待匹配视频帧和候选视频帧的时间戳之间的差值,对所述视频帧对进行分组;
根据各组视频帧对中所述待匹配视频帧和所述候选视频帧的相似度的平均值,获得所述各组视频帧对的相似度;
获得相似度大于预设相似度阈值的视频帧对组;
根据所述相似度大于预设相似度阈值的视频帧对组中的候选视频帧的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
7.根据权利要求6所述的同源视频片段的确定方法,其特征在于,所述根据所述视频帧对中的待匹配视频帧和候选视频之间的相似度,确定所述候选视频中与所述待匹配视频对应的同源视频片段,包括:
根据所述待匹配视频帧在所述待匹配视频中的时间戳和所述候选视频帧在所述候选视频中的时间戳,构建与所述视频帧对对应的相似度矩阵;
通过预设相似度阈值将待匹配视频帧和所述候选视频的相似度进行二值化处理,获得所述视频帧对对应的的得分矩阵;
确定所述得分矩阵的连通区域;
根据所述连通区域对应的候选视频帧在所述候选视频中的时间戳,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
8.根据权利要求2所述的同源视频片段的确定方法,其特征在于,包括:
所述待匹配视频和所述候选视频是根据用户通过用户交互界面输入的视频内容获得的;
确定所述候选视频中与所述待匹配视频对应的同源视频片段之后,所述方法还包括:向所述用户交互界面发送所述同源视频片段。
9.一种同源视频片段的确定装置,其特征在于,包括:
帧序列获取单元,用于获得待匹配视频的帧序列作为待匹配视频帧序列,并获得候选视频的帧序列作为候选视频帧序列;
实值特征获取单元,用于根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组;根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组;
同源视频片段确定单元,用于根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
10.一种电子设备,其特征在于,包括:
显示器;
处理器;
存储器,用于获得待匹配视频的帧序列作为待匹配视频帧序列,并获得候选视频的帧序列作为候选视频帧序列;根据所述待匹配视频帧序列中的帧信息以及所述待匹配视频帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频帧序列对应的第一实值特征组;根据所述候选视频帧序列中的帧信息以及所述候选视频序列中的相邻帧之间的上下文信息,获得所述候选视频帧序列对应的第二实值特征组;根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频对应的同源视频片段。
11.一种视频帧编码方法,其特征在于,包括:
获取目标视频的帧序列;
根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
12.根据权利要求11所述的视频帧编码方法,其特征在于,所述根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
对所述目标视频的帧序列中的视频帧进行特征提取,获得所述目标视频的帧序列中的视频帧对应的中间特征;
根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
13.根据权利要求12所述的视频帧编码方法,其特征在于,所述对所述帧序列进行图像特征提取,获得所述帧序列中各视频帧对应的中间特征,包括:
将所述目标视频的帧序列输入到中间特征提取模型,获得所述帧序列中各视频帧对应的中间特征。
14.根据权利要求12所述的视频帧编码方法,其特征在于,所述根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码,获得编码后的帧序列,包括:
将目标视频的帧序列中各视频帧对应的中间特征,输入序列特征编码器,获得编码后的帧序列;其中,所述预设的序列特征编码器,用于根据所述目标视频的帧序列中时序上相邻的设定数量的视频帧的中间特征,对所述目标视频的帧序列进行编码;编码后的视频帧信息中包括所述视频帧本身对应的信息以及与所述视频帧对应的上下文信息。
15.一种视频帧编码装置,其特征在于,包括:
帧序列获取单元,用于获取目标视频的帧序列。
帧序列编码单元,用于根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
16.一种电子设备,其特征在于,包括:
显示器;
处理器;
存储器,用于获取目标视频的帧序列;根据所述目标视频的帧序列中的帧信息以及所述目标视频的帧序列中的相邻帧之间的上下文信息,对所述目标视频的帧序列进行编码,获得编码后的帧序列。
17.一种用于同源视频片段的确定方法,其特征在于,包括:
接收用户的同源视频确定的请求;
接收用户发送的待匹配视频的帧序列以及候选视频的帧序列;
根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;
根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;
根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果;
向用户反馈所述同源视频确定结果。
18.一种用于同源视频片段的确定系统,其特征在于,包括:
请求单元,用于接收用户的同源视频确定的请求;
接收单元,用于接收用户发送的待匹配视频的帧序列以及候选视频的帧序列;
第一处理单元,用于根据所述待匹配视频的帧序列中的帧信息以及所述待匹配视频的帧序列中的相邻帧之间的上下文信息,获得所述待匹配视频的帧序列对应的第一实值特征组;
第二处理单元,用于根据所述候选视频的帧序列中的帧信息以及所述候选视频的帧序列中的相邻帧之间的上下文信息,获得所述候选视频的帧序列对应的第二实值特征组;
确定单元,根据所述第一实值特征组和所述第二实值特征组,确定所述候选视频中与所述待匹配视频中的同源视频确定结果;
反馈单元,用于向用户反馈所述同源视频确定结果。
19.根据权利要求18所述的用于同源视频片段的确定系统,其特征在于,包括:所述请求单元、接收单元和反馈单元设置于客户端;
所述第一处理单元、第二处理单元和确定单元设置于服务端。
20.一种用于同源视频片段的确定方法,其特征在于,包括:
接收用户的同源视频确定的请求;
接收用户发送的第一视频的帧序列和第二视频的帧序列;
根据所述第一视频的帧序列中的帧信息以及所述第一视频的帧序列中的相邻帧之间的上下文信息,获得所述第一视频的帧序列对应的第一实值特征组;
根据所述第二视频的帧序列中的帧信息以及所述第二视频的帧序列中的相邻帧之间的上下文信息,获得所述第二视频的帧序列对应的第二实值特征组;
根据所述第一实值特征组和所述第二实值特征组,确定所述第一视频中与所述第二视频中的同源视频确定结果;
向用户反馈所述同源视频确定结果。
CN202010966936.5A 2020-09-15 2020-09-15 一种同源视频片段的确定方法、装置及电子设备 Pending CN113836351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010966936.5A CN113836351A (zh) 2020-09-15 2020-09-15 一种同源视频片段的确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010966936.5A CN113836351A (zh) 2020-09-15 2020-09-15 一种同源视频片段的确定方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN113836351A true CN113836351A (zh) 2021-12-24

Family

ID=78962359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010966936.5A Pending CN113836351A (zh) 2020-09-15 2020-09-15 一种同源视频片段的确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113836351A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550070A (zh) * 2022-03-08 2022-05-27 腾讯科技(深圳)有限公司 视频片段的识别方法、装置、设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180056A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 视频中片段的匹配方法和装置
WO2019085941A1 (zh) * 2017-10-31 2019-05-09 腾讯科技(深圳)有限公司 一种关键帧提取方法、装置和存储介质
CN111522996A (zh) * 2020-04-09 2020-08-11 北京百度网讯科技有限公司 视频片段的检索方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180056A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 视频中片段的匹配方法和装置
WO2019085941A1 (zh) * 2017-10-31 2019-05-09 腾讯科技(深圳)有限公司 一种关键帧提取方法、装置和存储介质
CN111522996A (zh) * 2020-04-09 2020-08-11 北京百度网讯科技有限公司 视频片段的检索方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550070A (zh) * 2022-03-08 2022-05-27 腾讯科技(深圳)有限公司 视频片段的识别方法、装置、设备以及存储介质
CN114550070B (zh) * 2022-03-08 2024-09-17 腾讯科技(深圳)有限公司 视频片段的识别方法、装置、设备以及存储介质
US12143695B2 (en) 2022-03-08 2024-11-12 Tencent Technology (Shenzhen) Company Limited Method and apparatus for recognizing video clip, device, and storage medium

Similar Documents

Publication Publication Date Title
US20210312186A1 (en) Summarizing video content
US11417074B2 (en) Methods and apparatus for identifying objects depicted in a video using extracted video frames in combination with a reverse image search engine
CN105744292B (zh) 一种视频数据的处理方法及装置
CN108683924B (zh) 一种视频处理的方法和装置
EP2657884B1 (en) Identifying multimedia objects based on multimedia fingerprint
US20240073478A1 (en) Determining video provenance utilizing deep learning
CN110826365B (zh) 一种视频指纹生成方法和装置
EP3740912A1 (en) Data compression by local entropy encoding
CN111753673A (zh) 一种视频数据的检测方法和装置
TW201327203A (zh) 用於行動環境中之漸進式型樣匹配之方法及裝置
CN111382620A (zh) 视频标签添加方法、计算机存储介质和电子设备
CN111143619B (zh) 视频指纹生成方法、检索方法、电子设备及介质
CN113836351A (zh) 一种同源视频片段的确定方法、装置及电子设备
CN118916519A (zh) 数据处理方法、装置、设备及可读存储介质
CN113039805B (zh) 一种基于指纹匹配的媒体片段提取方法及系统
Vega et al. A robust video identification framework using perceptual image hashing
CN111147954A (zh) 一种缩略图抽取方法及装置
CN116229313A (zh) 标签构建模型的生成方法、装置、电子设备和存储介质
CN112738564B (zh) 数据处理方法、装置、电子设备及存储介质
CN119788088B (zh) 芯片的数据压缩方法、装置、设备及存储介质
Kutluk et al. ITU MSPR TRECVID 2010 Video Copy Detection System.
CN116389826A (zh) 视频切分及单题讲解视频获取方法、装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211224