CN111917999A - 视频处理方法、移动终端及可读存储介质 - Google Patents
视频处理方法、移动终端及可读存储介质 Download PDFInfo
- Publication number
- CN111917999A CN111917999A CN202010793961.8A CN202010793961A CN111917999A CN 111917999 A CN111917999 A CN 111917999A CN 202010793961 A CN202010793961 A CN 202010793961A CN 111917999 A CN111917999 A CN 111917999A
- Authority
- CN
- China
- Prior art keywords
- music
- video
- information
- action
- background music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 8
- 230000009471 action Effects 0.000 claims description 227
- 230000033764 rhythmic process Effects 0.000 claims description 78
- 230000007613 environmental effect Effects 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 230000033001 locomotion Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 230000000875 corresponding effect Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 17
- 238000006073 displacement reaction Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 210000001503 joint Anatomy 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000003141 lower extremity Anatomy 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 210000001364 upper extremity Anatomy 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 210000000544 articulatio talocruralis Anatomy 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 210000002310 elbow joint Anatomy 0.000 description 1
- 210000002468 fat body Anatomy 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 210000004394 hip joint Anatomy 0.000 description 1
- 210000000629 knee joint Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 210000000323 shoulder joint Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 210000003857 wrist joint Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请公开了一种视频处理方法、移动终端和计算机可读存储介质,方法包括获取待处理的原始视频,并获取所述原始视频中的图像内容;根据所述图像内容,筛选出匹配的背景音乐;将所述背景音乐与所述原始视频合成处理,输出带背景音乐的目标视频。本申请使得为视频匹配音乐的过程更加智能化,所有操作基本都由程序自动完成,同时本申请匹配的背景音乐基于视频的图像内容,使匹配的背景音乐更加准确。
Description
技术领域
本申请涉及音视频处理技术领域,尤其涉及一种视频处理方法、移动终端及可读存储介质。
背景技术
随着科技的发展,视频成为了人们记录生活和分享生活的一种重要方式。为了使视频更加有趣,人们往往会在视频中加入背景音乐。但是,人们在为视频选择背景音乐时,通常只能按照已有的模板进行人工选择,这种人工匹配音乐的方法效率低而且效果差。
上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
发明内容
本申请的主要目的在于提供一种视频处理方法、移动终端及可读存储介质,旨在解决人工匹配视频的背景音乐时效率低且效果差的技术问题。
为实现上述目的,本申请实施例提供的一种视频处理方法,所述视频处理方法包括以下步骤:
获取待处理的原始视频,并获取所述原始视频中的图像内容;
根据所述图像内容,筛选出匹配的背景音乐;
将所述背景音乐与所述原始视频合成处理,输出带背景音乐的目标视频。
可选地,所述获取原始视频中的图像内容的步骤包括:
获取所述原始视频中动作主体的动作模型信息和/或环境信息。
可选地,所述动作模型信息包括以下至少一种:动作主体信息、动作节奏信息、动作幅度信息和动作类型信息。
可选地,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
获取待匹配的背景音乐的音乐模型信息;
根据所述图像内容和所述音乐模型信息,筛选出匹配的背景音乐。
可选地,所述音乐模式信息包括以下至少一种:音乐节奏信息、音乐时间信息、音乐音量信息或音乐风格信息。
可选地,所述待匹配的背景音乐为从视频库中获取的背景音乐,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
从所述视频库的视频中获取以下至少一个视频内容:视频中主体信息,视频中环境信息,视频中动作类型信息;
根据所述图像内容和所述视频内容,筛选出匹配的背景音乐。
可选地,所述待匹配的背景音乐为从音频库中获取的背景音乐,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
从所述音频库的音频中获取音频模型;
根据所述图像内容和所述音频模型,筛选出匹配的背景音乐。
可选地,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
获取所述原始视频中动作主体的动作模型信息和所述待匹配的背景音乐的音乐模型信息的比较结果;
若所述比较结果满足预设条件,则判定所述背景音乐为筛选出的背景音乐。
可选地,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
根据所述图像内容中动作主体的动作模型信息对于所述原始视频进行分段;
对于所述分段后的原始视频,根据分段后的原始视频的图像内容筛选出匹配的背景音乐。
可选地,所述若所述比较结果达到满足预设条件,则判定所述背景音乐为筛选出的背景音乐的步骤包括以下至少一种:
若所述动作模型信息中动作节奏信息与待匹配的背景音乐的所述音乐模型信息中音乐节奏信息相似度符合第一预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
若所述动作模型信息中动作幅度信息与待匹配的背景音乐的所述音乐模型信息中音乐音量信息相似度符合第二预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
若所述动作模型信息中动作主体信息与所述视频库的的视频的视频中视频主体信息相似度符合第三预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
所述动作模型信息中动作类型信息与所述视频库的视频的视频中动作类型信息相似度符合第四预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
所述原始视频中环境信息与所述视频库的视频的环境信息相似度符合第五预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐。
可选地,所述将所述背景音乐与所述原始视频合成处理的步骤之前包括:
调整所述原始视频中动作主体的动作模型和/或所述背景音乐的音乐模型以调整两个模型相似度。
本申请还提供一种移动终端,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频处理程序,所述视频处理程序被所述处理器执行时实现如上述的视频处理方法的步骤。
本申请还提供一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的视频处理方法的步骤。
本申请实施例通过获取待处理的原始视频,并获取所述原始视频中的图像内容,然后根据图像内容,筛选出匹配的背景音乐,最后将匹配的背景音乐与原始视频进行合成处理,得到最终的目标视频。在本申请中在用户提供待处理的原始视频后,本方法会自动进行视频中图像内容的提取,并根据提取出的图像内容,进行背景音乐的匹配筛选,通过自动化的执行方法的各步骤,减少了人工的参与,提高了匹配过程整体的效率,同时根据图像内容进行背景音乐的匹配,使合成的目标视频中视频内容与背景音乐的匹配效果更好。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为实现本申请各个实施例的一种移动终端的硬件结构示意图;
图2为本申请实施例提供的一种通信网络系统架构图;
图3为本申请视频处理方法第一实施例的流程示意图;
图4为本申请视频处理方法第三实施例中对图3步骤S20的细化流程图;
图5为本申请视频处理方法第三实施例中动作节奏特征点与音乐节奏特征点的对应关系示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本申请中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本申请的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本申请各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)
等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本申请实施例,下面对本申请的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本申请实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
具体地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。其中,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本申请不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本申请各个实施例。
本申请提供一种视频处理方法。
在视频处理方法第一实施例中,该方法包括:
步骤S10,获取待处理的原始视频,并获取所述原始视频中的图像内容;
原始视频可以是用户本地存储的视频,也可以是用户从网络下载的视频,对于视频的来源本申请不做限制。
获取的图像内容主要包括原始视频中的动作主体的动作模型信息和环境信息,也包括其它可以体现动作主体的动作的信息,动作模型信息包括动作主体信息、动作节奏信息、动作幅度信息和动作类型信息,动作主体信息如人、猫、狗等,动作节奏信息如动作主体关节处的角速度和加速度等,动作幅度信息如关节处的位移等,动作类型信息如走路、舞蹈等,环境信息则包括环境中的物体、天气状况、背景中物体的变化情况等。
步骤S20,根据所述图像内容,筛选出匹配的背景音乐;
利用前面获取的动作主体的动作模型信息和/或环境信息,得到一个备选音乐库,依据动作主体的动作属性,得到动作特征点和动作节奏特征点,并根据动作节奏特征点获得原始视频的动作特征曲线,对于备选音乐库中的每首备选音乐,利用动作节奏特征点的时间序列得到音乐节奏特征点,利用音乐节奏特征点可以得到每首备选音乐的音乐特征曲线,最后根据两种特征曲线匹配出合适的背景音乐。
步骤S30,将所述背景音乐与所述原始视频合成处理,输出带背景音乐的目标视频;
对于匹配的背景音乐,本申请可以把它们组合或者单独与原始视频进行合成处理,同时在将背景音乐与原始视频合成前,可以对背景音乐或/和原始视频的节奏进行调整,最后输出合成后的视频。
在本实施例中,通过获取待处理的原始视频,并获取所述原始视频中的图像内容,然后根据图像内容,筛选出匹配的背景音乐,最后将匹配的背景音乐与原始视频进行合成处理,得到最终的目标视频。在本申请中在用户提供待处理的原始视频后,本方法会自动进行视频中图像内容的提取,并根据提取出的图像内容,进行背景音乐的匹配筛选,通过自动化的执行方法的各步骤,减少了人工的参与,提高了匹配过程整体的效率,同时根据图像内容进行背景音乐的匹配,使合成的目标视频中视频内容与背景音乐的匹配效果更好。
进一步地,在本申请视频处理方法的第一实施例的基础上,提供视频处理方法第二实施例,在第二实施例中,步骤S10包括:
步骤A,获取所述原始视频中动作主体的动作模型信息和/或环境信息;
其中,动作模型信息包括以下至少一种:动作主体信息、动作节奏信息、动作幅度信息和动作类型信息。
动作主体可以是人,可以是动物,也可以是机器人,只要是能产生动作的客观实体,都可以作为本申请的动作主体,同时,如果人作为动作主体,本申请还可以继续分析该主体的性别、年龄层、身材等信息,例如本申请最终分析得到动作主体为身姿曼妙的少女、体态偏胖的中年男子等。动作的节奏信息和幅度信息可以由动作属性推理获取,动作属性包括角速度、加速度、位移、动作部位,通过动作属性,可以概括出动作主体的动作,动作属性不局限于本申请列举的这些,还包括其他可通过图像识别分析获得与动作相关的信息。如通过各运动部位的角速度和加速度可以推断动作的节奏信息,通过各运动部位的位移推断运动的幅度信息,根据运动的节奏信息和幅度信息在判断最接近的动作类型。环境信息为动作主体所处的外部环境,比如教室、图书馆、公园、商场等,动作主体和动作主体所处的环境为本申请接下来获取备选音乐库提供了可利用的条件。
具体地,对于动作模型信息的获取可以为:对于能产生动作的动作主体,其主体包含有不同的关节点,并且动作的发生过程伴随着关节点的运动且与关节点的运动息息相关。常用的关节点有:上肢的腕关节、肘关节、肩关节,下肢的膝关节、踝关节,另外本申请还会用到髋关节、颈椎、腰椎。关节点的角速度大,说明动作的频率快,关节点的位移大,说明动作的幅度大,通过不同关节点的角速度和位移的比较,可以确定产生动作的动作部位,同时,通过大数据搜索,将获取的关节点的角速度与位移与不同种类的动作的角速度与位移进行对比,确定动作种类,例如,动作主体上肢和下肢的关节点都具有较大的角速度和较大的位移,可以认为动作主体在舞蹈,如果上肢的关节点角速度和位移较小,下肢的关节点角速度和位移相对更大且有周期性,则动作主体的动作可能是散步。在确定了动作主体产生动作的动作部位后,我们就会对于关节点进行筛选,选择动作部位的全部关节点,将这些关节点的动作属性作为动作主体的动作属性。
在本实施例中,获取原始视频中动作主体的动作模型信息和/或环境信息。通过获得这些图像内容,为之后匹配背景音乐提供可用的参考依据。
进一步地,参照图3、图4和图5,在本申请视频处理方法上述实施例的基础上,提供视频处理方法第三实施例,在第三实施例中,
步骤S20包括:
步骤S21,获取待匹配的背景音乐的音乐模型信息;
从网络和/或本地的视频库以及音频库中根据原始视频中的动作主体信息初步筛选出符合条件的待匹配的背景音乐,并形成备选音乐库,通过备选音乐库的产生,初步获取可能匹配的背景音乐,同时适当减少后面步骤的工作量。对于待匹配的背景音乐,构建音乐模型信息。
其中,所述音乐模型信息包括以下至少一种:音乐节奏信息、音乐时间信息、音乐音量信息或音乐风格信息。音乐时间信息为音乐的时长,音乐风格就是流行音乐、古典音乐、蓝调等。音乐的节奏可以按照下面的方式获取。对于音乐,音乐也有节奏,对于音乐的节奏,本申请也利用可以表示音乐节奏的音乐属性,通过量化这些音乐属性,获得一个可以反映音乐节奏的数值,同时,为了将视频中的动作属性与备选音乐的音乐属性联系起来,本申请会利用动作节奏特征点得到音乐节奏特征点,同样地,通过音乐节奏特征点和对应的数值,获取每首备选音乐的音乐特征曲线,该音乐特征曲线可以是连续的,也可以是不连续的。动作节奏特征点的时间序列体现动作节奏特征点在原始视频中的时间关系属性,本申请通过时间序列将原始视频与备选音乐联系起来,动作节奏特征点与音乐节奏特征点通过时间序列建立的对应关系参照图5。为了保证原始视频与备选音乐在节奏上是匹配的,基础地,原始视频与备选音乐的节奏特征点在各自的时间轴中所处的相对位置应该是大体上一致的。对于每个音乐节奏特征点,通过量化其能代表音乐特征的指标,获取一个音乐值,对于音乐,其音符的时长和音高能够一定程度上反映其音乐特征,因此音乐值与所述音乐节奏特征点的音符时长和音高正相关。音乐特征曲线的横轴为音乐的时间轴,纵轴为音乐值。每一个音乐节奏特征点都有对应的横坐标与纵坐标,得到构成音乐特征曲线的一些离散的点,可以通过插值的方法获取连续的音乐特征曲线,同时如果音乐节奏特征点的分布过于分散,我们分别获取音乐节奏特征点分布相对密集区域的音乐特征曲线,最终获取总体的分段不连续的音乐特征曲线。
步骤S22,根据所述图像内容和所述音乐模型信息,筛选出匹配的背景音乐;
在得到了待匹配的背景音乐后,本申请对于待匹配的背景音乐要做进一步的筛选,动作主体的动作模型信息会是筛选的标准,这样筛选后匹配的背景音乐会是与原始视频的图像内容相对应的,保证了匹配的背景音乐的准确性。
先建立相应的原始视频的动作特征曲线,建立的过程如下:
具有动作属性的时间点,说明该时间点有动作主体存在同时动作主体有动作产生,所以本申请将它们作为动作特征点,动作特征点中角速度的极值点可能是动作主体的动作属性发生变化的点,所以本申请将这些点作为动作节奏特征点。动作节奏特征点本身也是动作特征点,具有动作属性,而本申请可以对动作属性进行量化,得到一个可以反应动作属性的数值,因此对于每个动作节奏特征点都会得到与其对应的一个数值,通过这些点和对应的数值,我们可以获取原始视频对应的动作特征曲线,该动作特征曲线可以是连续的,也可以是不连续的。动作节奏特征点的动作属性包括一些抽象的概念,抽象的概念程序无法进行对比,因此我们需要对于动作节奏特征点的动作属性包含的信息进行量化,得到一个程序可以用来比较的值,这个值是通过对于动作属性中包含的各信息分别量化再加权获得,动作值在大体上能反映动作节奏特征点的动作属性。动作值与所述动作节奏特征点的角速度和位移正相关。对于所述动作特征曲线,其横轴为原始视频的时间轴,纵轴为动作值,每一个动作节奏特征点都有对应的横坐标与纵坐标,得到构成动作特征曲线的一些离散的点,可以通过插值的方法获取连续的动作特征曲线,同时如果动作节奏特征点的分布过于分散,我们分别获取动作节奏特征点分布相对密集区域的动作特征曲线,最终获取总体的分段不连续的动作特征曲线。
之后根据获取的原始视频的动作特征曲线和待匹配的背景音乐的音乐特征曲线,在获取了这两种特征曲线后,需要对两种曲线的相似程度进行对比,从而确定原始视频与备选音乐在节奏方面是否一致,即确定备选音乐能否作为匹配的背景音乐,两种曲线的相似程度的对比方法有很多,例如可以对比两种曲线整体上的趋势变化,也可以选取两种曲线上足够多的相对应的点,比较其曲线对应值的差值和差值的变化趋势。
匹配的过程如下:
在本申请中,将原始视频与备选音乐关联起来的一个重要因素就是动作节奏特征点与音乐节奏特征点的时间序列,动作节奏特征点和音乐节奏特征点的时间序列是一致的,因此动作节奏特征点与音乐节奏特征点存在对应关系。这里使用差值的绝对值可以更加准确的反应动作值与音乐值间的差距,同时后面计算总和时不会因为正负数的混合相加而产生偏差,更好的反映两种曲线间的匹配程度差异。对于每组特征点对的差值和总的差值都要分别小于一个数值,可以保证原始视频与备选音乐在整体上和关键的节点上节奏都是匹配的,因此得到的背景音乐是符合我们标准的。
在本实施例中,全部内容构成了一种动作—音乐匹配模型,这种模型主要利用的是视频和音乐中的节奏特征。在这个模型中,通过节奏将原始视频与备选音乐联系起来,同时通过分别量化原始视频中动作节奏特征点的动作属性与备选音乐中音乐节奏特征点的音乐属性,得到动作特征曲线和音乐特征曲线。将比较原始视频与备选音乐的匹配程度转化为比较动作特征曲线和音乐特征曲线的匹配程度。这个模型保证了原始视频与最后的背景音乐是匹配的,提升了本申请匹配音乐过程中的专业性。
进一步地,在本申请视频处理方法上述实施例的基础上,提供视频处理方法第四实施例,在第四实施例中,
待匹配的背景音乐为从视频库中获取的背景音乐,则步骤S20包括:
步骤B1,从所述视频库的视频中获取以下至少一个视频内容:视频中主体信息,视频中环境信息,视频中动作类型信息;
步骤B2,根据所述图像内容和所述视频内容,筛选出匹配的背景音乐;
当待匹配的音乐是从视频库中获取出来的时,则与原始视频的处理过程类似,即以视频库中的视频的视频内容为依据,获取视频中的主体信息,视频中的环境信息,视频中的动作类型信息,之后再根据原始视频中的图像内容与视频库中的视频内容进行匹配,如主体信息和动作类型信息是否一样,环境信息是否相似,若主体信息和动作类型信息相同且环境信息相似,则可以判断为匹配的背景音乐。
在本实施例中,对于视频库中的视频获取的背景音乐,则获取视频库中视频的内容如主体信息、环境信息和动作类型信息等,根据视频内容进行背景音乐的匹配,匹配过程更加快速。
进一步地,在本申请视频处理方法上述实施例的基础上,提供视频处理方法第四实施例,在第四实施例中,
待匹配的背景音乐为从音频库中获取的背景音乐,步骤S20包括:
步骤C1,从所述音频库的音频中获取音频模型;
步骤C2,根据所述图像内容和所述音频模型,筛选出匹配的背景音乐;
对于音频库中的音频,利用第三实施例中相同的方法可以得到音频库中的音频的音乐特征曲线,音乐特征曲线以及音频的音量信息、风格信息等组成音频模型,获取音乐特征曲线之后,按照与第三实施例中相同的流程将原始视频的动作特征曲线与音频库中的音乐的音乐特征曲线进行匹配,同时根据音频模型中的风格信息与原始视频中的环境信息作为辅助匹配信息,当动作特征曲线与音乐特征曲线的匹配度大于预设值且风格信息与环境信息相似如风格为古典音乐与环境信息为安静的环境是,则判定音频库中的音频与原始视频的视频内容是匹配的,可以作为匹配的背景音乐。其中,关于音乐模型中的风格信息与视频内容的环境信息是否相似的判断可以有用户提前设置好相应的对应关系,如安静环境中相似的风格信息为古典音乐、抒情音乐等,具体的设置方式和对应关系本申请不做限制。
在本实施例中,对于音频库中的音频建立的音频模型,通过音频模型与原始视频的图像内容匹配背景音乐,通过匹配结果的准确性。
进一步地,在本申请视频处理方法上述实施例的基础上,提供视频处理方法第五实施例,在第五实施例中,
步骤S20包括:
步骤D1,获取所述原始视频中动作主体的动作模型信息和所述待匹配的背景音乐的音乐模型信息的比较结果;
步骤D2,若所述比较结果满足预设条件,则判定所述背景音乐为筛选出的背景音乐;
动作模型信息为动作主体信息、动作节奏信息、动作幅度信息和动作类型信息其中的至少一种,音乐模型信息为音乐模型信息包括音乐节奏信息、音乐时间信息、音乐音量信息或音乐风格信息中的至少一种。在本实施例中,可以不需要将动作模型信息与音乐模型信息变为动作特征曲线与音乐特征曲线,而利用动作模型信息与音乐模型信息本身的比较结果。
其中,步骤D2包括以下至少一个步骤:
步骤D21,若所述动作模型信息中动作节奏信息与待匹配的背景音乐的所述音乐模型信息中音乐节奏信息相似度符合第一预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
这里,需要将动作模型信息与音乐模型信息转换为动作特征曲线与音乐特征曲线,之后再案子第三实施例中的方法比较动作特征曲线与音乐特征曲线的相似度,当相似度大于预设值及满足第一预设条件时,判定所述待匹配的背景音乐为筛选出的背景音乐。
步骤D22,若所述动作模型信息中动作幅度信息与待匹配的背景音乐的所述音乐模型信息中音乐音量信息相似度符合第二预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
步骤D23,若所述动作模型信息中动作主体信息与所述视频库的的视频的视频中视频主体信息相似度符合第三预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
步骤D24,所述动作模型信息中动作类型信息与所述视频库的视频的视频中动作类型信息相似度符合第四预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
步骤D25,所述原始视频中环境信息与所述视频库的视频的环境信息相似度符合第五预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
对于步骤D22至步骤D25,都是只需要利用动作模型信息与音乐模型信息中的一个特征进行判断,因此只需要比较相应属性的相似度大于对应的预设值即满足相应的预设条件,从而能够找到匹配的背景音乐。如都是老年人散步时的视频的背景音乐,或者都是处于图书馆中的视频的背景音乐等。
在本实施例中,找到匹配的背景音乐的标准根据多样化,从而能够提供更多的可选择的背景音乐给用户选择,从而提高用户的使用体验。
进一步地,在本申请视频处理方法上述实施例的基础上,提供视频处理方法第六实施例,在第六实施例中,
步骤S20包括:
步骤E1,根据所述图像内容中动作主体的动作模型信息对于所述原始视频进行分段;
步骤E2,对于所述分段后的原始视频,根据分段后的原始视频的图像内容筛选出匹配的背景音乐;
根据动作模型信息,将原始视频划分为根据明确的多个分段。如原始视频的视频主体的切换,从人切换为猫狗,或者根据动作节奏信息,将动作节奏快的原始视频与动作节奏慢的原始视频区分开来,从而将原始视频分段后能够根据准确的找到各个分段的视频最适合的背景音乐。这里将分段后的原始视频与背景音乐的匹配方法可以为前述各实施例中所包含的方法。
在本实施例中,通过对于原始视频进行分段,从而获取各分段后的视频最匹配的背景音乐,提高匹配结果的准确性。
进一步地,在本申请视频处理方法上述实施例的基础上,提供视频处理方法第七实施例,在第七实施例中,
步骤S30之前包括:
步骤F,调整所述原始视频中动作主体的动作模型和/或所述背景音乐的音乐模型以调整两个模型相似度;
为了使最终融合出的待背景音乐的视频更加自然流畅,因此需要对于动作模型或音乐模型进行调整。
其中,步骤F包括:
步骤F1,调整所述原始视频中动作主体的动作模型中至少一个:动作时间信息、动作节奏信息、或动作幅度信息;和/或
步骤F2,调整所述背景音乐的音乐模型中至少一个:音乐节奏信息、音乐时间信息、或音乐音量信息;
如同时调整动作模型的动作节奏与应用模型的音乐节奏,是两者的节奏更加统一。或者调大其中某个音乐模型的音量信息从而强调对应的原始视频的内容等。同时,对于原始视频和/或背景音乐的调整内容可以不限于上述列举的内容。
在本实施例中,在合成前,对于动作模型和/或应用模型进行调整,增加了本申请的趣味性,同时也是为了输出的目标视频更加完美。提供不同的目标视频让用户选择,让用户有参与感的同时更尊重用户的选择。
此外,本申请还提供一种视频处理装置,视频处理装置包括:
获取模块,用于获取待处理的原始视频,并获取所述原始视频中的图像内容;
筛选模块,用于根据所述图像内容,筛选出匹配的背景音乐;
生成模块,用于将所述背景音乐与所述原始视频合成处理,输出带背景音乐的目标视频。
可选地,所述获取模块还用于:
获取所述原始视频中动作主体的动作模型信息和/或环境信息。
可选地,所述筛选模块还包括:
第一获取单元,用于获取待匹配的背景音乐的音乐模型信息;
第一筛选单元,用于根据所述图像内容和所述音乐模型信息,筛选出匹配的背景音乐。
可选地,所述筛选模块还包括:
第二获取单元,用于从所述视频库的视频中获取以下至少一个视频内容:视频中主体信息,视频中环境信息,视频中动作类型信息;
第二筛选单元,用于根据所述图像内容和所述视频内容,筛选出匹配的背景音乐。
可选地,所述筛选模块还包括:
第三获取单元,用于从所述音频库的音频中获取音频模型;
第三筛选单元,用于根据所述图像内容和所述音频模型,筛选出匹配的背景音乐。
可选地,所述筛选模块还包括:
第四获取单元,用于获取所述原始视频中动作主体的动作模型信息和所述待匹配的背景音乐的音乐模型信息的比较结果;
第四筛选单元,用于若所述比较结果满足预设条件,则判定所述背景音乐为筛选出的背景音乐。
可选地,所述筛选模块还包括:
分段单元,用于根据所述图像内容中动作主体的动作模型信息对于所述原始视频进行分段;
第五筛选单元,用于对于所述分段后的原始视频,根据分段后的原始视频的图像内容筛选出匹配的背景音乐。
可选地,所述视频处理装置还包括:
调整模块,用于调整所述原始视频中动作主体的动作模型和/或所述背景音乐的音乐模型以调整两个模型相似度。
本申请还提供一种设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的方法的步骤。
本申请还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行如上各种可能的实施方式中所述的方法。
本申请实施例还提供一种芯片,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得安装有所述芯片的设备执行如上各种可能的实施方式中所述的方法。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在……时"或"当……时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
需要说明的是,在本文中,采用了诸如S10、S20等步骤代号,其目的是为了更清楚简要地表述相应内容,不构成顺序上的实质性限制,本领域技术人员在具体实施时,可能会先执行S20后执行S10等,但这些均应在本申请的保护范围之内。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本申请的保护之内。
Claims (14)
1.一种视频处理方法,其特征在于,所述视频处理方法包括以下步骤:
获取待处理的原始视频,并获取所述原始视频中的图像内容;
根据所述图像内容,筛选出匹配的背景音乐;
将所述背景音乐与所述原始视频合成处理,输出带背景音乐的目标视频。
2.如权利要求1所述的视频处理方法,其特征在于,所述获取原始视频中的图像内容的步骤包括:
获取所述原始视频中动作主体的动作模型信息和/或环境信息。
3.如权利要求2所述的视频处理方法,其特征在于,
所述动作模型信息包括以下至少一种:动作主体信息、动作节奏信息、动作幅度信息和动作类型信息。
4.如权利要求1所述的视频处理方法,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
获取待匹配的背景音乐的音乐模型信息;
根据所述图像内容和所述音乐模型信息,筛选出匹配的背景音乐。
5.如权利要求4所述的视频处理方法,其特征在于,
所述音乐模式信息包括以下至少一种:音乐节奏信息、音乐时间信息、音乐音量信息或音乐风格信息。
6.如权利要求4所述的视频处理方法,所述待匹配的背景音乐为从视频库中获取的背景音乐,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
从所述视频库的视频中获取以下至少一个视频内容:视频中主体信息,视频中环境信息,视频中动作类型信息;
根据所述图像内容和所述视频内容,筛选出匹配的背景音乐。
7.如权利要求4所述的视频处理方法,所述待匹配的背景音乐为从音频库中获取的背景音乐,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
从所述音频库的音频中获取音频模型;
根据所述图像内容和所述音频模型,筛选出匹配的背景音乐。
8.如权利要求4所述的视频处理方法,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
获取所述原始视频中动作主体的动作模型信息和所述待匹配的背景音乐的音乐模型信息的比较结果;
若所述比较结果满足预设条件,则判定所述背景音乐为筛选出的背景音乐。
9.如权利要求2所述的视频处理方法,其特征在于,所述根据所述图像内容,筛选出匹配的背景音乐的步骤包括:
根据所述图像内容中动作主体的动作模型信息对于所述原始视频进行分段;
对于所述分段后的原始视频,根据分段后的原始视频的图像内容筛选出匹配的背景音乐。
10.如权利要求8所述的视频处理方法,其特征在于,所述若所述比较结果达到满足预设条件,则判定所述背景音乐为筛选出的背景音乐的步骤包括以下至少一种:
若所述动作模型信息中动作节奏信息与待匹配的背景音乐的所述音乐模型信息中音乐节奏信息相似度符合第一预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
若所述动作模型信息中动作幅度信息与待匹配的背景音乐的所述音乐模型信息中音乐音量信息相似度符合第二预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
若所述动作模型信息中动作主体信息与所述视频库的的视频的视频中视频主体信息相似度符合第三预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
所述动作模型信息中动作类型信息与所述视频库的视频的视频中动作类型信息相似度符合第四预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐;
所述原始视频中环境信息与所述视频库的视频的环境信息相似度符合第五预设条件,则判定所述待匹配的背景音乐为筛选出的背景音乐。
11.如权利要求10所述的视频处理方法,其特征在于,所述将所述背景音乐与所述原始视频合成处理的步骤之前包括:
调整所述原始视频中动作主体的动作模型和/或所述背景音乐的音乐模型以调整两个模型相似度。
12.如权利要求10所述的视频处理方法,其特征在于,所述调整所述原始视频中动作主体的动作模型和/或所述背景音乐的音乐模型的步骤包括:
调整所述原始视频中动作主体的动作模型中至少一个:动作时间信息、动作节奏信息、或动作幅度信息;和/或
调整所述背景音乐的音乐模型中至少一个:音乐节奏信息、音乐时间信息、或音乐音量信息。
13.一种移动终端,其特征在于,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频处理程序,所述视频处理程序被所述处理器执行时实现如权利要求1至12中任一项所述的视频处理方法的步骤。
14.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的视频处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010793961.8A CN111917999A (zh) | 2020-08-07 | 2020-08-07 | 视频处理方法、移动终端及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010793961.8A CN111917999A (zh) | 2020-08-07 | 2020-08-07 | 视频处理方法、移动终端及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111917999A true CN111917999A (zh) | 2020-11-10 |
Family
ID=73283470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010793961.8A Pending CN111917999A (zh) | 2020-08-07 | 2020-08-07 | 视频处理方法、移动终端及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111917999A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112685592A (zh) * | 2020-12-24 | 2021-04-20 | 上海掌门科技有限公司 | 生成运动视频配乐的方法和装置 |
CN112866584A (zh) * | 2020-12-31 | 2021-05-28 | 北京达佳互联信息技术有限公司 | 视频合成方法、装置、终端及存储介质 |
CN113329263A (zh) * | 2021-05-28 | 2021-08-31 | 努比亚技术有限公司 | 一种游戏视频集锦制作方法、设备及计算机可读存储介质 |
CN113486214A (zh) * | 2021-07-23 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 音乐匹配方法、装置、计算机设备及存储介质 |
CN114513615A (zh) * | 2020-11-16 | 2022-05-17 | 阿里巴巴集团控股有限公司 | 视频的处理方法及装置、处理器及电子设备 |
CN119233037A (zh) * | 2023-06-29 | 2024-12-31 | 荣耀终端有限公司 | 视频数据的处理方法、电子设备及可读介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103795897A (zh) * | 2014-01-21 | 2014-05-14 | 深圳市中兴移动通信有限公司 | 自动生成背景音乐的方法和装置 |
CN109102787A (zh) * | 2018-09-07 | 2018-12-28 | 温州市动宠商贸有限公司 | 一种简易背景音乐自动创建系统 |
CN110099300A (zh) * | 2019-03-21 | 2019-08-06 | 北京奇艺世纪科技有限公司 | 视频处理方法、装置、终端及计算机可读存储介质 |
CN111324773A (zh) * | 2020-02-12 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 一种背景音乐构建方法、装置、电子设备和存储介质 |
-
2020
- 2020-08-07 CN CN202010793961.8A patent/CN111917999A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103795897A (zh) * | 2014-01-21 | 2014-05-14 | 深圳市中兴移动通信有限公司 | 自动生成背景音乐的方法和装置 |
CN109102787A (zh) * | 2018-09-07 | 2018-12-28 | 温州市动宠商贸有限公司 | 一种简易背景音乐自动创建系统 |
CN110099300A (zh) * | 2019-03-21 | 2019-08-06 | 北京奇艺世纪科技有限公司 | 视频处理方法、装置、终端及计算机可读存储介质 |
CN111324773A (zh) * | 2020-02-12 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 一种背景音乐构建方法、装置、电子设备和存储介质 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114513615A (zh) * | 2020-11-16 | 2022-05-17 | 阿里巴巴集团控股有限公司 | 视频的处理方法及装置、处理器及电子设备 |
CN112685592A (zh) * | 2020-12-24 | 2021-04-20 | 上海掌门科技有限公司 | 生成运动视频配乐的方法和装置 |
CN112866584A (zh) * | 2020-12-31 | 2021-05-28 | 北京达佳互联信息技术有限公司 | 视频合成方法、装置、终端及存储介质 |
CN112866584B (zh) * | 2020-12-31 | 2023-01-20 | 北京达佳互联信息技术有限公司 | 视频合成方法、装置、终端及存储介质 |
CN113329263A (zh) * | 2021-05-28 | 2021-08-31 | 努比亚技术有限公司 | 一种游戏视频集锦制作方法、设备及计算机可读存储介质 |
CN113329263B (zh) * | 2021-05-28 | 2023-10-17 | 努比亚技术有限公司 | 一种游戏视频集锦制作方法、设备及计算机可读存储介质 |
CN113486214A (zh) * | 2021-07-23 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 音乐匹配方法、装置、计算机设备及存储介质 |
CN119233037A (zh) * | 2023-06-29 | 2024-12-31 | 荣耀终端有限公司 | 视频数据的处理方法、电子设备及可读介质 |
WO2025001261A1 (zh) * | 2023-06-29 | 2025-01-02 | 荣耀终端有限公司 | 视频数据的处理方法、电子设备及可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109919251B (zh) | 一种基于图像的目标检测方法、模型训练的方法及装置 | |
CN111917999A (zh) | 视频处理方法、移动终端及可读存储介质 | |
CN110163806B (zh) | 一种图像处理方法、装置以及存储介质 | |
CN109461117B (zh) | 一种图像处理方法及移动终端 | |
WO2019233216A1 (zh) | 一种手势动作的识别方法、装置以及设备 | |
CN107767333B (zh) | 美颜拍照的方法、设备及计算机可存储介质 | |
CN108197185A (zh) | 一种音乐推荐方法、终端及计算机可读存储介质 | |
WO2019024237A1 (zh) | 信息推荐方法、移动终端及计算机可读存储介质 | |
CN108156374A (zh) | 一种图像处理方法、终端及可读存储介质 | |
CN107704514A (zh) | 一种照片管理方法、装置及计算机可读存储介质 | |
CN108055463A (zh) | 图像处理方法、终端及存储介质 | |
CN109686359B (zh) | 语音输出方法、终端及计算机可读存储介质 | |
CN109978610A (zh) | 信息处理方法、移动终端及计算机可读存储介质 | |
CN108198127A (zh) | 一种图像处理方法、装置及移动终端 | |
CN109999494B (zh) | 游戏操控方法、装置及计算机可读存储介质 | |
WO2022252823A1 (zh) | 直播视频生成方法及装置 | |
CN113126844A (zh) | 显示方法、终端及存储介质 | |
CN107133296B (zh) | 一种应用程序推荐方法、装置及计算机可读存储介质 | |
CN108765522A (zh) | 一种动态图像生成方法及移动终端 | |
CN111405361A (zh) | 一种视频获取方法、电子设备及计算机可读存储介质 | |
CN114065168A (zh) | 信息处理方法、智能终端及存储介质 | |
CN113127740A (zh) | 信息推荐方法、电子设备及存储介质 | |
CN107995590A (zh) | 一种信息记录方法和移动终端 | |
CN107317930A (zh) | 一种桌面图标的布局方法、装置及计算机可读存储介质 | |
WO2024055748A9 (zh) | 一种头部姿态估计方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |