[go: up one dir, main page]

CN107396032A - 一种基于x86架构的多点控制单元及其工作方法 - Google Patents

一种基于x86架构的多点控制单元及其工作方法 Download PDF

Info

Publication number
CN107396032A
CN107396032A CN201710617693.2A CN201710617693A CN107396032A CN 107396032 A CN107396032 A CN 107396032A CN 201710617693 A CN201710617693 A CN 201710617693A CN 107396032 A CN107396032 A CN 107396032A
Authority
CN
China
Prior art keywords
video
audio
module
way
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710617693.2A
Other languages
English (en)
Inventor
张海滨
孟宪伟
胡斌
王飞
张剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Sun Create Electronic Co Ltd
Original Assignee
Anhui Sun Create Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Sun Create Electronic Co Ltd filed Critical Anhui Sun Create Electronic Co Ltd
Priority to CN201710617693.2A priority Critical patent/CN107396032A/zh
Publication of CN107396032A publication Critical patent/CN107396032A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明属于视频会议技术领域,特别涉及一种基于X86架构的多点控制单元及其工作方法。本发明包括第一多媒体处理模块、音频合成模块、视频拼接模块、第二多媒体处理模块以及流媒体服务模块。本发明能够兼容符合标准sip协议的不同厂商的视频会议终端,具有简洁、轻量、高效、兼容性强、成本低廉的特点,本发明可以兼容sip协议的软硬件设备,大大降低了改造现有视频会议系统的成本。本多点控制单元的工作方法用来完成音视频的转发、音频合成以及视频拼接,本多点控制单元集成了流媒体服务器的功能,大大节省了搭建流媒体服务器的成本,极大地提高了数据分发的实时性和效率,给用来提供更好的体验。

Description

一种基于X86架构的多点控制单元及其工作方法
技术领域
本发明属于视频会议技术领域,特别涉及一种基于X86架构的多点控制单元及其工作方法。
背景技术
近年来,随着计算机技术、通信技术和互联网技术的飞速发展,以视频会议系统为代表的多媒体行业正快速发展,应用范围正逐渐从传统的专业领域、大型企业等高端用户向中小企业等普通用户和个人用户拓展。视频会议的价值也得到越来越多用户的认可。
视频会议系统,一般的视频会议系统又称为电视系统,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议。根据参会地点数目不同,视频会议可分为点对点会议和多点会议。通常,要召开多点视频会议,必须要有多点控制单元(MCU-Multi Control Unit)。多点控制单元是整个视频会议系统的核心组件,完成整个会议的管理、音频混音、视频画面拼接、多媒体码流分发等功能。除了多点控制单元之外,要召开视频会议,还需要视频会议终端、话筒、摄像机、显示器等设备。完整的视频会议系统涉及到的相关技术非常之多,需要很多外部设备的支持。
由于视频会议系统的复杂性,没有统一的行业标准,厂商各自为政,甚至人为的设置技术壁垒,不同厂商之间的视频会议终端是不兼容的,互相之间不能互通,无法进行视频会议。多点控制单元也只能兼容自己品牌的视频会议终端,使得现有视频会议系统的兼容性差、后期维护升级成本高。这样对于一些中小型企业和轻量级用户,现有视频会议产品的性价比就低了很多。
发明内容
本发明为了克服上述现有技术的不足,提供了一种基于X86架构的多点控制单元,本发明多点控制单元可以接入符合标准sip协议的不同厂商的视频会议终端,兼容性强,降低召开多点视频会议的难度,节省成本。
为实现上述目的,本发明采用了以下技术措施:
一种基于X86架构的多点控制单元包括第一多媒体处理模块、音频合成模块、视频拼接模块、第二多媒体处理模块以及流媒体服务模块,其中,
第一多媒体处理模块,用于接收多路音频视频流,并依次对多路音频视频流进行sip协议解析、音频视频解码得到解码后的多路音频以及解码后的多路视频;
音频合成模块,用于获取来自第一多媒体处理模块的解码后的多路音频,并将多路音频合成一路音频;
视频拼接模块,用于获取来自第一多媒体处理模块的解码后的多路视频,并将多路视频合成一路视频;
第二多媒体处理模块,用于接收并对分别来自音频合成模块、视频拼接模块的一路音频、一路视频进行编码,并输出编码后的一路音频和一路视频;
流媒体服务模块,用于接收来自第一多媒体处理模块的多路音频以及多路视频,以及接收来自第二多媒体处理模块的一路音频、一路视频,并输出接收到的音频和视频。
优选的,所述第一多媒体处理模块包括协议解析单元、音频解码单元以及视频解码单元,其中,
协议解析单元,用于接收多路音频视频流,并对多路音频视频流进行sip协议解析,得到多路音频以及多路视频输出至流媒体服务模块;
音频解码单元,用于接收来自协议解析单元的多路音频,并对多路音频进行解码,输出解码后的多路音频至音频合成模块;
视频解码单元,用于接收来自协议解析单元的多路视频,并对多路视频进行解码,输出解码后的多路视频至视频拼接模块。
优选的,所述第二多媒体处理模块包括音频编码单元以及视频编码单元,其中,
音频编码单元,用于接收并对来自音频合成模块的一路音频进行编码,输出编码后的一路音频;
视频编码单元,用于接收并对来自音频合成模块的一路视频进行编码,输出编码后的一路视频。
优选的,所述流媒体服务模块以rtsp服务的形式输出接收到的音频和视频。
优选的,所述第一多媒体处理模块通过rtp协议接收多路音频视频流。
优选的,本多点控制单元是基于x86架构开发搭建,且本多点控制单元运行在x86架构的机器上。
优选的,所述音频解码单元、音频编码单元均支持G711音频编码方式;所述视频解码单元和视频编码单元均支持H.264视频编码方式。
进一步的,所述流媒体服务模块支持通信带宽、帧率、码率的设置。
本发明还提供了一种基于X86架构的多点控制单元的工作方法的工作方法,包括以下步骤:
S1、所述第一多媒体处理模块中的协议解析单元接收多路音频视频流,协议解析单元对多路音频视频流进行sip协议解析,得到多路音频以及多路视频;所述协议解析单元输出多路音频以及多路视频至流媒体服务模块;
S2、所述音频解码单元接收来自协议解析单元的多路音频,并对多路音频进行解码,输出解码后的多路音频至音频合成模块;视频解码单元接收来自协议解析单元的多路视频,并对多路视频进行解码,输出解码后的多路视频至视频拼接模块;
S3、所述音频合成模块将多路音频合成一路音频,并将一路音频发送至音频编码单元;视频拼接模块将多路视频合成一路视频,并将一路视频发送至视频编码单元;
S4、所述音频编码单元对来自音频合成模块的一路音频进行编码,输出编码后的一路音频;视频编码单元对来自音频合成模块的一路视频进行编码,输出编码后的一路视频;音频编码单元和视频编码单元分别输出一路音频、一路视频至流媒体服务模块。
优选的,所述音频合成模块采用混音算法将多路音频合成一路音频,视频拼接模块采用基于二叉树的视频拼接算法将多路视频合成一路视频。
本发明的有益效果在于:
1)、本发明包括第一多媒体处理模块、音频合成模块、视频拼接模块、第二多媒体处理模块以及流媒体服务模块,本发明能够兼容符合标准sip协议的不同厂商的视频会议终端,具有简洁、轻量、高效、兼容性强、成本低廉的特点,本发明可以兼容sip协议的软硬件设备,大大降低了改造现有视频会议系统的成本。
2)、本多点控制单元的工作方法用来完成音视频的转发、音频合成以及视频拼接,本多点控制单元集成了流媒体服务器的功能,大大节省了搭建流媒体服务器的成本,极大地提高了数据分发的实时性和效率,给用来提供更好的体验。
附图说明
图1为本发明的多点控制单元的组成框图。
10—第一多媒体处理模块 11—协议解析单元
12—音频解码单元 13—视频解码单元
20—音频合成模块 30—视频拼接模块
40—第二多媒体处理模块 41—音频编码单元
42—视频编码单元 50—流媒体服务模块
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于X86架构的多点控制单元包括第一多媒体处理模块10、音频合成模块20、视频拼接模块30、第二多媒体处理模块40以及流媒体服务模块50,所述第一多媒体处理模块10用于接收多路音频视频流,并依次对多路音频视频流进行sip协议解析、音频视频解码得到解码后的多路音频以及解码后的多路视频;所述音频合成模块20用于获取来自第一多媒体处理模块10的解码后的多路音频,并将多路音频合成一路音频;所述视频拼接模块30用于获取来自第一多媒体处理模块10的解码后的多路视频,并将多路视频合成一路视频;所述第二多媒体处理模块40用于接收并对分别来自音频合成模块20、视频拼接模块30的一路音频、一路视频进行编码,并输出编码后的一路音频和一路视频;所述流媒体服务模块50用于接收来自第一多媒体处理模块10的多路音频以及多路视频,以及接收来自第二多媒体处理模块40的一路音频、一路视频,并输出接收到的音频和视频。
所述第二多媒体处理模块40输出一路音频、一路视频到解码器、视频会议终端等可以解码的软硬件设备,通过这些设备的解码后再输出到音箱和显示器等设备。
所述流媒体服务模块50用于转发来自第一多媒体处理模块10的多路音频以及多路视频,以及来自第二多媒体处理模块40的一路音频、一路视频,并输出到可以播放标准rtsp流媒体的软硬件设备中,例如vlc播放器、带rtsp流媒体播放功能的浏览器等。
例如,所述流媒体服务模块50为分发音视频流的服务器,所述服务器用于提供流媒体封装,只是做一层rtsp封装,再将音频视频转发。
多点控制单元是召开多点视频会议的核心设备,在多点视频会议中起到控制、音视频转发、音频合成、视频拼接等功能,本多点控制单元可以兼容标准sip协议的软硬件设备。
所述第一多媒体处理模块10包括协议解析单元11、音频解码单元12以及视频解码单元13,所述协议解析单元11用于接收多路音频视频流,并对多路音频视频流进行sip协议解析,得到多路音频以及多路视频输出至流媒体服务模块50;所述音频解码单元12用于接收来自协议解析单元11的多路音频,并对多路音频进行解码,输出解码后的多路音频至音频合成模块20;所述视频解码单元13用于接收来自协议解析单元11的多路视频,并对多路视频进行解码,输出解码后的多路视频至视频拼接模块30。
所述流媒体服务模块50接收来自协议解析单元11的多路音频以及多路视频。
所述第二多媒体处理模块40包括音频编码单元41以及视频编码单元42,所述音频编码单元41用于接收并对来自音频合成模块20的一路音频进行编码,输出编码后的一路音频;所述视频编码单元42用于接收并对来自音频合成模块20的一路视频进行编码,输出编码后的一路视频。
所述流媒体服务模块50以rtsp服务的形式输出接收到的音频和视频;所述多点控制单元是基于x86架构的;所述多点控制单元支持H.264视频编码方式、G711音频编码方式;所述多点控制单元支持通信带宽、帧率、码率等多媒体参数的设置。
本发明还提供了一种基于X86架构的多点控制单元的工作方法,包括以下步骤:
S1、所述第一多媒体处理模块10中的协议解析单元11接收多路音频视频流,协议解析单元11对多路音频视频流进行sip协议解析,得到多路音频以及多路视频;所述协议解析单元11输出多路音频以及多路视频至流媒体服务模块50;
S2、所述音频解码单元12接收来自协议解析单元11的多路音频,并对多路音频进行解码,输出解码后的多路音频至音频合成模块20;视频解码单元13接收来自协议解析单元11的多路视频,并对多路视频进行解码,输出解码后的多路视频至视频拼接模块30;
S3、所述音频合成模块20将多路音频合成一路音频,并将一路音频发送至音频编码单元41;视频拼接模块30将多路视频合成一路视频,并将一路视频发送至视频编码单元42;
S4、所述音频编码单元41对来自音频合成模块20的一路音频进行编码,输出编码后的一路音频;视频编码单元42对来自音频合成模块20的一路视频进行编码,输出编码后的一路视频;音频编码单元41和视频编码单元42分别输出一路音频、一路视频至流媒体服务模块50。
所述音频合成模块20采用混音算法将多路音频合成一路音频,视频拼接模块30采用基于二叉树的视频拼接算法将多路视频合成一路视频。
本发明可以应用在人防部门中,各个地方建设视频会议系统的时间不同,所用的设备也不同,要召开视频多点视频会议很困难,多点控制单元部署在x86机器上;在要召开多点视频会议之前,多点控制单元可以把符合标准sip协议的设备加入到通信列表;多点控制单元可以发起会议,邀请加入会议、邀请发言、禁止发言、关闭会场等;在召开会议的同时,可以把现场的视频和声音以rtsp服务的形式分发出去。也就说,多点控制单元可以融合符合sip协议的不同视频会议终端,大大降低改造现有视频会议系统的成本,提供了廉价高效的解决方案。

Claims (10)

1.一种基于X86架构的多点控制单元,其特征在于:包括第一多媒体处理模块(10)、音频合成模块(20)、视频拼接模块(30)、第二多媒体处理模块(40)以及流媒体服务模块(50),其中,
第一多媒体处理模块(10),用于接收多路音频视频流,并依次对多路音频视频流进行sip协议解析、音频视频解码得到解码后的多路音频以及解码后的多路视频;
音频合成模块(20),用于获取来自第一多媒体处理模块(10)的解码后的多路音频,并将多路音频合成一路音频;
视频拼接模块(30),用于获取来自第一多媒体处理模块(10)的解码后的多路视频,并将多路视频合成一路视频;
第二多媒体处理模块(40),用于接收并对分别来自音频合成模块(20)、视频拼接模块(30)的一路音频、一路视频进行编码,并输出编码后的一路音频和一路视频;
流媒体服务模块(50),用于接收来自第一多媒体处理模块(10)的多路音频以及多路视频,以及接收来自第二多媒体处理模块(40)的一路音频、一路视频,并输出接收到的音频和视频。
2.如权利要求1所述的一种基于X86架构的多点控制单元,其特征在于:所述第一多媒体处理模块(10)包括协议解析单元(11)、音频解码单元(12)以及视频解码单元(13),其中,
协议解析单元(11),用于接收多路音频视频流,并对多路音频视频流进行sip协议解析,得到多路音频以及多路视频输出至流媒体服务模块(50);
音频解码单元(12),用于接收来自协议解析单元(11)的多路音频,并对多路音频进行解码,输出解码后的多路音频至音频合成模块(20);
视频解码单元(13),用于接收来自协议解析单元(11)的多路视频,并对多路视频进行解码,输出解码后的多路视频至视频拼接模块(30)。
3.如权利要求2所述的一种基于X86架构的多点控制单元,其特征在于:所述第二多媒体处理模块(40)包括音频编码单元(41)以及视频编码单元(42),其中,
音频编码单元(41),用于接收并对来自音频合成模块(20)的一路音频进行编码,输出编码后的一路音频;
视频编码单元(42),用于接收并对来自音频合成模块(20)的一路视频进行编码,输出编码后的一路视频。
4.如权利要求3所述的一种基于X86架构的多点控制单元,其特征在于:所述流媒体服务模块(50)以rtsp服务的形式输出接收到的音频和视频。
5.如权利要求4所述的一种基于X86架构的多点控制单元,其特征在于:所述第一多媒体处理模块(10)通过rtp协议接收多路音频视频流。
6.如权利要求5所述的一种基于X86架构的多点控制单元,其特征在于:本多点控制单元是基于x86架构开发搭建,且本多点控制单元运行在x86架构的机器上。
7.如权利要求6所述的一种基于X86架构的多点控制单元,其特征在于:所述音频解码单元(12)、音频编码单元(41)均支持G711音频编码方式;所述视频解码单元(13)和视频编码单元(42)均支持H.264视频编码方式。
8.如权利要求7所述的一种基于X86架构的多点控制单元,其特征在于:所述流媒体服务模块(50)支持通信带宽、帧率、码率的设置。
9.一种如权利要求3~8任一项所述的基于X86架构的多点控制单元的工作方法,其特征在于,包括以下步骤:
S1、所述第一多媒体处理模块(10)中的协议解析单元(11)接收多路音频视频流,协议解析单元(11)对多路音频视频流进行sip协议解析,得到多路音频以及多路视频;所述协议解析单元(11)输出多路音频以及多路视频至流媒体服务模块(50);
S2、所述音频解码单元(12)接收来自协议解析单元(11)的多路音频,并对多路音频进行解码,输出解码后的多路音频至音频合成模块(20);视频解码单元(13)接收来自协议解析单元(11)的多路视频,并对多路视频进行解码,输出解码后的多路视频至视频拼接模块(30);
S3、所述音频合成模块(20)将多路音频合成一路音频,并将一路音频发送至音频编码单元(41);视频拼接模块(30)将多路视频合成一路视频,并将一路视频发送至视频编码单元(42);
S4、所述音频编码单元(41)对来自音频合成模块(20)的一路音频进行编码,输出编码后的一路音频;视频编码单元(42)对来自音频合成模块(20)的一路视频进行编码,输出编码后的一路视频;音频编码单元(41)和视频编码单元(42)分别输出一路音频、一路视频至流媒体服务模块(50)。
10.如权利要求9所述的一种基于X86架构的多点控制单元的工作方法,其特征在于:所述音频合成模块(20)采用混音算法将多路音频合成一路音频,视频拼接模块(30)采用基于二叉树的视频拼接算法将多路视频合成一路视频。
CN201710617693.2A 2017-07-26 2017-07-26 一种基于x86架构的多点控制单元及其工作方法 Pending CN107396032A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710617693.2A CN107396032A (zh) 2017-07-26 2017-07-26 一种基于x86架构的多点控制单元及其工作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710617693.2A CN107396032A (zh) 2017-07-26 2017-07-26 一种基于x86架构的多点控制单元及其工作方法

Publications (1)

Publication Number Publication Date
CN107396032A true CN107396032A (zh) 2017-11-24

Family

ID=60342404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710617693.2A Pending CN107396032A (zh) 2017-07-26 2017-07-26 一种基于x86架构的多点控制单元及其工作方法

Country Status (1)

Country Link
CN (1) CN107396032A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109150917A (zh) * 2018-10-30 2019-01-04 广州海格通信集团股份有限公司 基于sip协议的视频合成控制方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1816134A (zh) * 2005-02-06 2006-08-09 中兴通讯股份有限公司 一种多点视频会议系统及其媒体处理方法
CN101370114A (zh) * 2008-09-28 2009-02-18 深圳华为通信技术有限公司 视频及音频处理方法、多点控制单元和视频会议系统
JP2009117896A (ja) * 2007-11-01 2009-05-28 Toshiba Corp 合成映像配信装置ならびにその方法およびプログラム
CN101478642A (zh) * 2009-01-14 2009-07-08 镇江畅联通信科技有限公司 视频会议系统的多画面混图方法及装置
CN103051864A (zh) * 2012-12-26 2013-04-17 浙江元亨通信技术股份有限公司 移动视频会议方法及其系统
CN203206388U (zh) * 2013-04-29 2013-09-18 熔点网讯(北京)科技有限公司 一种用于视频会议的多点控制单元

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1816134A (zh) * 2005-02-06 2006-08-09 中兴通讯股份有限公司 一种多点视频会议系统及其媒体处理方法
JP2009117896A (ja) * 2007-11-01 2009-05-28 Toshiba Corp 合成映像配信装置ならびにその方法およびプログラム
CN101370114A (zh) * 2008-09-28 2009-02-18 深圳华为通信技术有限公司 视频及音频处理方法、多点控制单元和视频会议系统
CN101478642A (zh) * 2009-01-14 2009-07-08 镇江畅联通信科技有限公司 视频会议系统的多画面混图方法及装置
CN103051864A (zh) * 2012-12-26 2013-04-17 浙江元亨通信技术股份有限公司 移动视频会议方法及其系统
CN203206388U (zh) * 2013-04-29 2013-09-18 熔点网讯(北京)科技有限公司 一种用于视频会议的多点控制单元

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109150917A (zh) * 2018-10-30 2019-01-04 广州海格通信集团股份有限公司 基于sip协议的视频合成控制方法和系统
CN109150917B (zh) * 2018-10-30 2021-06-08 广州海格通信集团股份有限公司 基于sip协议的视频合成控制方法和系统

Similar Documents

Publication Publication Date Title
US8233026B2 (en) Scalable video encoding in a multi-view camera system
CN101257607B (zh) 一种应用于视频会议的多画面处理系统和方法
US8228363B2 (en) Method and system for conducting continuous presence conferences
EP2154885B1 (en) A caption display method and a video communication control device
US8531994B2 (en) Audio processing method, system, and control server
KR100880150B1 (ko) 멀티 포인트 화상회의 시스템 및 해당 미디어 프로세싱방법
CN100454820C (zh) Mcu级联系统和该系统的创建及通信方法
CN1893431A (zh) 具有格式与协议转换的内容整合平台
CN106464842B (zh) 用于混合式拓扑媒体会议系统的方法和系统
CN1893430A (zh) 具有格式与协议转换的内容整合方法
CN101198008A (zh) 一种实现多屏多画面的方法和系统
CN1929593A (zh) 多点视频会议中的空间相关音频
CN100562094C (zh) 一种会议电视系统中的多画面远端摄像机遥控方法
WO2013053336A1 (zh) 混音方法、装置及系统
CN100417155C (zh) 远程教学多模式实时多媒体交互系统
WO2012041117A1 (zh) 一种对视频会议终端集中监控的方法和系统及相关装置
CN102915736B (zh) 混音处理方法和混音处理系统
CN103581610A (zh) 进行不同参与设备的视频会议的方法与系统
CN104980683A (zh) 一种视频电话会议的实现方法及装置
CN1411278A (zh) Ip网络电视会议系统
CN101860714B (zh) 一种视频处理方法及其系统、mcu视频处理单元
CN102291399A (zh) 一种流媒体切换台
CN102438119B (zh) 一种数字电视的音视频通讯系统
CN107396032A (zh) 一种基于x86架构的多点控制单元及其工作方法
Ohira et al. A world first development of a multipoint videophone system over 3G-324M protocol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171124