内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体






AVS-S音视频监控标准介绍及展望

时间:2008-07-30 来源:胡瑞敏、牟晓弦、路依莎 武汉大 作者:顾小军 点击:

继上一期刊登《AVS视频和音频编码标准的应用》之后,本期通过分析安防产业的发展现状以及其对视频监控的特殊需求,介绍了国有自主知识产权面向安防的音视频标准AVS-S在安防视频监控核心技术上的重要性,制定的目的意义及其关键技术,进一步分析了需要解决的技术问题和相关技术方案,希望有助于推动安防监控产业的健康可持续发展。
文/胡瑞敏、牟晓弦、路依莎 武汉大学国家多媒体软件工程技术研究中心

面向安防的数字音视频监控标准(AVS-S)是中国制定的具有自主知识产权的新一代音视频编解码标准。相对于现存标准如MPEG-2、MPEG-4、MPEG-4 AVC(简称AVC,也称JVT、H.264)、AVS,及其它私有标准而言,其特有的最大优点就是能够满足目前安防产业的特殊需求,以解决阻碍国内安防产业健康持续发展的专利壁垒等问题,为安防产业发展带来了新的契机。

标准倾向于接受比较成熟的技术,因此有些技术比如面向对象的编码,虽然是安防领域所需要的技术,但不宜写入标准中。制定AVS-S的总体目标是为迅速发展的公共安全与监控领域设备提供音视频解码、系统、版权保护和文件格式等方面的规范,而需要满足的公共安全与监控领域的音视频编码需求为:能适应多种网络情况,支持通过专网、互联网、无线网络等传输,支持实时的码率可调,支持感兴趣区域的高质量编码,支持光线环境变化的优化编码,支持位置信息等辅助信息叠加,面向存储的优化编码。

信息产业部科学技术司早就在2002年12月正式发文成立“数字音视频编解码技术标准AVS工作组”,负责数字音视频等多媒体设备与产品中的压缩、解压缩、处理和表示等技术标准的制定工作。AVS标准组联合公安部第一研究所、武汉大学国家多媒体软件工程技术研究中心、TC100、北京大学等单位综合了安防需求,经过专家和企业代表多次讨论与一致认同,抽象出视频监控领域对数字音视频编解码技术标准的需求,并作为输出文档进行标准化,成为今后AVS-S制定的需求目标。

新标准为安防产业打造崭新的前景

安防行业的特殊需求
视频编解码技术是视频监控的实现基础和关键技术,视频监控在不断发展的同时,对视频编解码技术的需求也在不断提高。在最初的监控系统中,视频处理技术仅仅用来压缩存储数字化的视频信息。随着监控系统网络化和智能化的发展,安防领域有着压缩存储需求、显示和播放需求、网络QoS需求、安全性需求、交互性需求等一系列新的应用需求。对于每一类应用需求来说,会有不同层次的技术需求来不同程度地满足应用需求,表1为应用需求到技术需求的映射。根据标准的性质,不同的技术在标准中实现的优先级是不一样的。一般说来,成熟且迫切需要的技术是优先采用,不够成熟的技术或者实际需求有限的技术暂缓考虑。

新标准能够弥补现存标准的瓶颈
目前安防产业可以选择的信源编码标准有四个:MPEG-2、MPEG-4、MPEG-4 AVC(简称AVC,也称JVT、H.264)、AVS。从制订者分,前三个标准是由MPEG专家组完成的,第四个是我国自主制定的。从发展阶段分,MPEG-2是第一代信源标准,其余三个为第二代标准。从主要技术指标——编码效率比较:MPEG-4是MPEG-2的1.4倍,AVS和AVC相当,都是MPEG-2两倍以上。可以推测,MPEG-2技术陈旧需要更新及收费较高;MPEG-4出台的新专利许可政策被认为过于苛刻令人无法接受;H.264编码效率较高但是专利收费较为昂贵;同时目前的AVS标准不满足安防领域的特殊需求,而其它私有标准又无法实现不同系统的互通。因此,即使专利收费问题能够得到解决,这些现存标准也并不能够有效地适合安防行业的各种特殊需求,现实迫切需要制定新的标准。

AVS-S的关键技术

目前,TC100和AVS两个标准化已经同意共同开展面向安防监控的音视频编解码标准(AVS-S)的制定。AVS-S现在的技术处于制定阶段,预计明年可以制定完毕。

AVS-S在视频编码的混合框架基础之上,研究空域时域和质量可分级技术,实现多码流和时间空间分辨率的调整。然后,以此编码框架为基础,结合安防的特殊需求,逐项研究其解决算法,并在编码框架中添加对于这些特殊技术的语法语义和编解码结构上的支持。具体的技术要点叙述如下。

可分级视频编码框架
图1所示的编码框架基于现有的编码技术进行扩展,首先对视频流进行空域上的下采样,实现空域上的分层,其中,空间分辨率最小的层为基本层,每层可按照现有的编码技术分别编码。由于各层之间存在一定的相关性,考虑到计算复杂度,增强层可以复用基本层的运动信息。对于每一层可以进一步划分时域上的层次,通过调整视频序列结构,调整B帧的数量,以实现时域上的可分级性。而质量上的可分级性可以分别在每一层的变化和量化模块,通过调整量化系数来实现。通过这样的编码框架,视频流具有一定的带宽自适应能力、抗误码性能和更好的解决安防特殊需求的能力。

重点监控对象区域的分割
将可分级技术和对象编码技术相结合,对重点监控对象分配较多的码率进行高质量的压缩,而对于背景或其它不重要的监控区域进行一般的压缩。这样,在保证视频质量的基础上大幅地提高视频压缩率,减少需要的存储空间和传输带宽。
需要提出的是,目前对象分割算法的复杂度是非常高的,精细准确的分割对象很难实际应用。

研究具有防伪功能的数字视频水印技术及视频加密算法
视频水印技术在压缩视频流中提供防伪信息,并提供时间、地点信息的叠加等功能,支持OSD、LOGO和区域屏蔽,以及日期和时间的设置。它利用数据隐藏技术将特定的信息嵌入到视频数据中,保证重要数据的安全,防止资料被篡改和被伪造。可借鉴图像水印技术大量的研究成果,同时基于视频与图像某些本质的差异,重点研究视频水印和图像水印不同的技术特征。

面向环境的优化编码和快速检索技术
为了进一步提高编码压缩效率,可以根据光线环境的变化来调节编码器模式。为了达到优化编码的目的,可以考虑构建编解码标准的时候,将几类典型的应用环境分级,对不同的级别设定不同的编码级别。可分级编码技术能够比较方便地解决检索的速度问题。由于基本层的视频序列具有比较小的分辨率和帧率,所以可以在基本层上进行检索。当检索到需要的内容的时候,再解码出相应的增强层信息,以最好的质量来供调查取证。这样既可以降低检索的复杂度,又保证了取证的质量。
(中国集群通信网 | 责任编辑:陈晓亮)

中国集群通信网,国内首家集群通信专业网站。

Copyright © PttCn.Net, All Rights Reserved.   

联系我们 联系我们 中国集群通信网 对讲机学堂 对讲机世界