主页(http://www.pttcn.net):数字可视对讲技术探讨— 数字智能家居新秀 20世纪60年代,电视改变了人们的生活,出现了“电视一代”;80年代,电脑改变了人们的工作方式,促成了“电脑一代”;90年代,互联网改变了人们获取信息的方式,诞生了“网络一代”。进入21世纪,数字化的生活方式将无处不再,最终会全面进入每个人的家庭,数字家庭的浪潮已经汹涌澎湃。 传统的数字家庭中心之争:PC中心论、TV中心论及SetBox中心论,其优势和劣势都很明显,就单一产品而言都难以独自承担数字家庭的重任。近年来市场上出现了另一产品逐渐承担了数字家庭越来越多的功能和责任,这就是数字可视对讲。传统的楼宇可视对讲产品逐渐往数字化,网络化、智能化的方向发展,可视对讲产品除了担当可视对讲、遥控开锁、报警等功能外,还实现了远程视频监控、异动报警、门禁、三表抄送、信息发布、智能家居控制、上网及视频点播甚至手机联动等增值服务。这类产品大多内置了性能强大的Soc处理器和触摸TFT显示屏,尤其标配的网络功能,给产品带来了更多的想象空间,将越来越多的融合PVR、DPF数码相框、可视电话、媒体播放器等数字媒体功能。数字可视对讲悄悄地充当了数字家庭另一中心的角色。 可视对讲发展趋势 今后数字可视对讲的发展更多的是融合了智能家居控制,逐渐成为智能家居的控制中心,同时也会将越来越多的附加功能加入其中。 数字可视对讲技术原理及框图 数字可视对讲系统的构成,一般包含这么几个模块:室内机,梯口机、交换机、管理机等。如图2所示。
访客来访,通过梯口机拨号呼叫指定的室内机,梯口机通过将访客的影音信息数字化后编码压缩传送给指定的室内机,室内机接收到网络传输过来的影音信号进行解压缩显示,确定访客身份后,按动开锁键开启梯口的门锁。同时,梯口机和室内机之间还实现了VoIP,两个终端可实现双向语音对讲,为业主辨别来客身份提供进一步沟通、确认之需要。 在两个室内机或室内机与管理机之间,系统则提供了双向的视频及语音传输功能。在功能实现上,梯口机、管理机都可以归结为室内机。室内机的功能最为全面,实现音视频的压缩传输、接收解压缩显示和回声抵消功能,同时可作为各项网络增值业务的实现终端。本文以海思半导体的多用途媒体网络处理芯片Hi3510为例介绍室内机的构成。Hi3510是海思半导体针对媒体压缩/解压缩处理、网络传输、VoIP多功能混合应用市场开发的处理芯片,已广泛应用于可视电话、网络摄像机、网络视频服务器及数字可视对讲等产品上。从Hi3510应用于数字可视对讲的系统框图中,我们可以看出完整的信号处理元素和流程。 以Hi3510为核心,配备图像传感器作为影像输入源,视频信号通过ITU656接口输送给Hi3510,Hi3510对数字视频进行压缩处理,经过PHY将数据以TCP/IP包传输到目的地;同时,Hi3510对通过PHY传送的TCP/IP包进行解码、缩放,通过RGB888接口送至TFT Module显示;为方便用户进行选择操作,可通过SPI接口及GPIO实现触摸屏和按键功能;语音数据则通过一颗音频Codec进行AD编码后通过I2S总线送往Hi3510处理,Hi3510不仅仅需要对语音作压缩处理以备传输,而且还需要实现双向语音传输所需的回声抵消功能、唇音同步以及按键的双音多频DTMF等。多达两个的USB1.1接口提供了丰富的个人存贮界面,各种影音即可通过网络传输也可通过USB及USB转SD存贮至本地,以便需要时播放。若需扩展WIFI无线传输,另一个USB1.1接口可提供成本低且易实现的USB转Wi-Fi方案。 技术核心:视频压缩、语音处理、网络传输 未来多媒体产品的核心不外乎:音视频压缩,语音处理和网络传输三大部分。无论是从PC娱乐、SetBox,还是Digital TV以及任何多媒体产品都可以看到这三大要素的踪影。作为数字家庭中的新秀,这三要素也是构成数字可视对讲系统的基础。 由于历史原因,早期的数字可视对讲的视频编码格式多为H.263,其目的是为了和可视电话兼容。H.264作为H.263的升级版本提供了更大的压缩比和更好的网络适应性。基于此,越来越多的数字可视对讲产品采用H.264标准作为视频压缩的格式。 H.264最大特点是对带宽的要求很低,在同等的还原图像质量的情况下,H.264要比MPEG-4节省50%以上的码率。同时,H.264在设计之初就考虑到了在不同网络资源下的分级编码传输。H.264具有较强的容错能力,在质量不稳定的网络环境中,可以得到比MPEG4编码视频更好的质量。当然,H.264带来的好处不是免费的、更高的压缩比和良好的网络适应性能,而是处理算法的复杂化,对处理器提出了更高的性能要求。 为了适应网络传输的特点,语音也需要低带宽、高音质的音频编码标准。日常所常见的MP3、AAC等多媒体音频格式不能很好的适应语音网络通信的要求。语音网络通信使用的更多的是G.7xx和AMR(Adaptive Multi-Rate)语音编码,以便在有限带宽下提供多路数的语音数据业务。例如,G.729是一种高效的压缩编码技术,可将经过采样的64kb/s话音以几乎不失真的质量压缩至8kb/s,非常适合在VoIP系统中使用;AMR主要用于移动设备的音频,压缩比比较大,但相对其他的压缩格式质量比较差,由于多用于人声通话,效果还是很不错的。同时为了支撑双向语音对讲业务,语音处理模块仍要提供对回声抵消、唇音同步、噪声抑制、双音多频DTMF的支持。普通的多媒体处理器往往只能提供单一的语音处理功能,因此应用在数字可视对讲上的处理器需提供更为灵活和强大的语音支持。
|