5月18日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会在北京国家会议中心举办,浙江大华技术股份有限公司研发中心副总经理兼大数据研究院院长许焰带来了关于视频云的心得分享。
许焰表示:“视频云本质上是一朵能力云,我们希望提供云存储服务帮助用户解决海量视频图像存储问题。我们希望图像云识别帮助用户解决大规模图像计算能力,我们希望开放大数据能力,帮助大家解决行业上大数据挖掘的能力,我们希望提供这样一朵云让我们用户让我们上层用户变得更加简单,数据价值视频能力可以发挥更加完整。”
以下是许焰演讲实录:(以下内容根据现场速记整理,未经发言嘉宾确认,仅供参考,谢绝转载。)
大家下午好,今天我主题演讲是视频云平台的创新与实践。
视频云的火爆给我们所有人把目光从最早从文字到图片到音频到现在视频应用,让我们从数据应用改变成完全全新方式,在我们数据里面其实我们视频数据占76%,这76%的里面又有绝大多数的数据由摄象头产生的。很多人对摄象头没有概念,摄象头带来多少数据量?我们以高清数据为例,一个摄象头一个月带来1.3TB,一年带来15.6亿TB大华公司一年生产两千多万的摄象头,一个月带来8个亿TB的数据量。我们公司过去十几年的时间里面一直持续保持每年40%以上的速度快速成长,我们成为全球第二大视频监控的设备以及解决方案的供应商,凭借我们十几年技术视频领域的技术积累,我们不停在新领域进行探索和创新,其中包含我们视频云,我们视频云和普通云有什么区别?我们视频云我们更多希望开放十几年来在视频技术上的积累,我们希望把我们云开放出来,因此它本质上是一朵能力云,我们希望提供云存储服务帮助用户解决海量视频图像存储问题。我们希望图像云识别帮助用户解决大规模图像计算能力,我们希望开放大数据能力,帮助大家解决行业上大数据挖掘的能力,我们希望提供这样一朵云让我们用户让我们上层用户变得更加简单,数据价值视频能力可以发挥更加完整。
四年前我们公司开始尝试做云计算,我们想做云计算是面向行业的,面向视频甚至面向视频监控领域的云。行业云跟我们普通云计算有什么区别?在课程上,我们需要一个优化的IaaS,我们需要面向行业的PaaS,我们需要面向各种需求的SaaS,我们考虑这个问题我们毋庸置疑必须考虑我们行业特征数据以视频图像为主,对于IaaS最基本是存储服务,对于面向视频存储跟我们普通存储有哪些不一样,我们数据平均规模在3个PB,远大于我们所见互联网客户或者传统数据量。我们海量视频数据大量进行存储,少量进行读出和播放,它的特点跟互联网读多写少的特点完全不一样。第三点因为我们数据量特别庞大,而且数据里面的价值密度又有很低,因此客户对于这种成本非常之敏感,还有视频数据最重要一点它跟文本不一样,它一定配合流媒体我们才可以对数据进行播放或者对数据进行解析。同时它在扩展性以及数据生命周期上跟我们传统云存储都有很多不一样。
当我们大华围绕视频数据构建我们视频云存储的时候核心功能包含三块。第一块摄象头的接入管理,第二块分布式文件系统,第三块流媒体服务。我们希望构建的视频云无须我们前端摄像头厂商做任意开发,不用调SDK可以接入我们云端,我们支持摄像头各种协议,我们支持市场上所有主流摄象头的私有协议,几乎你想得到的都可以任意接入。我们也在第二块分布式文件系统上也是业界唯一第一家推出以视频流式方式写入的对象存储系统。同时我们支持以流式实时做容错方法。在一套系统上面一起支持面向海量大文件的视频存储,海量面向图片、文档小文件存储。在流媒体我们拥有很强各种视频的编辑码、我们支持各种各样的视频格式,我们视频云存储理念,是希望用户你只要有摄象头我们帮助你接入,数据流自动流到我们云平台,你所做的就是以文件流媒体使用这些数据。
对存储而言最重要毋庸置疑就是可靠性尤其对于我们行业用户而言。对于视频监控我们数据是时时7乘24小时不间断的写入,我们很多硬盘不支持这种模式,因为它支撑不了这种不停工作的模式,随着硬盘变得越来越大,我们硬盘故障带来的恢复周期变得慢慢不可接受,我们一块4KP的为例,我恢复周期四天四夜才能把这块硬盘恢复。我们在新闻上看到这个地方发生一个案件我们需要查录像,他告诉我们录像没了,实际上以前很多安防存储系统可靠性很低,平时没有人看这个录像你不知道这个设备已经出现故障了,当你看的时候你发现它故障了。我们最初构建我们云存储第一目标解决数据可靠性问题,因此我们采用流式实时写入,不可能采用高成本多复本技术,这种技术让我们原来几天几夜恢复一块硬盘数据,我们减到一小时几分钟我们就可以恢复,这是几十倍的提升,不仅仅给我们带来可靠性的提升,给我们带来某种程度上成本的下降,用户可以用更加廉价的硬件廉价硬盘提供高可用的服务。
任何创新本质无非是说我们能不能降低成本,或者我们能不能提升效率?对于我们行业来讲最大客户痛点就是说客户下载录像非常慢,我们以前很多公安客户给我们抱怨说我下载一个摄象头十天十夜数据我要花三天时间下载完,当我下载完这个嫌疑犯都不知道跑到哪里去了,我们考虑以前为什么下载这么慢?因为我们以前所有存储系统都有最大问题就是数据热点问题,我们有很多摄象头也有很多存储设备,每一个摄象头分到不同存储设备商,当我要这个摄象头只有这一个存储设备给我们提供服务,我们采用云的架构完全打破数据的热点,保证我们数据聚合读写,数据分散存储能力,让我们将24小时视频容量差不多是43个PB我们花一分钟最快就可以下载到我们本地,这是我们提供高性能的东西。这个高性能给我们带来用户的效率是极大的提升。
当然我们很多人在谈今天我们是DT的时代,DT时代核心在于我们数据是不是能够实现共享?我们数据是不是能够实现融合?但是对于行业用户而言我们传统的建设都是烟囱式建设,一套应用一个服务器一套存储是非常之专用的,专用有专用的好处,因为它可以解决固定的问题。比如说我们在安防这个行业以前我们怎么干?如果我们需要一套安防的存储我们只需要开发一个流媒体,然后在利用本地的文件系统就可以把这个数据存起来。但是这种模式在我们最早期的时候发现因为经过大量的数据写入又不停的数据删除,文件系统带来最大问题就是碎片化,碎片变多了它的性能就集聚下降,我们整个行业机会所有厂商都做一件事情就是做优化,做优化我们把本地文件系统完全抛弃掉,流媒体数据写进来将硬盘从头到底写到底,然后从头覆盖再写到底,这是最佳的优化。当今天我们以DT角度去看这个我们思考我们这么做我们数据能否实现共享,我们存储能否实现我们融合的想法?因此我们也是我们整个行业第一家推出以融合架构数据分享这种架构体现云存储的形式。
摄象头数据跟我们看到物联网很多其他的传感器它都有一个共性,因为它是数据7乘24小时不间断产生的过程,这种应用对我们来讲读出写入到底哪一个更重要?对于写入而言如果我们数据暂时不能读出,它只能暂时影响我应用是暂时不可用的,但是我数据出现中断不能写入,意味着我们整个系统发生了数据丢失,发生数据丢失以后我们不可能有下面更多的应用,因此对这种系统来讲它的写入远远比读出更加重要。但是如果我们写入比读出更重要,我们现在主流看到所有的存储,尤其是分布式存储的设计都是不满足的。我举个例子我们很多存储设计我们考虑有节点故障、硬盘故障甚至网络的故障,考虑原数据服务的故障,我们发现原数据故障基本的数据都进入只读的模式,意味着我们应用是灾难性的应用。原数据还是有可能发生故障我们考虑这种状况的时候,我们云存储发生原数据故障退到NaaS数据,原数据恢复之后我们数据可以迁移到云存储进行分散存储,这是取巧的做法但的确满足我们这种运用。
我们整个互联网领域我们云计算领域我们有一句话三分靠技术七分靠运维,这个运维其实非常重要,我们可以远程的运维,甚至可以去做很多事情,但是行业用户不允许我们存储有任何跟外面接触。也就是你不能去插网线,不能远程看到你这个存储设备,那怎么办?我们必须要靠技术。我举个很简单的例子我们有很多云系统给到公安客户,他没有标准机房没有空调,这个设备可能工作在他一个办公室,可能温度达到40度50度的工作时间,这个系统也要保证稳定运行。还有我们客户没有很好UPS,它的电源不稳定,可能经常断电又重新来电,这时候我们传统的存储或者我们常见的分布式存储,都扛不住各种各样的异常,但是我们云存储它必须考虑行业用户各种各样的乱七八糟的需求。也必须要保证我们存储拥有很高可靠性。
存储只是解决我们一个需求,数据等存进去有读出来,我们希望的东西一定说这个数据落进去以后我们能不能发挥这个数据价值,这是我们PaaS平台要做的事情。我们PaaS平台第一件做视频内容识别,第二件我们提供大数据服务。视频识别我们针对视频浓缩、视频摘要、人脸识别。大数据我们就是数据存储、数据碰撞,多维多表格的应用。基于时间、空间两个完全不同的数据碰撞,我们支持交通卡口里面我们想支持同行车两辆车是不是一直开,也有支持套牌车行业定制化服务。视频浓缩是一种什么技术?可以将我们一段很长视频里面所有目标全部摘出来以后我们再重新打乱到这个时间然后更加高密度的方式把目标全部叠加到原来背景上进行重新播放,这种技术让我们原来看一段一小时的视频我们只需要花36秒就看完了,也可能更短也可能更长,取决于这个视频内容有多长。我们为了得到36秒视频要做哪些准备?我们首先把原来一小时视频下载下来这个要花掉15分钟时间,然后把这一小时上传到我们智能服务器又花15分钟时间,然后我们原来单机智能服务器点击做浓缩动作又花掉15分钟时间,因此我们对一小时视频处理准备得花掉45分钟,很多人想那我还不如快进完来得快。我们搬到云端带来好处就是把原来一小时45分钟得到一个结果,直接变成一分钟,一小时一分钟浓缩我们瞬间可以看到里面我们所有要的目标,这是云给我们效率带来的极大提升,这是我们视频浓缩的效果,如果我不告诉你这是我们一段处理过的视频,也许你不知道这个视频怎么样的,它原来是非常稀疏的广场,几分钟才经过一辆车,这么几个小时的视频我们可以短短几十秒内就可以把这个视频看完。
理论上当我们拥有视频浓缩这个技术意味着我们可以对视频里面内容目标进行提取,提取完了之后自然而然很多人想到我其实可以对这个目标进行二次识别的,二次识别我们可以对里面特征进行提取。比如说我今天穿一件T恤衫、牛仔裤,衣服颜色是什么,是男是女,我往哪个方向移动,可以自动标注,标注完以后我们可以对视频内容进行检索。举个例子比如说最右边我们以白色条件为例去搜索视频里面的目标我们拿到是所有白色的目标,当我们从东往西运动这个方向作为条件的时候我们得到的就是中间这些所有的目标,他所有的运动方向都是从东往西运动。我们以人过滤我们得到所有人的目标,而且这个视频是一段非常普遍普通我们街头所拍到的一个视频。
视频浓缩这种技术它其实是非常粗粒度视频识别的技术,我们很多人希望有更加细粒度的技术去处理,比如说我要做人脸识别,我识别这个人是否戴眼镜,这个人有没有戴帽子,这个人衣服纹理是什么,颜色是什么?我们可以支持千万级人脸库一秒钟可以比对完。我们同时可以支持车做更加细粒度的,你车开在路上经过十字路口就拍下来,拍下来我们细粒度识别,识别出来不仅仅有牌子,是一辆什么样的车,是货车还是小轿车,是2014年的奥迪款,识别主驾驶员有没有系安全带,你有没有用什么东西遮住你脸部,根据车窗特征,是不是放一个纸巾盒,有没有挂件,各种特征形成一个库,这个库对我们后续要做物体搜索带来极大的帮助。所有识别都是智能算法本身,识别完了之后我们更多做一件事情将传统非结构化的视频我们转成了结构化数据,变成结构化数据以后我们以传统的甲骨文方式去存,完全没有办法支撑我们作用,所以我们有一个分析型数据库支撑我们应用。我们分析型数据库其实不仅仅只是提供一个普通查询或者模糊查询,更多提供面向行业的应用包括时空碰撞,包括这辆车常驻的点是哪里,常用地址有哪些,它今天有没有异常,它热力呈现是如何?它这辆车跟其他车之间是如何,各种各样碰撞真实的挖掘。
这是真实案例,我们拥有30亿过车的车辆数据系统我们做一个比较,用我们最小规模云计算的系统跟甲骨文加一台小型机比较我们得出答案是这样的。像碰撞查询、套牌车分析、首次出现、高危时刻,我们基本上秒级得到一个结论,甲骨文加上小型机几百秒都得不出结论,这是我们云给所有客户带来巨大性能提升也带来真真实实的东西。
我们拥有了存储能力,识别能力,大数据挖掘能力,我们可以做哪些事情?第一件事情非常简单,我们做以图搜图,我们做以图搜车,我点击车辆把它完全轨迹全部画出来,过程热力呈现画出来,针对它统计也出来,这个识别非常精确,它可以精确这辆车是一个福特,型号是2014年出产的,颜色是白色,类型是MPV,牌照是某某,这个人进行了脸部遮挡说明他有嫌疑,这是我们以图搜车的案例。我们有一个公安客户跟我们谈一个梦想,他说他想构建一个天罗地网,比如说我今天走在路上,突然边上开过来一辆摩托车把我包抢了,我赶快报警,我给它描述,他可以立马调摄象头分析这个目标,我们找到摩托车的车牌号码,于是把车牌号码和其他特征下放到我们布控的云平台里面,一旦在下一个摄象头立马发出报警,立马有警察给抓捕到,这在今天立刻可以落地。
停车难是我们碰到的最大问题,我们下班发现我车被人刮了,你只能找保安能不能看谁刮了我的车,你怎么看?你必须把今天早上八点钟一直到你下班的视频看完才可以发现谁刮了你的车,这是非常耗时的过程,如了视频云这个平台我们轻松做一件事情我们选中这辆车在周边画一个小框,我找到所有在这个框里面出现的目标是谁就可以了。
还有一种如果我们把所有停车场给互联起来我们有拿到所有去所有停车场包括它的车型我们可以做一件事情,我们知道开宝马的人通常喜欢去哪里购物购物习惯是什么样的,开奔驰跟开宝马有没有不一样的。我们公安行业构建一个我们把车辆识别结果数据再去拿到公安原来数据进行碰撞建模,我们围绕以车、人以及人的关系构建了一个模型,每辆车经过我们都会对他打分,判断这个人发生犯罪的可能性有多高,这个系统我们仅仅浙江省一个县公安部署六个月,我们抓获23名犯罪嫌疑人,抓获11名在逃的犯罪人员,抓获15个套牌车辆。我们针对所有危险车辆大数据的呈现可视化的,当然我们可以把所有车汇聚进来我们做车和车之间关联,人跟人之间关联,以及人和车之间的关联,各种各样的碰撞。我们针对像某一个交通路口做的热力呈现,从右往左这条路比从右往右的路繁忙,上面变成红色意味着交通部门可不可以采取潮汐道缓解压力。我们判断这个地方是不是增加人行横道或者天性。我们运用到商业里面我们判断某个人热力是如何,以及我们针对这个商场画两个框判断所有经过两个框的热力如何,从而决定我两个商品之间是否存在关联性。所有应用我们都是基于视频数据所出来的,这也是我们基于视频数据对一个城市做了热力呈现,它清晰告诉我们国庆节比平时繁忙得多,这个繁忙点都在哪里可以清晰告诉我们,除了市中心,郊区各种旅游地方也是异常繁忙。通过视频数据还可以做什么事情?在教育里面我们做一些代答卡,判断这堂课是不是教育质量高,你可以判断这个人有没有睡觉,这个人有没有低头玩手机,通过这个我们判断这个老师教学如何的,这个教师不同时间段教学如何,可以从而编辑他的授课过程。
我们过去一年时间构建全国100多个视频云的案例,承载我们100个PB的数据量,这仅仅是一年新增的数据量而已,我们今天也想借中国云计算大会场,我们很希望开放我们视频云里面像存储的能力、识别能力以及我们大数据能力,帮助我们更多的客户去实现他的价值。我们也希望更多合作伙伴跟我们一起打造用户的应用,提升视频的价值。
今天我汇报就到这里,谢谢。