主页(http://www.pttcn.net):邬贺铨:大数据挖掘是智慧城市建设与管理的无形生产资料 十八大提出坚持走中国特色新型工业化、城镇化、农业现代化的道路,推动信息化与工业化的深度融合,工业化与城镇化的良性互动,城镇化与农业现代化的相互协调,促进工业化、城镇化、信息化、农业现代化的同步发展,这标志着我国城镇化发展进入了新时期,智慧城市是城镇化发展的一个新时期,推动城镇化的发展。什么是智慧城市?我认为智慧城市是对人力与社会资源和传统及现代设施的投资,促进可持续经济发展和高质量生活,同时通过提供参与治理的机会实现对自然资源聪明的管理,这时一个城市就被称为智慧城市。"Smart city"如果准确的翻译应该是聪明的城市,智慧城市应该具有以下四个要素:一、可测量的, 可监控的以及可分析的,也就是说通过分析服务于个人, 企业及政府的系统所产生的数据流, 提供新的洞察力和机会, 提高效率,测量的数据要整合和创新,提供市机关,企业,教育机构和个人共同创造城市的构想蓝图及实施方案,提高生活质量。 从欧盟智慧城市评价体系看大数据应用现状 欧盟对智慧城市的评价分为六个方面:智慧经济、智慧治理、智慧生活、智慧人民、智慧环境、智慧移动性。也就是说智慧城市要促进经济的发展,要改进和帮助更多大众的参与,让老百姓享受智慧的生活,人民得到更好的服务,居住环境更加优化。智慧城市的应用很广泛,我们都知道有物流、交通、电网、工业、农业、建筑、环境、医疗等方面。现在我要讲的是,智慧城市本身会催生大数据,我们可以看到一个企业会涉及到很多环境,管理环境,开放环境,知识环境、服务环境,过去这些环境的关联度不够,那么现在通过数据库使得这些环境能够联合起来,使得企业的效率提高40%-60%,根据赛门铁克的一份最新调研报告,今天全世界所有企业的信息存储总量已达2.2ZB,企业平均10PB,大企业更大点,小企业小点。一般企业都会建立数据库,必须进行数据的集资和数据的挖掘,企业的数据在企业内部已经占有很重要的位置。 刚刚提到欧盟有几个标准,在智慧经济方面,首先大数据在商业上怎么能很好运用,它会分析用户的购物行为,什么商品搭配在一起会卖得更好,还有很多公司通过分析找到最佳客户,淘宝数据魔方则是淘宝平台上的大数据应用方案。那么商家可以了解淘宝平台上的行业宏观情况、自己品牌的市场状况、消费者行为情况等,并可以据此作出经营决策。美国有个投资公司分析了全球3.4亿微博账户留言,判断民众情绪,人们高兴的时候会买股票,而焦虑的时候会抛售股票,依此决定公司股票的买入或卖出,该公司今年第一季度获得7%的收益率。阿里公司根据在淘宝网上中小企业的交易状况筛选出财务健康和诚信的企业,从而无需担保来放贷,目前已放贷300多亿元,坏帐率仅0.3%,大大低于商业银行。企业通过信息收集很好的掌握企业的运营状况,分析居民与财务有关的记录包括贷款申请、租赁、房地产、购买零售商品、纳税申报、水电费缴付、有线电视缴费、电话缴费、报纸与杂志订阅、机动车档案等,能够得出消费者的个人信用评分,从而推断客户支付意向与支付能力,发现潜在的欺诈。IBM日本公司建立了一个经济指标预测系统,从互联网新闻中搜索影响制造业的480项经济数据,计算出采购经理人指数PMI预测值。印第安纳大学学者利用Google提供的心情分析工具,对270万用户在2008年3~12月所张贴的970万条留言,挖掘出用户happiness、kindness、 alertness、sureness、 vitality 和calmness等六种心情,进而对道琼斯工业指数的变化进行预测,准确率达到87%。利用大数据分析可实现对合理库存量的管理,华尔街对冲基金依据购物网站顾客评论分析企业产品销售状况,华尔街银行根据求职网站岗位数量推断就业率。 智慧治理方面,美国纽约的警察分析交通拥堵与犯罪发生地点的关系,有效改进治安。美国纽约的交通部门从交通违规和事故的统计数据中发现规律,改进了道路设计。利用短信、微博、微信和搜索引擎可以收集热点事件与舆情挖掘。电信运营商拥有大量的手机数据,通过对手机数据的挖掘,不针对个人而是着眼于群体行为,可从中分析:实时动态的流动人口的来源及分布情况;出行和实时交通客流信息及拥塞情况。利用手机用户身份和位置的检测可了解突发性事件的聚集情况。MIT的Reality Mining项目,通过对10万多人手机的通话、短信和空间位置等信息进行处理,提取人们行为的时空规则性和重复性,进行流行病预警和犯罪预测。 伦敦200个交通摄像头一天就产生8TB,中国的交通哪只200个,可以想象我们产生的数据量比它多得多,另外环境监测对城市的河流进行采样,通过卫星发布,收集产量的数据,这个数据非常大,通过这个数据分析能够判别城市中有没有污染。智慧医疗方面,无论是药品的研发还是商业模式的开发运用数据分析都能够得到很好的分析,我们医院里有大量的病例,这里有大量的数据,传统的普通病例很难挖掘数据,现在变成电子化有利于更高数据挖掘,数据的挖掘有利于发现医疗知识,由于医疗资源的分配不均,因此远程医疗十分必要,另外,居家监护很重要,谷歌公司与美国疾病控制和预防中心等机构合作,依据网民搜索内容分析全球范围内流感等病疫传播状况,谷歌的判断与疾控中心的判断是一致的。社交网络为许多慢性病患者提供了临床症状交流和诊治经验分享平台,医院借此可获得足够多的临床效果统计。个性化的医疗同样很重要,我们发现,同样的治疗对一些病人无效,75%癌症病人,70%的老年痴呆者、50%的关节炎病人、43%的糖尿病患者、40%的哮喘病患者,38%的抑郁症病人。因为人体对药品代谢方式的差异取决于个体特定的基因、酶和蛋白质组合,因此基因信息对选择最优治疗非常关键。对人体个性体质的挖掘会做到真正意义上的对症下药,一个人的基因信息大概1GB。 除此之外,我们还通过网络进行学习,早期的网络学习是通过网站专业人员编制的内容,如今我们希望能够实现更加智能的搜索。随着移动互联网的出现,搜索引擎会变成基于语音的智能搜索;基于位置的搜索;基于个性化搜索。大众传播发展的很快,这里包含着大量的数据,例如微博传播具有裂变性、主动性、即时性、便捷性、交互性、草根性,跟进性和临场感,每一个微博用户既是"服务器",也是"受众"。中国的微博比社交网络更热,因为140个字符的微博在英文和中为分别约等于25个和85个英语单词,即中文微博的信息量是Twitter的3~4倍。最近两个月在YouTube上上载的视频超过了ABC、 NBC和 CBS 电视台自1948年以来24/7/365 连续播出的内容,而"云平台+多屏融合"模式已成为智能家居和智能车载等的发展方向。 大数据挖掘是智慧城市建设与管理的无形生产资料 支撑智慧城市的大数据技术是什么?物联网不能基于单个事件(单个观察或传感器的读数)来触发活动。需要利用专家系统和数学模型,综合异构来源的多种信息,对观察到的数据进行过滤、汇聚和数据挖掘,参考历史数据,考虑事件间的相关性和上下文感知,进行分析推理,给出决策。大数据的挑战,数据管理,数据来自不同地方和不同标准,数据量大小、结构形式、实时性等要求不同,增加采集、编索与整合的困难,需要对传统的数据传输工具ETL(提取、转换和加载)流程进行重新设计。数据存储,传统的集中式数据库、数据仓库系统已经不能有效的处理大数据的存储和分析,需要分布式处理;数据计算,大量的仿真和计算任务必须协调数百个参数,为了处理具有高维特征的图像等多媒体数据,将高维数据看成位于一个相对低维子流形(局部具有欧氏空间性质的空间)上,利用流形的性质将数据降维后度量与处理。压缩感知利用"数据是稀疏可压缩"的先验知识,使大数据转换为更有效的"稀疏表达"。数据的呈现需要可视化最终甚至是中间的计算结果,可能需要脑机工程技术,以便组合自动计算(机器)和高级智能获得更直觉的洞察力。数据分享与访问控制,安全与隐私保护。 智慧城市有大量的数据,电力、交通、通信、消防、工业等等,这些行业产生了大量的数据,关键是能不能共享,我们现在建立了很多垂直系统和应用,我们最大的问题是不能实现共享,这就影响到我们对智慧城市的管理,未来城市本身基础设施建设比较容易,关键是怎么能把这些数据应用起来,所以智慧城市更需要管理者的大智慧。现在很多的智慧城市都和云城市联系在一起,北京有祥云工程、上海由云海计划,都是,最后无线城市、数字城市、宽带城市、感知城市是智慧城市的必要条件;智慧城市是城镇化进程的下一阶段,是城市信息化的新高度,是现代城市发展的愿景;智慧城市每天产生大量的数据,大数据的收集、存储和分析处理及使用对智慧城市是很大的挑战,这不仅是技术也是法律和政策需要关注的问题;大数据的挖掘对智慧城市的经济发展和社会管理是无形的生产资料,大数据价值的合理共享和利用将创造巨大的财富;创新智慧城市的数据管理,从数据管理中打造智慧城市新兴产业和服务业! (中国集群通信网 | 责任编辑:陈晓亮) |