运营商如何玩转大数据

时间:14-07-09 栏目:大数据 作者:爱说云网 评论:0 点击: 1,570 次

大数据技术方案

  如果说大数据在之前仅仅是人们口头上热炒的一个词的话,今年春节时央视《晚间新闻》启用百度地图定位可视化大数据播报的春节人口迁徙新闻,随后“百度迁徙”的上线通过春运线路、热门迁移城市等海量数据在线服务为“大数据”上演的一幕幕生动情景剧,则形象地说明了大数据走入各行各业的现实。

  在盘活大数据价值这一个方向上,互联网企业已经显现出决心和速度,而拥有巨大用户资源和各类海量数据的运营商,显然也早已在大数据概念出现后就开始投入研究,但到底该怎么玩?如何基于庞大的用户数据资源优化产品结构,推出更加个性化的服务?已是运营商的当务之急。

  怎么运用大数据?

  对于运营商如何真正利用起大数据,思特奇大数据专家于佳琪接受CWW记者采访时提出了两个关键过程,一是运营商如何运用大数据实现有效分析,二是通过企业数据资产的归集建设企业级数据中心

  分析,恰恰是现阶段大数据发展的重中之重。

  为何这样说?于佳琪解释,如果说以往的传统小数据能反映用户行为是“为什么”,那么,所有小数据集合起来的大数据反映的则是更为重要的“是什么”。

  “业界现在提到大数据往往是指大数据分析,大数据出现的目的,就是为了处理现有软件架构不能完成的采集数据处理任务而产生的。数据采集、处理、存储、应用恰恰是传统数据分析的一系列过程。”

  在谈到大数据分析时,也有很多业内人提到了人工智能决策支持系统。对于二者的区别,于佳琪表示,传统的数据挖掘,数据来源是数据抽样的过程,通过抽样算法进行分析,得出“为什么”结论;而大数据是通过庞大数据量,分析单元数据之间的联系,发现一定的趋势或者它们之间更深层的联系,得出“是什么”结论,而这样的结论对于大数据来说才是真正的目的。

  “在大数据分析的基础上,大数据还应该是数据资产集合和应用的概念。”在不断深入研究大数据运营以及与三大运营商总部、省分公司充分沟通后,思特奇得出更精准的结论。

  于佳琪解释,和电信运营商相比,互联网企业数量庞大,提大数据的思想更早一些,但除了百度、阿里巴巴、腾讯拥有庞大自身数据的企业,其他互联网企业业务垂直,数据较为单一,量也不够大,他们在做大数据分析时的劣势是数据源不够、多样性不够丰富,而数据源的量和多样性恰恰是运营商最有优势的地方。

  随着手机在生活和工作中的深入应用,运营商的先天优势很明显,即可以探索到所有客户通过移动终端产生了什么样的行为,包括互联网行为和语音通话的行为。这些行为恰恰为运营商提供了庞大的、客观的数据。这样的整体数据资产归集在一起,逐步发展为应用与数据分离的状态,则是软件行业一直追求的目标。

  “这样集中的目的,是最终让每一个运营商有在业务域、管理域、网络域等不同域的数据资产都能对上层应用以数据服务的方式开放,上层可以利用数据中心的管理对数据进行应用开发,而不限于某个域的开发。比如流量经营、智能管道,都可以利用这样开放的架构,对数据进行利用,进而对产品和服务进行提升。”于佳琪形象地总结了运营商玩转大数据的第二个关键阶段。

  数据分析的关键在哪?

  数据采集、数据处理、数据导入导出被认为是大数据做好分析的关键,但这几个基本过程也并非意味着轻松。

  与传统的技术平台(小型机+存储阵列)数据采集不同,大数据中心的基础架构基本上都是分布式的架构(x86服务器),相比之下,传统技术平台带来的数据采集瓶颈一时半会还较难突破。另外,传统数据源系统的数据结构和数据库,还不能提供源源不断地实现分布式的数据导出。“但这样的问题已有了一定的解决办法,”于佳琪称, “例如在数据归集和采集上,大数据中心可以同时向很多数据源进行采集,这也是分布式架构的优势。而下一步需要解决的则是,从现有的关系型数据库里更高效地采集数据。”

  谈及大数据的处理,不能不谈结构化数据和非机构化的数据的区别,几乎像男性和女性天生就特别理性和特别感性一样,可以被计算机轻松识别的结构化数据(往往可以破解为0101……代码)处理起来并不难,而大量增长的非机构化数据(以文件、图片、视频等等形式存在的,很难被破解为规律代码的数据)则有较大处理难度(是啊,人类如果能明白女人到底在想什么就可以把很多事情变简单)。

  对付这样难搞的非结构化数据,通过技术将其转换为计算机能够读懂的数据,让其“束手就擒”并被有效分析,又是一项大数据发展中的重要课题。

  “赋予数据生命”

  无论好搞还是难搞,“数据导出的意义,是为了有效应用”,于佳琪总结数据导出的关键:一方面是把数据打包给大数据平台,赋予数据生命,让上层更好地使用它;另一方面,使用数据的最终用户是人,而不是计算机,所以让人来读懂数据分析结果是最重要的。

  试想一下一个有千百行数据的报表摆在你的面前,这是大数据最终应该呈现的效果吗?NO!数据报表体现不出来数据的意义,把经过汇集、分析、导出的“理性男人”的结构化数据,最终又变为容易被理解被看懂的以图形、图像等可视化结论为主的“感性女人” 非结构化数据,才是大数据运用的最终目的。

  如果你是运营商你可能会问:“我们的很多业务系统都是彼此独立的,这样怎么来应用大数据?”

  于佳琪对此称,运营商一个个相对封闭且独立的“烟囱式”业务系统,是数据统一协调应用的难点,也正是大数据在运营商中应用的驱动。一个办法是,运营商建大数据中心,把这些数据都归集在大平台上进行挖掘和处理,但目前这一方面还存在一次性投资大、建设效益形成慢等风险;另一个办法是,在运营商已做好相关数据规划的前提下,把数据先归集好,采取小步快跑的方式先把大数据体系架构搭建起来,通过弹性扩展,根据需求不断扩充架构,通过应用的迁移,基于应用和数据的分离,把数据逐步归集进来,而后通过开放的数据服务平台提供给上层应用和开发者。

  “两种方式各有优劣。不过小步快跑可以避免大数据投资带来的风险,数据运用从小变大,应用价值可以逐步衍伸。”

相关文章

玩转大数据:需要知晓的12种工具
views 1307
  无论是在构建大数据的应用程序,还是仅仅只想从开发的移动应用中得到一点点启发,程序员现在比以往任何时候都需要数据分析工具。这绝对是一个好东西,所以很多公司从程序员的需求和技能出发,构建了一些数据分析工具。   在过去的几年里,Derrick看到了很多初创公司,各类项目以及开发工具等等,它们都旨在为...
到底要不要选择BaaS?看情况吧
views 1595
备份即服务(BaaS)从云端提供了备份和恢复操作。基于云的BaaS提供商在其数据中心维持一套必不可少的备份设备、应用软件、流程和管理。客户要在本企业安装一些系统――通常是硬件设备和备份代理,但根本不需要购买备份服务器和软件,不需要什么升级、打补丁,也不需要购买重复数据删除专用设备。 请注意:Baa...
云计算让大数据概念越来越流行
views 1496
摘要: 日益增强的存储能力和日益下降的存储成本,以及不断改善的数据分析能力,共同促进了大数据在越来越多的企业和行业的应用。正如云计算等等已经为我们...... 关键词: 云计算大数据     日益增强的存储能力和日益下降的存储成本,以及不断改善的数据分析能力,共同促进了大数据在越来越多的企业和行...
大众点评的大数据实践
views 1381
  这一阶段的主要工作是建立了一个小的集群,并导入了少量用户进行测试。为了满足用户的需求,我们还调研了任务调度系统和数据交换系统。 我们使用的版本是当时最新的稳定版,Hadoop 0.20.203和Hive 0.7.1。此后经历过多次升级与Bugfix。现在使用的是Hadoop 1.0...
利用云计算和大数据来防止渔业过度捕捞...
views 1780
谷歌最近推出了一项雄心勃勃的计划:结合云计算、大数据和卫星网络监控全球渔业活动,主要着眼于防止过度捕捞。 太平洋上的渔船信号(来自computerworld.com)     根据海洋环境保护组织Oceana的说法,SkyTruth曾和Oceana一起打造基于卫星数据分析的全局数据平台,可以让市民...
为什么中小企业更应采用云计算
views 1626
  据国外媒体报道,云计算为各种规模企业带来业务成本方面的降低,云计算提供的优势对于刚成立的小公司尤其明显。可以总结出八条原因,证明小公司更加适合采用云计算。 1.规模效益:大公司的规模效益很明显,小公司通常资源有限,任何能够节约采购预算的方案都应被优先考虑。 2.企业级功能:大公司通...
华为召开2014云计算大会 诠释以云计算为中心的IT战略...
views 1543
华为今天在上海世博中心举行2014华为云计算大会(Huawei Cloud Congress,HCC2014),来自全球80多个国家超过10,000客户、合作伙伴和业内人士参加了本次大会。在今年的云计算大会上,华为将通过 发布一系列创新的IT解决方案,覆盖数据中心、融合存储、云操作系统和大数据分析平...
大数据思维下的新闻编辑学
views 1235
   大数据时代带来的思维变革,在数据视觉化、关联性思维和预测性思维等方面对传统的编辑思维发生着影响。在大数据与媒介融合背景下推进编辑课程改革,需要延长传统的“新闻编辑链”,实现新闻业务之间完全融合;引入“云报纸”等云技术新闻产品,刷新编辑学的研究客体;实现新闻编辑与史论的融合;实现从重方法到重创意...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 运营商如何玩转大数据

运营商如何玩转大数据:等您坐沙发呢!

发表评论


读者排行