运营商如何玩转大数据

时间:14-07-09 栏目:大数据 作者:爱说云网 评论:0 点击: 1,277 次

大数据技术方案

  如果说大数据在之前仅仅是人们口头上热炒的一个词的话,今年春节时央视《晚间新闻》启用百度地图定位可视化大数据播报的春节人口迁徙新闻,随后“百度迁徙”的上线通过春运线路、热门迁移城市等海量数据在线服务为“大数据”上演的一幕幕生动情景剧,则形象地说明了大数据走入各行各业的现实。

  在盘活大数据价值这一个方向上,互联网企业已经显现出决心和速度,而拥有巨大用户资源和各类海量数据的运营商,显然也早已在大数据概念出现后就开始投入研究,但到底该怎么玩?如何基于庞大的用户数据资源优化产品结构,推出更加个性化的服务?已是运营商的当务之急。

  怎么运用大数据?

  对于运营商如何真正利用起大数据,思特奇大数据专家于佳琪接受CWW记者采访时提出了两个关键过程,一是运营商如何运用大数据实现有效分析,二是通过企业数据资产的归集建设企业级数据中心

  分析,恰恰是现阶段大数据发展的重中之重。

  为何这样说?于佳琪解释,如果说以往的传统小数据能反映用户行为是“为什么”,那么,所有小数据集合起来的大数据反映的则是更为重要的“是什么”。

  “业界现在提到大数据往往是指大数据分析,大数据出现的目的,就是为了处理现有软件架构不能完成的采集数据处理任务而产生的。数据采集、处理、存储、应用恰恰是传统数据分析的一系列过程。”

  在谈到大数据分析时,也有很多业内人提到了人工智能决策支持系统。对于二者的区别,于佳琪表示,传统的数据挖掘,数据来源是数据抽样的过程,通过抽样算法进行分析,得出“为什么”结论;而大数据是通过庞大数据量,分析单元数据之间的联系,发现一定的趋势或者它们之间更深层的联系,得出“是什么”结论,而这样的结论对于大数据来说才是真正的目的。

  “在大数据分析的基础上,大数据还应该是数据资产集合和应用的概念。”在不断深入研究大数据运营以及与三大运营商总部、省分公司充分沟通后,思特奇得出更精准的结论。

  于佳琪解释,和电信运营商相比,互联网企业数量庞大,提大数据的思想更早一些,但除了百度、阿里巴巴、腾讯拥有庞大自身数据的企业,其他互联网企业业务垂直,数据较为单一,量也不够大,他们在做大数据分析时的劣势是数据源不够、多样性不够丰富,而数据源的量和多样性恰恰是运营商最有优势的地方。

  随着手机在生活和工作中的深入应用,运营商的先天优势很明显,即可以探索到所有客户通过移动终端产生了什么样的行为,包括互联网行为和语音通话的行为。这些行为恰恰为运营商提供了庞大的、客观的数据。这样的整体数据资产归集在一起,逐步发展为应用与数据分离的状态,则是软件行业一直追求的目标。

  “这样集中的目的,是最终让每一个运营商有在业务域、管理域、网络域等不同域的数据资产都能对上层应用以数据服务的方式开放,上层可以利用数据中心的管理对数据进行应用开发,而不限于某个域的开发。比如流量经营、智能管道,都可以利用这样开放的架构,对数据进行利用,进而对产品和服务进行提升。”于佳琪形象地总结了运营商玩转大数据的第二个关键阶段。

  数据分析的关键在哪?

  数据采集、数据处理、数据导入导出被认为是大数据做好分析的关键,但这几个基本过程也并非意味着轻松。

  与传统的技术平台(小型机+存储阵列)数据采集不同,大数据中心的基础架构基本上都是分布式的架构(x86服务器),相比之下,传统技术平台带来的数据采集瓶颈一时半会还较难突破。另外,传统数据源系统的数据结构和数据库,还不能提供源源不断地实现分布式的数据导出。“但这样的问题已有了一定的解决办法,”于佳琪称, “例如在数据归集和采集上,大数据中心可以同时向很多数据源进行采集,这也是分布式架构的优势。而下一步需要解决的则是,从现有的关系型数据库里更高效地采集数据。”

  谈及大数据的处理,不能不谈结构化数据和非机构化的数据的区别,几乎像男性和女性天生就特别理性和特别感性一样,可以被计算机轻松识别的结构化数据(往往可以破解为0101……代码)处理起来并不难,而大量增长的非机构化数据(以文件、图片、视频等等形式存在的,很难被破解为规律代码的数据)则有较大处理难度(是啊,人类如果能明白女人到底在想什么就可以把很多事情变简单)。

  对付这样难搞的非结构化数据,通过技术将其转换为计算机能够读懂的数据,让其“束手就擒”并被有效分析,又是一项大数据发展中的重要课题。

  “赋予数据生命”

  无论好搞还是难搞,“数据导出的意义,是为了有效应用”,于佳琪总结数据导出的关键:一方面是把数据打包给大数据平台,赋予数据生命,让上层更好地使用它;另一方面,使用数据的最终用户是人,而不是计算机,所以让人来读懂数据分析结果是最重要的。

  试想一下一个有千百行数据的报表摆在你的面前,这是大数据最终应该呈现的效果吗?NO!数据报表体现不出来数据的意义,把经过汇集、分析、导出的“理性男人”的结构化数据,最终又变为容易被理解被看懂的以图形、图像等可视化结论为主的“感性女人” 非结构化数据,才是大数据运用的最终目的。

  如果你是运营商你可能会问:“我们的很多业务系统都是彼此独立的,这样怎么来应用大数据?”

  于佳琪对此称,运营商一个个相对封闭且独立的“烟囱式”业务系统,是数据统一协调应用的难点,也正是大数据在运营商中应用的驱动。一个办法是,运营商建大数据中心,把这些数据都归集在大平台上进行挖掘和处理,但目前这一方面还存在一次性投资大、建设效益形成慢等风险;另一个办法是,在运营商已做好相关数据规划的前提下,把数据先归集好,采取小步快跑的方式先把大数据体系架构搭建起来,通过弹性扩展,根据需求不断扩充架构,通过应用的迁移,基于应用和数据的分离,把数据逐步归集进来,而后通过开放的数据服务平台提供给上层应用和开发者。

  “两种方式各有优劣。不过小步快跑可以避免大数据投资带来的风险,数据运用从小变大,应用价值可以逐步衍伸。”

相关文章

大数据和云计算–不仅仅为了大公司...
views 1224
如今,云计算是活蹦乱跳的。举例来说,我住在拉斯维加斯,一个城市充满了创业公司,其中大部分是启动和运行在很短的时间内这在很大程度上归功于对“云”。看看全国各地,真是他的世界。数以百万计小型,中型和大型组织已经接受了它,并看到在这个过程中巨额回报。    或者看看你的手机,你会看到通常的嫌疑人。以消...
玩转大数据:需要知晓的12种工具
views 1074
  无论是在构建大数据的应用程序,还是仅仅只想从开发的移动应用中得到一点点启发,程序员现在比以往任何时候都需要数据分析工具。这绝对是一个好东西,所以很多公司从程序员的需求和技能出发,构建了一些数据分析工具。   在过去的几年里,Derrick看到了很多初创公司,各类项目以及开发工具等等,它们都旨在为...
管中窥豹:腾讯大数据平台
views 1300
腾讯有中国最全的社交数据,面对一个数据金矿,腾讯不可能坐视不理,腾讯基于hadoop研究了自己的大数据平台,最大的一个集群规模超过5600台。本文简单分析下腾讯的大数据平台的技术特点。 下面这个图是腾讯的技术架构图: 整个系统相对比较简单,主要有以下几大组件组成。 TDBank(Tencent...
十大必知的大数据分析公司
views 1343
data scientist 大数据和数据分析技术将持续升温,相关创业公司也如雨后春笋一般让人们目接不暇。 最近大数据分析专家Robin Bloor 根据技术创新性, 技术路线等评判标准, 列出了10家值得关注的大数据分析技术公司,IT经理网编译整理如下: Actuate: clip_imag...
大数据思维下的新闻编辑学
views 1007
   大数据时代带来的思维变革,在数据视觉化、关联性思维和预测性思维等方面对传统的编辑思维发生着影响。在大数据与媒介融合背景下推进编辑课程改革,需要延长传统的“新闻编辑链”,实现新闻业务之间完全融合;引入“云报纸”等云技术新闻产品,刷新编辑学的研究客体;实现新闻编辑与史论的融合;实现从重方法到重创意...
MPP DB 是 大数据实时分析系统 未来的选择吗?...
views 2083
大数据领域,实时分析系统(在线查询)是最常见的一种场景,前面写了一个《实时分析系统(HIVE/HBASE/IMPALA)浅析》讨论业界当前常见的方案。互联网公司用得比较多是HIVE/HBASE,如腾讯基于HIVE深度定制改造,改名为TDW,小米等公司选用HBASE等。关于HIVE/HBASE/IMP...
云计算背景下的大数据时代来临
views 1412
数据中心正在成为新时代的“信息电厂”,成为知识经济的基础设施。过去一年,“大数据”正在成为一个热门话题。 半个世纪信息技术的发展,主要解决的是云计算中“结构性”数据的存储、处理与应用。“结构性”数据的特征有如你到银行去存取款,银行的计算机系统记录着你的名字,在名字之后是你存取款的数量、时间、类型等信...
浅析大数据与云计算物联网等热点的关系...
views 1316
  大数据时代的到来,是全球知名咨询公司麦肯锡最早提出的,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 近几年大数据一词的持续升温也带来了大数据泡沫的疑虑,大数据的前景与目前云计算、物联网...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 运营商如何玩转大数据

运营商如何玩转大数据:等您坐沙发呢!

发表评论


读者排行