大数据分析处理平台的调度应该具备什么能力?

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,614 次

本文想讨论下大数据分析处理平台的调度从架构上看应该起到一个什么样的作用,达到一个什么样的能力。

谈调度之前,先说说大数据分析处理平台的定义:集成数据采集/导入/存储、高效统计分析/挖掘分析、结果数据可视化呈现等功能的一体化系统,它具有简单易用、高度管理、平滑扩展、定向定制、算法丰富、支持迁移、可视呈现等特点。一般来说,大数据分析处理平台有以下几个显著特点:

  1. 规模大,集群化。百度,腾讯,阿里的大数据分析平台目前都在几千甚至上万台X86服务器的规模。
  2. 复杂度高,多个子系统异构。现在很难有一种技术能把所有问题搞定,所以通常是多个子系统混合一起通力合作。
  3. 系统负载高,压力大,从腾讯公布的数据来看,每天完成上百万个任务的执行。
  4. 可靠性要求高,容易维护。

那么调度在整个大数据分析处理平台中起到什么作用?我觉得一个智能、高效的调度应该达到以下几个层面的能力:

  1. 首先是从资源角度,整个系统中要做到高效,就需要一个全局的分配资源的中心。这样才能做到各个子系统资源合理,高效的分配和调度。业界现在最常见的是MESOS,YARN,腾讯基于YARN的基础上改造了GAIA,谷歌公布了他的第三代调度Omega,关于资源管理可以看我前面的文章《资源管理框架(mesos/YARN/coraca/Torca/Omega)选型分析》。
  2. 从系统整合角度,整个系统一定是异构的系统,所以调度要支持异构,能整合异构系统来一起完成整个数据的计算,流转,存储以及提供服务。
  3. 从业务角度来看,系统一定的可扩展的,业务可快速定制的,所以调度本身能结合业务进行定制,支持任务的编排,任务的各个子系统的快速迁移。
  4. 从调度本身能力来看,调度本身应该是一个智能的调度,具有自学习,自我调优的能力,一个智能的调度系统才适合业务的不停变化。

相关文章

大数据时代驾到:1万亿云计算蛋糕诱惑开始“接地气”...
views 1999
目前互联网应用更多的是消费者,未来将是工业互联网时代,规模要比现在大很多倍   6月5日至7日,第五届中国云计算大会在北京召开。阿里巴巴、百度、金山、IBM、新浪、雅虎等互联网公司技术负责人以及中国移动运营商悉数到场。   尽管北京接连几日大雨,但这并没有熄灭技术爱好者的热情,国家会议中心四楼600...
存储领域6大技术的侵略势力
views 1633
目前存储行业的中心范畴正处于六股实力的猛烈围攻之下,而且其间每股实力都雄心勃勃、期望能将作为现有存储阵列根底之中心网络文件存储及块存储阵列中的部分甚至一切计划彻底击退。 这些新近兴起的实力现已瞄准了块存储与文件存储阵列在数据拜访推迟以及运用本钱等方面存在的致命缺点; 此外现有计划通常在容量与性能的可...
借道大数据 互联网基金再探“蓝海”
views 1555
“百发”突围“宝宝军团”  2013年度诺贝尔经济学奖获得者罗伯特·J·席勒曾表示,市场一直在寻求公允价值,但是价格很少是正确的;市场本身也带有主观判断(过度乐观、过度悲观)。被称为“恐慌指数”的VIX溢价存在表明投资者情绪会影响投资行为,而投资行为直接影响资产价格。  正是基于投资者非理性行为在互...
玩转大数据:需要知晓的12种工具
views 1281
  无论是在构建大数据的应用程序,还是仅仅只想从开发的移动应用中得到一点点启发,程序员现在比以往任何时候都需要数据分析工具。这绝对是一个好东西,所以很多公司从程序员的需求和技能出发,构建了一些数据分析工具。   在过去的几年里,Derrick看到了很多初创公司,各类项目以及开发工具等等,它们都旨在为...
大数据和云计算–不仅仅为了大公司...
views 1424
如今,云计算是活蹦乱跳的。举例来说,我住在拉斯维加斯,一个城市充满了创业公司,其中大部分是启动和运行在很短的时间内这在很大程度上归功于对“云”。看看全国各地,真是他的世界。数以百万计小型,中型和大型组织已经接受了它,并看到在这个过程中巨额回报。    或者看看你的手机,你会看到通常的嫌疑人。以消...
如何结合大数据与云计算?
views 1362
  你如何在大数据的海洋寻宝?对于那些拥有庞大信息需要处理的企业,在数据分析之前要克服的第一个障碍就是--不能够定位到相关并且有意义的信息。这也是HGST遇到的问题,HGST(日立环球存储科技公司)是一个计算机硬件的主要生产厂商,他们现在迫切需要追踪在生产设施上收集到的数据。据HGST的云计算与高性...
大众点评的大数据实践
views 1344
  这一阶段的主要工作是建立了一个小的集群,并导入了少量用户进行测试。为了满足用户的需求,我们还调研了任务调度系统和数据交换系统。 我们使用的版本是当时最新的稳定版,Hadoop 0.20.203和Hive 0.7.1。此后经历过多次升级与Bugfix。现在使用的是Hadoop 1.0...
大数据时代,科技走到了宗教尽头
views 1757
这是一个人人都言“大数据”的时代,然“大数据”存在于何处?影响于何处?难免,普通大众被席卷而来的“大数据”之潮迷乱了眼睛,搅乱了思绪。正是在这样的时刻,笔者认为尤为重要的是保有敬畏之心与清醒的思维,认识到“大数据”的局限性。 渗透时刻,无处不在的大数据 大数据可能是时下最吸引眼球的话题之一。从通过...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 大数据分析处理平台的调度应该具备什么能力?

大数据分析处理平台的调度应该具备什么能力?:等您坐沙发呢!

发表评论


读者排行