大数据分析处理平台的调度应该具备什么能力?

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,817 次

本文想讨论下大数据分析处理平台的调度从架构上看应该起到一个什么样的作用,达到一个什么样的能力。

谈调度之前,先说说大数据分析处理平台的定义:集成数据采集/导入/存储、高效统计分析/挖掘分析、结果数据可视化呈现等功能的一体化系统,它具有简单易用、高度管理、平滑扩展、定向定制、算法丰富、支持迁移、可视呈现等特点。一般来说,大数据分析处理平台有以下几个显著特点:

  1. 规模大,集群化。百度,腾讯,阿里的大数据分析平台目前都在几千甚至上万台X86服务器的规模。
  2. 复杂度高,多个子系统异构。现在很难有一种技术能把所有问题搞定,所以通常是多个子系统混合一起通力合作。
  3. 系统负载高,压力大,从腾讯公布的数据来看,每天完成上百万个任务的执行。
  4. 可靠性要求高,容易维护。

那么调度在整个大数据分析处理平台中起到什么作用?我觉得一个智能、高效的调度应该达到以下几个层面的能力:

  1. 首先是从资源角度,整个系统中要做到高效,就需要一个全局的分配资源的中心。这样才能做到各个子系统资源合理,高效的分配和调度。业界现在最常见的是MESOS,YARN,腾讯基于YARN的基础上改造了GAIA,谷歌公布了他的第三代调度Omega,关于资源管理可以看我前面的文章《资源管理框架(mesos/YARN/coraca/Torca/Omega)选型分析》。
  2. 从系统整合角度,整个系统一定是异构的系统,所以调度要支持异构,能整合异构系统来一起完成整个数据的计算,流转,存储以及提供服务。
  3. 从业务角度来看,系统一定的可扩展的,业务可快速定制的,所以调度本身能结合业务进行定制,支持任务的编排,任务的各个子系统的快速迁移。
  4. 从调度本身能力来看,调度本身应该是一个智能的调度,具有自学习,自我调优的能力,一个智能的调度系统才适合业务的不停变化。

相关文章

Google将其云平台开源项目托管于Github – 开源软件...
views 1961
Google的云计算部门近日将其云平台相关的开源项目都移植到了Github中,其中包括App Engine(应用部署平台)、BigQuery(大数据分析平台)、Compute Engine(云计算引擎)、Cloud SQL(云端关系型数据库)和Cloud Storage(云端存储)相关的工具和示例。...
大众点评的大数据实践
views 1564
  这一阶段的主要工作是建立了一个小的集群,并导入了少量用户进行测试。为了满足用户的需求,我们还调研了任务调度系统和数据交换系统。 我们使用的版本是当时最新的稳定版,Hadoop 0.20.203和Hive 0.7.1。此后经历过多次升级与Bugfix。现在使用的是Hadoop 1.0...
无处不在的大数据
views 1635
大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅...
中国云计算困局
views 1693
连VOIP这种业务,都无法正名化,可见电信一脉对自己固有的收入是多么在意,以及多么强势。在这种大背景下,云计算更多呈现的是一种“概念化”,一种连完整的SAAS都谈不上的低等级应用,一种其实就是Web式Email那个类型的所谓云计算。 有位媒体朋友打电话咨询我一个事。说在江浙一带,有一位搞国际货运代理...
互联网金融论战:银行股还能买吗
views 1874
自从余额宝问世以来,互联网金融迅速兴起,成为社会各界广泛关注的热点话题。如今,余额宝诞生已经整整一周年,而各方关于互联网金融前景与趋势的争论依旧是甚嚣尘上。以万向控股副董事长肖风为代表的一方力挺互联网金融,认为互联网将会颠覆传统金融,互联网是未来的一切和一切的未来。以巨人投资董事长史玉柱为代表的一方...
百度实时计算平台的实现和应用
views 1815
百度实时计算平台的实现和应用     “大数据”在互联网行业中已是普遍现象,一家公司每天累积的用户行为数据甚至已不能用TB来衡量。海量数据对实时分析和计算提出了更高的要求,实时处理程序必须确保在严格的时间内响应,通常以秒为单位,甚至是毫秒。传统的批量计算模型已无法满足这些要...
大数据和云计算–不仅仅为了大公司...
views 1618
如今,云计算是活蹦乱跳的。举例来说,我住在拉斯维加斯,一个城市充满了创业公司,其中大部分是启动和运行在很短的时间内这在很大程度上归功于对“云”。看看全国各地,真是他的世界。数以百万计小型,中型和大型组织已经接受了它,并看到在这个过程中巨额回报。    或者看看你的手机,你会看到通常的嫌疑人。以消...
为什么中小企业更应采用云计算
views 1837
  据国外媒体报道,云计算为各种规模企业带来业务成本方面的降低,云计算提供的优势对于刚成立的小公司尤其明显。可以总结出八条原因,证明小公司更加适合采用云计算。 1.规模效益:大公司的规模效益很明显,小公司通常资源有限,任何能够节约采购预算的方案都应被优先考虑。 2.企业级功能:大公司通...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 大数据分析处理平台的调度应该具备什么能力?

大数据分析处理平台的调度应该具备什么能力?:等您坐沙发呢!

发表评论


读者排行