管中窥豹:腾讯大数据平台

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,599 次

腾讯有中国最全的社交数据,面对一个数据金矿,腾讯不可能坐视不理,腾讯基于hadoop研究了自己的大数据平台,最大的一个集群规模超过5600台。本文简单分析下腾讯的大数据平台的技术特点。

下面这个图是腾讯的技术架构图:

整个系统相对比较简单,主要有以下几大组件组成。

TDBank(Tencent Data Bank):数据实时收集与分发平台。将数据处理系统同数据源解耦,基于“发布-订阅”模型的分布式消息中间件,它起到了很好的缓存和缓冲作用,系统类似kafka,目前的资料不清楚,是否是kafka改造而来?

TDW(Tencent distributed Data Warehouse):腾讯分布式数据仓库。主要支持海量数据的的离线存储和计算,TDW集群总设备8400台,单集群最大规模5600台,总存储数据超过100PB,日均计算量超过5PB,日均Job数达到100万个。TDW是基于Hive优化的,主要是从易用性和性能上做了优化,HIVE的性能再优化针对小数据无能为力。所以后面腾讯研究方向是HBASE和spark。

TRC是基于开源的Storm深度定制的流式处理引擎,用JAVA重写了Storm的核心代码。为了解决了资源利用率和集群规模的问题,重构了底层调度模块,实现了任务级别的权限管理、资源分配、资源隔离。结果集存储在HBASE和Postgre中,用传统的Postgre主要是解决HADOOP update性能低的问题。

Gaia,名字挺吓人,实际上基于YARN,自研Sfair (Scalable fair scheduler)调度器,优化调度逻辑,提供更好的可扩展性,并进一步增强调度的公平性,提升可定制化,将调度吞吐提升10倍以上。

整个数据平台业务上主要支撑的有精准推荐,实时多维分析,秒级监控,腾讯分析、信鸽等。

  1. 从互联网整个行业来看,腾讯在技术上相对来说并不开放,公开的资源较少,代码开源的就更少,所以能分析的资料非常少。腾讯走的是基于成熟开源的软件然后根据自己的需求深度重构的思路,和阿里差不多。

  2. 从腾讯使用HIVE/STORM来看,腾讯起步比较早,选用HIVE/STORM,当前业界比较火的又是spark。

  3. 腾讯的系统主要还是支撑内部需求,开放比较少,希望腾讯后面可以将优化思路和业界广泛交流下,最好当能是能开源一些项目,为社区贡献力量。

相关文章

115浏览器“云社交” 符合3亿个人云存储用户需求...
views 1397
浏览器作为PC端几乎唯一的上网入口,其重要性不言而喻,放眼国内浏览器市场,各大厂商为抢占几乎饱和的市场份额,谁家的浏览器卖点更能满足当下的用户需求,便成了重中之重。115科技于近日推出的全新115浏览器,主打的就是时下乃至未来几年网民迫切需求的“云端体验”,“云社交”服务作为其重要的一部分,已经在1...
利用云计算和大数据来防止渔业过度捕捞...
views 1657
谷歌最近推出了一项雄心勃勃的计划:结合云计算、大数据和卫星网络监控全球渔业活动,主要着眼于防止过度捕捞。 太平洋上的渔船信号(来自computerworld.com)     根据海洋环境保护组织Oceana的说法,SkyTruth曾和Oceana一起打造基于卫星数据分析的全局数据平台,可以让市民...
大数据思维下的新闻编辑学
views 1109
   大数据时代带来的思维变革,在数据视觉化、关联性思维和预测性思维等方面对传统的编辑思维发生着影响。在大数据与媒介融合背景下推进编辑课程改革,需要延长传统的“新闻编辑链”,实现新闻业务之间完全融合;引入“云报纸”等云技术新闻产品,刷新编辑学的研究客体;实现新闻编辑与史论的融合;实现从重方法到重创意...
详解大数据的思想形成与价值维度
views 1178
  比如经济上,黄仁宇先生对宋朝经济的分析中发现了“数目字管理”(即定量分析)的广泛应用(可惜王安石变法有始无终)。又如军事,“向林彪学习数据挖掘”的桥段不论真假,其背后量化分析的思想无疑有其现实基础,而这一基础甚至可以回推到2000多年前,孙膑正是通过编造“十万灶减到五万灶再减到三万灶”的数据、利...
数据、移动化、云计算、电子商务、绿色IT将成为未来5年迫切需要的五个关键技术...
views 1193
根据市场研究资料的整合,对中国未来5年的IT市场进行了预测。伴随经济的发展,中国IT市场将会持续两位数的增长,尤其在新兴的科技领域,包括业务的自动化、智能化,企业的信息化服务,互联网领域的业务新模式应用都会成为未来IT市场发展的带动力。而对于CIO来说,大数据、移动化、云计算、电子商务、绿色IT将成...
云计算大数据联手PE资本 最佳投资时机来临...
views 1342
  5月20日-23日,第六届云计算大会在北京举行。大会上,中国电子学会与北京藏山资本投资有限公司共同发起成立“中国云计算、大数据产业发展基金”。藏山资本作为中国电子学会在云计算、大数据方面唯一的资本合作方,基金一期规模2亿元人民币,主要投资于国内云计算、大数据等产业领域的成长型优秀企业。   行业...
大数据引擎推动国家治理能力现代化-技术方案...
views 1193
在全球化和信息化的背景下,中国作为一个“巨型国家”的“社会结构性”转型,是21世纪人类文明史上有着全球性影响的重大事件。对中国转型过程众多领域中的“海量信息”或“大数据”的正确解读,不仅对于中国国家治理能力的提高,实现社会的平稳转型产生决定性影响;而且也必将对“世界的合理化”程度和人类文明的进程与走...
国务院推六项政策扶持小微企业
views 1407
国务院总理李克强9月17日主持召开国务院常务会议,部署进一步扶持小微企业发展推动大众创业万众创新,决定全面建立临时救助制度、为困难群众兜底线救急难。  李克强说,今年经济下行压力依然很大,特别是七八月份以来增速放缓,但就业仍然实现了稳定增长。他说,“这里既有服务业增长的因素,但更重要的,还是通过改革...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 管中窥豹:腾讯大数据平台

管中窥豹:腾讯大数据平台:等您坐沙发呢!

发表评论


读者排行