试读《大数据时代的IT架构设计》

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,785 次

大数据”的概念是在最早经历信息爆炸的学科--天文学和基因学中提出来的,而今已经渗透到了各行各业和生活中的方方面面。牛津大学教授维克托曾在《大数据时代》一书中指出,通过对海量数据进行分析,能够获得有巨大价值的产品和服务,或深刻的洞见。大数据引起了商业变革,管理变革,以致思维变革。调整信息系统的架构,使之能够适应大数据时代的需要,成为了工程师们的一个重要课题。

试读章节主要有四个篇章,前两部分分别从电信运营商上网日志的处理和金融银行业的需求谈起,首先阐释了已有的方案以及不足。

对于电信上网日志分析系统,面临的主要问题:

1. 日志数据量巨大,只能够短期保存

2. 基于详细通话记录为主的客户行为分析可能缺失了大量的客户行为有效信息,从而得不到有指导意义的分析结果

而随着信息量的增长,金融银行业以往所使用的关系型数据库不能够满足数据存储的需求。在业务数据处理和历史数据备份两个方面遇到了以下问题:

1. 增加机器性能和存储空间,这将加大核心系统的运营维护成本

2. 大量数据离线存储,将导致客户无法快速获取交易信息,银行自身也很难依据此数据指定决策

这两个例子恰好体现了大数据时代对于IT架构的两个基本需求,一是存储,二是计算。两个案例不约而同地采用Hadoop作为解决方案,也恰恰体现了Hadoop的优势所在:能够实现低成本的海量数据存储,支持分布式计算和数据挖掘。对于海量数据存储和计算,谷歌实验室有关于GFS和Map/Reduce的论文分别讨论。而Hadoop项目也正是受了这两篇论文的启发而建立。

试读的的前两个章节侧重于Hadoop的应用,对于Hadoop集群本身并未作太多技术细节的探讨。后两个章节,优酷土豆和淘宝的工程师,则结合自己公司内的实际应用,讨论了相关的技术细节。

第三章节主要讨论集群安全。身份认证、用户权限以及Web界面访问控制都是Hadoop集群所存在的安全问题。

Kerberos(地狱三头看门狗)的引入,一定程度上解决了这些问题。Kerberos主要由两部分构成,Identity Store主要包含身份认证信息,KDC则是密钥分发服务器。为解决单点故障问题,KDC服务本身也被配置成了主从式,并通过脚本实现主从库中认证信息的同步,从而增强了Kerbeors的可靠性。

为保证平台的安全运营,还应强调操作的安全规范和实时监控。

不得不承认淘宝对于分布式技术的贡献,以及其技术团队的执行力。第四章节阐释了TFS的技术细节。下面是GFS与TFS架构的对比

由开源中收益,并回馈开源社区。这是每一个IT公司及工程师所应做的。第四章节介绍了TFS的系统架构、存储机制,扩容和容灾等,这些都与GFS类似,可看作GFS论文的中文通俗版。最后提出了TFS的发展方向,而这也是每一个分布式系统的发展方向--在保证数据可靠性的基础上提高服务效率、降低存储以及运维成本。

相关文章

大数据引擎推动国家治理能力现代化-技术方案...
views 1608
在全球化和信息化的背景下,中国作为一个“巨型国家”的“社会结构性”转型,是21世纪人类文明史上有着全球性影响的重大事件。对中国转型过程众多领域中的“海量信息”或“大数据”的正确解读,不仅对于中国国家治理能力的提高,实现社会的平稳转型产生决定性影响;而且也必将对“世界的合理化”程度和人类文明的进程与走...
选举大数据研究 美两党火拚-应用案例
views 1846
  大数据研究是美国选战的重要策略,民主党在两次总统选举中领先,但共和党急起直追,网路与手机的数位流动资讯,已成胜选的关键。   美国千禧世代支持者研究网路资料,拟定选举策略,是总统欧巴马两度入主白宫的重要推手;民主党虽在11月的期中选举落败,但大数据(Big Data)研究更为精进,年轻人较支持...
亚信张灏:打通各行业数据壁垒 让大数据变现畅通无阻...
views 2143
大数据时代已经到来,企业所拥有的数据日益激增,如何更好地挖掘数据价值,进而指导业务发展,产生更高效益,成为企业关注的焦点和追求的方向。2014中关村大数据日上,亚信提出了大数据资产的概念,及帮助合作伙伴提升大数据资产价值的最佳实践。借此机会,CSDN专访了亚信大数据事业部总经理张灏,请他分享了亚信对...
阿里云计算推全新大数据工具“采云间”...
views 1960
25日,阿里云计算发布大数据工具采云间——基于ODPS的简易工具解决方案。利用采云间,中小型公司不用再购买上百万元的商业智能(BI)软件,大大降低大数据分析的门槛。   采云间是一个Web端的在线工具,简称DPC(Data Process Center),内部集成了阿里数据开发者套件和商业智能套件...
大数据和云计算–不仅仅为了大公司...
views 1740
如今,云计算是活蹦乱跳的。举例来说,我住在拉斯维加斯,一个城市充满了创业公司,其中大部分是启动和运行在很短的时间内这在很大程度上归功于对“云”。看看全国各地,真是他的世界。数以百万计小型,中型和大型组织已经接受了它,并看到在这个过程中巨额回报。    或者看看你的手机,你会看到通常的嫌疑人。以消...
管中窥豹:腾讯大数据平台
views 2029
腾讯有中国最全的社交数据,面对一个数据金矿,腾讯不可能坐视不理,腾讯基于hadoop研究了自己的大数据平台,最大的一个集群规模超过5600台。本文简单分析下腾讯的大数据平台的技术特点。 下面这个图是腾讯的技术架构图: 整个系统相对比较简单,主要有以下几大组件组成。 TDBank(Tencent...
大数据时代,课堂应如何创新
views 2007
随着大数据时代出现,有人曾这样预言,随着MOOC、微课、翻转课堂等基于网络的教学形式的出现,我们这些中小学教师弄不好是会下岗的。 这也许不是危言耸听。 当我们孩子天天拿着IPAD,随时随地搜索、了解各种知识、资讯时,他们是这个互联网时代的原住民,而我们从“50后”到“80后”的教师,充其量只是网络世...
云计算遭遇大数据 碰撞出技术革命
views 1830
前两天有人在微博发问,用什么样的方式讲述大数据和云计算才能非专业人士听的更清楚,其实关于大数据的案例有很多,商业智能分析也多次提到过关于数据挖掘的价值和意义,只不过在今天看数据比以前还多而已,大数据并不可怕,可怕的是他的实时分析能力,会让缺点和真相赤裸裸暴露在人们面前,那么当云计算遭遇大数据一股脑向...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 试读《大数据时代的IT架构设计》

试读《大数据时代的IT架构设计》:等您坐沙发呢!

发表评论


读者排行