试读《大数据时代的IT架构设计》

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,611 次

大数据”的概念是在最早经历信息爆炸的学科--天文学和基因学中提出来的,而今已经渗透到了各行各业和生活中的方方面面。牛津大学教授维克托曾在《大数据时代》一书中指出,通过对海量数据进行分析,能够获得有巨大价值的产品和服务,或深刻的洞见。大数据引起了商业变革,管理变革,以致思维变革。调整信息系统的架构,使之能够适应大数据时代的需要,成为了工程师们的一个重要课题。

试读章节主要有四个篇章,前两部分分别从电信运营商上网日志的处理和金融银行业的需求谈起,首先阐释了已有的方案以及不足。

对于电信上网日志分析系统,面临的主要问题:

1. 日志数据量巨大,只能够短期保存

2. 基于详细通话记录为主的客户行为分析可能缺失了大量的客户行为有效信息,从而得不到有指导意义的分析结果

而随着信息量的增长,金融银行业以往所使用的关系型数据库不能够满足数据存储的需求。在业务数据处理和历史数据备份两个方面遇到了以下问题:

1. 增加机器性能和存储空间,这将加大核心系统的运营维护成本

2. 大量数据离线存储,将导致客户无法快速获取交易信息,银行自身也很难依据此数据指定决策

这两个例子恰好体现了大数据时代对于IT架构的两个基本需求,一是存储,二是计算。两个案例不约而同地采用Hadoop作为解决方案,也恰恰体现了Hadoop的优势所在:能够实现低成本的海量数据存储,支持分布式计算和数据挖掘。对于海量数据存储和计算,谷歌实验室有关于GFS和Map/Reduce的论文分别讨论。而Hadoop项目也正是受了这两篇论文的启发而建立。

试读的的前两个章节侧重于Hadoop的应用,对于Hadoop集群本身并未作太多技术细节的探讨。后两个章节,优酷土豆和淘宝的工程师,则结合自己公司内的实际应用,讨论了相关的技术细节。

第三章节主要讨论集群安全。身份认证、用户权限以及Web界面访问控制都是Hadoop集群所存在的安全问题。

Kerberos(地狱三头看门狗)的引入,一定程度上解决了这些问题。Kerberos主要由两部分构成,Identity Store主要包含身份认证信息,KDC则是密钥分发服务器。为解决单点故障问题,KDC服务本身也被配置成了主从式,并通过脚本实现主从库中认证信息的同步,从而增强了Kerbeors的可靠性。

为保证平台的安全运营,还应强调操作的安全规范和实时监控。

不得不承认淘宝对于分布式技术的贡献,以及其技术团队的执行力。第四章节阐释了TFS的技术细节。下面是GFS与TFS架构的对比

由开源中收益,并回馈开源社区。这是每一个IT公司及工程师所应做的。第四章节介绍了TFS的系统架构、存储机制,扩容和容灾等,这些都与GFS类似,可看作GFS论文的中文通俗版。最后提出了TFS的发展方向,而这也是每一个分布式系统的发展方向--在保证数据可靠性的基础上提高服务效率、降低存储以及运维成本。

相关文章

云计算牵手大数据 背后是IT与业务的融合...
views 1539
年又一年,云计算大会在中国走过第六个年头,这六年里也正是云计算从进入中国,到逐渐被接受到开始落地的六年。 2009年,第一届大会还停留在讨论云计算领域和范畴;2010年,第二届大会界定云计算热点技术和应用;2011年,第三届大会讨论与传统运营商关系,分享云计算实践经验;2012年,第四届大会定义“云...
数据可视化、信息可视化、知识可视化-技术方案...
views 2257
 概述   数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着,数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又...
大数据时代大数据分析的哲学变革
views 1914
近年来,大数据这个原本陌生的专业词汇迅速进入大众视野,掀起了一场新的数据技术革命。大数据正在改变我们的生产、生活、教育、思维等诸多领域以及认识、理解世界的方式,作为时代精神精华的哲学,应该及时对这场数据革命做出全面的回应和批判,深入分析大数据对我们的世界观、认识论、方法论、价值观和伦理观将带来的深刻...
互联网医疗:大数据如何开启千亿级市场?...
views 1301
在北京301医院计算机应用与管理科副主任赵京利的办公桌上,放着一摞“数据查询统计申请表”,有要查询“环境因素对呼吸疾病影响”的相关病历的,也有要调取异体器官移植的过往案例的,各种查询需求五花八门。 “这样的申请越来越多,每个要求都不一样。要在我们的数据库里调取相关数据,我必须给每个申请单独编写检索...
美国大数据工程师面试攻略有哪些?
views 3006
大家好,我是来自硅谷的董飞,应国内朋友邀请,很高兴跟大家交流一下美国大数据工程师的面试攻略。 个人介绍 先做一个自我介绍,本科南开后,加入了一个创业公司kuxun,做实时信息检索,后来进入百度基础架构组,搭建了Baidu App Engine的早期版本,随后去Duke大学留...
谁在用阿里云?云计算用户须知10个问题...
views 1877
云计算喊了好几年了,笔者很好奇,到底什么样的用户在使用,以及这些用户在采购和使用云计算时是基于一种怎样的场景、需求和心态?   根据工信部电信研究院在其《云计算白皮书》(2014)中披露的统计数据。在全球排名前50万的网站中,约有2%采用了公共云服务,其中80%的网站采用了亚马逊和Rackspace...
互联网思维下该如何研究用户,哪里寻求大数据资源?...
views 1553
互联网时代,都倡导以客户需求为导向设计产品,但到底该如何研究用户?哪里寻求到用户资源?大家都在说大数据营销,但该如何利用大数据?哪里寻求这些资源呢?        易卓数据问:现在互联网的时代,都倡导以客户需求为导向设计产品,但是我却不知道该如何研究用户,哪里寻求到我的用户资源,简单的做问卷调查...
存储领域6大技术的侵略势力
views 1822
目前存储行业的中心范畴正处于六股实力的猛烈围攻之下,而且其间每股实力都雄心勃勃、期望能将作为现有存储阵列根底之中心网络文件存储及块存储阵列中的部分甚至一切计划彻底击退。 这些新近兴起的实力现已瞄准了块存储与文件存储阵列在数据拜访推迟以及运用本钱等方面存在的致命缺点; 此外现有计划通常在容量与性能的可...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 试读《大数据时代的IT架构设计》

试读《大数据时代的IT架构设计》:等您坐沙发呢!

发表评论


读者排行