试读《大数据时代的IT架构设计》

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,729 次

大数据”的概念是在最早经历信息爆炸的学科--天文学和基因学中提出来的,而今已经渗透到了各行各业和生活中的方方面面。牛津大学教授维克托曾在《大数据时代》一书中指出,通过对海量数据进行分析,能够获得有巨大价值的产品和服务,或深刻的洞见。大数据引起了商业变革,管理变革,以致思维变革。调整信息系统的架构,使之能够适应大数据时代的需要,成为了工程师们的一个重要课题。

试读章节主要有四个篇章,前两部分分别从电信运营商上网日志的处理和金融银行业的需求谈起,首先阐释了已有的方案以及不足。

对于电信上网日志分析系统,面临的主要问题:

1. 日志数据量巨大,只能够短期保存

2. 基于详细通话记录为主的客户行为分析可能缺失了大量的客户行为有效信息,从而得不到有指导意义的分析结果

而随着信息量的增长,金融银行业以往所使用的关系型数据库不能够满足数据存储的需求。在业务数据处理和历史数据备份两个方面遇到了以下问题:

1. 增加机器性能和存储空间,这将加大核心系统的运营维护成本

2. 大量数据离线存储,将导致客户无法快速获取交易信息,银行自身也很难依据此数据指定决策

这两个例子恰好体现了大数据时代对于IT架构的两个基本需求,一是存储,二是计算。两个案例不约而同地采用Hadoop作为解决方案,也恰恰体现了Hadoop的优势所在:能够实现低成本的海量数据存储,支持分布式计算和数据挖掘。对于海量数据存储和计算,谷歌实验室有关于GFS和Map/Reduce的论文分别讨论。而Hadoop项目也正是受了这两篇论文的启发而建立。

试读的的前两个章节侧重于Hadoop的应用,对于Hadoop集群本身并未作太多技术细节的探讨。后两个章节,优酷土豆和淘宝的工程师,则结合自己公司内的实际应用,讨论了相关的技术细节。

第三章节主要讨论集群安全。身份认证、用户权限以及Web界面访问控制都是Hadoop集群所存在的安全问题。

Kerberos(地狱三头看门狗)的引入,一定程度上解决了这些问题。Kerberos主要由两部分构成,Identity Store主要包含身份认证信息,KDC则是密钥分发服务器。为解决单点故障问题,KDC服务本身也被配置成了主从式,并通过脚本实现主从库中认证信息的同步,从而增强了Kerbeors的可靠性。

为保证平台的安全运营,还应强调操作的安全规范和实时监控。

不得不承认淘宝对于分布式技术的贡献,以及其技术团队的执行力。第四章节阐释了TFS的技术细节。下面是GFS与TFS架构的对比

由开源中收益,并回馈开源社区。这是每一个IT公司及工程师所应做的。第四章节介绍了TFS的系统架构、存储机制,扩容和容灾等,这些都与GFS类似,可看作GFS论文的中文通俗版。最后提出了TFS的发展方向,而这也是每一个分布式系统的发展方向--在保证数据可靠性的基础上提高服务效率、降低存储以及运维成本。

相关文章

浅析大数据与云计算物联网等热点的关系...
views 1847
  大数据时代的到来,是全球知名咨询公司麦肯锡最早提出的,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 近几年大数据一词的持续升温也带来了大数据泡沫的疑虑,大数据的前景与目前云计算、物联网...
中小企业CIO怎样磨合管理软件?
views 1902
如今,每一个企业都需要实施管理软件,但通常情况下,企业管理者并不懂管理软件,更别说软件选型和实施了。因此,企业管理领域又出现了一个新的职务--CIO。 作为企业信息化建设的服务提供者与管理者,CIO与管理软件有着相同却也截然不同的使命。相同点是皆服务于企业信息化;不同的是,CIO的使命是,...
如何在Ubuntu乌班图系统上安装MongoDB芒果数据库...
views 3626
做为IT界最为流利的技术之一,大数据,下面介绍安装大数据的非关系数据库的MongoDB的安装方法 1导入公共密钥为了使用安装包管理系统    Import the public key used by the package management system. sudo apt-key ad...
云计算“三国时代”:百度有开发者,阿里靠中间人,腾讯要突围...
views 1937
云计算“三国时代”:百度有开发者,阿里靠中间人,腾讯要突围   自从2013年9月腾讯云推出之后,中国云计算市场正式进入三国时代。尽管微软、亚马逊云服务均已入华,中国三大运营商也有云计算产品,京东、新浪等“小巨头”也有云计算产品,但相比三大互联网巨头而言,它们并没有多少存在感。云计算不...
大数据与网络黑产
views 3132
随着互联网不断深度介入人们的生活,网络上也在源源不断积累起大量数据。这些数据就像散落在互联网生态中的粒粒珍珠,诱惑着网络黑产分子瞪大贪婪的双眼,伺机而动…… 记者调查发现,基于这些存在的产业链,上游,是以技术含量最高的职业黑客为主,他们通过挖掘漏洞、编写木马实施入侵,获取数据;中游,是购买这些数据...
谁在用阿里云?云计算用户须知10个问题...
views 2011
云计算喊了好几年了,笔者很好奇,到底什么样的用户在使用,以及这些用户在采购和使用云计算时是基于一种怎样的场景、需求和心态?   根据工信部电信研究院在其《云计算白皮书》(2014)中披露的统计数据。在全球排名前50万的网站中,约有2%采用了公共云服务,其中80%的网站采用了亚马逊和Rackspace...
IBM推出新一代的数据云服务,帮助企业“多知先觉”...
views 1636
IBM公司近期宣布推出新一代的基于IBM云的数据服务,从而确保企业和组织机构中可以更为便捷地应用更为可靠的信息。 在大数据无处不在的世界里,随时获取和利用洞察力意味着比对手获得更大的竞争优势。如今,“在分析领域上每投入1美金,将得到13.01美金的回报”,这相比3年前提高了1.2倍 。一些新的基于云...
国务院推六项政策扶持小微企业
views 1801
国务院总理李克强9月17日主持召开国务院常务会议,部署进一步扶持小微企业发展推动大众创业万众创新,决定全面建立临时救助制度、为困难群众兜底线救急难。  李克强说,今年经济下行压力依然很大,特别是七八月份以来增速放缓,但就业仍然实现了稳定增长。他说,“这里既有服务业增长的因素,但更重要的,还是通过改革...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 试读《大数据时代的IT架构设计》

试读《大数据时代的IT架构设计》:等您坐沙发呢!

发表评论


读者排行