试读《大数据时代的IT架构设计》

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,506 次

大数据”的概念是在最早经历信息爆炸的学科--天文学和基因学中提出来的,而今已经渗透到了各行各业和生活中的方方面面。牛津大学教授维克托曾在《大数据时代》一书中指出,通过对海量数据进行分析,能够获得有巨大价值的产品和服务,或深刻的洞见。大数据引起了商业变革,管理变革,以致思维变革。调整信息系统的架构,使之能够适应大数据时代的需要,成为了工程师们的一个重要课题。

试读章节主要有四个篇章,前两部分分别从电信运营商上网日志的处理和金融银行业的需求谈起,首先阐释了已有的方案以及不足。

对于电信上网日志分析系统,面临的主要问题:

1. 日志数据量巨大,只能够短期保存

2. 基于详细通话记录为主的客户行为分析可能缺失了大量的客户行为有效信息,从而得不到有指导意义的分析结果

而随着信息量的增长,金融银行业以往所使用的关系型数据库不能够满足数据存储的需求。在业务数据处理和历史数据备份两个方面遇到了以下问题:

1. 增加机器性能和存储空间,这将加大核心系统的运营维护成本

2. 大量数据离线存储,将导致客户无法快速获取交易信息,银行自身也很难依据此数据指定决策

这两个例子恰好体现了大数据时代对于IT架构的两个基本需求,一是存储,二是计算。两个案例不约而同地采用Hadoop作为解决方案,也恰恰体现了Hadoop的优势所在:能够实现低成本的海量数据存储,支持分布式计算和数据挖掘。对于海量数据存储和计算,谷歌实验室有关于GFS和Map/Reduce的论文分别讨论。而Hadoop项目也正是受了这两篇论文的启发而建立。

试读的的前两个章节侧重于Hadoop的应用,对于Hadoop集群本身并未作太多技术细节的探讨。后两个章节,优酷土豆和淘宝的工程师,则结合自己公司内的实际应用,讨论了相关的技术细节。

第三章节主要讨论集群安全。身份认证、用户权限以及Web界面访问控制都是Hadoop集群所存在的安全问题。

Kerberos(地狱三头看门狗)的引入,一定程度上解决了这些问题。Kerberos主要由两部分构成,Identity Store主要包含身份认证信息,KDC则是密钥分发服务器。为解决单点故障问题,KDC服务本身也被配置成了主从式,并通过脚本实现主从库中认证信息的同步,从而增强了Kerbeors的可靠性。

为保证平台的安全运营,还应强调操作的安全规范和实时监控。

不得不承认淘宝对于分布式技术的贡献,以及其技术团队的执行力。第四章节阐释了TFS的技术细节。下面是GFS与TFS架构的对比

由开源中收益,并回馈开源社区。这是每一个IT公司及工程师所应做的。第四章节介绍了TFS的系统架构、存储机制,扩容和容灾等,这些都与GFS类似,可看作GFS论文的中文通俗版。最后提出了TFS的发展方向,而这也是每一个分布式系统的发展方向--在保证数据可靠性的基础上提高服务效率、降低存储以及运维成本。

相关文章

亚信张灏:打通各行业数据壁垒 让大数据变现畅通无阻...
views 1805
大数据时代已经到来,企业所拥有的数据日益激增,如何更好地挖掘数据价值,进而指导业务发展,产生更高效益,成为企业关注的焦点和追求的方向。2014中关村大数据日上,亚信提出了大数据资产的概念,及帮助合作伙伴提升大数据资产价值的最佳实践。借此机会,CSDN专访了亚信大数据事业部总经理张灏,请他分享了亚信对...
移动互联时代CFO变身记
views 1847
美国零售巨头Target在邮件中向一位中学女生推荐孕婴用品及其优惠券,被其父亲强烈质疑与抗议,在获得道歉后,父亲却发现女儿真的怀孕了。Target这个广为流传的故事,被认为是其在大数据营销等方面精密的探索。 不过在客户身上搜集信息用于营销决策,也可能存在数据安全的风险。2014年1月,Target公...
Monet DB学习笔记
views 2693
1 架构: 三层软件架构: SQL front-end:前端SQL解析,数据模型优化,降低数据中间结果的总量,最后将SQL语句解析为MAL(MonetDB Assembly Language)。 Tactical-optimizers:一系列优化模块的集合,组成优化管道,这个模块提供功能从符号处理到...
详解大数据的思想形成与价值维度
views 1326
  比如经济上,黄仁宇先生对宋朝经济的分析中发现了“数目字管理”(即定量分析)的广泛应用(可惜王安石变法有始无终)。又如军事,“向林彪学习数据挖掘”的桥段不论真假,其背后量化分析的思想无疑有其现实基础,而这一基础甚至可以回推到2000多年前,孙膑正是通过编造“十万灶减到五万灶再减到三万灶”的数据、利...
《机器学习实战》作者Peter Harrington:如何成为一位数据科学家-技术方案...
views 1961
 现如今,人们的生活无外乎就是这个样子的,早上被闹钟准时叫醒,醒来后喝杯现泡的咖啡、吃上一片现烤的面包片,然后乘坐交通工具去上班。通常在上班的路上还要堵车一小会儿。   虽然生活的每一天都在重复,但却总不是一成不变的。随着物联网技术的不断成熟,越来越多的无生命物体开始变得更加智能。它们通过传感器、...
云计算和大数据是一对孪生技术
views 1526
12月26日讯 26日下午2014全国智能物流云峰会暨湖南海驿智能物流园招商启动仪式12月26日在长沙举行。会上中科院云计算中心岳强博士以《物流云时代的变革》为题,做主题演讲,他表示,云计算和大数据是一对孪生技术,云计算中心是大数据的存储和处理基地 .   大家下午好!首先我把中科院研究中心的情况给...
12大编程语言收入排行榜-技术博客-@大数据资讯...
views 1837
计算机软件开发或者说程序员工作已经成为收入最高的职业之一。 BI最近的一份报告显示,近两年美国软件工程师的平均年薪已经接近10万美元(下图),与之相比欧洲的软件工程师的收入要少得多,平均年薪月5.5万美元,不过比去年同期增长了9%,呈现上升势头。 但值得注意的是,不同编程语言技巧的市场价值不同,...
大数据挖掘带动的变迁
views 1369
自大数据进入了人们的视线之后,它便逐渐成为人们普遍关注的焦点。大数据讲的是PB时代的科学,本质上大数据的挑战是PB时代的对科学的挑战,更是对包括数据挖掘在内的认知科学的挑战。那么,大数据时代怎么做数据挖掘呢?   在现今时代人们通常所说的大数据主要包括三个来源:第一是自然界大数据,也就是地球上的自然...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 试读《大数据时代的IT架构设计》

试读《大数据时代的IT架构设计》:等您坐沙发呢!

发表评论


读者排行