云计算之分布式文件系统

时间:14-07-10 栏目:云计算 作者:爱说云网 评论:0 点击: 1,466 次

云计算的分布式文件系统(如Google的GFS)是整个云计算的基石,提供上层表格系统所需的可靠和高效的数据存储,假设是:

        容错与自动故障恢复是DNA

整个文件系统由许多廉价计算机组成,机器故障是常事而非例外,系统需要不停地进行自我检测和监控,发现故障机器并自动恢复;

        系统存储大文件而非小文件

整个文件系统存储数百万数千万的100MB或更大尺寸的文件,而不是数十亿的KB尺寸小文件,支持对小文件的创建、读写,但不高效;

        文件的主要修改是追加

文件系统支持高效的大尺寸数据追加,特别是来自多个用户的无锁并发追加,小尺寸的数据追加和数据的改写也支持,但不高效;

        高效的大尺寸顺序读

大尺寸的顺序读数据十分高效,小尺寸随机读相对比较低效;

        持续可用的网络带宽比低的单次读写延时更加重要

多数上层应用程序对数据吞吐量有较高的要求,但对单次读写时间没有很高的要求。保持持续可用的网络带宽比保证每次读写的低延时有更大的意义。

 

在云计算的分布式文件系统中,数据被分成固定大小的块,即chunk(在GFS中是64MB)。由于可靠性和性能的需求,每个chunk在系统中有若干份拷贝(缺省是3份),保存在不同的worker上。此外,这3份拷贝通所在的worker通常位于不同的机架和不同的网络交换机,因此一个机架或交换机故障不会导致数据不可用。把多个拷贝分布到不同交换机上进一步提高了数据读出的可用网络带宽,增加了数据读出的性能,但却增加了写入时在不同交换机之间传输的数据量,增加了写入成本,由于数据的读远远多于对数据的写,这种做法提高了系统的总体性能。

 

与云计算架构的其他子系统一样,云计算的分布式文件系统采用了“单一master+多个worker”的结构,其中worker保存chunk数据的拷贝,master保存了文件和目录的名字空间、文件到chunk的映射、当前worker列表、chunk拷贝在当前worker上的分布等。此外,master还记录了worker的chunk数据大小、可用磁盘空间、数据读写次数等,并在必要的时候进行chunk迁移以便实现负载的相对平衡。

 

云计算的分布式文件系统还提供了客户端库,应用程序通过客户端库访问文件数据。例如,当客户端需要读出一个文件从某个位置开始的数据时,客户端库通过询问master获得该文件的指定位置所在的chunk以及该chunk所在的worker列表,客户端库再向其中的一个worker(通常是离该客户端网络距离最近的worker)发起读chunk(指定的偏移值和指定的长度)的请求,worker读出指定的数据后返回给客户端库,客户端库再返回给应用程序。

 

以上对云计算的分布式文件系统做了一个大致描述,后续文章还有更多的叙述。

相关文章

改变IT企业的十个趋势:云计算居首
views 1641
据外国媒体报道,美国最大风投机构Kleiner Perkins Caufield&Byers的合伙人马特·墨菲(Matt Murphy)一直关注移动和云基础架构技术的投资。近日,墨菲撰文,指出了改变企业IT计算的10大重要走向,以下就是墨菲文章的主要内容。       在企业IT计算领域,变...
长虹“财务云”:中国企业财务共享先行者...
views 1954
 打开长虹财务共享中心的官方网站,首先映入眼帘的赫然是这样一行字:“中国企业财务共享的先行者。”这样一句毫不客气地把自己置于中国财务共享顶点位置的话,是自信还是狂妄?   或许,以下事实能为我们解答这个问题:今年4月,长虹财务共享中心的案例作为哈佛经济学研究成果案例纳入MBA课程;在此之前,该案例也...
云计算思想的产生
views 1530
传统模式下,企业建立一套IT系统不仅仅需要购买硬件等基础设施,还有买软件的许可证,需要专门的人员维护。当企业的规模扩大时还要继续升级各种软硬件设施以满足需要。对于企业来说,计算机等硬件和软件本身并非他们真正需要的,它们仅仅是完成工作、提供效率的工具而已。对个人来说,我们想正常使用电脑需要安装许多软件...
智明星通携手IBM 云计算提升玩家体验
views 1419
IBM和北京智明星通科技有限公司共同宣布,智明星通采用IBM SoftLayer公有云平台,在40多个国家发行运营游戏,为全球千万用户提供极致的游戏体验。智明星通是首批将中国游戏推向海外市场的国内游戏公司之一,创立于2008年,历经6年快速发展,现已成为中国互联网企业国际化过程的一家标杆企业。 ...
停止混乱:剔除三个云计算术语
views 1668
在刚刚过去的十月份,纽约举行的Interop会议上的一位演讲者,清晰的阐述了云计算背后的炒作仍记在蔓延,没有结束的迹象。我猜我们中的大多数都不会抱怨。云计算为IT和IT服务带来了新鲜的声明。然而,炒作会导致困惑,大多数都是自找麻烦,   为了解决这个问题,有一些云计算词语让我很抓狂。我不止一次的听到...
云存储:越过安全门槛 才能俘获用户芳心...
views 1555
现如今,随着云存储技术的深入应用,云存储的优势是不言而喻的,然而,目前,云存储却受困扰安全危机,不仅严重影响到云存储发展,也直接影响到用户的使用效果,未来,随着云存储技术的不断发展,安全问题终将得到解决。 云存储   其一、按需使用,按需付费,企业不必承担多余的开销,可以有效降低成本。 ...
迪斯尼发布云电影服务 支持移动和在线观看...
views 1608
2月26日消息,据国外媒体报道,沃尔特迪斯尼公司发布了一款面向消费者的云电影服务Disney Movies Anywhere,该服务支持用户在线购买和观看迪斯尼、皮克斯和马维尔等制片厂出品的影片,用户们还可以将购买的影片保存在云中供日后观看。 迪斯尼推出这项服务的目的是鼓励消费者购买数字影片。与好莱...
盘点数据库2014:一步之遥到云端
views 3417
年终将至,盘点开始。数据库技术重换青春,市场竞争也达到了前所未有的激烈程度。可以肯定的是,数据库未来将沿着“云”和“大数据”这两个主要方向发展。无论是传统关系型数据库巨头,还是新晋NoSQL、NewSQL创业公司,都希望抓住这一机遇,或重现辉煌,或迎头赶上。如果非要用一个词来形容2014的话,我想没...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 云计算之分布式文件系统

云计算之分布式文件系统:等您坐沙发呢!

发表评论


读者排行