云计算之分布式文件系统

时间:14-07-10 栏目:云计算 作者:爱说云网 评论:0 点击: 1,396 次

云计算的分布式文件系统(如Google的GFS)是整个云计算的基石,提供上层表格系统所需的可靠和高效的数据存储,假设是:

        容错与自动故障恢复是DNA

整个文件系统由许多廉价计算机组成,机器故障是常事而非例外,系统需要不停地进行自我检测和监控,发现故障机器并自动恢复;

        系统存储大文件而非小文件

整个文件系统存储数百万数千万的100MB或更大尺寸的文件,而不是数十亿的KB尺寸小文件,支持对小文件的创建、读写,但不高效;

        文件的主要修改是追加

文件系统支持高效的大尺寸数据追加,特别是来自多个用户的无锁并发追加,小尺寸的数据追加和数据的改写也支持,但不高效;

        高效的大尺寸顺序读

大尺寸的顺序读数据十分高效,小尺寸随机读相对比较低效;

        持续可用的网络带宽比低的单次读写延时更加重要

多数上层应用程序对数据吞吐量有较高的要求,但对单次读写时间没有很高的要求。保持持续可用的网络带宽比保证每次读写的低延时有更大的意义。

 

在云计算的分布式文件系统中,数据被分成固定大小的块,即chunk(在GFS中是64MB)。由于可靠性和性能的需求,每个chunk在系统中有若干份拷贝(缺省是3份),保存在不同的worker上。此外,这3份拷贝通所在的worker通常位于不同的机架和不同的网络交换机,因此一个机架或交换机故障不会导致数据不可用。把多个拷贝分布到不同交换机上进一步提高了数据读出的可用网络带宽,增加了数据读出的性能,但却增加了写入时在不同交换机之间传输的数据量,增加了写入成本,由于数据的读远远多于对数据的写,这种做法提高了系统的总体性能。

 

与云计算架构的其他子系统一样,云计算的分布式文件系统采用了“单一master+多个worker”的结构,其中worker保存chunk数据的拷贝,master保存了文件和目录的名字空间、文件到chunk的映射、当前worker列表、chunk拷贝在当前worker上的分布等。此外,master还记录了worker的chunk数据大小、可用磁盘空间、数据读写次数等,并在必要的时候进行chunk迁移以便实现负载的相对平衡。

 

云计算的分布式文件系统还提供了客户端库,应用程序通过客户端库访问文件数据。例如,当客户端需要读出一个文件从某个位置开始的数据时,客户端库通过询问master获得该文件的指定位置所在的chunk以及该chunk所在的worker列表,客户端库再向其中的一个worker(通常是离该客户端网络距离最近的worker)发起读chunk(指定的偏移值和指定的长度)的请求,worker读出指定的数据后返回给客户端库,客户端库再返回给应用程序。

 

以上对云计算的分布式文件系统做了一个大致描述,后续文章还有更多的叙述。

相关文章

高性能计算解决方案_华为云服务
views 1911
华为云服务高性能计算定位 高性能计算(High Performance Computing, HPC)是IT应用的一个重要分支。科研人员、工程师为了解决复杂的科学计算、工业设计和数据分析等问题,需要超高计算能力、海量存储、高速低延迟网络等 IT资源。高性能计算是解决这些高度复杂问题的方...
部署云计算和移动:你需要新的网络防御战略...
views 3223
现在企业正逐渐转移到更为分散和日益虚拟化的运营模式,这对IT产生了深远的影响。而企业资产数字化以及对企业资源的灵活的访问更是突出了这一趋势。随着传统物理界限逐渐模糊,最终用户开始从几乎任何设备任何地方连接到网络,利用云计算和移动性。所有这些都迫使IT企业重新思考其网络防御战略以保护高价值资产。 ...
OpenStack的数据库开发基础
views 1447
前言 对于一个业务系统,如何高效、平稳地使用数据库是每一个开发人员都会遇到的问题,OpenStack 也不例外,以 OpenStack 的虚拟网络组件 Neutron 为例,其数据库涉及几百张表,需要维护数据库版本近百;一些表因为设计原因形成了很高的“热点”;因为 OpenStack 是分布式的...
企业信息化的关键成功因素
views 2091
 企业信息化不仅是一个庞大而复杂的系统工程,而且也有其自身的战略目标,大企业信息化的战略目标,企业必须分析影响企业信息化目标的关键成功因素。所谓关键成功因素,是指实现目标必须进行的事项或活动。本文在分析国内外企业的案例基础上,并结合实践,提出了企业信息化的关键成功因素和企业在实施过程中应树立的几个正...
企业如何面对云计算时代带来的挑战
views 1183
企业面临云计算时代的挑战   云计算是一个全新的技术,同时也放大了IT的挑战,原来放在自己服务器内部的一些服务资料,现在要放到云上。在云上的应用是可以在任何的地方,或在任何一个角落被迁移。如果保证通过一个简单的用户登陆,这个应用能从某一个点迁移到另外一个点,到底什么人能够看到什么样的信息,看到这些信...
分类垃圾贴上二维码 生成积分换取日用品...
views 1286
市民只要给垃圾进行分类、并贴上相应的二维码标签,就可以获得积分并兑换生活用品。这就是我市在锦江区开展的垃圾分类试点,不仅大幅提高了垃圾回收率,还让市民有了垃圾分类的意识。据市城管局相关负责人介绍,今年我市将在中心城区和二圈层城区小区中各开展1万户生活垃圾分类试点;同时,启动中心城区生活垃圾分类转运示...
中国企业为何青睐甲骨文HCM云服务
views 1264
现代企业的HR工作早已突破了传统的招聘、薪酬及人事管理等范畴。HR需要从传统的桎梏中解脱出来,开始思考利用先进的IT技术实现人力资本的现代化管理,获取人力资本市场的最新洞察,提升员工体验,构筑企业未来发展的人才力量。如何快速适应新市场的人才管理模式?如何在企业内部实现一致性?如何平衡多元化人才队伍的...
玩转云存储 后期制作巧用搜狐企业网盘...
views 1348
从热映的《撒娇女人最好命》、《太平轮》,到即将推出的《微爱之渐入佳境》。华谊兄弟三箭齐发,迎接贺岁档的到来。银幕上精彩纷呈的背后是国内外制作团队共同努力协作的结果。华谊兄弟通过引入云存储技术,巧妙的利用搜狐企业网盘高效传输、协同办公的特性,将后期制作进行分解,通过国内外不同团队间的合作,让影片的制作...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 云计算之分布式文件系统

云计算之分布式文件系统:等您坐沙发呢!

发表评论


读者排行