云计算之分布式文件系统

时间:14-07-10 栏目:云计算 作者:爱说云网 评论:0 点击: 1,617 次

云计算的分布式文件系统(如Google的GFS)是整个云计算的基石,提供上层表格系统所需的可靠和高效的数据存储,假设是:

        容错与自动故障恢复是DNA

整个文件系统由许多廉价计算机组成,机器故障是常事而非例外,系统需要不停地进行自我检测和监控,发现故障机器并自动恢复;

        系统存储大文件而非小文件

整个文件系统存储数百万数千万的100MB或更大尺寸的文件,而不是数十亿的KB尺寸小文件,支持对小文件的创建、读写,但不高效;

        文件的主要修改是追加

文件系统支持高效的大尺寸数据追加,特别是来自多个用户的无锁并发追加,小尺寸的数据追加和数据的改写也支持,但不高效;

        高效的大尺寸顺序读

大尺寸的顺序读数据十分高效,小尺寸随机读相对比较低效;

        持续可用的网络带宽比低的单次读写延时更加重要

多数上层应用程序对数据吞吐量有较高的要求,但对单次读写时间没有很高的要求。保持持续可用的网络带宽比保证每次读写的低延时有更大的意义。

 

在云计算的分布式文件系统中,数据被分成固定大小的块,即chunk(在GFS中是64MB)。由于可靠性和性能的需求,每个chunk在系统中有若干份拷贝(缺省是3份),保存在不同的worker上。此外,这3份拷贝通所在的worker通常位于不同的机架和不同的网络交换机,因此一个机架或交换机故障不会导致数据不可用。把多个拷贝分布到不同交换机上进一步提高了数据读出的可用网络带宽,增加了数据读出的性能,但却增加了写入时在不同交换机之间传输的数据量,增加了写入成本,由于数据的读远远多于对数据的写,这种做法提高了系统的总体性能。

 

与云计算架构的其他子系统一样,云计算的分布式文件系统采用了“单一master+多个worker”的结构,其中worker保存chunk数据的拷贝,master保存了文件和目录的名字空间、文件到chunk的映射、当前worker列表、chunk拷贝在当前worker上的分布等。此外,master还记录了worker的chunk数据大小、可用磁盘空间、数据读写次数等,并在必要的时候进行chunk迁移以便实现负载的相对平衡。

 

云计算的分布式文件系统还提供了客户端库,应用程序通过客户端库访问文件数据。例如,当客户端需要读出一个文件从某个位置开始的数据时,客户端库通过询问master获得该文件的指定位置所在的chunk以及该chunk所在的worker列表,客户端库再向其中的一个worker(通常是离该客户端网络距离最近的worker)发起读chunk(指定的偏移值和指定的长度)的请求,worker读出指定的数据后返回给客户端库,客户端库再返回给应用程序。

 

以上对云计算的分布式文件系统做了一个大致描述,后续文章还有更多的叙述。

相关文章

车联网+O2O将成下一个风口 互联网大佬们争先卡位...
views 1706
12月9日,滴滴打车宣布公司获得新一轮超过7亿美元融资,投资方包括淡马锡、国际投资集团DST、腾讯。这是滴滴打车获得的D轮融资,滴滴打车创业仅两年(2012年9月),四轮共融资8.18亿美元,融资速度空前之快。 互联网行业无论融资,或是上市都在加快。 12月12日,滴滴打车副总裁朱平豆接受21世纪...
构建高效信息化系统,助力中小企业发展腾飞-华为解决方案...
views 1729
——华为中小企业云解决方案 中小企业信息化服务市场正在成为运营商待开拓的“蓝海”,调查表明,我国中小型企业在“十二五”期间云计算领域产业链规模预计可达7500亿~10000亿元。在投资方面,预计到2012年,中小企业信息化市场规模将达到2697亿 。中小企业目前最迫切的需求是市场与营销、企业管理、客...
浅淡私有云存储:高效、可靠、安全的存储池...
views 1518
由于众多客户部署技术的模式由内部部署转为外部部署,亚马逊、谷歌和微软等大公司纷纷投入巨资,构建公有云存储解决方案。   云存储服务可以节省成本,因为用户没必要购买及管理自己的基础设施。它还让用户可以提高灵活性,减少存储容量。   但公有云存储并不适合所有类型的数据;出于安全、法律或合规方面的...
四个小工具确保成功的云计算体验 – 企业应用与云计算...
views 1509
云计算的出现改变了传统的业务模式。但最近频频出再安全漏洞事件,却也使企业在使用云计算技术上生了胆怯,尤其是这些安全事件还有上升的趋势,据美国电信运营商Verizon安全部门公布的2013年度《数据泄密调查报告》显示,2013年中有记录的网络间谍事件数量为511起,这一数字是2012年的三倍之多。 这...
亚马逊AWS发布AWS中国区合作伙伴计划
views 1947
12月12日上午消息,AWS北京技术峰会今天在北京举办,Amazon Web Services(AWS)中国今天宣布在中国推出AWS合作伙伴计划(AWS Partner Network,简称APN)。通过这项计划,AWS中国意在吸引更多的技术和咨询类客户加入这个计划,并帮助最终客户更好地利用AWS拓...
云计算思想的产生
views 1740
传统模式下,企业建立一套IT系统不仅仅需要购买硬件等基础设施,还有买软件的许可证,需要专门的人员维护。当企业的规模扩大时还要继续升级各种软硬件设施以满足需要。对于企业来说,计算机等硬件和软件本身并非他们真正需要的,它们仅仅是完成工作、提供效率的工具而已。对个人来说,我们想正常使用电脑需要安装许多软件...
云计算进汽车厂,或改变汽车制造模式...
views 1530
从今年第六届云计算大会中为制造业专设的技术论坛,到国家对于制造业的信息化建设,都体现着制造业的地位与价值。制造业包含的内容很广,这其中以汽车制造最为典型。中国作为汽车大国,在2014年汽车的保有量达到了1.4亿辆,虽然数量巨大,但中国汽车制造业的水平与国外相比并不成熟。制造创新能力以及产业链的整合优...
2015年7大云安全预测
views 1600
不断发生的数据泄露事故正在动摇企业和消费者的信心,也增加了云计算领域对安全的讨论。快速的云计算部署要求企业保护敏感数据的同时,保持应用程序的功能。那么,未来几个月哪些趋势会推动市场发展呢?下面让我们看看云安全市场2015年的发展趋势:   1. 私有云的演变   在企业试图利用云计算提供的控制、...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 云计算之分布式文件系统

云计算之分布式文件系统:等您坐沙发呢!

发表评论


读者排行