在Docker容器之间拷贝数据：原理与操作示例

时间:14-12-19 栏目:大数据技术文章作者:爱说云网评论:0 点击: 1,994 次

本文标签： Docker , 大数据

ocker容器可以类比成一个目录，它可以将一个应用程序运行时所依赖的所有环境（注：此应用依赖的其他的服务或程序等）打包在一起运行；同时可以随意的对它进行“启动”、“停止”、“移动”或者“删除”等操作。Docker容器在Linux的命名空间（Namespace）机制下被激活，这样就可以使得运行在同一服务器上的不同Docker容器能在网络（Networking）与存储（storage）层面上被“隔离”（isolation）的运行。每个Docker容器都是在一个Docker镜像（image）的基础上创建而来；而一个Docker镜像可以支持创建、运行多个Docker容器，这主要取决于服务器的硬件性能。所以，Docker容器是Docker运行时的表现形式。

　　什么是Docker镜像？

　　Docker 容器是基于一个Docker镜像创建的，而Docker镜像本身则可以通过Docker命令行工具或者Dockerfiles来生成。Docker镜像既可以包含操作系统基础设施（fundamentals）也可以包含一个预先搭建好的可以直接启动的应用程序栈。Docker镜像可以被看做是一个只读的模板，这个模板中包含了很多“层”；而任何基于这个Docker镜像的新增操作或者更新操作都会导致一个基于当前层的新的层被创建出来，这个新创建的层是直接叠加在当前层之上的而非覆盖整个Docker镜像（注：创建新层的过程就是创建新容器的过程）。这就是一个新的Docker容器是怎么被创建出来的。

　　从一个容器拷贝数据到另一个容器：

　　在容器之间拷贝数据是Docker一个重要而且基本的功能。拷贝数据到其他容器的功能可以在真实场景中，如当服务器遇到不可预见的“灾难”（注：断电，宕机）时，起到备份数据的作用。

　　使用容器的数据卷：

　　数据卷（data volume，注：位置在/var/lib/docker/volumes）是容器可以访问，但是位置不在root文件系统中的一个目录。为了能让容器之间可以共享数据，Docker让“卷”（volume）可以绕过Docker镜像的层叠机制。容器中所有对镜像的改变全部都直接存储。每个容器都有固定的运行目录在/var/lib/docker目录下；而每个容器卷的数据则默认单独存储在/var/lib/docker/volumes/目录底下。 docker run命令的-v选项能够实现容器间数据卷中数据的互相拷贝。

　　操作示例

　　在这个例子中，我们假设基于镜像mymod/dvc:v1创建并运行了两个容器:dvc1与dvc2，以下是启动这两个镜像的命令：
　　

　　以下命令将创建并启动一个新的容器（也是基于mymod/dvc: v1镜像）但是挂载dvc1的数据卷，并使用cp命令拷贝容器dvc1中的数据到宿主机（host）上。
　　

　新建的容器以读-写权限挂载宿主机的/var/temp目录为/host目录，然后挂载所有dvc1的数据卷，包含dvc1中的/var/www/html 目录，然后拷贝/var/www/html的文件目录到/host/dvc1_files下，対映宿主机/var/temp目录。

　　现在我们用以下命令拷贝dvc1容器的数据到其他的容器中：
　　

　　新建的容器将宿主机的/var/tmp目录以只读的形式映射到dvc2容器的/host目录中，同时加载dvc2容器的所有数据卷，然后将/host /dvc1_files（对应宿主机/var/tmp/dvc1_files）目录的结构拷贝到dvc2容器的/var/www/html目录下。

　　同样的目标可以在Dockerfile中使用ADD命令实现。ADD有两个参数一个是源容器一个是目的容器。ADD命令可以实现从源容器拷贝文件或者数据到目的容器的目标，而不用管各个容器的文件系统差异。

　　结论

　　Docker 肯定会提供更好的方式来“培养”容器化服务部署，以支持更广泛的部署平台；同时开发社区也期望Docker构建服务层级（service layer）。而Docker的做法是：开发容器核心容量，开发跨容器服务管理与通信功能。我们在这篇文章中所阐述的是数据可以在容器间被复制与冗余，这可以用来应付各种数据的损毁与恢复。Docker还提供了使用方便的容器间差异分析功能，这可以让容器更好的支持排错（debugging）、快速共享部署环境以达到快速的部署的目标。Docker可以将容器部署环境从开发或者QA阶段直接提交到AWS部署环境。用户可以通过Docker的数据卷在容器间共享数据；可以将宿主机的目录直接挂载到容器中或者甚至可以从容器中导出数据存档，所以，Docker非常方便。

Docker应用实践：一个简单的Java EE&Docker示例...

学习Docker的最好办法就是迅速在工作中应用它，本文作者使用Docker部署了一个Java EE应用，非常简单和方便。需要注意的是，由于作者写作时本地网络有问题，所以Dockerfile中很多的资源都没有从网络下载，你再实践时，可以尝试修改。学习快乐 :) 本文中，我们将会把Java EE和...

下一个云计算的大事件：谷歌拥抱Docker...

谷歌对当今最热门的云计算技术Docker给予了相当大的支持。在谷歌看来，Docker也是一个足以改变人们创建软件方式的东西，它能让任何程序开发人员更轻松地、即刻地体会到海量计算性能的优势。北京时间6月10日消息，据Wired报道称，谷歌对当今最热门的云计算技术Docker给予了相当大的支持。“...

十大必知的大数据分析公司

data scientist 大数据和数据分析技术将持续升温，相关创业公司也如雨后春笋一般让人们目接不暇。最近大数据分析专家Robin Bloor 根据技术创新性，技术路线等评判标准，列出了10家值得关注的大数据分析技术公司，IT经理网编译整理如下： Actuate： clip_imag...

《机器学习实战》作者Peter Harrington：如何成为一位数据科学家-技术方案...

　现如今，人们的生活无外乎就是这个样子的，早上被闹钟准时叫醒，醒来后喝杯现泡的咖啡、吃上一片现烤的面包片，然后乘坐交通工具去上班。通常在上班的路上还要堵车一小会儿。　　虽然生活的每一天都在重复，但却总不是一成不变的。随着物联网技术的不断成熟，越来越多的无生命物体开始变得更加智能。它们通过传感器、...

中小企业CIO怎样磨合管理软件？

如今，每一个企业都需要实施管理软件，但通常情况下，企业管理者并不懂管理软件，更别说软件选型和实施了。因此，企业管理领域又出现了一个新的职务--CIO。作为企业信息化建设的服务提供者与管理者，CIO与管理软件有着相同却也截然不同的使命。相同点是皆服务于企业信息化;不同的是，CIO的使命是，...

浅论Hadoop应用工作思路

随着企业对大数据越来越重视，hadoop应用达到了前所未有的高度。今天聊聊hadoop应用的工作思路，我想了下以下几方面，和大家一起讨论：首先最重要的是建立一支以开发人员为主的团队。 Hadoop虽然很火，但是还是在初级阶段，开源的东西存在业务不完全匹配，成熟度低等诸多问题。所以不管是什么公司...

大数据时代,课堂应如何创新

随着大数据时代出现，有人曾这样预言，随着MOOC、微课、翻转课堂等基于网络的教学形式的出现，我们这些中小学教师弄不好是会下岗的。这也许不是危言耸听。当我们孩子天天拿着IPAD，随时随地搜索、了解各种知识、资讯时，他们是这个互联网时代的原住民，而我们从“50后”到“80后”的教师，充其量只是网络世...

Amazon发布免费的AWS EC2 Container服务,且支持Docker...

近日，在AWS re:Invent云计算大会上的第二场主题演讲中，Amazon的CTO Werner Vogels宣布发布AWS EC2 Container服务。目前，AWS EC2 Container服务预览版免费提供于开发者，开发者可以在官网进行注册使用。这是一项高度可扩展、高性能、免费的容器...

声明: 本文由( 爱说云网 )原创编译，转载请保留链接: 在Docker容器之间拷贝数据：原理与操作示例