一般性的文件使用MobaXterm软件直接拖拽即可,而服务器没有界面等问题可以采用命令的方式传输
本文的内容是在集群中比较常用,由其是集群同步
\1. scp(secure copy)安全拷贝
scp,linux命令,可以实现服务器与服务器之间的数据拷贝。(from server1 to server2)
语法:把本服务器的文件传到其他服务器中
scp -r 源文件 目标文件
scp -r $pdir/$fname $user@hadoop$host:$pdir/$fname
scp -r /opt/module root@hadoop102:/opt/module
注意:
如果涉及到软连接ln,scp会进行拷贝真正的文件,而不是软连接。会很耗时且占用内存
解决软连接的问题是先打包文件再进行scp。
tar zcvf test.tar.gz test # 打包test文件夹
tar zxvf test.tar.gz # 解压
# 为什么压缩包可以解决软连接的问题:
# 个人的想法是软连接建立时如果是按相对路径建立的ln -s test/1.txt 2,那么压缩解压后仍能保持相对路径
# 如果ln -s软连接时写的是绝对路径ln -s /home/ouc/test/1.txt 2,那么压缩拷贝到别处/etc后解压,点击解压后的2,打开的还是home下的 。 这个问题个人验证过了
# 所以说,我们用打包解决scp的软连接问题是可以的,因为github程序的软连接一般都是相对路径
少数情况下,如果ln软连接的是内核之类的或者是集群环境,可以考虑使用rsync -l
# 个人推测rsync拷贝完也是按照建立路径的规则查找的
- r:代表递归
- 源文件/目标文件:格式如下
用户@主机名:目录/文件
- user要用对应目录的写权限
使用:
#(a)在hadoop101上,将hadoop101中/opt/module目录下的软件拷贝到hadoop102上。
[atguigu@hadoop101 /]$ scp -r /opt/module root@hadoop102:/opt/module
#(b)在hadoop103上,将hadoop101服务器上的/opt/module目录下的软件拷贝到hadoop103上。
[atguigu@hadoop103 opt]$sudo scp -r atguigu@hadoop101:/opt/module root@hadoop103:/opt/module
#(c)在hadoop103上操作将hadoop101中/opt/module目录下的软件拷贝到hadoop104上。
[atguigu@hadoop103 opt]$ scp -r atguigu@hadoop101:/opt/module root@hadoop104:/opt/module
注意:拷贝过来的/opt/module目录,别忘了在hadoop102、hadoop103、hadoop104上修改所有文件的,所有者和所有者组。sudo chown atguigu:atguigu -R /opt/module
#(d)将hadoop101中/etc/profile文件拷贝到hadoop102的/etc/profile上。
[atguigu@hadoop101 ~]$ sudo scp /etc/profile root@hadoop102:/etc/profile
#(e)将hadoop101中/etc/profile文件拷贝到hadoop103的/etc/profile上。
[atguigu@hadoop101 ~]$ sudo scp /etc/profile root@hadoop103:/etc/profile
#(f)将hadoop101中/etc/profile文件拷贝到hadoop104的/etc/profile上。
[atguigu@hadoop101 ~]$ sudo scp /etc/profile root@hadoop104:/etc/profile
注意:拷贝过来的配置文件别忘了source一下/etc/profile,。
\2. rsync 远程同步工具
rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。
rsync和scp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。
语法:
rsync -rvl $pdir/$fname $user@hadoop$host:$pdir/$fname
说明:
rsync -选项 源 目的
#把hadoop101机器上的/opt/software目录同步到hadoop102服务器的root用户下的/opt/目录
[atguigu@hadoop101 opt]$ rsync -rvl /opt/software/ root@hadoop102:/opt/software
- 选项:r:递归。v:显示复制过程。l:拷贝符号链接
- 路径格式与scp相同:目的用户@主机:目的路径/名称
\3. xsync集群分发脚本
(1)需求:循环复制文件到所有节点的相同目录下。
说明:在/home/atguigu/bin这个目录下
(3)脚本实现
#(a)在/home/atguigu目录下创建bin目录,这个目录下存放的脚本,atguigu用户可以在系统任何地方直接执行。并在bin目录下xsync创建文件,文件内容如下:
[atguigu@hadoop102 ~]$ mkdir bin
[atguigu@hadoop102 ~]$ cd bin/
[atguigu@hadoop102 bin]$ touch xsync
[atguigu@hadoop102 bin]$ vi xsync
#!/bin/bash
# \`代表执行命令;$#代表取参数个数 $1代表取第一个参数 $p代表取变量内容
echo ======args==================
#1 获取输入参数个数,如果没有参数,直接退出
pcount=$#
if((pcount==0)); then
echo no args;
exit;
fi
#2 获取文件名称
p1=$1
fname=`basename $p1`
echo filename=$fname
#3 获取上级目录的绝对路径
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir
#4 获取当前用户名称
user=`whoami`
echo ------start------------------------------
#5 循环
for((host=1; host<4; host++)); do
echo --------------== hadoop$host ==------------------
rsync -rvl $pdir/$fname $user@hadoop$host:$pdir
# 复制输入的文件名称 到 目标主机的同级目录下
done
echo ------over...----------------------------
#文件修改结束
#(b)修改脚本 xsync 具有执行权限
[atguigu@hadoop102 bin]$ chmod 777 xsync
#(c)调用脚本形式:xsync 文件名称
[atguigu@hadoop102 bin]$ xsync /home/atguigu/bin
# 作用:将/home/atguigu/bin
注意:如果将xsync放到/home/atguigu/bin目录下仍然不能实现全局使用,可以将xsync移动到/usr/local/bin目录下。