2016年12月16日星期五

rsync同步的艺术

http://roclinux.cn/?p=2643


《rsync同步的艺术》

本原创文章属于《Linux大棚》博客。
博客地址为http://roclinux.cn
文章作者为roc。
==
如果你是一位运维工程师,你很可能会面对几十台、几百台甚至上千台服务器,除了批量操作外,环境同步、数据同步也是必不可少的技能。
说到“同步”,不得不提的利器就是rsync,今天就来说说我从这个工具中看到的同步的艺术。
[不带任何选项]
我们经常这样使用rsync:
$ rsync main.c machineB:/home/userB
1 只要目的端的文件内容和源端不一样,就会触发数据同步,rsync会确保两边的文件内容一样。
2 但rsync不会同步文件的“modify time”,凡是有数据同步的文件,目的端的文件的“modify time”总是会被修改为最新时刻的时间。
3 rsync不会太关注目的端文件的rwx权限,如果目的端没有此文件,那么权限会保持与源端一致;如果目的端有此文件,则权限不会随着源端变更。
4 只要rsync有对源文件的读权限,且对目标路径有写权限,rsync就能确保目的端文件同步到和源端一致。
5 rsync只能以登陆目的端的账号来创建文件,它没有能力保持目的端文件的输主和属组和源端一致。(除非你使用root权限,才有资格要求属主一致、属组一致)
[-t选项]
我们经常这样使用-t选项:
$ rsync -t main.c machineB:/home/userB
1 使用-t选项后,rsync总会想着一件事,那就是将源文件的“modify time”同步到目标机器。

2 带有-t选项的rsync,会变得更聪明些,它会在同步前先对比两边文件的时间戳和文件大小,如果一致,则就认为两边文件一样,对此文件就不再采取更新动作了。
3 因为rsync的聪明,也会反被聪明误。如果目的端的文件的时间戳、大小和源端完全一致,但是内容恰巧不一致时,rsync是发现不了的。这就是传说中的“坑”!
4 对于rsync自作聪明的情况,解决办法就是使用-I选项。
[-I选项]
我们经常这样使用-I选项:
$ rsync -I main.c machineB:/home/userB
1 -I选项会让rsync变得很乖很老实,它会挨个文件去发起数据同步。
2 -I选项可以确保数据的一致性,代价便是速度上会变慢,因为我们放弃了“quick check”策略。(quick check策略,就是先查看文件的时间戳和文件大小,依次先排除一批认为相同的文件)
3 无论情况如何,目的端的文件的modify time总会被更新到当前时刻。
【-v选项】
这个选项,简单易懂,就是让rsync输出更多的信息,我们可以举一个例子:
$ rsync -vI main.c machineB:/home/userB                                                   
main.c

sent 81 bytes  received 42 bytes  246.00 bytes/sec
total size is 11  speedup is 0.09
你增加越多的v,就可以获得越多的日志信息。
$ rsync -vvvvt abc.c machineB:/home/userB 
cmd= machine=machineB user= path=/home/userB
cmd[0]=ssh cmd[1]=machineB cmd[2]=rsync cmd[3]=--server cmd[4]=-vvvvte. cmd[5]=. cmd[6]=/home/userB 
opening connection using: ssh machineB rsync --server -vvvvte. . /home/userB 
note: iconv_open("ANSI_X3.4-1968", "ANSI_X3.4-1968") succeeded.
(Client) Protocol versions: remote=28, negotiated=28
(Server) Protocol versions: remote=30, negotiated=28
[sender] make_file(abc.c,*,2)
[sender] flist start=0, used=1, low=0, high=0
[sender] i=0  abc.c mode=0100664 len=11 flags=0
send_file_list done
file list sent
send_files starting
server_recv(2) starting pid=31885
recv_file_name(abc.c)
received 1 names
[receiver] i=0   abc.c mode=0100664 len=11
recv_file_list done
get_local_name count=1 /home/userB
recv_files(1) starting
generator starting pid=31885 count=1
delta transmission enabled
recv_generator(abc.c,0)
abc.c is uptodate
generate_files phase=1
send_files phase=1
recv_files phase=1
generate_files phase=2
send files finished
total: matches=0  hash_hits=0  false_alarms=0 data=0
generate_files finished
recv_files finished
client_run waiting on 14318

sent 36 bytes  received 16 bytes  104.00 bytes/sec
total size is 11  speedup is 0.21
_exit_cleanup(code=0, file=main.c, line=1031): entered
_exit_cleanup(code=0, file=main.c, line=1031): about to call exit(0)
[-z选项]
这是个压缩选项,只要使用了这个选项,rsync就会把发向对端的数据先进行压缩再传输。对于网络环境较差的情况下建议使用。
一般情况下,-z的压缩算法会和gzip的一样。
[-r选项]
我们在第一次使用rsync时,往往会遇到这样的囧境:
$ rsync superman machineB:/home/userB
skipping directory superman
如果你不额外告诉rsync你需要它帮你同步文件夹的话,它是不会主动承担的,这也正是rsync的懒惰之处。
所以,如果你真的想同步文件夹,那就要加上-r选项,即recursive(递归的、循环的),像这样:
$  rsync -r superman machineB:/home/userB
我们在上面的讲解中说过,如果时间戳和文件大小完全一致,只有文件内容不同,且你没有使用-I选项的话,那么,rsync是不会进行数据同步的。
那么,提个问题:“因为在Linux的世界里,文件夹也是文件,如果这类文件(文件夹)也只有内容不同,而时间戳和文件大小都相同,rsync会发现么?”
实验大家可以自己动手做,结论在这里告诉大家:
对于文件夹,rsync是会明察秋毫的,只要你加了-r选项,它就会恪尽职守的进入到文件夹里去检查,而不会只对文件夹本身做“quick check”的。
[-l选项]
如果我们要同步一个软链接文件,你猜rsync会提示什么?
$ ll
total 128
-rw-rw-r--  1 userA userA 11 Dec 26 07:00 abc.c
lrwxrwxrwx  1 userA userA  5 Dec 26 11:35 softlink -> abc.c
$ rsync softlink machineB:/home/userB
skipping non-regular file "softlink"
嗯,你猜对了,rsync又无情地拒绝了我们。它一旦发现某个文件是软链接,就会无视它,除非我们增加-l选项。
$ rsync -l softlink machineB:/home/userB
使用了-l选项后,rsync会完全保持软链接文件类型,原原本本的将软链接文件复制到目的端,而不会“follow link”到指向的实体文件。
如果我偏偏就想让rsync采取follow link的方式,那就用-L选项就可以了。你可以自己试试效果。
[-p选项]
这个选项的全名是“perserve permissions”,顾名思义,就是保持权限。
如果你不使用此选项的话,rsync是这样来处理权限问题的:
1 如果目的端没有此文件,那么在同步后会将目的端文件的权限保持与源端一致;
2 如果目的端已存在此文件,那么只会同步文件内容,权限保持原有不变。
如果你使用了-p选项,则无论如何,rsync都会让目的端保持与源端的权限一致的。
[-g选项和-o选项]
这两个选项是一对,用来保持文件的属组(group)和属主(owner),作用应该很清晰明了。不过要注意的一点是,改变属主和属组,往往只有管理员权限才可以。
[-D选项]
-D选项,原文解释是“preserve devices(root only)”,从字面意思看,就是保持设备文件的原始信息。由于博主没有实际体验过它的好处,所以没有太多发言权。
[-a选项]
1 -a选项是rsync里比较霸道的一个选项,因为你使用-a选项,就相当于使用了-rlptgoD这一坨选项。以一敌七,唯-a选项也。(在看了前文之后,你应该可以很轻松的理解这七个选项的作用了)
2 -a选项的学名应该叫做archive option,中文叫做归档选项。使用-a选项,就表明你希望采取递归方式来同步,且尽可能的保持各个方面的一致性。
3 但是-a选项也有阿克琉斯之踵,那就是-a无法同步“硬链接”情况。如果有这方面需求,要加上-H选项。
[–delete选项、–delete-excluded选项和–delete-after选项]
三个选项都是和“删除”有关的:
1 –delete:如果源端没有此文件,那么目的端也别想拥有,删除之。(如果你使用这个选项,就必须搭配-r选项一起)
2 –delete-excluded:专门指定一些要在目的端删除的文件。
3 –delete-after:默认情况下,rsync是先清理目的端的文件再开始数据同步;如果使用此选项,则rsync会先进行数据同步,都完成后再删除那些需要清理的文件。
看到这么多delete,你是否有点肝颤? 的确,在rsync的官方说明里也有这么一句话:
This option can be dangerous if used incorrectly!  
It is a very good idea to run first using the dry  run  option
(-n) to see what files would be deleted to make sure 
important files aren't listed.
从这句话里,我们学到了一个小技巧,那就是-n选项,它是一个吓唬人的选项,它会用受影响的文件列表来警告你,但不会真的去删除,这就让我们有了确认的机会和回旋的余地。我们看看实际用法吧:
$ rsync -n --delete -r . machineB:/home/userB/
deleting superman/xxx
deleting main.c
deleting acclink
[–exclude选项和–exclude-from选项]
如果你不希望同步一些东西到目的端的话,可以使用–exclude选项来隐藏,rsync还是很重视大家隐私的,你可以多次使用–exclude选项来设置很多的“隐私”。
如果你要隐藏的隐私太多的话,在命令行选项中设置会比较麻烦,rsync还是很体贴,它提供了–exclude-from选项,让你可以把隐私一一列在一个文件里,然后让rsync直接读取这个文件就好了。
[–partial选项]
这就是传说中的断点续传功能。默认情况下,rsync会删除那些传输中断的文件,然后重新传输。但在一些特别情况下,我们不希望重传,而是续传。
我们在使用中,经常会看到有人会使用-P选项,这个选项其实是为了偷懒而设计的。以前人们总是要手动写–partial –progress,觉得太费劲了,倒不如用一个新的选项来代替,于是-P应运而生了。有些读者会问–partial我知道作用了,可–progress是干什么用的呢?为什么很多人要使用它呢,它有那么大的吸引力?(真有…)
[–progress选项]
使用这个选项,rsync会显示出传输进度信息,有什么用呢,rsync给了一个很有意思的解释:
This gives a bored user something to watch.
好了,写了这么多,大家看的已经很乏味了,去实际用用–progress解解闷,是个不错的选择 ^_^
PS:后续会讲解有关rsync的–exclude的PATTERN语法。


==========================================================
语法
rsync [OPTION]... SRC DEST 
rsync [OPTION]... SRC [USER@]host:DEST 
rsync [OPTION]... [USER@]HOST:SRC DEST 
rsync [OPTION]... [USER@]HOST::SRC DEST 
rsync [OPTION]... SRC [USER@]HOST::DEST 
rsync://[USER@]HOST[:PORT]/SRC [DEST] 

对应于以上六种命令格式,rsync有六种不同的工作模式:
 拷贝本地文件。
当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如:rsync -a /data /backup 使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。
当DST路径地址包含单个冒号":"分隔符时启动该模式。如:rsync -avz *.c foo:src 使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。
当SRC地址路径包含单个冒号":"分隔符时启动该模式。如:rsync -avz foo:src/bar /data 从远程rsync服务器中拷贝文件到本地机。
当SRC路径信息包含"::"分隔符时启动该模式。如:rsync -av root@192.168.78.192::www /databack 从本地机器拷贝文件到远程rsync服务器中。
当DST路径信息包含"::"分隔符时启动该模式。如:rsync -av /databack root@192.168.78.192::www 列远程机的文件列表。这类似于rsync传输,不过只要在命令中省略掉本地机信息即可。如:rsync -v rsync://192.168.78.192/www

来自: http://man.linuxde.net/rsync

美国的肿瘤专科医院更是举世闻名,其中以位于德克萨斯州的MD安德森癌症中心(MD Anderson Cancer Center)为首,是世界公认的最好的肿瘤医院。MD安德森癌症中心领先于世界的优秀主要肿瘤专科有:肺癌、乳腺癌、白血病、膀胱癌、前列腺癌、子宫内膜癌、卵巢癌、头颈部癌、胰腺癌和黑色素瘤。同时安德森是世界上最大的肿瘤药物临床试验基地,全球最先进的肿瘤药物都是从安德森的临床试验出来的,安德森癌症中心的病人有很多机会使用世界上最先进的正在临床试验阶段的新型肿瘤药物(领先于其他病患几年的时间)。


《发生率》显示,全部25种重大疾病基本已经涵盖了多数的高发重疾险。而“6病种”,在全部25种重疾中占比居高不下,在较多年龄段中占比为60%-90%,最高的占比达94.5%。这6种病分别为恶性肿瘤、急性心肌梗塞、脑中风后遗症、重大器官移植术或造血干细胞移植术、冠状动脉搭桥术(或称冠状动脉旁路移植术)和终末期肾病(或称慢性肾功能衰竭尿毒症期)。
中国肿瘤登记中心2015年年报数据显示,目前我国癌症发病率为285.91/100000,每年我国新发癌症病例约312万,平均每分钟有6人被诊断为恶性肿瘤。《临床医师癌症杂志》近期发布的《2015年中国癌症统计》报道显示,2015年中国有429.2万例新发肿瘤病例和281.4万例死亡病例。
而恶性肿瘤,也是重疾险中理赔概率最高的。
富德生命人寿近期发布的重疾险理赔原因显示,重大疾病理赔中75%为癌症。重大疾病理赔案件中以癌症、急性心肌梗塞和脑中风后遗症为主,占比分别为75%、10%和5%。2015年因癌症发生的重大疾病理赔中,其中女性占比61%,男性占比39%。男性癌症中以肺癌、肝癌和胃癌为主,分别占男性癌症的15.67%、15.19%和9.72%;女性癌症中以乳腺癌、甲状腺癌和子宫颈癌为主,分别占女性癌症的26.38%、16.28%和10.34%。
2015年平安北京分公司重疾理赔十大出险原因显示,第一为恶性肿瘤(癌症)为65.0%,第二位是心肌梗塞(急性心肌梗死)为14.4%,第三位是脑中风或脑中风后遗症为5.4%,接下来分别是冠状动脉绕道手术(3.6%)、慢性肾衰竭(2.7%)、良性脑肿瘤(1.4%)、心脏瓣膜置换术(0.8%)、重要器官移植或造血干细胞移植术(0.8%)、肝病末期(0.6%)、系统性红斑狼疮(0.6%)。
而2014年广东友邦保险的大病数据显示,15种出险率最高的疾病分别是17.02%的甲状腺癌、14.36%的乳腺癌、8.46%的急性心肌梗塞、肺癌(6.5%)、肝癌(5.9%)、宫颈癌(5.23%)、白血病(4.03%)、胃癌(3.99%)、脑中风后遗症(3.84%)、良性脑肿瘤(2.66%)、子宫内膜癌(2.54%)、肾癌(2.31%)心脏瓣膜手术2.22%、终末期肾病2.00%、卵巢癌(1.97%)。
从这份数据中可以发现,在这15中出险率高的“重大疾病”中,以原位癌为主。原位癌是指上皮恶性肿瘤局限在皮肤或粘膜内,还未通过皮肤或粘膜下面的基底膜侵犯到周围组织。包括乳腺癌、子宫癌、卵巢癌、宫颈癌等。因此,女性在购买重疾险时,是否包含原位癌,比险种的数量更为重要。

2016年12月5日星期一

how to build a kms server to active windows products

https://www.dwhd.org/20150723_011447.html

server guide: https://forums.mydigitallife.info/threads/50234-Emulated-KMS-Servers-on-non-Windows-platforms

windows OS activation example:
PS C:\WINDOWS\system32> slmgr.vbs -upk
PS C:\WINDOWS\system32> slmgr.vbs -ipk W269N-WFGWX-YVC9B-4J6C9-T83GX
PS C:\WINDOWS\system32> slmgr.vbs -skms kms.bcsytv.com
PS C:\WINDOWS\system32> slmgr.vbs -ato
PS C:\WINDOWS\system32> slmgr.vbs -dlvf

office activation:
http://www.ihacksoft.com/ospp-vbs.html

cscript ospp.vbs /dstatus
显示当前已安装产品密钥的许可证信息。可以查看到自已安裝的版本有多少个序列号。
ospp.vbs
cscript ospp.vbs /unpkey:xxxxx
卸载已安装的产品密钥。后面的数字是密钥的最后5位数。
此时再执行cscript ospp.vbs /dstatus发现产品密钥已经没有了,我重新进行导入。
ospp.vbs
cscript ospp.vbs /inpkey:xxxxx……
安装、替换现有的产品密钥。和上面的过程刚好相反。
cscript ospp.vbs /sethst:x.x.x.x
设置KMS主机名。x.x.x.x一般为IP地址。
cscript ospp.vbs /act
激活当前安装的Office。
cscript ospp.vbs /remhst
删除KMS主机名。







2016年11月24日星期四

check process memory usage on Linux

check process memory usage on Linux

1. Use this tool:

  http://www.pixelbeat.org/scripts/ps_mem.py 

 [root@web2 ~]# python ./ps_mem.py
 Private  +   Shared  =  RAM used       Program

   4.0 KiB +  10.5 KiB =  14.5 KiB       klogd
   4.0 KiB +  16.5 KiB =  20.5 KiB       udevd
   4.0 KiB +  23.0 KiB =  27.0 KiB       glusterd
 76.0 KiB +  17.0 KiB =  93.0 KiB       init
 84.0 KiB +  11.0 KiB =  95.0 KiB       syslogd
100.0 KiB +  22.0 KiB = 122.0 KiB       agetty
436.0 KiB +  13.0 KiB = 449.0 KiB       klogd1
392.0 KiB + 265.0 KiB = 657.0 KiB       sendmail.sendmail (2)
   1.0 MiB +  66.5 KiB =   1.1 MiB       bash
   1.5 MiB + 268.0 KiB =   1.8 MiB       sshd (2)
  3.0 MiB + 847.0 KiB =   3.8 MiB       crond (13)
137.2 MiB +  11.0 MiB = 148.2 MiB       httpd (34)
253.0 MiB +   5.4 MiB = 258.4 MiB       php (18)
---------------------------------
                        414.7 MiB
=================================


2.

htop

Similar to the top command, the htop command also shows memory usage along with various other details.
The header on top shows cpu usage along with RAM and swap usage with the corresponding figures.


A few ways to execute commands remotely using SSH

In this article I describe a few ways to execute commands on a remote host using SSH. If you want to follow along, first set HOST variable to your testing server, optimaly configured with publickey authentication.

Single-line command

Executing a single command:
ssh $HOST ls
Executing several commands, inlined, separated with ;
ssh $HOST ls; pwd; cat /path/to/remote/file
Executing a command with sudo
ssh $HOST sudo ls /root
sudo: no tty present and no askpass program specified
sudo requires interactive shell, it can be enabled with -t parameter.
ssh -t $HOST sudo ls /root
[sudo] password for zaiste:

Simple multi-line command

VAR1="Variable 1"
ssh $HOST '
ls
pwd
if true; then
    echo "True"
    echo $VAR1      # <-- it won't work
else
    echo "False"
fi
'
Shell variables won't be expanded with this method.

Multi-line command with variables expansion

In order to make variables expansion work, use bash -c.
VAR1="Variable 1"
ssh $HOST bash -c "'
ls
pwd
if true; then
    echo $VAR1
else
    echo "False"
fi
'"

Multi-line command from local script

A local script can be executed against remote machine with a simple stdin redirection.
cat script.sh
ls
pwd
hostname
ssh $HOST < script.sh

Multi-line command using Heredoc

Using heredoc is probably the most convenient way to execute multi-line commands on a remote machine. Also, variables expansion works out-of-the-box.
VAR1="boo"
ssh -T $HOST << EOSSH
ls
pwd
if true; then
  echo $VAR1
else
  echo "False"
fi
EOSSH
If you need to assign variables within the heredoc block, put the opening heredoc in single quotes.
ssh -T $HOST <<'EOSSH'
VAR1=`pwd`
echo $VAR1

VAR2=$(uname -a)
echo $VAR2

EOSSH
The following warning message
Pseudo-terminal will not be allocated because stdin is not a terminal.
can be disabled by adding -T parameter to ssh execution.

2016年11月23日星期三

lftp 限速

在/etc/lftp.conf中加入:
    set net:limit-rate 819200,40960
下载800kB,上传40kB

2016年11月22日星期二

sed常用命令


使用sed删除匹配行及上下几行


删除包含DATA Partition的行,同时删除这行的后面2行和上面3行
sed -i ‘/DATA Partition/,+2d;:go;1,3!{P;N;D};N;bgo’ report.cfg
参考文档:
sed ‘/5/,+3d;:go;1,2!{P;N;D};N;bgo’ file
/5/,+3d 对匹配到5的那一行以及该行的后三行都执行d操作(d 清空模式空间)
:go 设一个标签go
1,2!{P;N;D} 除了第一行和第二行,其他行都执行P;N;D操作(P 打印当前模式空间的第一行;N 将下一行添加到当前模式空间中;D 删除模式空间的第一行并开始一个新的循环)
N 这个命令只对第一行和第二行有效了,因为其他行在上一个命令中都执行了D,直接开始新的循环了,所以这个命令不会被执行。
bgo 返回go标签

http://bbs.chinaunix.net/thread-3775201-1-1.html
=================================================

** 在一文件中指定的字符后插入内容
   sed -i s/指定的字符/&要插入的字符/ 文件

** 在一文件中指定的字符前和后插入内容

   sed -i s/指定的字符/前面要插入的字符&后面要插入的字符/ 文件


** 在匹配行前插入
   sed -i ’/pattern/ i “插入字符串”’ datafile

** 在匹配行后插入
   sed -i ’/pattern/ a “插入字符串”’ datafile

**   在文件的每行末尾添加一个回车
     sed '/$/a\\n' test.txt

**  在文件的末尾添加'eof'
     sed '$a\eof' test.txt
** sed 中引用环境变量,注意文件结尾也用 $ 时,要把这个$转义才行,且sed 命令只能放在双引号内。
   sed "\$a30 2 * * * /usr/local/bin/backup.sh $test"  cron/root

** 替换空格之前的所有字符(包括空格)
     sed  's/.* /字符串/g' datafile  #注意那个红点

**在匹配行的行尾增加字符
    sed '/pattern/s/$/插入字符串/g' datafile

**在匹配行的行首增加字符

    sed '/pattern/s/^/插入字符串/g' datafile
===============================================


文本处理工具之二 sed命令详解

      sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。
sed命令的语法格式:
       sed的命令格式: sed [option]  'sed command'filename
sed的脚本格式:sed [option] -f  'sed  script'filename
sed命令的选项(option)
                -n :只打印模式匹配的行
-e :直接在命令行模式上进行sed动作编辑,此为默认选项
-f :将sed的动作写在一个文件内,用f  filename 执行filename内的sed动作
-r :支持扩展表达式
-i 直接修改文件内容
sed在文件中查询文本的方式:
1)使用行号,可以是一个简单数字,或是一个行号范围
 x                                  
x为行号
x,y
表示行号从x到y
/pattern
查询包含模式的行
/pattern   /pattern
查询包含两个模式的行
pattern/,x  
在给定行号上查询包含模式的行
x,/pattern/  
通过行号和模式查询匹配的行
x,y!  
查询不包含指定行号x和y的行

2)使用正则表达式、扩展正则表达式(必须结合-r选项)  
^
锚点行首的符合条件的内容,用法格式"^pattern"
$
锚点行尾的符合条件的内容,用法格式"pattern$"
^$
空白行
.
匹配任意单个字符
*
匹配紧挨在前面的字符任意次(0,1,多次)
.*
匹配任意长度的任意字符
\?
匹配紧挨在前面的字符0次或1次
\{m,n\}
匹配其前面的字符至少m次,至多n次
\{m,\}
匹配其前面的字符至少m次
\{m\}
精确匹配前面的m次\{0,n\}:0到n次          
\<
锚点词首----相当于  \b,用法格式:\<pattern
\>
锚点词尾,用法格式:\>pattern
\<pattern\>
单词锚点
\(\)
分组,用法格式:\(pattern\),引用\1,\2
[]
匹配指定范围内的任意单个字符
[^]
匹配指定范围外的任意单个字符
[:digit:]
所有数字,  相当于0-9, [0-9]--->  [[:digit:]]
[:lower:]
所有的小写字母
[:upper:]
所有的大写字母
[:alpha:]
所有的字母
[:alnum:]
相当于0-9a-zA-Z
[:space:]
空白字符
[:punct:]
所有标点符号
1
2
3
4
5
6
7
#######sed的匹配模式支持正则表达式#####################
sed'5 q'/etc/passwd#打印前5行
sed-n '/r*t/p'/etc/passwd#打印匹配r有0个或者多个,后接一个t字符的行
sed-n '/.r.*/p'/etc/passwd#打印匹配有r的行并且r后面跟任意字符
sed-n '/o*/p'/etc/passwd#打印o字符重复任意次
sed-n '/o\{1,\}/p'/etc/passwd#打印o字重复出现一次以上
sed-n '/o\{1,3\}/p'/etc/passwd#打印o字重复出现一次到三次之间以上
   sed的编辑命令(sed  command)
p
打印匹配行(和-n选项一起合用)
=
显示文件行号
a\  
在定位行号后附加新文本信息
i\
在定位行号后插入新文本信息
d    
删除定位行
c\  
用新文本替换定位文本
filename
写文本到一个文件,类似输出重定向 >
r    filename
从另一个文件中读文本,类似输入重定向  <
s
使用替换模式替换相应模式
q
第一个模式匹配完成后退出或立即退出
l
显示与八进制ACSII代码等价的控制符
{}
在定位行执行的命令组,用分号隔开
n  
从另一个文件中读文本下一行,并从下一条命令而不是第一条命令开始对其的处理
N
在数据流中添加下一行以创建用于处理的多行组
g
将模式2粘贴到/pattern n/
y    
传送字符,替换单个字符

对文件的操作无非就是”增删改查“,怎样用sed命令实现对文件的”增删改查“,玩转sed是写自动化脚本必须的基础之一。
sed命令打印文件信息(查询):
1
2
3
4
5
6
7
8
9
####用sed打印文件的信息的例子的命令######
sed -n '/^#/!p'  /etc/vsftpd/vsftpd.conf      
sed -n '/^#/!{/^$/!p}'  /etc/vsftpd/vsftpd.conf
sed -e '/^#/d' -e '/^$/d'  /etc/vsftpd/vsftpd.conf
sed -n '1,/adm/p' /etc/passwd
sed -n '/adm/,6p' /etc/passwd
sed -n '/adm/,4p' /etc/passwd
sed -n '/adm/,2p' /etc/passwd
###以下图片是对这些sed命令例子的解释和显示结果
sed命令实现对文件内容的添加:(对源文件添加的话就用-i参数):
1
2
3
4
5
6
7
8
9
10
####sed命令可以实现的添加######
#1)匹配行的行首添加,添加在同行
#2)匹配行的行中的某个字符后添加
#3)匹配行的行尾添加字符
#4)匹配行的行前面行添加
#5)匹配行的行后面行添加
#6)文件的行首添加一行
  [root@jie1 ~]# sed -i '1 i\sed command start' myfile
#7)文件的行尾追加一行
  [root@jie1 ~]# sed -i '$a \sed command end' myfile


sed命令实现对文件内容的删除:(对源文件直接删除用-i参数):
sed的删除操作是针对文件的行,如果想删除行中的某个字符,那就用替换(别急,替换稍后就讲,而且替换是sed最常用的)

重点sed命令实现对文件内容的替换(替换是在shell自动化脚本中用到最多的操作)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
#================源文件里面的内容===============================
[root@jie1 ~]# cat test
anonymous_enable=YES
write_enable=YES
local_umask=022
xferlog_enable=YES
connect_from_port_20=YES
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
DEVICE="eth0"
BOOTPROTO="static"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.22.1
NETMASK=255.255.0.0
#======================================================================
[root@jie1 ~]# sed -i '/DEVICE/c\Ethernet' test
        #匹配DEVICE的行,替换成Ethernet这行
[root@jie1 ~]# sed -i 's/static/dhcp/' test    
        #把static替换成dhcp(/,@,#都是前面所说的地址定界符)
[root@jie1 ~]# sed -i '/IPADDR/s@22\.1@10.12@' test
        #匹配IPADDR的行,把22.1替换成10.12由于.号有特殊意义所有需要转义
[root@jie1 ~]# sed -i '/connect/s#YES#NO#' test
        #匹配connect的行,把YES替换成NO
[root@jie1 ~]# sed -i 's/bin/tom/2g' test      
        #把所有匹配到bin的行中第二次及第二次之后出现bin替换成tom
[root@jie1 ~]# sed -i 's/daemon/jerry/2p' test 
        #把所有匹配到bin的行中第二次出现的daemon替换成jerry,并在生产与匹配行同样的行
[root@jie1 ~]# sed -i 's/adm/boss/2' test      
        #把所有匹配到adm的行中仅仅只是第二次出现的adm替换成boss
[root@jie1 ~]# sed -i '/root/{s/bash/nologin/;s/0/1/g}' test
        #匹配root的行,把bash替换成nologin,且把0替换成1
[root@jie1 ~]# sed -i 's/root/(&)/g' test                
        #把root用括号括起来,&表示引用前面匹配的字符
[root@jie1 ~]# sed -i 's/BOOTPROTO/#BOOTPROTO/' test     
        #匹配BOOTPROTO替换成#BOOTPROTO,在配置文件中一般用于注释某行
[root@jie1 ~]# sed -i 's/ONBOOT/#&/' test                
        #匹配ONBOOT的行的前面添加#号,在配置文件中也表示注释某行
[root@jie1 ~]# sed -i '/ONBOOT/s/#//' test               
        #匹配ONBOOT的行,把#替换成空,即去掉#号,也一般用作去掉#注释
#================执行以上sed命令之后文件显示的内容====================
[root@jie1 ~]# cat test
anonymous_enable=YES
write_enable=YES
local_umask=022
xferlog_enable=YES
connect_from_port_20=NO
(root):x:1:1:(root):/(root):/bin/nologin
bin:x:1:1:tom:/tom:/stom/nologin
daemon:x:2:2:jerry:/sbin:/stom/nologin
daemon:x:2:2:jerry:/sbin:/stom/nologin
adm:x:3:4:boss:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0

sed引用变量:(在自动化shell脚本 中也经常会使用到变量
     第一种当sed命令里面没有默认的变量时可以把单引号改成双引号;  
     第二种当sed命令里面有默认的变量时,那自己定义的变量需要加单引号,且sed里面的语句必须用单引
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
[root@jie1 ~]# cat >> myfile << EOF
> hello world
> i am jie
> how are you
> EOF   #先生成一个文件
[root@jie1 ~]# cat myfile
hello world
i am jie
how are you
[root@jie1 ~]# name=li
         #定义一个变量,且给变量赋值
[root@jie1 ~]# sed -i "s/jie/$name/" myfile
         #把匹配jie的字符替换成变量的值
[root@jie1 ~]# cat myfile
hello world
i am li
how are you
[root@jie1 ~]# sed -i "$a $name" myfile
          #当sed命令也有默认变量时,在去引用自己定义的变量会出现语法错误
sed: -e expression #1, char 3: extra characters after command
[root@jie1 ~]# sed -i '$a '$name'' myfile
          #在引用自定义的变量时,sed语句必须用单引引住,然后把自定义的变量也用单引号引住
[root@jie1 ~]# cat myfile
hello world
i am li
how are you
li
[root@jie1 ~]#

sed的其它高级使用:
1)把正在用sed操作的文件的内容写到例外一个文件中
1
2
3
4
5
6
7
8
9
10
11
12
[root@jie1 ~]# cat test   #sed操作的文件中的内容
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[root@jie1 ~]# sed -i 's/IPADDR/ip/w ip.txt' test
       #把sed操作的文件内容保存到另外一个文件中,w表示保存,ip.txt文件名
[root@jie1 ~]# cat ip.txt  #查看新文件的内容
ip=172.16.10.12
[root@jie1 ~]#
2)读取一个文件到正在用sed操作的文件中
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
[root@jie1 ~]# cat myfile   #文件内容
hello world
i am li
how are you
li
[root@jie1 ~]# cat test  #将用sed操作的文件的内容
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[root@jie1 ~]# sed  -i '/Ethernet/r myfile' test
      #在匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后
[root@jie1 ~]# cat test  #再次查看用sed命令操作的行
Ethernet
hello world
i am li
how are you
li
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[root@jie1 ~]#

sed的经典例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
##1)、处理以下文件内容,将域名取出并进行计数排序,如处理:
http://www.baidu.com/index.html
http://www.baidu.com/1.html
http://post.baidu.com/index.html
http://mp3.baidu.com/index.html
http://www.baidu.com/3.html
http://post.baidu.com/2.html
得到如下结果:
域名的出现的次数 域名
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
[root@localhost shell]# cat file | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
[root@codfei4 shell]# awk -F/ '{print $3}' file |sort -r|uniq -c|awk '{print $1"\t",$2}'
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
##2)、用grep结合sed取出网卡的ip地址
[root@jie1 ~]# ifconfig | grep -B1 "inet addr" |grep -v "\-\-" |sed -n -e 'N;s/\(eth[0-9]\).*\n.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\).*/\1 \2/p'


 学会sed的使用是写自动化shell脚本的基础,sed也是一个非常有用且重要的命令,是文本处理工具之一,以上是我自己学习总结的sed命令简单的用法,sed还有更高级的用法,也还在学习中。

===============================================

1、删除行首空格
sed ‘s/^[ ]*//g’ filename
sed ‘s/^ *//g’ filename
sed ‘s/^[[:space:]]*//g’ filename

2、行后和行前添加新行
行后:sed ‘s/ceagle/&\n/g’ filename
行前:sed ‘s/ceagle/\n&/g’ filename
&代表ceagle

3、使用变量替换(使用双引号)
sed -e “s/$varable1/$varable2/g” filename

4、在第一行前插入文本
sed -i ‘1 i\插入字符串’ datafile

5、在最后一行插入
sed -i ‘$ a\插入字符串’ datafile

6、在匹配行前插入
sed -i ‘/pattern/ i “插入字符串”‘ datafile

7、在匹配行后插入
sed -i ‘/pattern/ a “插入字符串”‘ datafile

8、删除文本中空行和空格组成的行以及#号注释的行
grep -v ^# filename | sed /^[[:space:]]*$/d | sed /^$/d

9、sed -e ‘1!G;h;$!d’ file倒过来显示

sed 附加/替换:

sed “/xmdh/a\daoyou” file 把含有xmdh的行的结尾附加daoyou(有换行)

sed ‘s/$/ daoyou/’ file把每行的结尾附加daoyou(在同一行)

sed ‘/test/s/$/ daoyou/’ file把包含test行的结尾附加daoyou(在同一行)

sed ’10s/$/ daoyou/’ file把第10行的结尾附加daoyou(在同一行)

sed “s/xmdh/daoyou/g” file把xmdh替换成daoyou

sed “s/xmdh/daoyou/;G” file把xmdh替换成daoyou并增加一个换行

cat userlog |sed -n ‘/xmdh/ w test.txt’查看含有xmdh并写入test.txt中

Amazing Windows OS resources Share!!!

Almost all Windows OS List: https://www.heidoc.net/php/myvsdump_details.php?id=P1521F62172Ax64Lcn Latest keys:   https://bbs.kafan.cn/th...