下载此文档

中标麒麟Linux系统文本和文件处理介绍.pdf


文档分类:IT计算机 | 页数:约23页 举报非法文档有奖
1/23
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/23 下载此文档
文档列表 文档介绍
中标麒麟Linux服务器操作系统培训系列
中标麒麟Linux系统文本和文件处理介绍
技术创新,变革未来
本章目标
•使用工具来抽取、分析和处理文本数据
•使用文件查询命令
查看文件内容
•cat∶ 通过 STUOUT 显示一个或多个文件
–多个文件被连锁 (concatenated) 在一起
•less∶ 一页一页地查看文件或 STDIN 输出
–查看时有用的命令包括∶
•/文本 搜索 文本
•n/N 跳到下一个 / 上一个匹配
•v 在一个文本编辑器中打开文件
–less 命令是 man 命令使用的分页器
查看文件的部分内容
•head∶ 显示文件的前 10 行
–使用 -n 来改变要显示的行数
•tail∶ 显示文件的最后 10 行
–使用 -n 来改变要显示的行数
–使用 -f 来“跟随”对文件的后续补充
–对监控日志文件非常有用
按关键字抽取文本
•显示文件或 STDIN 中匹配了某种模式的文本行
–$ grep 'john' /etc/passwd
–$ date --help | grep year
•使用 -i 来不分大小写地搜索
•使用 -n 来显示匹配的行号
•使用 -v 来显示不包含模式的行
•使用 -AX 在显示每项搜索匹配时包括匹配文本后
的 X 行上下文
•使用 -BX 在显示每项搜索匹配时包括匹配文本前
的 X 行上下文
按列抽取文本
•显示文件或 STDIN 数据的指定列
–$ cut -d: -f1 /etc/passwd
–$ grep root /etc/passwd | cut -d: -f7
•使用 -d 来指定区分列的定界符 (默认为 TAB)
•使用 -f 来指定要显示的列
•使用 -C 来按字符切割
–$ cut -c2-5 /usr/share/dict/words
收集文本统计数据
•计数单词总数、行总数、字节总数和字符总数
•可以对文件或 STDIN 中的数据运行
–$ wc
–39 237 1901
•使用 -I 来只计数行数
•使用 -w 来只计数单词总数
•使用 -c 来只计数字节总数
•使用 -m 来只计数字符总数 (不显示)
整理文本
•把整理过的文本显示在STDOUT - 不改变原始文件
–$ sort [选项] 文件
–常用选项
–-r 执行反方向(由上至下)整理
–-n 执行按数字大小整理
–-f 选项忽略(fold) 字符串中的字符大小写
–-u 选项(独特,unique) 删除输出中的重复行
–-t c 选项使用c 作为字段定界符
–-k X 选项按照使用c 字符分隔的字段X 来整理
•能使用多次
重复行操作
•sort -u∶ 从输入中删除重复行
•uniq∶ 从输入中删除重复的前后相接的行
–使用 -c 选项来计数发生次数
–和 sort 命令一起使用效果最佳∶
•$ sort | uniq -c
文件比较
•diff
–比较两个文件之间的区别
• $ diff -broken -works
• 5c5
• < use_widgets = no
•---
• > use_widgets = yes
•注明第 5 行有区别 (改变)
–diff 命令的图形化版本是 gvimdiff
•在 vim-X11 软件包中提供

中标麒麟Linux系统文本和文件处理介绍 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数23
  • 收藏数0 收藏
  • 顶次数0
  • 上传人科技星球
  • 文件大小304 KB
  • 时间2021-10-22