正则表达式与文件格式化处理

21.1.24

  • 正规表示法就是处理字串的方法,他是以行为单位来进行字串的处理行为;
  • 正规表示法透过一些特殊符号的辅助,可以让使用者轻易的达到『搜寻/删除/取代』某特定字串的处理程序;
  • 只要工具程序支持正规表示法,那么该工具程序就可以用来作为正规表示法的字串处理之用;
  • 正规表示法与万用字节是完全不一样的东西!万用字节 (wildcard) 代表的是 bash 操作介面的一个功能, 但正规表示法则是一种字串处理的表示方式!
  • 使用 grep 或其他工具进行正规表示法的字串比对时,因为编码的问题会有不同的状态,因此, 你最好将 LANG 等变量配置为 C 或者是 en 等英文语系!
  • grep 与 egrep 在正规表示法里面是很常见的两支程序,其中, egrep 支持更严谨的正规表示法的语法;
  • 由於编码系统的不同,不同的语系 (LANG) 会造成正规表示法撷取数据的差异。因此可利用特殊符号如 [:upper:] 来替代编码范围较佳;
  • 由於严谨度的不同,正规表示法之上还有更严谨的延伸正规表示法;
  • 基础正规表示法的特殊字符有: *, ?, [], [-], [^], ^, $ 等!
  • 常见的正规表示法工具有: grep , sed, vim 等等
  • printf 可以透过一些特殊符号来将数据进行格式化输出;
  • awk 可以使用『栏位』为依据,进行数据的重新整理与输出;
  • 文件的比对中,可利用 diff 及 cmp 进行比对,其中 diff 主要用在纯文字文件方面的新旧版本比对
  • patch 命令可以将旧版数据升级到新版 (主要亦由 diff 创建 patch 的补丁来源文件)
原文地址:https://www.cnblogs.com/ananing/p/14320439.html