提取位于<title>...</title>内的文本标题内容

#vim title.txt

<title>nhlinkin</title>

# cat title.txt  | sed 's:.*<title>([^<]*).*:1:'
nhlinkin


正则表达式说明:(本人理解的,如有错误,请大家指正,谢谢。)

1  1 中的内容是(  )内匹配的内容。

2  .*<title>代表<title>前面的所有内容,包含<title>本身。

3  [^<]*代表不以<开头的<title>后面的内容。

4  .* 代表以<开头的<title>后面的部份,即</title>后面的所有内容,包含</title>本身。

另:

# echo '<li><a href="http://games.sina.com.cn/"><b>games.sina.com.cn</b></a></li>' | sed 's:.*<b>([^<]*).*:1:'

games.sina.com.cn

<b>最接近要取的title。

原文地址:https://www.cnblogs.com/nhlinkin/p/3511974.html