xml.sax 笔记

from xml.sax import saxutils
html_str = """<!DOCTYPE html>
<html>
<head>
  <title>name</title>
</head>
<body>
<h1>namejr</h1>
<p>my name is namejr</p>
<span>my age is <b>22</b> years old</span>
<p>other string, such as "*", "@"</p>
</body>
</html>"""

# xml.sax.saxutils.escape(data[, entities={}])将html代码进行转义

# xml.sax.saxutils.escape(data)  # 按照规定的进行转义,转义的内容:"<"/">"/"&" 对应"&lt;"/"&gt;"/"&amp;"
print(saxutils.escape(html_str))
"""
D:笔记python电子书Python3>python index.py
&lt;!DOCTYPE html&gt;
&lt;html&gt;
&lt;head&gt;
  &lt;title&gt;name&lt;/title&gt;
&lt;/head&gt;
&lt;body&gt;
&lt;h1&gt;namejr&lt;/h1&gt;
&lt;p&gt;my name is namejr&lt;/p&gt;
&lt;span&gt;my age is &lt;b&gt;22&lt;/b&gt; years old&lt;/span&gt;
&lt;p&gt;other string, such as "*", "@"&lt;/p&gt;
&lt;/body&gt;
&lt;/html&gt;
"""

# 如果想转义自己定义的字符就要使用到entities参数
entities = {'*':'不知道写啥', '@':'更不知道写啥'}
print(saxutils.escape(html_str, entities=entities))
"""
D:笔记python电子书Python3>python index.py
&lt;!DOCTYPE html&gt;
...
&lt;span&gt;my age is &lt;b&gt;22&lt;/b&gt; years old&lt;/span&gt;
&lt;p&gt;other string, such as "不知道写啥", "更不知道写啥"&lt;/p&gt;
&lt;/body&gt;
&lt;/html&gt;
"""
# xml.sax.saxutils.unescape()  # 与xml.sax.saxutils.escape()相反

 

xml.sax.saxutils.quoteattr()

from xml.sax import saxutils
# xml.sax.saxutils.quoteattr() 与escape()相似,区别是quoteattr()将根据数据的内容选择引号,试图避免对字符串中的任何引号进行编码(只使用一种引号不编码,如果单双引号都在使用,会对双引号进行编码)
html_str = "<element attr={}>".format(saxutils.quoteattr("ab' cd"ef"))
print(html_str)
原文地址:https://www.cnblogs.com/namejr/p/10004472.html