5.xpath语法

from lxml import etree

s="""<div>
    <ul>
         <li class="item-0"><a href="代码link1.html">erfirst item</a></li>
         <li class="item-1"><a href="link2.html">second item</a></li>
         <li class="item-inactive"><a href="link3.html">third item</a></li>
         <li class="item-1"><a href="link4.html">fourth item</a></li>
         <li class="item-0"><a href="link5.html">fifth item</a>
     </ul>
 </div>"""
res=etree.HTML(s) #将指定的字符串进行解析
print(etree.tostring(res))
red=res.xpath("/html/body/div/ul/li/a/@href")   #根据指定的xpath语法来查找相关内容
#//从全局进行查找的标签
#/从当前标签下查找指定的标签
#[num]表示要父级目录下的指定顺序标签
#[限制条件]根据限制条件找到指定的标签
#text()  打印标签中的内容
#@标签属性 指定相关属性
print(red)

# for i in res:
#     #显示element对象需要用到etree.tostring函数
#     print(etree.tostring(i,encoding="utf8").decode("utf8"))