.text是文本
xpath语法:
/一层层查找
//不固定位置 //title/text()
@选取属性 [@href]和[@href='']
.当前位置
``* //div[@*] 选取所有带属性的div
contains contains[@id,'images'] 选取id属性的值包含‘images’的节点
request.selector.xpath(...).extract() 返回unicode
CSS选择器;
``* 通用选择器
E 标签选择器,选择E标签元素
.info class选择器 匹配calss属性里面包含info的元素
E[attr='val'] 属性的值为val的E标签
###
import requests
from lxml import etree
start_url='http://www.jianshu.com'
response=requests.get(start_url).text
soup=etree.HTML(response)
aa=soup.xpath('//a[@class="title"]')
for i in aa:
print(i.text)