Beautifulsoup

一、获取Tag

1.find_all方法

(1)find_all(name='tag_name',attrs,recursive,text,**kwargs)

name:tag对应的名称,当包括多个tag时,返回的是一个列表,可以利用列表功能选取对应的tag。

href:tag的属性,常用属性class,style,id等,当为True时表示有该属性,传入正则表达式时表示该属性的值

recursive:中文指递归的循环的,True:搜索当前标签的所有子孙节点,False:仅直接节点

text:文档中字符串内容,参数接受字符串、正则表达式、列表、True,可用soup.text或者soup.get_text()获得对应的字符串内容。注意tag与string的区别,例如soup=<a <span>音乐美学</span></a>,print(soup.string)结果为None,print(soup.text)结果为“音乐美学”

(2)soup(name='tag_name',attrs),可以直接输出对应tag的内容,tag.text等同于tag.get_text()获得所有的text

原文地址:https://www.cnblogs.com/mango-lee/p/Mango_lee.html