Python爬虫五 BeautifulSoup库

安装

pip install beautifulsoup4

小测

  1. 即使安装的是beautifulsoup4,但是使用时简写为bs4
  2. 从bs4库导入一个BeautifulSoup类,注意B和S大写
  3. html.parser为解析器,还有xml,lxml, html5lib等解析器

bs4基本元素

基于bs4的html遍历方式

下行遍历

上行遍历

平行遍历(发生在同一个父节点下的各个节点间)

原文地址:https://www.cnblogs.com/leerep/p/12451929.html