python爬虫入门--抓取wiki词条

from bs4 import BeautifulSoup
import re 
from urllib import request
req = request.urlopen("https://en.m.wikipedia.org/wiki/Main_Page").read().decode("utf-8");
soup = BeautifulSoup(req,"html.parser");
for tag in soup.find_all("a",href=re.compile('^/wiki/')):
    if not re.search(".(jpg|JPG)$",tag["href"]):
        print(tag.get_text(),"<--->","http://en.m.wikipedia.org"+tag["href"]);

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/lx-1024/p/8025295.html

推荐文章
Codeforces 360C Levko and Strings dp (看题解）
Codeforces 418D Big Problems for Organizers 树的直径 + st表（看题解）
Codeforces 241B Friends 字典树
Java实验——输出二维数组连续二维子数组的最大和
软件工程第三周总结
构建之法阅读笔记01
Java实验——输出一个数组里面连续子数组最大的和（二）文件操作
软件工程第二周总结
软件工程第一周开课博客
Java实验——输出一个数组里面连续子数组最大的和
Unity从实践中学习(1)
Jave工具——servlet+jsp编程中mysql数据库连接及操作通用工具类
java课堂测试—根据模板完成一个简单的技术需求征集系统
系统发育树理论基础
Running command-line BLAST
热门数据挖掘模型应用入门（一）: LASSO回归
何用glmnet或lars包进行feature selection
一个全基因组重测序分析实战
django Chinese
django-bower
uwsgi
Angular.js中处理页面闪烁的方法详解
Mongo db change datadir
day 007作业
day 007总结
day 006作业
day006 总结
day 005作业
day 005总结
day 004作业