用python抓取oj题目(0)——重回战场 duoduo3_69 博客园

用python抓取oj题目(0)——重回战场 - duoduo3_69 - 博客园

额 开学6周了 老吴终于把我们想起来了

之前发现诺基亚的Qt写图形界面实在是太华丽了 虽然是C++的一个库 但自从有了Qml之后 图形界面就像css一样 简单啊 玩的正起劲那 这好 又要开是纠结的生活了

这次的任务是从别的oj上抓数据 也就是把oj上的神马题目描述 输入输出 图片 作者神马的都抓到数据库里

而且图片要下载到本地 不只是用他原来的链接 

主要是用: python urllib2(一个强大的库)、 beautifulsoup(html解析)、sqlalchemy(类似一个抽象的数据库基类一样 ) 都很强大 而且简单上手 因为是网站的子模块 so 显示部分就不用弄的很好 用django搭哥架子看看抓的数据对不对就ok

做了三天现在 第一天研究了下怎么catch 第二天把字都存下来了 第三天把图也download下了 今天用django搭个架子显示显示看看 等全部弄完之后在详细记录总结下 希望能在清明前弄完

额 贴几个资源网站 以备不时只需:

Beautiful Soup 中文文档(好不容易找到的中文文档) http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html

Sqlalchemy文档(直接下个pdf最好) http://docs.sqlalchemy.org/en/rel_0_6/index.html

hdoj(第一个oj就是杭电 测试都用它) http://acm.hdu.edu.cn/

CSDN Qt(个人觉得最好的Qt资源集散地 别的链接都能从这转过去) http://qt.csdn.net/

Qt部分中文文档(可看)  http://blog.csdn.net/jokerjhm

NokiaQt中文Wiki http://www.developer.nokia.com/Community/Wiki/Qt_%E5%BC%80%E5%8F%91

我胡汉三还会回来的 Qt等着我

原文地址:https://www.cnblogs.com/lexus/p/2422083.html