教你如何用python爬取A股财务报表(含代码)

 量化交易除了在K线上可以有所应用,还可以用于基本面的操作,在处理数据之前首先要获取数据,网易财经给我们提供了一个方便的API接口,这样就不必在其他资讯网里面使用收钱的API

抓下来的数据都是CSV格式,财务报表有利润表、资产负债表、现金流量表(本来应该还有一个所有者权益表我没找到)。

  在网页和程序当中都使用拼音第一个字母小写代替(lrb,zcfzb,xjllb)

  接下来直接上代码,使用的是python3.6.6环境是用anaconda搭建

import re,urllib
import xlwt
from bs4 import BeautifulSoup
from time import sleep
count = 1
for count in range(600500,603800):
    url = 'http://quotes.money.163.com/service/lrb_'+str(count)+'.html'
    while True:
        try:
            content = urllib.request.urlopen(url,timeout=2).read()
            print(content)
            with open('../利润表/'+str(count)+'lrb.csv','wb') as f:
                f.write(content)
            print(count)
            sleep(1)
            break
        except Exception as e:
            if str(e) =='HTTP Error 404: Not Found':
                break
            else:
                print(e)
                continue

  ok,就这么简单就完成啦,可以复制改一下路径然后就可以把三个表一起下下来了,这个程序里已经做了容错,所以在抓完所有数据之前不会自动停下(除非手工停止)。

  如果对你有帮助可以收藏点个赞~

原文地址:https://www.cnblogs.com/lantian123/p/13212953.html