bibli直播弹幕实时爬取

1 分析数据来源

  •    在不知道弹幕信息在哪里的时候,只能去all里面查看每一个相应的信息,看信息是否含有弹幕信息
  •    在知道弹幕信息文件的时候,我们可以直接用全局文件搜索,定位到弹幕数据文件.操作如下图

2 查看文件的请求信息

3 查看请求头信息,构建请求头

  • 请求头;
headers={
    'Content-Type':'application/x-www-form-urlencoded',
    'Origin': 'https://live.bilibili.com',
    'Referer':'https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36',
}
  •  请求体数据
data={ 
    'roomid': '7734200', #房间号
    'csrf_token': 'fa56950667934cf5a3479ca94abc1f9a',
    'csrf': 'fa56950667934cf5a3479ca94abc1f9a',
    'visit_id': '',
}

4 代码

import requests
import time

#请求头 headers
={ 'Content-Type':'application/x-www-form-urlencoded', 'Origin': 'https://live.bilibili.com', 'Referer':'https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36', }
#请求体 data
={ 'roomid': '7734200', 'csrf_token': 'fa56950667934cf5a3479ca94abc1f9a', 'csrf': 'fa56950667934cf5a3479ca94abc1f9a', 'visit_id': '', } url='https://api.live.bilibili.com/ajax/msg'

#实时请求数据 while True: time.sleep(2) response=requests.post(url=url,headers=headers,data=data) dic_data=response.json() # print(type(dic_data)) content=[item['text'] for item in dic_data['data']['room']] print(content)

 5 效果

原文地址:https://www.cnblogs.com/angle6-liu/p/10579983.html