2020.2.12

通过爬取有道词典的翻译结果连接post方法的爬虫方法

首先我们分析网页的内容

 这个是需要爬取的网址,下面有post提交的表单

 接下来爬取的代码实现的步骤如下:

基于控制台获取到输入的待翻译词语
设定请求的URL
这里有一个反爬的措施,translate_o?这个_o删除即刻
建立post的表单,并且将浏览器拷贝下来的表单修改成最基本的字典的格式
提交post请求
接受到相应的结果
json字符串转化成python的字典格式
打印翻译的结果

import requests
import json
#基于控制台获取到输入的待翻译词语
content = input("请输入:")
#设定请求的URL
url = 'http://fanyi.youdao.com/translate_?smartresult=dict&smartresult=rule'
#这里有一个反爬的措施,translate_o?这个_o删除即刻
#url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
#建立post的表单,并且将浏览器拷贝下来的表单修改成最基本的字典的格式
post_form = {
'i': content,
'from':' AUTO',
'to':' AUTO',
'smartresult':' dict',
'client':' fanyideskweb',
'salt':' 15817288178174',
'sign':' a28b6746d6d2ca8f79e0c77cf7f101f2',
'ts':' 1581728817817',
'bv':' 6275445dcf58d2f326d4a0dd44c9b352',
'doctype':' json',
'version':' 2.1',
'keyfrom':' fanyi.web',
'action':' FY_BY_REALTlME',
'typoResult' : 'false'
}
#提交post请求
response = requests.post(url,data=post_form)
#接受到相应的结果
trans_json = response.text
#json字符串转化成python的字典格式
trans_dict = json.loads(trans_json)
result = trans_dict['translateResult'][0][0]
#打印翻译的结果
print("翻译结果:")
print(result)
print()

结果如下

原文地址:https://www.cnblogs.com/xuzhaoyang/p/12307644.html