第一个爬虫和测试

一、第一个测试

测试球赛的GameOver函数

def GameOver(N, scoreA, scoreB):

'''

function: 定义一局比赛的结束条件

N: 代表当前局次(第五局为决胜局)

return: 若比赛结束的条件成立返回真,否则为假

'''

if N <= 4:

return (scoreA>=25 and abs(scoreA-scoreB)>=2 or scoreB>=25 and abs(scoreA-scoreB)>=2)

else:

return (scoreA>=15 and abs(scoreA-scoreB)>=2) or (scoreB>=15 and abs(scoreA-scoreB)>=2)

 

try:

for i in range(10):

a,b,c=map(int,input().split(','))

print(GameOver(a,b,c))

except:

print("error")

 

 

三、这是一个简单的HTML页面

<html>

<head>

<title>Simpke</title>

</head>

<body><p id='china'>你好,中国</p>

</body>

</html>

要求如下:
(1)打印head标签的内容

(2)获取body的内容

(3)获取id为china的标签对象

(4)获取并打印html页面的中文字符

代码如下:

from bs4 import BeautifulSoup

import re

soup=BeautifulSoup("<html><head><title>Simpke</title></head><body><p id='china'>你好,中国</p></body></html>","html.parser")

print(soup.head,"05") #打印head的内容和我的学号后两位

print(soup.body) #打印body的内容

print(soup.find_all(id="china")) #打印id为china的文本

r=soup.text

pattern = re.findall(u'[u1100-uFFFDh]+?',r)

print(pattern)

结果如下:

 

二、第一个爬虫

我是爬虫谷歌网页的

代码如下:

import requests

def one(url):

try:

r=requests.get(url)

r.raise_for_status()

r.encoding='utf-8'

return r.text()

except:

return("爬虫失败")

url="https://www.google.com.hk/"

print(one(url))

 

结果为:

原文地址:https://www.cnblogs.com/panqiaoyan/p/10893660.html