Python爬虫批量爬取网页数据并保存到Excel中
Python爬⾍批量爬取⽹页数据并保存到Excel中⽂章⽬录
1、环境准备
中秋节简短文案pip install requests梦到鬼
pip install re
pip install openpyxl
2、源代码
import requests学画画零基础
import re
import openpyxl
# 要爬取的⽹页
baseurl ='zhuanlan.zhihu/p/357510629'
十字尾巴弯弯算算数目少三#  创建Excel表并写⼊数据
wb = openpyxl.Workbook()# 创建Excel对象
ws = wb.active  # 获取当前正在操作的表对象
# 往表中写⼊标题⾏,以列表形式写⼊!
ws.append(['事件名称', '时间', '地点名称', '事件简介'])
# 请求头
headers ={
'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
'Connection':'keep-alive',
'User-Agent':'Mozilla/5.0 (X11; Linux x86_64; rv:60.0) Gecko/20100101 Firefox/60.0',
'Upgrade-Insecure-Requests':'1'
如何卸载软件
}
content = (baseurl,headers=headers).content.decode('utf-8')
# 事件名称
event_name = re.findall(r"<td>事件</td><td>(.+?)</td>",content)
print(event_name)
# 时间
start_time = re.findall(r"<td>时间</td><td>(.+?)</td>",content)
print(start_time)
# 地点名称
area_name = re.findall(r"<td>地点</td><td>(.+?)</td>",content)
print(area_name)
如何设置u盘启动
# 事件简介
introduction = re.findall(r"<td>简介</td><td>(.+?)</td>",content)
print(introduction)
for i in range(len(event_name)):  # 每页25条数据,写⼊⼯作表中
ws.append([event_name[i], start_time[i], area_name[i], introduction[i]])
wb.save('数据.xlsx')# 存⼊所有信息后,保存为filename.xlsx

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。