Python爬虫批量爬取网页数据并保存到Excel中--慧智精品网

Python爬⾍批量爬取⽹页数据并保存到Excel中⽂章⽬录

1、环境准备

中秋节简短文案pip install requests梦到鬼

pip install re

pip install openpyxl

2、源代码

import requests学画画零基础

import re

import openpyxl

# 要爬取的⽹页

baseurl ='zhuanlan.zhihu/p/357510629'

十字尾巴弯弯算算数目少三# 创建Excel表并写⼊数据

wb = openpyxl.Workbook()# 创建Excel对象

ws = wb.active # 获取当前正在操作的表对象

# 往表中写⼊标题⾏，以列表形式写⼊！

ws.append(['事件名称', '时间', '地点名称', '事件简介'])

# 请求头

headers ={

'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',

'Connection':'keep-alive',

'User-Agent':'Mozilla/5.0 (X11; Linux x86_64; rv:60.0) Gecko/20100101 Firefox/60.0',

'Upgrade-Insecure-Requests':'1'

如何卸载软件

}

content = (baseurl,headers=headers).content.decode('utf-8')

# 事件名称

event_name = re.findall(r"<td>事件</td><td>(.+?)</td>",content)

print(event_name)

# 时间

start_time = re.findall(r"<td>时间</td><td>(.+?)</td>",content)

print(start_time)

# 地点名称

area_name = re.findall(r"<td>地点</td><td>(.+?)</td>",content)

print(area_name)

如何设置u盘启动

# 事件简介

introduction = re.findall(r"<td>简介</td><td>(.+?)</td>",content)

print(introduction)

for i in range(len(event_name)): # 每页25条数据，写⼊⼯作表中

ws.append([event_name[i], start_time[i], area_name[i], introduction[i]])

wb.save('数据.xlsx')# 存⼊所有信息后，保存为filename.xlsx

发表评论

慧智精品网

Python爬虫批量爬取网页数据并保存到Excel中

发表评论

推荐文章

【中国历史十五讲】读书说明与指导(吴树国)

中药泡脚的历史典故

关于司马迁的历史评价

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

热门文章

山西汉代政治,文化名人及作品

唐装的起源和历史演变

中国古代史阶段特征

中国历史上的汉朝文化发展

[汉代历史简介]汉代历史故事

历史汉代全部知识点总结

汉代经济发展对中国经济史的影响

汉代的文学体裁

汉源名字来历

简述汉代艺术的基本特征和美学风格

汉代文学的风格和特征

汉代陶瓷知识点归纳总结

汉代经济发展与中外贸易

中国古代史完整版

汉代的科学技术与数学发展

汉代的录囚名词解释

汉代对中国文化的影响-概述说明以及解释

汉代的思想大一统知识点

汉学与宋学的名词解释

汉唐文化交融研究

最新文章

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

互动训练B—《汉武帝巩固大一统王朝》

汉代耧车的历史价值

红星照耀中国汉代青铜读书笔记

湖南马王堆汉墓的发掘与研究

标签列表