python抓取网页图片教程_Python实现简单网页图片抓取完整代码实例--慧智精品网

python抓取⽹页图⽚教程_Python实现简单⽹页图⽚抓取完整

代码实例

利⽤python抓取⽹络图⽚的步骤是：

1、根据给定的⽹址获取⽹页源代码

2、利⽤正则表达式把源代码中的图⽚地址过滤出来

3、根据过滤出来的图⽚地址下载⽹络图⽚绍兴旅游景点

以下是⽐较简单的⼀个抓取某⼀个百度贴吧⽹页的图⽚的实现：

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

#抓取⽹页图⽚

#根据给定的⽹址来获取⽹页详细信息，得到的html就是⽹页的源代码

def getHtml(url):台式机添加硬盘

page = urllib.urlopen(url)

中德关系

html = ad()

return html

def getImg(html):

#利⽤正则表达式把源代码中的图⽚地址过滤出来

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = repile(reg)

imglist = imgre.findall(html) #表⽰在整个⽹页中过滤出所有图⽚的地址，放在imglist中

x = 0

for imgurl in imglist:

urllib.urlretrieve(imgurl,'%s.jpg' %x) #打开imglist中保存的图⽚⽹址，并下载图⽚保存在本地

x = x + 1

html = getHtml("tieba.baidu/p/2460150866")#获取该⽹址⽹页详细信息，得到的html就是⽹页的源代码

getImg(html)#从⽹页源代码中分析并下载保存图⽚

进⼀步对代码进⾏了整理，在本地创建了⼀个“图⽚”⽂件夹来保存图⽚

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

import os

#抓取⽹页图⽚

#根据给定的⽹址来获取⽹页详细信息，得到的html就是⽹页的源代码def getHtml(url):

page = urllib.urlopen(url)

html = ad()

return html

#创建保存图⽚的⽂件夹

def mkdir(path):

path = path.strip()

# 判断路径是否存在

# 存在 True

# 不存在 Flase

isExists = ists(path)

if not isExists:

print u'新建了名字叫做',path,u'的⽂件夹'

# 创建⽬录操作函数

os.makedirs(path)

return True

else:

# 如果⽬录存在则不创建，并提⽰⽬录已经存在

print u'名为',path,u'的⽂件夹已经创建成功'

return False

# 输⼊⽂件名，保存多张图⽚

def saveImages(imglist,name):

number = 1

for imageURL in imglist:

splitPath = imageURL.split('.')

fTail = splitPath.pop()

if len(fTail) > 3:

fTail = 'jpg'

fileName = name + "/" + str(number) + "." + fTail

旅泡# 对于每张图⽚地址，进⾏保存

try:

u = urllib2.urlopen(imageURL)

data = u.read()

f = open(fileName,'wb+')

f.write(data)

print u'正在保存的⼀张图⽚为',fileName

f.close()

except urllib2.URLError as e:

print (e.reason)

number += 1

#获取⽹页中所有图⽚的地址

def getAllImg(html):

#利⽤正则表达式把源代码中的图⽚地址过滤出来

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = repile(reg)

相逢何必曾相识前一句imglist = imgre.findall(html) #表⽰在整个⽹页中过滤出所有图⽚的地址，放在imglist中

return imglist

#创建本地保存⽂件夹，并下载保存图⽚

if __name__ == '__main__':

html = getHtml("tieba.baidu/p/2460150866")#获取该⽹址⽹页详细信息，得到的html就是⽹页的源代码path = u'图⽚'

mkdir(path) #创建本地⽂件夹

imglist = getAllImg(html) #获取图⽚的地址列表

药妆saveImages(imglist,path) # 保存图⽚

结果在“图⽚”⽂件夹下保存了⼏⼗张图⽚，如截图：

总结

以上就是本⽂关于Python实现简单⽹页图⽚抓取完整代码实例的全部内容，希望对⼤家有所帮助。感兴趣的朋友可以继续参阅本站：如有不⾜之处，欢迎留⾔指出。感谢朋友们对本站的⽀持！

慧智精品网

python抓取网页图片教程_Python实现简单网页图片抓取完整代码实例

发表评论

推荐文章

三八妇女节的来历和意义一览

妇女节的文化符号与象征

2024年各种节日纪念日大全一览表

中国三八妇女节的起源介绍

2025妇女节是第几个妇女节

热门文章

表白情书600字写给男生_情书

女孩追男孩的方法

女人如何轻松追到男人女人追男人的方法

爱上了女同事,该怎么说才最合适

怎么和内向的女生聊天

表白该怎么说

关于拒绝男生表白的话

2024七夕节表白需要准备什么

女生给男生写情书范文6篇

给喜欢的人表白方式

怎么对男生表白

向男生表白的话委婉点

个性_男生表白女生的话

热脸贴冷屁股的句子

我对我的男朋友说别人1句不好他反驳10句

追一个人被拒绝的文案短句

约会被拒绝后的高情商回复

面对拒绝的应对策略

关于有趣又有深意的句子沙雕沙雕到极致的句子

女生拒绝男生表白的句子

最新文章

2025妇女节是第几个妇女节

三八妇女节感谢女性的奉献与付出

三八妇女节的庆祝方式和习俗

女生节在每年的几号?

三八妇女节引号

已婚男人的情书

标签列表

慧智精品网

python抓取网页图片教程_Python实现简单网页图片抓取完整代码实例

发表评论

推荐文章

三八妇女节的来历和意义一览

妇女节的文化符号与象征

2024年各种节日纪念日大全一览表

中国三八妇女节的起源介绍

2025妇女节是第几个妇女节

热门文章

表白情书600字写给男生_情书

女孩追男孩的方法

女人如何轻松追到男人女人追男人的方法

爱上了女同事,该怎么说才最合适

怎么和内向的女生聊天

表白该怎么说

关于拒绝男生表白的话

2024七夕节表白需要准备什么

女生给男生写情书范文6篇

给喜欢的人表白方式

怎么对男生表白

向男生表白的话委婉点

个性_男生表白女生的话

热脸贴冷屁股的句子

我对我的男朋友说别人1句不好他反驳10句

追一个人被拒绝的文案短句

约会被拒绝后的高情商回复

面对拒绝的应对策略

关于有趣又有深意的句子沙雕 沙雕到极致的句子

女生拒绝男生表白的句子

最新文章

2025妇女节是第几个妇女节

三八妇女节感谢女性的奉献与付出

三八妇女节的庆祝方式和习俗

女生节在每年的几号?

三八妇女节引号

已婚男人的情书

标签列表

关于有趣又有深意的句子沙雕沙雕到极致的句子