Python使用Scrapy爬取妹子图_python教程-查字典教程网

导航

手机

今天:

点击即可测试根据你的名字测试命运

客服中心

投稿赚钱

免费注册

首页

电脑基础
电脑操作入门（Windows）电脑操作入门（Ubuntu）抓图基础入门教程 WinRAR 压缩软件基础入门教程 SCIM 输入法基础教程 7-Zip 压缩软件基础入门教程光盘刻录基础教程电脑硬件基础教程 Windows 控制面板教程电脑基础知识电脑应用技巧电脑健康知识电脑初学者入门
系统安装
WindowsXP 安装基础教程 Ubuntu 安装基础教程 Gparted 分区编辑器操作基础 VMware 虚拟机基础入门教程 VirtualBox 虚拟机基础教程 360安全卫士基础入门教程操作系统 windows10安装教程 windows8安装教程 windows7安装教程 U盘教程 windows2003教程 Linux教程苹果MAC教程其他教程
办公制作
Word 基础入门教程 Excel 基础入门教程 PowerPoint 基础入门教程蒙泰瑶光课件制作基础 OpenOffice.org Writer OpenOffice.org Calc OpenOffice.org Impress 高效办公
图像动画
Photoshop CS 基础入门教程 GIMP 基础入门教程 3DS Max 8.0 基础入门教程 Flash 8.0 基础入门教程 Flash 8.0 脚本基础教程 Ulead Gif Animator 教程图形图像 Painter基础教程 isee基础教程可牛影像基础教程光影魔术手基础教程 Freehand基础教程
音频视频
Goldwave 基础入门教程视频编辑基础入门教程影视制作媒体工具快手抖音
编程开发基础
Visual C++基础入门教程 C++ 基础入门教程 C 基础入门教程 CSS 基础入门教程 VB 基础入门教程 QBasic基础入门教程 HTML 音画帖基础入门教程 Nvu 网站制作基础 FrontPage 网站制作基础 Kompozer 网站制作基础 Kompozer 帮助文档 KompoZer user guide Poedit 翻译基础教程 Ubuntu 命令行基础教程谷歌网站管理员工具操作基础 C#基础教程
网络应用
QQ 聊天基础入门教程 Firefox3 基础入门教程 Discuz! 和 PW 论坛安装教程电子邮件基础入门教程论坛新手基础入门教程其他教程... 网络知识网络基础知识网络应用技术网络故障处理下载工具
教学设计
2008-2009学年 2009-2010学年 2010-2011学年 2011-2012学年 2012-2013学年 2013-2014学年 2014-2015学年

当前位置：查字典教程网 >脚本专栏 >python >Python使用Scrapy爬取妹子图

Python使用Scrapy爬取妹子图

摘要：PythonScrapy爬虫，听说妹子图挺火，我整站爬取了，上周一共搞了大概8000多张图片。和大家分享一下。核心爬虫代码#-*-codin...

Python Scrapy爬虫，听说妹子图挺火，我整站爬取了，上周一共搞了大概8000多张图片。和大家分享一下。

核心爬虫代码

# -*- coding: utf-8 -*- from scrapy.selector import Selector import scrapy from scrapy.contrib.loader import ItemLoader, Identity from fun.items import MeizituItem class MeizituSpider(scrapy.Spider): name = "meizitu" allowed_domains = ["meizitu.com"] start_urls = ( 'http://www.meizitu.com/', ) def parse(self, response): sel = Selector(response) for link in sel.xpath('//h2/a/@href').extract(): request = scrapy.Request(link, callback=self.parse_item) yield request pages = sel.xpath("//div[@class='navigation']/div[@id='wp_page_numbers']/ul/li/a/@href").extract() print('pages: %s' % pages) if len(pages) > 2: page_link = pages[-2] page_link = page_link.replace('/a/', '') request = scrapy.Request('http://www.meizitu.com/a/%s' % page_link, callback=self.parse) yield request def parse_item(self, response): l = ItemLoader(item=MeizituItem(), response=response) l.add_xpath('name', '//h2/a/text()') l.add_xpath('tags', "//div[@id='maincontent']/div[@class='postmeta clearfix']/div[@class='metaRight']/p") l.add_xpath('image_urls', "//div[@id='picture']/p/img/@src", Identity()) l.add_value('url', response.url) return l.load_item()

项目地址：https://github.com/ZhangBohan/fun_crawler

以上所述就是本文的全部内容了，希望大家能够喜欢。

【Python使用Scrapy爬取妹子图】相关文章：

★ python使用rabbitmq实现网络爬虫示例

★ Python yield使用方法示例

★ Python httplib，smtplib使用方法

★ python中的yield使用方法

★ Python Web框架Pylons中使用MongoDB的例子

★ python生成器的使用方法

★ python使用xmlrpc实例讲解

★ Python使用urllib2获取网络资源实例讲解

★ Python urlopen 使用小示例

★ Python的函数嵌套的使用方法

上一篇： Python实现统计单词出现的个数

下一篇： Python基于smtplib实现异步发送邮件服务

相关阅读

更多>>

网友关注

更多>>

网友最新关注视频

更多>>

精品推荐

电脑基础

系统安装

办公制作

图像动画

音频视频

编程开发基础

网络应用

手机

数码

摄影

平面设计

ps

网页设计

室内设计

三维

电脑

电子商务

建站

编程开发

脚本专栏

操作系统

实用技巧

软件教程

网络

硬件教程

分类导航

电脑基础

系统安装

办公制作

图像动画

音频视频

编程开发基础

网络应用

手机

数码

摄影

平面设计

ps

网页设计

室内设计

三维

电脑

电子商务

建站

编程开发

脚本专栏

操作系统

实用技巧

软件教程

网络

硬件教程

视频教程

教学设计

脚本专栏子分类

最新python学习

热门python学习