手机
当前位置:查字典教程网 >脚本专栏 >python >Python打印scrapy蜘蛛抓取树结构的方法
Python打印scrapy蜘蛛抓取树结构的方法
摘要:本文实例讲述了Python打印scrapy蜘蛛抓取树结构的方法。分享给大家供大家参考。具体如下:通过下面这段代码可以一目了然的知道scrap...

本文实例讲述了Python打印scrapy蜘蛛抓取树结构的方法。分享给大家供大家参考。具体如下:

通过下面这段代码可以一目了然的知道scrapy的抓取页面结构,调用也非常简单

#!/usr/bin/env python import fileinput, re from collections import defaultdict def print_urls(allurls, referer, indent=0): urls = allurls[referer] for url in urls: print ' '*indent + referer if url in allurls: print_urls(allurls, url, indent+2) def main(): log_re = re.compile(r'<GET (.*?)> (referer: (.*?))') allurls = defaultdict(list) for l in fileinput.input(): m = log_re.search(l) if m: url, ref = m.groups() allurls[ref] += [url] print_urls(allurls, 'None') main()

希望本文所述对大家的Python程序设计有所帮助。

【Python打印scrapy蜘蛛抓取树结构的方法】相关文章:

Python中使用中文的方法

python二叉树遍历的实现方法

python实现bitmap数据结构详解

Python操作列表的常用方法分享

python调用shell的方法

Python 条件判断的缩写方法

python条件和循环的使用方法

python中stdout输出不缓存的设置方法

如何运行Python程序的方法

vc6编写python扩展的方法分享

精品推荐
分类导航