手机
当前位置:查字典教程网 >脚本专栏 >ruby专题 >ruby+nokogori抓取糗事百科前10页并存储进数据库示例
ruby+nokogori抓取糗事百科前10页并存储进数据库示例
摘要:ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库复制代码代码如下:#encoding:utf-8requ...

ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库

复制代码 代码如下:

#encoding:utf-8

require "open-uri"

require "nokogiri"

require "mysql"

@dbh=Mysql.real_connect("localhost","root","dengli","pachong")

@file=open("qb.txt","w")

def getQiubai(url)

data=open(url){|f| f.read}

doc=Nokogiri::HTML(data)

doc.css('div.block.untagged.mb15.bs2').each{|p|

content=p.css('div.content').text

@file.puts("#{content}n")

img=p.css('div.thumb img').each{|img|

imgAddr=img.attr('src')

@file.puts("#{imgAddr}n")

time=Time.now

sql="INSERT INTO qiushibaike (`body`,`img`,`time`) VALUES ('#{content}','#{imgAddr}','#{time}')"

@dbh.query(sql)

}

}

end

for i in 1..10

@file.puts("这是第#{i}页")

url="http://www.qiushibaike.com/8hr/page/#{i}"

getQiubai(url)

end

【ruby+nokogori抓取糗事百科前10页并存储进数据库示例】相关文章:

Ruby中百分号和字面值的使用示例

ruby 学习笔记(1) 初识语法

在Ruby程序中连接数据库的详细教程

Ruby使用Monkey Patch猴子补丁方式进行程序开发的示例

ruby基本数据类型简明介绍

使用Ruby来处理文本的教程

浅析Ruby的源代码布局及其编程风格

Ruby常量查找路径问题深入研究

Ruby中使用Nokogiri包来操作XML格式数据的教程

ruby和pig处理流式文件实例

精品推荐
分类导航