手机
当前位置:查字典教程网 >脚本专栏 >ruby专题 >ruby+nokogori抓取糗事百科前10页并存储进数据库示例
ruby+nokogori抓取糗事百科前10页并存储进数据库示例
摘要:ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库复制代码代码如下:#encoding:utf-8requ...

ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库

复制代码 代码如下:

#encoding:utf-8

require "open-uri"

require "nokogiri"

require "mysql"

@dbh=Mysql.real_connect("localhost","root","dengli","pachong")

@file=open("qb.txt","w")

def getQiubai(url)

data=open(url){|f| f.read}

doc=Nokogiri::HTML(data)

doc.css('div.block.untagged.mb15.bs2').each{|p|

content=p.css('div.content').text

@file.puts("#{content}n")

img=p.css('div.thumb img').each{|img|

imgAddr=img.attr('src')

@file.puts("#{imgAddr}n")

time=Time.now

sql="INSERT INTO qiushibaike (`body`,`img`,`time`) VALUES ('#{content}','#{imgAddr}','#{time}')"

@dbh.query(sql)

}

}

end

for i in 1..10

@file.puts("这是第#{i}页")

url="http://www.qiushibaike.com/8hr/page/#{i}"

getQiubai(url)

end

【ruby+nokogori抓取糗事百科前10页并存储进数据库示例】相关文章:

ruby 学习笔记(1) 初识语法

Ruby基础知识之数据类型

ruby使用restclient上传服务器本地文件示例

在阿里云 (aliyun) 服务器上搭建Ruby On Rails环境

ruby 正则表达式 教程

浅析Ruby的源代码布局及其编程风格

Ruby实现二分搜索(二分查找)算法的简单示例

ruby和pig处理流式文件实例

实例解析Ruby设计模式开发中对观察者模式的实现

浅谈Ruby on Rails下的rake与数据库数据迁移操作

精品推荐
分类导航