Python读大数据txt_python教程-查字典教程网

导航

手机

客服中心

投稿赚钱

免费注册

首页

系统安装
WindowsXP 安装基础教程 Ubuntu 安装基础教程 Gparted 分区编辑器操作基础 VMware 虚拟机基础入门教程 VirtualBox 虚拟机基础教程 360安全卫士基础入门教程操作系统 windows10安装教程 windows8安装教程 windows7安装教程 U盘教程 windows2003教程 Linux教程苹果MAC教程其他教程
办公制作
Word 基础入门教程 Excel 基础入门教程 PowerPoint 基础入门教程蒙泰瑶光课件制作基础 OpenOffice.org Writer OpenOffice.org Calc OpenOffice.org Impress 高效办公
图像动画
Photoshop CS 基础入门教程 GIMP 基础入门教程 3DS Max 8.0 基础入门教程 Flash 8.0 基础入门教程 Flash 8.0 脚本基础教程 Ulead Gif Animator 教程图形图像 Painter基础教程 isee基础教程可牛影像基础教程光影魔术手基础教程 Freehand基础教程
音频视频
Goldwave 基础入门教程视频编辑基础入门教程影视制作媒体工具快手抖音
编程开发基础
Visual C++基础入门教程 C++ 基础入门教程 C 基础入门教程 CSS 基础入门教程 VB 基础入门教程 QBasic基础入门教程 HTML 音画帖基础入门教程 Nvu 网站制作基础 FrontPage 网站制作基础 Kompozer 网站制作基础 Kompozer 帮助文档 KompoZer user guide Poedit 翻译基础教程 Ubuntu 命令行基础教程谷歌网站管理员工具操作基础 C#基础教程
网络应用
QQ 聊天基础入门教程 Firefox3 基础入门教程 Discuz! 和 PW 论坛安装教程电子邮件基础入门教程论坛新手基础入门教程其他教程... 网络知识网络基础知识网络应用技术网络故障处理下载工具
电脑基础
iphone教程安卓教程手机软件教程手机技巧微信教程手机知识刷机教程
教学设计
2008-2009学年 2009-2010学年 2010-2011学年 2011-2012学年 2012-2013学年 2013-2014学年 2014-2015学年

当前位置：查字典教程网 >脚本专栏 >python >Python读大数据txt

Python读大数据txt

摘要：如果直接对大文件对象调用read()方法，会导致不可预测的内存占用。好的方法是利用固定长度的缓冲区来不断读取文件内容。即通过yield。在用...

如果直接对大文件对象调用 read() 方法，会导致不可预测的内存占用。好的方法是利用固定长度的缓冲区来不断读取文件内容。即通过yield。

在用Python读一个两个多G的txt文本时，天真的直接用readlines方法，结果一运行内存就崩了。

还好同事点拨了下，用yield方法，测试了下果然毫无压力。咎其原因，原来是readlines是把文本内容全部放于内存中，而yield则是类似于生成器。

代码如下：

def open_txt(file_name): with open(file_name,'r+') as f: while True: line = f.readline() if not line: return yield line.strip()

调用实例：

for text in open_txt('aa.txt'): print text

例二：

目标 txt 文件大概有6G，想取出前面1000条数据保存于一个新的 txt 文件中做余下的操作，虽然不知道这样做有没有必要但还是先小数据量测试一下吧。参考这个帖子：我想把一个list列表保存到一个Txt文档，该怎么保存，自己写了一个简单的小程序。

====================================================

import datetime import pickle start = datetime.datetime.now() print "start--%s" % (start) fileHandle = open ( 'train.txt' ) file2 = open('s_train.txt','w') i = 1 while ( i < 10000 ): a = fileHandle.readline() file2.write(''.join(a)) i = i + 1 fileHandle.close() file2.close() print "done--%s" % ( datetime.datetime.now() - start) if __name__ == '__main__': pass

====================================================

pickle 这个库大家说的很多，官网看看，后面可以好好学习一下。

【Python读大数据txt】相关文章：

★ Python修改Excel数据的实例代码

★ Python help()函数用法详解

★ Python学习笔记_数据排序方法

★ Python交换变量

★ python strip()函数介绍

★ Python 学习笔记

★ Python 条件判断的缩写方法

★ Python实现类继承实例

★ wxPython 入门教程

★ Python中文件遍历的两种方法

上一篇： Python常用的爬虫技巧总结

下一篇：详解Python迭代和迭代器

相关阅读

更多>>

网友关注

更多>>

网友最新关注视频

更多>>

精品推荐

系统安装

办公制作

图像动画

音频视频

编程开发基础

网络应用

数码

摄影

平面设计

ps

网页设计

室内设计

三维

电脑

电子商务

建站

编程开发

脚本专栏

操作系统

实用技巧

软件教程

网络

硬件教程

分类导航

系统安装

办公制作

图像动画

音频视频

编程开发基础

网络应用

电脑基础

数码

摄影

平面设计

ps

网页设计

室内设计

三维

电脑

电子商务

建站

编程开发

脚本专栏

操作系统

实用技巧

软件教程

网络

硬件教程

视频教程

教学设计

脚本专栏子分类

最新python学习

热门python学习