linux中去掉文件重复数据行的方法(去重复ip)_unix linux教程-查字典教程网

导航

手机

客服中心

投稿赚钱

免费注册

首页

系统安装
WindowsXP 安装基础教程 Ubuntu 安装基础教程 Gparted 分区编辑器操作基础 VMware 虚拟机基础入门教程 VirtualBox 虚拟机基础教程 360安全卫士基础入门教程操作系统 windows10安装教程 windows8安装教程 windows7安装教程 U盘教程 windows2003教程 Linux教程苹果MAC教程其他教程
办公制作
Word 基础入门教程 Excel 基础入门教程 PowerPoint 基础入门教程蒙泰瑶光课件制作基础 OpenOffice.org Writer OpenOffice.org Calc OpenOffice.org Impress 高效办公
图像动画
Photoshop CS 基础入门教程 GIMP 基础入门教程 3DS Max 8.0 基础入门教程 Flash 8.0 基础入门教程 Flash 8.0 脚本基础教程 Ulead Gif Animator 教程图形图像 Painter基础教程 isee基础教程可牛影像基础教程光影魔术手基础教程 Freehand基础教程
音频视频
Goldwave 基础入门教程视频编辑基础入门教程影视制作媒体工具快手抖音
编程开发基础
Visual C++基础入门教程 C++ 基础入门教程 C 基础入门教程 CSS 基础入门教程 VB 基础入门教程 QBasic基础入门教程 HTML 音画帖基础入门教程 Nvu 网站制作基础 FrontPage 网站制作基础 Kompozer 网站制作基础 Kompozer 帮助文档 KompoZer user guide Poedit 翻译基础教程 Ubuntu 命令行基础教程谷歌网站管理员工具操作基础 C#基础教程
网络应用
QQ 聊天基础入门教程 Firefox3 基础入门教程 Discuz! 和 PW 论坛安装教程电子邮件基础入门教程论坛新手基础入门教程其他教程... 网络知识网络基础知识网络应用技术网络故障处理下载工具
电脑基础
iphone教程安卓教程手机软件教程手机技巧微信教程手机知识刷机教程
教学设计
2008-2009学年 2009-2010学年 2010-2011学年 2011-2012学年 2012-2013学年 2013-2014学年 2014-2015学年

当前位置：查字典教程网 >操作系统 >unix linux >linux中去掉文件重复数据行的方法(去重复ip)

linux中去掉文件重复数据行的方法(去重复ip)

摘要：一、去掉相邻重复的数据行$catdata1.txt|uniq输出：beijingwuhanbeijingwuhan二、去掉所有重复的数据行$...

一、去掉相邻重复的数据行

$cat data1.txt | uniq

输出：

beijing

wuhan

beijing

wuhan

二、去掉所有重复的数据行

$cat data1.txt | sort | uniq

注：

只有uniq命令的话，只是把相邻的重复的数据行去掉。

如果先 sort 的话，就会把所有重复的数据行变成相邻的数据行，再 uniq 的话，就去掉所有重复的数据行了。

输出：

beijing

wuhan

附：data1.txt

[root@syy ~]# cat data1.txt

beijing

beijing

wuhan

wuhan

wuhan

beijing

beijing

beijing

wuhan

wuhan

注：在过滤日志中的IP地址很有用。

Linux下删除大数据文件中部分字段重复的行

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件，数据由4个字段组成，按照要求需要删除第二个字段重复的行，找来找去linux下也没找到合适的工具，sed/gawk等流处理工具只能针对一行一行处理，并无法找到字段重复的行。看来只好自己python一个程序了，突然想起来利用mysql，于是进行乾坤大挪移：

1. 利用mysqlimport --local dbname data.txt导入数据到表中，表名要与文件名一致

2. 执行下列sql语句(要求唯一的字段为uniqfield）

use dbname;

alter table tablename add rowid int auto_increment not null;

create table t select min(rowid) as rowid from tablename group by uniqfield;

create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;</p> <p>drop table tablename;

rename table t2 to tablename;

【linux中去掉文件重复数据行的方法(去重复ip)】相关文章：

★ Linux下取得UUID的方法分享

★ Linux删除重复行的代码

★ Linux 备份恢复方法

★ Linux下备份恢复技术的应用

★ linux添加开机启动项的方法介绍

★ linux下文件解压

★ Linux文件权限的设置方法

★ linux下删除乱码文件名的方法

★ linux 修改文件名 linux 批量改文件名解决方法

★ 为SUSE Linux添加软件安装源的方法(图文)

上一篇： linux系统中文件I/O教程

下一篇： Linux下删除大数据文件中部分字段重复行的方法

相关阅读

更多>>

网友关注

更多>>

网友最新关注视频

更多>>

精品推荐

系统安装

办公制作

图像动画

音频视频

编程开发基础

网络应用

数码

摄影

平面设计

ps

网页设计

室内设计

三维

电脑

电子商务

建站

编程开发

脚本专栏

操作系统

实用技巧

软件教程

网络

硬件教程

分类导航

系统安装

办公制作

图像动画

音频视频

编程开发基础

网络应用

电脑基础

数码

摄影

平面设计

ps

网页设计

室内设计

三维

电脑

电子商务

建站

编程开发

脚本专栏

操作系统

实用技巧

软件教程

网络

硬件教程

视频教程

教学设计

操作系统子分类

最新unix linux学习

热门unix linux学习