Linux下删除大数据文件中部分字段重复行的方法-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

Linux下删除大数据文件中部分字段重复行的方法

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件，数据由4个字段组成，按照要求需要删除第二个字段重复的行，找来找去linux下也没找到合适的工具，sed/gawk等流处理工具只能针对一行一行处理，并无法找到字段重复的行。看来只好自己python一个程序了，突然想起来利用mysql，于是进行乾坤大挪移：

1. 利用mysqlimport --local dbname data.txt导入数据到表中，表名要与文件名一致
2. 执行下列sql语句(要求唯一的字段为uniqfield）

复制代码

代码如下:

use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;
drop table tablename;
rename table t2 to tablename;

上一篇：linux中去掉文件重复数据行的方法(去重复ip)
下一篇：Linux中限制用户访问权限的3种方法

相关文章

Linux下删除大数据文件中部分字段重复行的方法

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件，数据由4个字段组成，按照要求需要删除第二个字段重复的行，找来找去linux下也没找到合适的工具，sed/gawk等流处理工Linux,下,删除,大,数据,文件,...

国内最大网站侵犯著作权案告破：迅播影院被端不法牟

站长之家(Chinaz.com) 8 月 9 日每当有新电影上映，大多数人会选择正规渠道不雅观影，但...

威海智能外呼系统代理（威海智能外呼系统代理电话）

本篇文章给大家谈谈威海智能外呼系统代理，以及威海智能外呼系统代理电话对应的知...

柳州人工外呼系统哪家强（柳州客服招聘网）

本篇文章给大家谈谈柳州人工外呼系统哪家强，以及柳州客服招聘网对应的知识点，希...

农银汇理基金开通400客服热线

农银汇理基金管理有限公司于4月30日起正式开通全国统一客户服务号码40068-95599，异地...

随州小型外呼系统代理商（随州小型外呼系统代

本文目录一览：1、网络电话外呼体系哪个好？2、智能电话外呼体系哪家的比较好用？...

中国电信统一外呼系统（中国电信统一外呼系统

本文目录一览：1、一致通讯外呼体系怎样样2、目前国内干流的外呼体系(电信等级的...

不限制行业防封号电销卡签署合作备忘录

不限制行业防封号电销卡随着5G和物联网行业加速发展，中国已经成为全球各类型智能...

贷款投资类企业彩铃录音内容

1、您好，欢迎致电诚信贷款公司。本公司专业提供，中小企业贷款，个人小额贷款，急...

点播外呼系统操作（呼叫中心外呼系统）

本文目录一览： 1、外呼系统是怎么用的？ 2、外呼系统怎么办理？ 3、新型外呼系统，...

兴义电话外呼系统不封号

兴义电话外呼系统不封号电话销售软硬件、场地、服务人员全部由外包商提供，企业按...

400电话申请如何办理了解400电话申请，展现企业实力和规

现在是互联网时代，400电话处理的角色非常巨大，你可以直接在互联网上购买或查询很...

虚拟外呼系统合法吗（虚拟号外呼系统）

本文目录一览： 1、游戏外呼客服违法吗2、电话外呼系统属于违法吗3、语音群呼（外呼...

佛山防封电销卡品牌（防封电销卡有用吗）

本文目录一览：1、电销防封卡哪家的比较好?2、哪家公司有防封号电销卡?3、电销外呼...

呼叫中心被众多企业当做营销工具

现如今，呼叫中心在企业中的应用已经不仅仅局限于传统的接听模式了，而是以外呼营...

400电话为什么这么流行？

随着科技的迅速发展，信息时代的到来，对各行业都提出了新要求，人们越来越注重服...

Linux下删除大数据文件中部分字段重复行的方法

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件，数据由4个字段组成，按照要求需要删除第二个字段重复的行，找来找去linux下也没找到合适的工具，sed/gawk等流处理工Linux,下,删除,大,数据,文件,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

Linux下删除大数据文件中部分字段重复行的方法 Linux,下,删除,大,数据,文件,