8行代码实现Python文件去重-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

8行代码实现Python文件去重

目录

需求描述
撸代码ing

需求描述

上周突然接到一个任务，要通过XX网站导出XX年-XX年之间的数据，导出后的文件名就是对应日期，导出后发现，竟然有的文件大小是一样，但文件名又没有重复，所以打开文件看了下，确实重复了，原因暂时不清楚，预测是网站的原因，最后发现大概只有 30% 的数据没有重复。我淦！

啥也不说，首要任务还是把那些没有重复的文件给筛选出来，或是删除重复的文件。文件很多几百个，通过一个个的对比文件去删除估计又要加班，然后突然想到 Python 有个内置的 filecmp 能够貌似是比较文件的，于是乎就有了这篇文章~

撸代码ing

导出的文件都是保存在同一文件夹下的，格式也相同。然后，上网查了下 filecmp.cmp() 的用法。

filecmp.cmp(f1, f2, shallow=True)
f1/f2：待比较的两个文件路径。shallow ：默认为True，即只比较os.stat()获取的元数据(创建时间，大小等信息)是否相同，设置为False的话，在对比文件的时候还要比较文件内容。

from pathlib import Path
import filecmp

path_list = [path for path in Path(r'C:\Users\pc\Desktop\test').iterdir() if path.is_file()]

for front in range(len(path_list) - 1):
    for later in range(front + 1, len(path_list)):
        if filecmp.cmp(path_list[front], path_list[later], shallow=False):
            path_list[front].unlink()    # 删除文件
            break

为了防止代码有问题，我先创建了一个 test 文件夹，在文件夹下手动创建了6个文件，1~5中只有1,2,3,4,5对应的数字内容，第6个为空文件。

之后再将文件全部复制一份。

▶️运行效果

到此这篇关于8行代码实现Python文件去重的文章就介绍到这了,更多相关Python文件去重内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python实现MD5进行文件去重的示例代码
对python读写文件去重、RE、set的使用详解
Python实现的txt文件去重功能示例

上一篇：如何利用python脚本自动部署k8s
下一篇：Python中flask框架跨域问题的解决方法

相关文章

8行代码实现Python文件去重

目录需求描述撸代码ing 需求描述上周突然接到一个任务，要通过XX网站导出XX年-XX年之间的数据，导出后的文件名就是对应日期，导出后发现，竟然有的文件大小是一样，但文件名又8行,代码,实现,Python,文件,...

武汉crm外呼系统平台（CRM外呼）

本文目录一览： 1、呼叫中心+CRM系统是什么？2、武汉外呼系统哪家公司做得好？3、电...

名牌的市场扩展效应

名牌商标被称为“金护照”，有了“金护照”，可以潇洒走天下。因为有了被社会公众...

衡阳市机器人电销外包（衡阳市机器人电销外包厂）

本文目录一览： 1、现在电销机器人这个职业好做吗？2、市面上的智能电销机器人真的...

巨人热线400电话蜜雪冰城加盟事业的重要服务窗口申请

2020年是与蜜雪冰城建立合作关系的第四年。通过引入巨人热线产品，不断提升蜜雪冰...

大连电销外呼系统软件（外呼电话系统软件）

本文目录一览： 1、电销外呼体系哪个好了？市面上的太多了！有能够引荐的吗？2、外...

AXB防封外呼系统app（电销防封号外呼系统）

本篇文章给大家谈谈AXB防封外呼系统app，以及电销防封号外呼系统对应的知识点，希望...

飞鱼外呼系统怎么操作（飞鸟外呼系统）

本文目次一览： 1、外呼零碎怎样操持？ 2、飞鱼外呼零碎怎样？ 3、飞鱼外呼零碎怎样...

公司怎么注册商标

公司注册商标相比个人注册简单点，只要提供公司营业执照复印件就可以办理。如果自...

做电销机器人违法吗（电销机器人有效果吗）

本篇文章给我们谈谈做电销机器人违法吗，以及电销机器人有作用吗对应的知识点，期...

linux Bash 快捷键大全

一、编辑命令 Ctrl + a ：移到命令行首 Ctrl + e ：移到命令行尾 Ctrl + f ：按字符前移（右...

办理ETC咨询电话，让你轻松拥有电子通行卡

ETC是电子不停车收费系统的简称，由于其方便快捷的支付方式以及避免拥堵的道路通行...

湖南智能呼叫电话机器人（长沙智能机器人公司）

今天给各位分享湖南智能呼叫电话机器人的知识，其中也会对长沙智能机器人公司进行...

Lua中string.lower()使用指南

前言今天我们总结的函数也比较简单，函数的作用的将所给字符串的中的大写字母转换...

忘记root密码时使用Linux系统光盘进行补救的方法

救援模式即rescue ，这个模式主要是应用于，系统无法进入的情况。如，grub损坏或者某...

上海华泛信息获评“技术先进型服务企业”

CTI论坛(ctiforum)3月5日消息（记者潘婷）：“上海市第一批技术先进型服务企业”名单近...

8行代码实现Python文件去重

目录需求描述撸代码ing 需求描述上周突然接到一个任务，要通过XX网站导出XX年-XX年之间的数据，导出后的文件名就是对应日期，导出后发现，竟然有的文件大小是一样，但文件名又8行,代码,实现,Python,文件,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

8行代码实现Python文件去重 8行,代码,实现,Python,文件,