• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    如何利用Python实现一个论文降重工具

    前言

    时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

    首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

    去重原理

    论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

    正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

    为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

    开放平台的使用

    语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

    此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

    def translate(q,lan_from,lan_to):
        url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
        salt = random.randint(1, 65536)
        sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
        params = {
            'from' :lan_from,
            'to' :lan_to,
            'salt' : salt,
            'sign' : sign,
            'appid' : appid,
            'q': q
        }
        r = requests.get(url,params=params)
        txt = r.json()
        if txt.get('trans_result', -1) == -1:
            print('ERROR Code:{}'.format(txt))
            return q
        return txt['trans_result'][0]['dst']

    总结

    在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

    到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

    您可能感兴趣的文章:
    • Python实现的txt文件去重功能示例
    • Python做文本按行去重的实现方法
    • python实现文本去重且不打乱原本顺序
    • python读取TXT到数组及列表去重后按原来顺序排序的方法
    • Python统计文件中去重后uuid个数的方法
    • 对python读写文件去重、RE、set的使用详解
    上一篇:python实现MD5进行文件去重的示例代码
    下一篇:Python实现查询剪贴板自动匹配信息的思路详解
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    如何利用Python实现一个论文降重工具 如何,利用,Python,实现,一个,