• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    pandas快速处理Excel,替换Nan,转字典的操作

    pandas读取Excel

    import pandas as pd
    # 参数1:文件路径,参数2:sheet名
    pf = pd.read_excel(path, sheet_name='sheet1')

    删除指定列

    # 通过列名删除指定列
    pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)

    替换列名

    # 旧列名 新列名对照
    columns_map = {
        '列名1': 'newname_1',
        '列名2': 'newname_2',
        '列名3': 'newname_3',
        '列名4': 'newname_4',
        '列名5': 'newname_5',
        # 没有列名的情况
        'Unnamed: 10': 'newname_6',
    }
    new_fields = list(columns_map.values())
    pf.rename(columns=columns_map, inplace=True)
    pf = pf[new_fields]

    替换 Nan

    通常使用

    pf.fillna('新值')

    替换表格中的空值,(Nan)。

    但是,你可能会发现 fillna() 会有不好使的时候,记得加上 inplace=True

    # 加上 inplace=True 表示修改原对象
    pf.fillna('新值', inplace=True)

    官方对 inplace 的解释

    inplace : boolean, default False

    If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).

    全列输出不隐藏

    你可能会发现,输出表格的时候会出现隐藏中间列的情况,只输出首列和尾列,中间用 … 替代。

    加上下面的这句话,再打印的话,就会全列打印。

    pd.set_option('display.max_columns', None)
    print(pf)

    将Excel转换为字典

    pf_dict = pf.to_dict(orient='records')

    全部代码

    import pandas as pd
    pf = pd.read_excel(path, sheet_name='sheet1')
    columns_map = {
        '列名1': 'newname_1',
        '列名2': 'newname_2',
        '列名3': 'newname_3',
        '列名4': 'newname_4',
        '列名5': 'newname_5',
        # 没有列名的情况
        'Unnamed: 10': 'newname_6',
    }
    new_fields = list(columns_map.values())
    pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)
    pf.rename(columns=columns_map, inplace=True)
    pf = pf[new_fields]
    pf.fillna('Unknown', inplace=True)
    # pd.set_option('display.max_columns', None)
    # print(smt)
    pf_dict = pf.to_dict(orient='records')
    

    补充:python pandas replace 0替换成nan,bfill/ffill

    0替换成nan

    一般情况下,0 替换成nan会写成

    df.replace(0, None, inplace=True)

    然而替换不了,应该是这样的

    df.replace(0, np.nan, inplace=True)

    nan替换成前值后值

    df.ffill(axis=0) # 用前一个值替换
    df.bfill(axis=0) # 用后一个值替换

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

    您可能感兴趣的文章:
    • 教你使用Pandas直接核算Excel中的快递费用
    • Python入门之使用pandas分析excel数据
    • pandas读取excel时获取读取进度的实现
    • pandas读取excel,txt,csv,pkl文件等命令的操作
    • python pandas模糊匹配 读取Excel后 获取指定指标的操作
    • pandas针对excel处理的实现
    • 关于Python 解决Python3.9 pandas.read_excel(‘xxx.xlsx‘)报错的问题
    • 解决使用Pandas 读取超过65536行的Excel文件问题
    • 利用Python pandas对Excel进行合并的方法示例
    • Python pandas对excel的操作实现示例
    • pandas to_excel 添加颜色操作
    • 解决python pandas读取excel中多个不同sheet表格存在的问题
    • Python pandas如何向excel添加数据
    • pandas中的ExcelWriter和ExcelFile的实现方法
    • pandas实现excel中的数据透视表和Vlookup函数功能代码
    • Python使用Pandas读写Excel实例解析
    • pandas将多个dataframe以多个sheet的形式保存到一个excel文件中
    • 利用python Pandas实现批量拆分Excel与合并Excel
    上一篇:pandas读取excel,txt,csv,pkl文件等命令的操作
    下一篇:pandas调整列的顺序以及添加列的实现
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    pandas快速处理Excel,替换Nan,转字典的操作 pandas,快速,处理,Excel,替换,