pandas数据处理之标签列字符转数字的实现-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

pandas数据处理之标签列字符转数字的实现

机器学习中，当我们在进行数据预处理的时候，对于标签列非字符的数据，我们往往需要将其转换成字符，因为有的算法可能不支持非数字类型来做特征。

那么怎么快捷地来着这个转换呢，请看我的示例：

1.构建测试数据

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.数据转换下，并获取标签列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函数进行转换

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

这样，就将标签列处理好了哈

等用完之后，再转回来

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

补充：pandas factorize将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

都是字符串特征,无法用于训练，当然可以单独建立map硬编码处理，但是pandas已经封装好了相应的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

pandas 对每一列数据进行标准化的方法
pandas数据处理进阶详解
Pandas 数据处理,数据清洗详解
使用pandas模块实现数据的标准化操作

上一篇：python用pyecharts实现地图数据可视化
下一篇：python 批量重命名移动文件

相关文章

pandas数据处理之标签列字符转数字的实现

机器学习中，当我们在进行数据预处理的时候，对于标签列非字符的数据，我们往往需要将其转换成字符，因为有的算法可能不支持非数字类型来做特征。那么怎么快捷地来着这个转换pandas,数据处理,之,标签,...

镇江电销防封软件安装

镇江电销防封软件安装,镇江电销防封软件安装办理,怎么安装镇江电销防封软件防封号...

400电话申请有哪些优势山西400电话号码是免费申请的吗

许多公司，特别是一些新成立的公司，如果他们想节省大量的通信费用，就必须打开...

金融行业电话销售用什么卡好

金融行业电话销售用什么卡好？快来联系我。华恒通讯公司专业办理稳定不封号电销卡...

运城专业外呼线路办理,电话营销线路-[放心省心]

运城专业外呼线路办理,电话营销线路或者更无法做到准确对接，从而影响了公司的销售...

这些400电话选号技巧你知道吗？

你知道400电话的选号技巧吗？现如今大部分企业都会有自己的400电话，一方面方便业务...

重庆防封电销卡办理，重庆防封电销系统办理

如果你还徘徊在靠刷量、碰运气才能成单的阶段，接下来的小技巧会帮助你提高成单率...

电销机器人运营中心（销售智能电销机器人）

今天给各位分享电销机器人运营中心的知识，其中也会对销售智能电销机器人进行解释...

镇江人工外呼系统（镇江人工外呼系统招标）

本文目录一览： 1、可以简单说一下外呼系统是什么吗？2、外呼系统是什么意思3、外呼...

协作机器人代理

智能电销机器人【协作机器人】最后，在完成整个呼叫工作后，您可以查看此次呼叫工...

电话机器人办理银行业务（银行机器人打电话来要求还款

本文目录一览：1、95588智能机器人打电话过来通知提前还贷款2、银行的机器人是AI还是...

细致区分，窄带物联网和宽带物联网有什么区别？

物联网发展迅速，但物联网相关知识普及的速度有待提高。以至于很多人对物联网没概...

400开头的电话都是些什么电话400开头的电话都是些什么电

400开头的电话都是些什么电话400开头的电话都是些什么电话百度百科以下内容由巨人小...

百度地图可以注册店铺吗？百度可以注册店铺吗？

现在可以在百度地图上免费注册店铺位置吗？可以的，首先你要注册一个百度账号，点...

300家申请供货华为，三星、索尼等100家企业获批

三星电子最近获得了向华为供应 OLED 显示屏的许可，日本索尼和美国豪威科技也获得许...

防御SQL注入的方法总结

SQL 注入是一类危害极大的攻击形式。虽然危害很大，但是防御却远远没有XSS那么困难。...

pandas数据处理之标签列字符转数字的实现

机器学习中，当我们在进行数据预处理的时候，对于标签列非字符的数据，我们往往需要将其转换成字符，因为有的算法可能不支持非数字类型来做特征。那么怎么快捷地来着这个转换pandas,数据处理,之,标签,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

pandas数据处理之标签列字符转数字的实现 pandas,数据处理,之,标签,