jupyter notebook AI人工智能数据预处理中数据脱敏碰到的问题

import numpy as np
import pandas as pd 
import datetime
dfraw=pd.read_csv('coding/datasets/contacts.csv',index_col='ssn')
dfraw.head()

df['ssn']=dfraw['ssn'].apply(
    lambda ssn:ssn[:6] + '*'*8 + ssn[14:])
df.head()

然后会提示出错KeyError: 'ssn'
这是为什么呢？
还有我想知道路径('coding/datasets/contacts.csv',index_col='ssn')代表了什么含义？为什么把coding换成 . 不可以。因为习题里面原路径是('./datasets/contacts.csv',index_col='ssn')，但是会报错

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2022-04-06 12:38
关注
建议百度查看下pandas的read_csv()函数参数的意思就知道了。
前面的是路径，后面的index_col是将原来的列名设置为"ssn"
至于coding换成点不行，那就是路径不对，这个涉及到相对路径，也就是相对于你运行目前代码的py文件所在的路径，习题那么写2的话，py文件就是datasets这个文件夹同一级，而你这么写你是在coding这个文件夹同一级，你的coding下面一级才是datasets。如果你搞不懂就设置绝对路径，也就是从盘符开始写起

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容