GPS505 2022-04-06 12:23 采纳率: 100%
浏览 91
已结题

jupyter notebook AI人工智能数据预处理中 数据脱敏 碰到的问题

import numpy as np
import pandas as pd 
import datetime
dfraw=pd.read_csv('coding/datasets/contacts.csv',index_col='ssn')
dfraw.head()

df['ssn']=dfraw['ssn'].apply(
    lambda ssn:ssn[:6] + '*'*8 + ssn[14:])
df.head()

然后会提示出错KeyError: 'ssn'
这是为什么呢?
还有我想知道路径('coding/datasets/contacts.csv',index_col='ssn')代表了什么含义? 为什么把coding换成 . 不可以。因为习题里面原路径是('./datasets/contacts.csv',index_col='ssn'),但是会报错

  • 写回答

3条回答 默认 最新

  • 爱晚乏客游 2022-04-06 12:38
    关注

    建议百度查看下pandas的read_csv()函数参数的意思就知道了。
    前面的是路径,后面的index_col是将原来的列名设置为"ssn"
    至于coding换成点不行,那就是路径不对,这个涉及到相对路径,也就是相对于你运行目前代码的py文件所在的路径,习题那么写2的话,py文件就是datasets这个文件夹同一级,而你这么写你是在coding这个文件夹同一级,你的coding下面一级才是datasets。如果你搞不懂就设置绝对路径,也就是从盘符开始写起

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 7月8日
  • 已采纳回答 6月30日
  • 创建了问题 4月6日

悬赏问题

  • ¥15 poi合并多个word成一个新word,原word中横版没了.
  • ¥15 【火车头采集器】搜狐娱乐这种列表页网址,怎么采集?
  • ¥15 求MCSCANX 帮助
  • ¥15 机器学习训练相关模型
  • ¥15 Todesk 远程写代码 anaconda jupyter python3
  • ¥15 我的R语言提示去除连锁不平衡时clump_data报错,图片以下所示,卡了好几天了,苦恼不知道如何解决,有人帮我看看怎么解决吗?
  • ¥15 在获取boss直聘的聊天的时候只能获取到前40条聊天数据
  • ¥20 关于URL获取的参数,无法执行二选一查询
  • ¥15 液位控制,当液位超过高限时常开触点59闭合,直到液位低于低限时,断开
  • ¥15 marlin编译错误,如何解决?