大海-繁星 2022-09-05 13:58 采纳率: 100%
浏览 351
已结题

pycharm数据分析导入数据集,打印输出格式不一致

最近在学习python数据分析,刚接触pycharm不久,在学习参考有关书籍的代码时,遇到一些问题不太明白,希望有人能给予解答,十分感谢!
问题如下:
在导入sklearn包自带数据集和导入自己的数据集时,打印输出的结果格式不一样,不知道是什么原因?
1、导入sklearn包自带数据集及输出结果如下:

img

输出结果:

img

查看sklearn包数据集原始数据,发现就是普通的CSV格式,且里面并没有“data”、“target”、“target_name”等关键字
sklearn包数据源:

img

2、导入自己的数据集及输出结果如下:
通过pandas方式导入数据集:

img

输出结果:

img

不知道为何上述两种方式的输出结果不一样,看数据导入源码并没有做任何变换,
Q1:为何sklearn包的数据集的输出格式已经分类,而自己的数据集就是普通格式,背后的原理是什么?
Q2:自己的数据集能否实现与sklearn包的数据集相同的输出效果?
希望有人能给予解答,十分感谢!

  • 写回答

1条回答 默认 最新

  • 亖夕 Python领域新星创作者 2022-09-05 14:13
    关注

    1,sklearn包自带数据集为列表,输出为字典键值对格式
    2,pandas用read_csv打开的是逐行读取输出为行列表格。可以转化为sklearn格式

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

    报告相同问题?

    问题事件

    • 系统已结题 9月14日
    • 已采纳回答 9月6日
    • 创建了问题 9月5日

    悬赏问题

    • ¥15 Qt 不小心删除了自带的类,该怎么办
    • ¥15 我需要在PC端 开两个抖店工作台客户端.(语言-java)
    • ¥15 有没有哪位厉害的人可以用C#可视化呀
    • ¥15 可以帮我看看代码哪里错了吗
    • ¥15 设计一个成绩管理系统
    • ¥15 PCL注册的选点等函数如何取消注册
    • ¥15 问一下各位,为什么我用蓝牙直接发送模拟输入的数据,接收端显示乱码呢,米思齐软件上usb串口显示正常的字符串呢?
    • ¥15 Python爬虫程序
    • ¥15 crypto 这种的应该怎么找flag?
    • ¥15 代码已写好,求帮我指出错误,有偿!