大海-繁星 2022-09-05 13:58 采纳率: 100%
浏览 422
已结题

pycharm数据分析导入数据集,打印输出格式不一致

最近在学习python数据分析,刚接触pycharm不久,在学习参考有关书籍的代码时,遇到一些问题不太明白,希望有人能给予解答,十分感谢!
问题如下:
在导入sklearn包自带数据集和导入自己的数据集时,打印输出的结果格式不一样,不知道是什么原因?
1、导入sklearn包自带数据集及输出结果如下:

img

输出结果:

img

查看sklearn包数据集原始数据,发现就是普通的CSV格式,且里面并没有“data”、“target”、“target_name”等关键字
sklearn包数据源:

img

2、导入自己的数据集及输出结果如下:
通过pandas方式导入数据集:

img

输出结果:

img

不知道为何上述两种方式的输出结果不一样,看数据导入源码并没有做任何变换,
Q1:为何sklearn包的数据集的输出格式已经分类,而自己的数据集就是普通格式,背后的原理是什么?
Q2:自己的数据集能否实现与sklearn包的数据集相同的输出效果?
希望有人能给予解答,十分感谢!

  • 写回答

1条回答 默认 最新

  • 亖夕 Python领域新星创作者 2022-09-05 14:13
    关注

    1,sklearn包自带数据集为列表,输出为字典键值对格式
    2,pandas用read_csv打开的是逐行读取输出为行列表格。可以转化为sklearn格式

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月14日
  • 已采纳回答 9月6日
  • 创建了问题 9月5日

悬赏问题

  • ¥15 加氢站氢负荷数据集来源
  • ¥15 umi接入sentry遇到问题
  • ¥15 HBuilderX打包H5网页,扫码模块无法使用
  • ¥15 Javascript跳转页面后,无法执行后面代码,如何解决?
  • ¥15 echarts绘制图表
  • ¥15 请教两个关于高德地图定位不准的技术问题
  • ¥15 根据企业名称 对照两个文件 样本筛选/匹配
  • ¥15 Linux环境下CA证书更新问题
  • ¥15 sqlserver语句提取结果以外数据
  • ¥60 微信小程序如何上传QQ聊天文件