weixin_46930976 2022-05-12 15:43 采纳率: 66.7%
浏览 225
已结题

jupyter中数据分割后,测试数据出现could not convert string to float:

 #问题遇到的现象和发生背景
对人口普查数据 分析,但是数据分割后,进行训练,出现错误。
采用的训练模型为SGDClassifier
 #问题相关代码,请勿粘贴截图
from sklearn.linear_model import SGDClassifier
lr=SGDClassifier(loss='log',max_iter=100) #迭代的最大次数,只影响fit方法,默认值为5
lr.fit(trainx,trainy)
lr.score(testx,testy)

 #运行结果及报错内容
ValueError: could not convert string to float: 'ID_122543'
ValueError Traceback (most recent call last)
in ()
2
3 lr=SGDClassifier(loss='log',max_iter=100)
-> 4 lr.fit(trainx,trainy)
5 lr.score(testx,testy)

D:\anaconda\lib\site-packages\sklearn\linear_model\stochastic_gradient.py in fit(self, X, y, coef_init, intercept_init, sample_weight)
584 loss=self.loss, learning_rate=self.learning_rate,
585 coef_init=coef_init, intercept_init=intercept_init,
-> 586 sample_weight=sample_weight)
587
588

D:\anaconda\lib\site-packages\sklearn\linear_model\stochastic_gradient.py in fit(self, X, y, alpha, C, loss, learning_rate, coef_init, intercept_init, sample_weight)
416 self.classes
= None
417
-> 418 X, y = check_X_y(X, y, 'csr', dtype=np.float64, order="C")
419 n_samples, n_features = X.shape
420

D:\anaconda\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, warn_on_dtype, estimator)
571 X = check_array(X, accept_sparse, dtype, order, copy, force_all_finite,
572 ensure_2d, allow_nd, ensure_min_samples,
-> 573 ensure_min_features, warn_on_dtype, estimator)
574 if multi_output:
575 y = check_array(y, 'csr', force_all_finite=True, ensure_2d=False,

D:\anaconda\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, warn_on_dtype, estimator)
431 force_all_finite)
432 else:
-> 433 array = np.array(array, dtype=dtype, order=order, copy=copy)
434
435 if ensure_2d:

 #我的解答思路和尝试过的方法
百度查询各种原因是空格,特殊字符,以及格式不正确,但是核对了错误的数据ID,没有问题。
 #我想要达到的结果

  • 写回答

3条回答 默认 最新

  • weixin_46930976 2022-05-15 15:13
    关注

    问题解决了,数据中的ID数据类型影响,我直接删除ID就解决了,具体的我感觉上面的两位说的都对着呢。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 5月23日
  • 已采纳回答 5月15日
  • 创建了问题 5月12日

悬赏问题

  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测
  • ¥88 python部署量化回测异常问题
  • ¥30 酬劳2w元求合作写文章
  • ¥15 在现有系统基础上增加功能
  • ¥15 远程桌面文档内容复制粘贴,格式会变化
  • ¥15 这种微信登录授权 谁可以做啊
  • ¥15 请问我该如何添加自己的数据去运行蚁群算法代码
  • ¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”