weixin_46930976 2022-05-12 15:59 采纳率: 66.7%
浏览 1490
已结题

jupyter中数据分割后,测试数据出现could not convert string to float:

问题遇到的现象和发生背景

对人口普查数据 分析,但是数据分割后,进行训练,出现错误。
采用的训练模型为SGDClassifier

问题相关代码,请勿粘贴截图

from sklearn.linear_model import SGDClassifier
lr=SGDClassifier(loss='log',max_iter=100)
lr.fit(trainx,trainy)
lr.score(testx,testy)

运行结果及报错内容

ValueError: could not convert string to float: 'ID_122543'
ValueError Traceback (most recent call last)
in ()
2
3 lr=SGDClassifier(loss='log',max_iter=100)
-> 4 lr.fit(trainx,trainy)
5 lr.score(testx,testy)

D:\anaconda\lib\site-packages\sklearn\linear_model\stochastic_gradient.py in fit(self, X, y, coef_init, intercept_init, sample_weight)
584 loss=self.loss, learning_rate=self.learning_rate,
585 coef_init=coef_init, intercept_init=intercept_init,
-> 586 sample_weight=sample_weight)
587
588

D:\anaconda\lib\site-packages\sklearn\linear_model\stochastic_gradient.py in fit(self, X, y, alpha, C, loss, learning_rate, coef_init, intercept_init, sample_weight)
416 self.classes = None
417
-> 418 X, y = check_X_y(X, y, 'csr', dtype=np.float64, order="C")
419 n_samples, n_features = X.shape
420

D:\anaconda\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, warn_on_dtype, estimator)
571 X = check_array(X, accept_sparse, dtype, order, copy, force_all_finite,
572 ensure_2d, allow_nd, ensure_min_samples,
-> 573 ensure_min_features, warn_on_dtype, estimator)
574 if multi_output:
575 y = check_array(y, 'csr', force_all_finite=True, ensure_2d=False,

D:\anaconda\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, warn_on_dtype, estimator)
431 force_all_finite)
432 else:
-> 433 array = np.array(array, dtype=dtype, order=order, copy=copy)
434
435 if ensure_2d:

我的解答思路和尝试过的方法

百度查询各种原因是空格,特殊字符,以及格式不正确,但是核对了错误的数据ID,没有问题。

我想要达到的结果
  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 5月20日
    • 创建了问题 5月12日

    悬赏问题

    • ¥15 51单片机读写24C02
    • ¥50 grlb复位怎么能够不回调?也不卡在home状态?
    • ¥15 win系统下做一个开机自动最大化运行某应用程序的执行文件
    • ¥15 grlb复位,设置设置返回行程为0,卡在home状态,怎么解决?
    • ¥100 CubeIDE更换芯片以及调整代码
    • ¥50 有没有可以远程指导问题
    • ¥15 origin柱状图,分组如何分
    • ¥15 两个不同IP互通的配置命令
    • ¥15 office弹窗激活问题
    • ¥15 明阳风电1.5s,风机重启后报出振动开关触发,无法复位求解。