独恋若风 2019-03-19 14:51 采纳率: 0%

用神经网络训练模型，报错字符串不能转换为浮点，请问怎么解决？

import matplotlib.pyplot as plt
from math import sqrt
from matplotlib import pyplot
import pandas as pd
from numpy import concatenate
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation
from keras.optimizers import Adam
import tensorflow
'''
keras实现神经网络回归模型
'''

读取数据

path = 'data001.csv'

删掉不用字符串字段

train = pd.read_csv(path)
dataset = train.iloc[1:,:]

df转array

values = dataset.values

原始数据标准化，为了加速收敛

scaler = MinMaxScaler(feature_range=(0, 1))
scaled = scaler.fit_transform(values)
y = scaled[:, -1]
X = scaled[:, 0:-1]

随机拆分训练集与测试集

from sklearn.model_selection import train_test_split

train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3)

全连接神经网络

model = Sequential()
input = X.shape[1]

隐藏层128

model.add(Dense(128, input_shape=(input,)))
model.add(Activation('relu'))

Dropout层用于防止过拟合

model.add(Dropout(0.2))

隐藏层128

model.add(Dense(128))
model.add(Activation('relu'))

model.add(Dropout(0.2))

没有激活函数用于输出层，因为这是一个回归问题，我们希望直接预测数值，而不需要采用激活函数进行变换。

model.add(Dense(1))

使用高效的 ADAM 优化算法以及优化的最小均方误差损失函数

model.compile(loss='mean_squared_error', optimizer=Adam())

early stoppping

from keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(monitor='val_loss', patience=50, verbose=2)

训练

history = model.fit(train_X, train_y, epochs=300, batch_size=20, validation_data=(test_X, test_y), verbose=2,
shuffle=False, callbacks=[early_stopping])

loss曲线

pyplot.plot(history.history['loss'], label='train')
pyplot.plot(history.history['val_loss'], label='test')
pyplot.legend()
pyplot.show()

预测

yhat = model.predict(test_X)

预测y逆标准化

inv_yhat0 = concatenate((test_X, yhat), axis=1)
inv_yhat1 = scaler.inverse_transform(inv_yhat0)
inv_yhat = inv_yhat1[:, -1]

原始y逆标准化

test_y = test_y.reshape((len(test_y), 1))
inv_y0 = concatenate((test_X, test_y), axis=1)
inv_y1 = scaler.inverse_transform(inv_y0)
inv_y = inv_y1[:, -1]

计算 RMSE

rmse = sqrt(mean_squared_error(inv_y, inv_yhat))
print('Test RMSE: %.3f' % rmse)
plt.plot(inv_y)
plt.plot(inv_yhat)
plt.show()

报错是：Traceback (most recent call last):
File "F:/SSD/CNN.py", line 24, in
scaled = scaler.fit_transform(values)
File "D:\anaconda\lib\site-packages\sklearn\base.py", line 464, in fit_transform
return self.fit(X, **fit_params).transform(X)
File "D:\anaconda\lib\site-packages\sklearn\preprocessing\data.py", line 334, in fit
return self.partial_fit(X, y)
File "D:\anaconda\lib\site-packages\sklearn\preprocessing\data.py", line 362, in partial_fit
force_all_finite="allow-nan")
File "D:\anaconda\lib\site-packages\sklearn\utils\validation.py", line 527, in check_array
array = np.asarray(array, dtype=dtype, order=order)
File "D:\anaconda\lib\site-packages\numpy\core\numeric.py", line 538, in asarray
return array(a, dtype, copy=False, order=order)
ValueError: could not convert string to float: 'label'

label是csv文件里的列名，但是就算去掉，还是会报这个错误

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-10-25 19:25
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
关于该问题，我找了一篇非常好的博客，你可以看看是否有帮助，链接：简单的神经网络解决实际问题

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

悬赏问题

¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮

用神经网络训练模型，报错字符串不能转换为浮点，请问怎么解决？

读取数据

删掉不用字符串字段

df转array

原始数据标准化，为了加速收敛

随机拆分训练集与测试集

全连接神经网络

隐藏层128

Dropout层用于防止过拟合

model.add(Dropout(0.2))

隐藏层128

model.add(Dropout(0.2))

没有激活函数用于输出层，因为这是一个回归问题，我们希望直接预测数值，而不需要采用激活函数进行变换。

使用高效的 ADAM 优化算法以及优化的最小均方误差损失函数

early stoppping

训练

loss曲线

预测

预测y逆标准化

原始y逆标准化

计算 RMSE

2条回答 默认 最新

悬赏问题

2条回答默认最新