独恋若风 2019-03-19 14:51 采纳率: 0%
浏览 1283

用神经网络训练模型,报错字符串不能转换为浮点,请问怎么解决?

import matplotlib.pyplot as plt
from math import sqrt
from matplotlib import pyplot
import pandas as pd
from numpy import concatenate
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation
from keras.optimizers import Adam
import tensorflow
'''
keras实现神经网络回归模型
'''

读取数据

path = 'data001.csv'

删掉不用字符串字段

train = pd.read_csv(path)
dataset = train.iloc[1:,:]

df转array

values = dataset.values

原始数据标准化,为了加速收敛

scaler = MinMaxScaler(feature_range=(0, 1))
scaled = scaler.fit_transform(values)
y = scaled[:, -1]
X = scaled[:, 0:-1]

随机拆分训练集与测试集

from sklearn.model_selection import train_test_split

train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3)

全连接神经网络

model = Sequential()
input = X.shape[1]

隐藏层128

model.add(Dense(128, input_shape=(input,)))
model.add(Activation('relu'))

Dropout层用于防止过拟合

model.add(Dropout(0.2))

隐藏层128

model.add(Dense(128))
model.add(Activation('relu'))

model.add(Dropout(0.2))

没有激活函数用于输出层,因为这是一个回归问题,我们希望直接预测数值,而不需要采用激活函数进行变换。

model.add(Dense(1))

使用高效的 ADAM 优化算法以及优化的最小均方误差损失函数

model.compile(loss='mean_squared_error', optimizer=Adam())

early stoppping

from keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(monitor='val_loss', patience=50, verbose=2)

训练

history = model.fit(train_X, train_y, epochs=300, batch_size=20, validation_data=(test_X, test_y), verbose=2,
shuffle=False, callbacks=[early_stopping])

loss曲线

pyplot.plot(history.history['loss'], label='train')
pyplot.plot(history.history['val_loss'], label='test')
pyplot.legend()
pyplot.show()

预测

yhat = model.predict(test_X)

预测y逆标准化

inv_yhat0 = concatenate((test_X, yhat), axis=1)
inv_yhat1 = scaler.inverse_transform(inv_yhat0)
inv_yhat = inv_yhat1[:, -1]

原始y逆标准化

test_y = test_y.reshape((len(test_y), 1))
inv_y0 = concatenate((test_X, test_y), axis=1)
inv_y1 = scaler.inverse_transform(inv_y0)
inv_y = inv_y1[:, -1]

计算 RMSE

rmse = sqrt(mean_squared_error(inv_y, inv_yhat))
print('Test RMSE: %.3f' % rmse)
plt.plot(inv_y)
plt.plot(inv_yhat)
plt.show()


报错是:Traceback (most recent call last):
File "F:/SSD/CNN.py", line 24, in
scaled = scaler.fit_transform(values)
File "D:\anaconda\lib\site-packages\sklearn\base.py", line 464, in fit_transform
return self.fit(X, **fit_params).transform(X)
File "D:\anaconda\lib\site-packages\sklearn\preprocessing\data.py", line 334, in fit
return self.partial_fit(X, y)
File "D:\anaconda\lib\site-packages\sklearn\preprocessing\data.py", line 362, in partial_fit
force_all_finite="allow-nan")
File "D:\anaconda\lib\site-packages\sklearn\utils\validation.py", line 527, in check_array
array = np.asarray(array, dtype=dtype, order=order)
File "D:\anaconda\lib\site-packages\numpy\core\numeric.py", line 538, in asarray
return array(a, dtype, copy=False, order=order)
ValueError: could not convert string to float: 'label'

label是csv文件里的列名,但是就算去掉,还是会报这个错误

  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-10-25 19:25
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥15 关于下拉菜单选项关联的问题
  • ¥15 如何修改pca中的feature函数
  • ¥20 java-OJ-健康体检
  • ¥15 rs485的上拉下拉,不会对a-b<-200mv有影响吗,就是接受时,对判断逻辑0有影响吗
  • ¥15 使用phpstudy在云服务器上搭建个人网站
  • ¥15 应该如何判断含间隙的曲柄摇杆机构,轴与轴承是否发生了碰撞?
  • ¥15 vue3+express部署到nginx
  • ¥20 搭建pt1000三线制高精度测温电路
  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况
  • ¥15 画两个图 python或R