望采纳!点击该回答右侧的“采纳”按钮即可采纳!!
可以使用pandas的sample方法来随机选择数据的行,然后使用train_test_split函数将数据分为训练集和测试集。
代码我给你写了一份,有用可以采纳博主的答案呀
import pandas as pd
from sklearn.model_selection import train_test_split
读取数据
data = pd.read_csv('data.csv')
随机选择数据的行
data_sample = data.sample(frac=1)
取前90%的数据作为训练集,剩余的数据作为测试集
train_size = int(len(data_sample) * 0.9)
train = data_sample[:train_size]
test = data_sample[train_size:]
也可以使用train_test_split函数将数据分为训练集和测试集
X = data_sample.iloc[:, :-1]
y = data_sample.iloc[:, -1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42)
print('训练集大小:', len(X_train))
print('测试集大小:', len(X_test))