如下代码,输出如下,其中genres列是一个个列表,我现在想做的是给他降维,没一个数组都降成10维,要怎么做了,用scikit 里的pca要咋做了
from bert_serving.client import BertClient
from sklearn.decomposition import PCA
import pandas as pd
DATA_PATH = 'C:/Users/leaf/Desktop/ml-latest-small/movies.csv'
movies = pd.read_csv(DATA_PATH, index_col='movieId')[:2] # 读取csv文件
movies['genres']=movies['genres'].apply(lambda x:x.replace('|',' ')) # 这样会把几个类型作为一个句子,返回一个词向量
bc=BertClient() # 开启bert-server客户端
movies['genres']=movies['genres'].apply(lambda x:bc.encode([x])[0]) # 仅返回一个词向量
print(movies)
输出如下