穆穆青风至 2022-10-07 15:08 采纳率: 97.4%
浏览 14
已结题

主成分分析 pca要咋做了

如下代码,输出如下,其中genres列是一个个列表,我现在想做的是给他降维,没一个数组都降成10维,要怎么做了,用scikit 里的pca要咋做了

from bert_serving.client import BertClient
from sklearn.decomposition import PCA
import pandas as pd

DATA_PATH = 'C:/Users/leaf/Desktop/ml-latest-small/movies.csv'
movies = pd.read_csv(DATA_PATH, index_col='movieId')[:2]  # 读取csv文件
movies['genres']=movies['genres'].apply(lambda x:x.replace('|',' ')) # 这样会把几个类型作为一个句子,返回一个词向量
bc=BertClient() # 开启bert-server客户端
movies['genres']=movies['genres'].apply(lambda x:bc.encode([x])[0]) # 仅返回一个词向量
print(movies)

输出如下

img

  • 写回答

1条回答 默认 最新

  • ·星辰大海 2022-10-07 15:54
    关注

    假设你的数组一个是1xn的然后你有m个数组,那么可以拼接成 mxn的矩阵,对矩阵进行降维就可以了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月18日
  • 已采纳回答 10月10日
  • 创建了问题 10月7日