穆穆青风至 2022-10-07 15:08 采纳率: 97.4%
浏览 12
已结题

主成分分析 pca要咋做了

如下代码,输出如下,其中genres列是一个个列表,我现在想做的是给他降维,没一个数组都降成10维,要怎么做了,用scikit 里的pca要咋做了

from bert_serving.client import BertClient
from sklearn.decomposition import PCA
import pandas as pd

DATA_PATH = 'C:/Users/leaf/Desktop/ml-latest-small/movies.csv'
movies = pd.read_csv(DATA_PATH, index_col='movieId')[:2]  # 读取csv文件
movies['genres']=movies['genres'].apply(lambda x:x.replace('|',' ')) # 这样会把几个类型作为一个句子,返回一个词向量
bc=BertClient() # 开启bert-server客户端
movies['genres']=movies['genres'].apply(lambda x:bc.encode([x])[0]) # 仅返回一个词向量
print(movies)

输出如下

img

  • 写回答

1条回答 默认 最新

  • ·星辰大海 2022-10-07 15:54
    关注

    假设你的数组一个是1xn的然后你有m个数组,那么可以拼接成 mxn的矩阵,对矩阵进行降维就可以了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月18日
  • 已采纳回答 10月10日
  • 创建了问题 10月7日

悬赏问题

  • ¥15 如何用Labview在myRIO上做LCD显示?(语言-开发语言)
  • ¥15 Vue3地图和异步函数使用
  • ¥15 C++ yoloV5改写遇到的问题
  • ¥20 win11修改中文用户名路径
  • ¥15 win2012磁盘空间不足,c盘正常,d盘无法写入
  • ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
  • ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
  • ¥15 帮我写一个c++工程
  • ¥30 Eclipse官网打不开,官网首页进不去,显示无法访问此页面,求解决方法
  • ¥15 关于smbclient 库的使用