穆穆青风至 2022-10-07 15:08 采纳率: 97.4%
浏览 12
已结题

主成分分析 pca要咋做了

如下代码,输出如下,其中genres列是一个个列表,我现在想做的是给他降维,没一个数组都降成10维,要怎么做了,用scikit 里的pca要咋做了

from bert_serving.client import BertClient
from sklearn.decomposition import PCA
import pandas as pd

DATA_PATH = 'C:/Users/leaf/Desktop/ml-latest-small/movies.csv'
movies = pd.read_csv(DATA_PATH, index_col='movieId')[:2]  # 读取csv文件
movies['genres']=movies['genres'].apply(lambda x:x.replace('|',' ')) # 这样会把几个类型作为一个句子,返回一个词向量
bc=BertClient() # 开启bert-server客户端
movies['genres']=movies['genres'].apply(lambda x:bc.encode([x])[0]) # 仅返回一个词向量
print(movies)

输出如下

img

  • 写回答

1条回答 默认 最新

  • ·星辰大海 2022-10-07 15:54
    关注

    假设你的数组一个是1xn的然后你有m个数组,那么可以拼接成 mxn的矩阵,对矩阵进行降维就可以了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月18日
  • 已采纳回答 10月10日
  • 创建了问题 10月7日

悬赏问题

  • ¥15 echarts图表制作
  • ¥15 halcon根据玻璃面板纹路取区域
  • ¥15 HFSS设计小型化180度耦合器
  • ¥15 使用CInternetSession,CHttpFile读取网页文件时有些电脑上会卡住怎么办?
  • ¥15 水下机器人的半物理仿真研究
  • ¥15 微服务假死,一段时间后自动恢复,如何排查处理
  • ¥50 webrtc-streamer TCP rtsp
  • ¥15 cplex运行后参数报错是为什么
  • ¥15 之前不小心删了pycharm的文件,后面重新安装之后软件打不开了
  • ¥15 vue3获取动态宽度,刷新后动态宽度值为0