穆穆青风至 2022-10-07 15:08 采纳率: 97.4%
浏览 12
已结题

主成分分析 pca要咋做了

如下代码,输出如下,其中genres列是一个个列表,我现在想做的是给他降维,没一个数组都降成10维,要怎么做了,用scikit 里的pca要咋做了

from bert_serving.client import BertClient
from sklearn.decomposition import PCA
import pandas as pd

DATA_PATH = 'C:/Users/leaf/Desktop/ml-latest-small/movies.csv'
movies = pd.read_csv(DATA_PATH, index_col='movieId')[:2]  # 读取csv文件
movies['genres']=movies['genres'].apply(lambda x:x.replace('|',' ')) # 这样会把几个类型作为一个句子,返回一个词向量
bc=BertClient() # 开启bert-server客户端
movies['genres']=movies['genres'].apply(lambda x:bc.encode([x])[0]) # 仅返回一个词向量
print(movies)

输出如下

img

  • 写回答

1条回答 默认 最新

  • ·星辰大海 2022-10-07 15:54
    关注

    假设你的数组一个是1xn的然后你有m个数组,那么可以拼接成 mxn的矩阵,对矩阵进行降维就可以了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月18日
  • 已采纳回答 10月10日
  • 创建了问题 10月7日

悬赏问题

  • ¥15 用lstm来预测股票价格
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥170 如图所示配置eNSP
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改
  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上