歪西_Yang 2023-04-02 02:03 采纳率: 0%
浏览 49

t-SNE数据可视化与标准化/归一化的顺序问题

在做高维数据t-SNE可视化的时候,是否需要先将数据进行归一化处理再进行t-SNE可视化?还是说先进行t-SNE可视化之后进行归一化处理?是否有数学依据?

  • 写回答

2条回答 默认 最新

  • Taylor 淡定哥 2023-04-02 02:21
    关注

    在进行高维数据的t-SNE可视化时,建议先将数据进行归一化处理,然后再进行t-SNE可视化。

    归一化可以使得不同维度的特征值具有相同的尺度,避免某些维度的特征值过大而影响到t-SNE的计算。此外,归一化还可以加快t-SNE的计算速度和提高可视化效果。

    具体来说,t-SNE算法的核心是将高维数据映射到低维空间中,并保留数据点之间的局部相似性。如果数据未经过归一化处理,则不同维度之间的尺度差异会对相似性度量产生影响,从而导致可视化效果不佳。

    因此,建议在进行t-SNE可视化前,先对数据进行归一化处理。一般可以采用z-score标准化或者将数据缩放到[0, 1]范围内等方法进行归一化。

    需要注意的是,在进行归一化处理后,数据的原始分布信息可能会受到影响。因此,有时候也可以先进行t-SNE可视化,然后再对可视化结果进行归一化处理。但这种方法需要谨慎使用,并根据具体情况进行调整。

    总之,数据归一化和t-SNE可视化是相互依存的,二者都可以影响到可视化结果。具体的处理方法需要结合实际情况进行选择。

    评论

报告相同问题?

问题事件

  • 创建了问题 4月2日

悬赏问题

  • ¥100 如何用js写一个游戏云存档
  • ¥15 ansys fluent计算闪退
  • ¥15 有关wireshark抓包的问题
  • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
  • ¥15 向数据表用newid方式插入GUID问题
  • ¥15 multisim电路设计
  • ¥20 用keil,写代码解决两个问题,用库函数
  • ¥50 ID中开关量采样信号通道、以及程序流程的设计
  • ¥15 U-Mamba/nnunetv2固定随机数种子
  • ¥30 C++行情软件的tick数据如何高效的合成K线