从多元正态分布中生成3维样本

问题遇到的现象和发生背景

从多元正态分布中生成3维样本。样本的大小 T = 300。多变量正态分布的参数由你自己选择。自己选择，但它们应满足以下条件。1）数学上的
1）数学期望值m必须为非零；2）协方差矩阵S必须为非正交且为正确定。正向确定。
让𝑌=（𝑦𝑖𝑗），其中𝑦𝑖=（𝑦𝑖1，.，𝑦𝑖𝐾）代表单元i的K项矢量。在我们的案例中，K=3，i从1到300变化。
1. 在样本中产生缺失数据，条件如下：每个单位的每个项目观察到的概率为4/5，遗漏的概率为1/5。
（完全案例分析）。只考虑没有遗漏项目的单位。估计模型参数（数学期望值和协方差矩阵），只使用完全观察到的项目。观察到的项目。你的估计值与参数的实际值有多接近？有多少个
估算器的构建有多少可用的观测值？
（可用案例分析）。考虑教科书 "有缺失值的统计分析 "中的第3.4段。有缺失值的统计分析"。并构建估计器，如下数学估计器构建以下数学期望、协方差和相关矩阵的估计值。1) 𝑦̅𝑗 (𝑗) 2) 𝑠𝑗𝑘 (𝑗𝑘) , 3) 𝑟𝑗𝑘 ∗ , 4) 𝑟𝑗𝑘 (𝑗𝑘)。 , 5) 𝑠𝑗𝑘 ∗ , 6) 𝑠𝑗𝑘̃ (𝑗𝑘) 。 , 𝑗, 𝑘∈{1,2,3}。(见课本中的符号）。从s和r构建构建相应的协方差矩阵S和相关矩阵R的估计值。这些估计值对实际矩阵有多接近？所有的相关性都在（-1，1）范围内吗？是否所有估计的矩阵都是正确定的吗？

我想要达到的结果

使用Python和Jupyter notebook编写,完成以上的项目要求

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
2301_76433421 2023-02-08 08:02
关注
获得7.50元问题酬金
使用numpy和scipy包中的函数生成多元正态分布样本

import numpy as np from scipy.stats import multivariate_normal # 定义均值和协方差矩阵 mean = np.array([0,0,0]) cov = np.array([[1,0,0],[0,1,0],[0,0,1]]) # 生成样本 samples = multivariate_normal.rvs(mean=mean, cov=cov, size=300)

这将生成一个形状为(300, 3)的样本矩阵，每一行都是一个三维的正态分布样本。

使用numpy中的randint函数生成随机的0/1数字，表示该项是否被观察到。

import numpy as np # 定义观察到的概率为4/5，即遗漏的概率为1/5 prob = 0.8 # 生成300*3的随机0/1矩阵，表示每一项是否被观察到 mask = np.random.randint(0,2,size=(300,3)) mask = (mask<prob).astype(float) # 使用随机矩阵对样本进行遮盖 samples_missing = samples * mask

这将生成一个形状为(300, 3)的样本矩阵，表示每一项有缺失数据的情况。

使用numpy的mean和cov函数估计数学期望和协方差矩阵，仅考虑完全观察到的项目。

import numpy as np # 获取所有完全观察到的项目 samples_observed = samples_missing[np.all(samples_missing!=0, axis=1)] # 估计数学期望值 mean_estimated = np.mean(samples_observed, axis=0) # 估计协方差矩阵 cov_estimated = np.cov(samples_observed, rowvar=False) # 比较估计的数学期望值和协方差矩阵与实际的数学期望值和协方差矩阵的差距 print("Difference between estimated mean and actual mean: ", np.mean(mean_estimated - mean)) print("Difference between estimated covariance and actual covariance: ", np.mean(cov_estimated - cov)) # 计算可用的观测值数量 num_observed = np.sum(np.all(samples_missing!=0, axis=1))

上面的代码将打印出估计的数学期望值和协方差矩阵与实际数学期望值和协方差矩阵的差距，并计算可用的观测值数量。
在进行有缺失值的统计分析时，使用估计器来估计数学期望、协方差和相关矩阵的值，是一种常见的方法。首先，需要使用可用案例分析来处理缺失值，然后使用合适的方法来构建估计器。如果估计值与实际值接近，则可以认为估计器是合理的；如果所有相关性都在-1和1之间，则说明相关性是合法的；如果所有估计的矩阵都是正确定的，则说明估计是准确的。最后，使用Python和Jupyter notebook编写完成上述项目要求。
解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

多元正态分布的边际与条件分布分析
2025-05-21 20:32

AllyBo的博客多元高斯分布（也称为多变量正态分布）是统计学中的一个重要概念，是单变量正态分布的高维推广。它广泛应用于多个领域，包括机器学习、信号处理、金融分析等。在本章中，我们将首先介绍多元高斯分布的基本概念，然后...
python 二元正态分布_多元正态分布的检验
2021-01-15 12:23

昂立中学生的博客如同正态分布在单变量分析中的地位类似，在对多个因变量（多元）同时进行分析时，常常假设因变量组合成的向量服从一个多元正态分布。比如重复测量数据将重复的测量结果（比如各个时间点上的测量结果）视为不同的因...
Pytorch~多组多元正态分布
2024-01-21 22:53

whaosoft143的博客 torch.matmul 是实现矩阵乘法的函数，...但是这个做法有一个缺点，那就是不够自由，因为每次实例化这个类只能生成一个正态分布的采样，而在我朋友的例子里面，我们需要同时生成 B 个正态分布的 m 组采样。whaosoft ai
二维正态分布数据的Fisher分类实战
2025-07-20 21:49

鱼总美签的博客它通过找到一个线性组合的特征，使得不同类别的数据在这个新特征空间中尽可能地被区分开来，同时确保同一类别内的数据紧密地聚集在一起。LDA的基本思想是最大化类间距离与类内距离的比值，这样做的结果是，得到的...
概率论：高斯/正态分布
2015-10-30 20:31

-柚子皮-的博客正态分布（高斯分布）若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布，记为N（μ，σ^2）。其概率密度函数为正态分布的期望值μ决定了其位置，其标准差σ决定了分布的幅度。正态随机变量概率密度函数 ...
33、概率统计与R语言入门
2025-07-23 11:44

cake8的博客本博客系统介绍了概率统计的核心概念，包括双变量正态分布、随机变量的变换、矩估计法等基础知识，并深入探讨了图上的随机游走与马尔可夫链理论，涵盖平稳分布、极限分布及MCMC方法（如Metropolis–Hastings算法和...
基于随机过程的图像生成：探索新的生成策略
2023-07-25 00:28

光子AI的博客而传统的基于模糊、轮廓、噪声等生成方式已无法满足现实世界中各种复杂场景的需求。因此，为了提升图像生成的质量和效率，我国国内外很多学者、工程师都致力于从事基于随机过程的图像生成研究。本文旨在系统阐述基于...
VAE 自编码器模型简介：学习高维数据的分布，并将其映射到一个低维空间 Variational Autoencoders Explained
2023-08-05 01:42

光子AI的博客 Variational autoencoder（VAE）是一种自编码器模型，它可以用来学习高维数据的分布，并将其映射到一个低维空间。...VAE使用了变分推断方法，使得潜在变量能够生成新的数据样本，并且能够很好地拟合输入数据上的分布。
SQL是一种标准化的编程语言，用R探索
2024-12-16 09:18

MD赋能的博客 R语言作为一种强大的统计计算和数据分析工具，不仅在数据处理和可视化方面表现出色，还在与数据库连接和网络爬虫方面备强大...本文将介绍如何在R中进行数据库连接和网络爬虫，并展示如何使用SQL语言在R中进行数据操作。
Python计算【10】
2024-09-27 20:52

「已注销」的博客文章目录协方差概述协方差的定义协方差的计算协方差的例子协方差矩阵协方差矩阵定义协方差矩阵的性质协方差矩阵的计算协方差矩阵的例子协方差矩阵的例题 多元正态分布 基础 多元正态分布密度函数多元...
SQL（Structured Query Language）是一种标准化的编程语言
2024-11-06 18:37

MD赋能的博客大家知道，SQL专为数据操作而设计，能够高效执行复杂的查询、筛选、排序、分组等操作。在R中，通过SQL语句进行数据操作，代码更简洁明了，便于维护和理解。尤其对于复杂的多表联结操作，SQL的表达能力更强。
R语言初步统计绘图与编程
2014-08-21 00:57

- **非参数统计分析**: 包括Kruskal-Wallis检验、Mann-Whitney U检验等，适用于数据不符合正态分布的情况。R中的`stats`包提供了相应的函数实现。 - **多元统计分析**: 如主成分分析（PCA）、因子分析、聚类分析等。...
多元统计分析实战：R语言代码与数据应用
2025-08-24 02:13

飙车致死法厄同的博客多元统计分析是统计学的一个分支，它涉及到对含有多个...在多元统计分析中，一个核心的问题是处理变量之间的相关性和多变量的依赖性。由于涉及的变量多，数据结构复杂，传统单变量统计方法可能无法充分捕捉数据的特性。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月8日

从多元正态分布中生成3维样本

问题遇到的现象和发生背景

我想要达到的结果

5条回答 默认 最新

问题事件

5条回答默认最新