我想在R中模拟以下内容。设X是一个随机变量,取值{0,1,2}和Y,Z是任意连续分布的两个随机变量:
-
如何生成X、Y和Z,使Y和Z之间的Pearson相关性非常高(例如r=0.8(,而它们各自与X的相关性非常不同?。
-
换言之,给定cor(Y,Z(=r,其中r相对较大,哪个X、Y和Z使cor(X,Y(和cor(X、Z(最小化?
-
如何不仅生成两个(Y,Z(,而且生成k个变量(Y_1,Y_2,…,Y_k(来满足前面的(它们有一个具有非对角元素=r的相关矩阵,其中r非常高(,但它们与X的相关性非常不同(。?
1-2。Y~N(0,1(,Z~N(Y,0(,X=[Z<Y]+[Y<0],[.]=艾弗森括号在R:
Y <- rnorm(100)
Z <- rnorm(100, Y)
X = I(Z<Y) + I(Y<0)
cbind(Y, Z ,X) %>%
cor()
Y Z X
Y 1.0000000 0.7545677 -0.6593067
Z 0.7545677 1.0000000 -0.8240605
X -0.6593067 -0.8240605 1.0000000
我3点离开。作为练习。