2025年用Python 或者SPSS 做 通径分析

用Python 或者SPSS 做 通径分析一边学 一边记 简单相关系数 仅仅研究两个变量之间的关系 偏相关系数 多个相关变量中研究两个变量之间的关系 多元回归 多个不相关 理想化 不存在完全不相关 自变量与一个因变量之间的关系 通径分析 多个相关的自变量与一个因变量之间的关系 典型相关系数

大家好,我是讯享网,很高兴认识大家。

一边学,一边记。
简单相关系数:仅仅研究两个变量之间的关系
偏相关系数:多个相关变量中研究两个变量之间的关系
多元回归:多个不相关(理想化,不存在完全不相关)自变量与一个因变量之间的关系
通径分析:多个相关的自变量与一个因变量之间的关系
典型相关系数:多个相关的因变量与多个相关的自变量之间的关系

看图
在这里插入图片描述
讯享网
图中箭头表示自变量之间存在因果关系,x1直接指向y为x1对y的直接通径。
r表示变量之间的相关系数
在直接通径上,若xi到的值增加一个标准差单位时,y将要改变的标准差单位Piy,称为通径xi到y的系数。
这里x1与x2相关,所以x1在影响y时,同时也在通过x2影响着y。它通过x2影响y的称为间接通径。
在这里插入图片描述
在通径分析中,一般认为最难计算的就是通径系数P,但其实,对数据做线性回归时,得到的标准化系数,就是通径系数。
用SPSS计算很方便,用Python也可以,但是Python要先对所有数据标准化再进行多元回归。得到标准化系数。
比如下面的数据。
在这里插入图片描述
这就15行数据,所有的数据如下:

array([[ 10. , 23. , 4. , 113. , 15.7], [ 9. , 20. , 4. , 106. , 14.5], [ 10. , 22. , 4. , 111. , 17.5], [ 13. , 21. , 4. , 109. , 22.5], [ 10. , 22. , 4. , 110. , 15.5], [ 10. , 23. , 4. , 103. , 16.9], [ 8. , 23. , 3. , 100. , 8.6], [ 10. , 24. , 3. , 114. , 17. ], [ 10. , 20. , 3. , 104. , 13.7], [ 10. , 21. , 3. , 110. , 13.4], [ 10. , 23. , 4. , 104. , 20.3], [ 8. , 21. , 4. , 109. , 10.2], [ 6. , 23. , 3. , 114. , 7.4], [ 8. , 21. , 4. , 113. , 11.6], [ 9. , 22. , 4. , 105. , 12.3]]) 

讯享网

用spss做多元线性回归
在这里插入图片描述
结果中株高的系数不显著,不具有统计学意义,可以先去除掉看一看
在这里插入图片描述
可以看到标准化系数那一列中,就是我们要得到的直接通径P值。
我们再计算一下他的皮尔森相关系数:

讯享网np.corrcoef(df1,rowvar=False) 
array([[ 1. , -0., 0., -0.0, 0.], [-0., 1. , -0., 0., 0.0], [ 0., -0., 1. , -0.0, 0.], [-0.0, 0., -0.0, 1. , -0.00], [ 0., 0.0, 0., -0.00, 1. ]]) 

这是5X5的矩阵,第一行就表示x1 。

这个矩阵最后一列就就是所有变量对y的影响。

算一下单株穗数,也就是第一个变量,他的直接通径为P = 0.862

总结,从相关系数并不能看出这个变量对y的影响大小,因为变量间也会相关,并且变量间相关度越高,本身自变量对y的单独影响可能就会越低。

小讯
上一篇 2025-02-16 15:47
下一篇 2025-03-25 09:25

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/10945.html