参考文献

注册

 

发新话题 回复该主题

SPSSAU数据分析主成分回归案例分 [复制链接]

1#

案例背景

  1.案例说明

研究调查家公司-年关于财务方面的具体数据,这些财务指标维度分别为盈利能力、偿债能力、运营能力、发展能力以及公司治理。其中每个维度分别有几个分析项,但是有些指标是越大越好,有些指标是越小越好。需要在研究前进行数据处理。

  2.研究目的

利用偿债能力、运营能力、发展能力以及公司治理四个维度下的分析项进行主成分分析以及判断分析项与主成分之间的关系,利用得到的成分得分进行命名作为线性回归的自变量,用盈利能力下的三个指标作为线性回归的因变量,因为每次线性回归只能放入一个因变量所以重复进行三次分析并且得到结论。

数据处理

主成分的目的就是用少数几个成分去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个成分(之所以称其为成分,是因为它是不可观测的,即不是具体的变量),以最少的信息丢失为前提,以较少的几个成分反映原资料的大部分信息。

在进行主成分之前,由于所选取的指标体系中每个指标都有自己的量纲和变动差异性,这样给综合分析建模带来不便,于是我们需要对收集得到的数据进行预处理,以消除量纲和变动差异性的影响。通常对数据进行的处理包括标准化处理(Z-score法)、正向处理、均值化处理等。

此案例中有些指标需要提前处理,具体指标隶属维度以及指标性质如下,比如资产负责率是逆向指标可以进行逆向化处理或者取倒数;但是取倒数需要分析项的数据大于0,其他指标需要正向化处理,公司治理的2个指标可以做正向化处理也可以做适度化,比如认为指标不是越大越好也不是越小越好,接近于某个值或某个范围内认为更好那就使用适度化,此案例中认为越大越好处理为正向化(也有参考文献做适度化处理,建议以参考文献为主)。

首先用SPSSAU将分析项进行“描述分析”观察数据的基本情况。发现资产负债率所有数据均大于0,所以进行处理时可以直接“取倒数”。

然后利用SPSSAU“数据处理”中的“生成变量”进行指标处理(一般正逆向化处理后不需要在进行标准化处理,因为已经正逆向化已经处理了量纲问题,但是取倒数后需要进行标准化处理)。

主成分结果

  1.判断分析项与主成分之间的关系

上表格针对主成分提取情况,以及主成分提取信息量情况进行分析,从上表可知:主成分分析一共提取出4个主成分,特征根值均大于1,此4个主成分的方差解释率分别是23.%,17.%,12.%,10.%,累积方差解释率为65.%。

成分与对应项之间的关系:

一般情况下,如果13项与4个成分之间的对应关系情况,与专业知识情况不符合,比如第一项被划分到了第一个成分下面,此时则说明可能这项应该被删除处理,其出现了‘张冠李戴’现象。因而在进行分析时很可能会对部分不合理项进行删除处理。除此之外,也有可能会出现‘纠缠不清’现象。

“张冠李戴”

一般情况下,如果13项与4个成分之间的对应关系情况,与专业知识情况不符合,比如第一项被划分到了第一个成分下面,此时则说明可能这项应该被删除处理,其出现了‘张冠李戴’现象。例如案例中的“每股经营性现金流量”应该属于成分3是分析时被划分到别的成分中。

“纠缠不清”

除了“张冠李戴”现象,有时候会出现‘纠缠不清’现象,比如案例中的“销售现金比率”可归属为成分3,同时也可归属到成分4,这种情况较为正常(称作‘纠缠不清’),需要结合实际情况处理即可,可将该项删除,也可不删除,这时,分析带有一定主观性。

Step1:第一次分析

本例子中共13个分析项,此13个分析项共分为4个维度,因此在分析前可主动告诉SPSSAU,此13项是四个维度,否则SPSSAU会自动判断多少个成分(通常软件自动判断与实际情况有很大出入,所以建议主动设置成分个数)。如下图:

上表格展示主成分对于研究项的信息提取情况,以及主成分和研究项对应关系,从上表可知:针对共同度而言,共涉及MMS_应收账款周转率,MMS_净利润增长率,MMS_主营业务收入增长率共3项,说明主成分和研究项之间的关系非常薄弱,主成分不能有效的提取出研究项信息。因而应该将此3项进行删除,删除之后再次进行分析。

Step2:第二次分析

从上图中可以看出:

“流动比率”、“速动比率”以及“资产负债率”这3项,它们全部对应着成分1,公因子方差均高于0.4,说明此3项应该同属于一个维度,即逻辑上这3项,并没有出现“张冠李戴”现象。但是有出现“纠缠不清”的情况。

“第一大股东持股比”和“前十大股东持股比”共2项,它们全部对应着成分2,但是二者出现“纠缠不清”的现象,考虑到此维度只剩下两个维度所以暂不处理。

“总资产现金回收率”、“销售现金比率”以及“每股经营性现金流量”共3项,当他们对应成分3,其中“每股经营性现金流量”出现“张冠李戴”进行删除处理。对于“纠缠不清”的情况保留观察。

“存货周转率”、“总资产周转率”它们对应着成分4,但是二者出现“纠缠不清”的现象,考虑到此维度只剩下两个维度所以暂不处理。

总结上述分析可知“每股经营性现金流量”出现“张冠李戴”进行删除处理。而其他出现“纠缠不清”现象的,暂时不处理(进行

分享 转发
TOP
发新话题 回复该主题