网站首页
手机版

多变量分析

更新时间:2023-02-03 08:28:18作者:百科

多变量分析

多个变量统计分析技术在社会研究中的运用。又称多元分析。它的分类方法很多,主要有按变量层次分类和按功能分类。

图

社会现象是复杂的,例如一种现象往往不止是一种原因引起的;或一种社会现象往往同时扮演因和果的角色;或作为因的各种现象之间又存在着某种联系;或在确认现象间的相关或因果联系时,往往还需要通过引入其他变量,才可加以确认。因此,多变量分析除根据变量层次分类外,还可根据多变量分析的目的、功能或用途来分类,便于使用者根据需要选择不同的分析技术。在选择时,要注意变量的层次。

详析模式

为了深入研究和分析两个变量xy之间的关系,需要引进第3个变量z,然后通过3个变量的因果模型分析,详细分析所要研究的两个变量xy之间的关系。其中包括辨明变量xy之间是否确有关系,关系的方向如何,以及辨明变量 z与变量xy之间的关系类型,是否存在中介的变量等等。例如,根据统计,婚龄长的人,患病率高些。初看起来,似乎变量婚龄与变量患病率之间存在着正相关。但如果引入变量年龄z,则发现这样一个事实:年龄大,同时也是婚龄长和患病率高的原因。实际婚龄和患病率之间并非存在真正因果的关系。可见,为了探讨婚龄和患病率之间是否确有关系,必须引入年龄z方能得出正确结论。又如,增加教育经费和提高教育质量之间存在着正相关。但教育经费 x不能直接转化为教育质量y,其间必然还要通过中间措施,如购置教学设备z。所以,购置教学设备成为教学经费和教育质量形成正相关必不可少的一个中介变量。

引入变量 z对原有变量xy关系进行分析,是通过对变量z的控制进行的,因此变量z又称控制变量。具体作法是,对于定类或定序变量采用“分表法”,对原有变量xy作交叉分类表,又称原表(表2),按控制变量z的不同取值:z=z1z=z2z=z3,……再作成分表(表a,表b,表c)。然后比较原表和分表中变量xy的相关系数。对于定类变量,可通过λ系数或τ系数的比较;对于定序变量,可通过 γ系数的比较;对于定距变量,可采用偏相关系数法…,?a href='http://www.baiven.com/baike/223/306724.html' target='_blank' style='color:#136ec2'>粗苯颖冉舷喙叵凳?img src="/uploads/baike/3/35679y807397_25264.jpg" alt="公式 符号">和偏相关系数公式 符号,无须再作原表和分表。这两种方法的原理是一样的。

图 表a 表b 表c

为了对详析模式有一清晰了解,必须搞清控制变量z在变量xy中所处的位置。如果控制变量z位于变量xy之前(图1)则称z为前置变量;如果控制变量z位于变量xy之间(图2)则称z为中介变量。

图1 图2

根据变量z控制前后,变量xy相关程度的变化,可对变量xy之间的关系作如下几种解释。

(1)原表和各分表中,变量xy的相关程度都不变,则可确信变量xy之间的原关系是成立的,是存在相关的,且其相关程度和原表是一样的。

(2)若分表中,变量xy的相关程度和原表相比,呈现复杂的情况:有的不变或增加;有的减少或消失。这时可将变量 z看作是讨论变量xy之间关系的一种分类或条件,z又称条件变量。

(3)若 z控制后,所有分表中变量xy的关系都消失了,则说明变量 z可能是变量xy变化的共因,即前置变量(图1),但也可能是中介变量(图2)。对于前者(图1),严格说来变量xy并不存在因果联系,因此变量 xy之间的相关称伪相关或虚假相关。即用变量z就可解释变量xy之间的关系。例如,前述变量年龄z就可能是变量婚龄x和变量患病率y产生虚假相关的前置变量。而购置教学设备必然发生在增加教学经费之后和提高教育质量之前,它称作中介变量。有了中介变量,对变量xy之间的关系就可作进一步的分析或解释。所谓变量xy关系的消失,并不意味着相关系数的计算结果正好为零。对于抽样来说,变量间相关为零的原假设被接受就可看作是关系的消失。若变量z控制后,分表中所有变量xy的关系仍然是显著的,但都减弱了,则说明变量xy的关系中部分是由于z的存在。

(4)对于图1的因果模型,详析模式不仅可以讨论变量xy之间原有关系不为零的情况:公式 符号≠0,也可讨论原有关系为零的情况:公式 符号=0。因为偏相关系数 公式 符号和原有相关系数公式 符号存在以下关系式:

公式 符号

公式 符号=0,公式 符号≠0,公式 符号≠0,且公式 符号公式 符号异号时,则公式 符号>0。它表示变量 xy之间的关系,只有当变量z得以控制后方被释放出来。所以美国学者M.罗森伯格称z为压抑变量,而原有相关公式 符号=0是虚假的,或称虚假的零相关。罗森伯格还设想了公式 符号公式 符号可能反向的情况。它表示原有相关系数的极性(正向或反向),实际是歪曲了事实的真相,只有当变量 z得以控制后,变量xy之间相关的真实极性才得以显示,这种情况下的控制变量 z称作歪曲变量。

多因分析

研究社会现象的产生是若干原因共同作用的模型(图3):y=α11x1+α12x2+……α1nxn多因分析除了多元回归外,还可将回归与相关技术结合起来,称作典型相关分析技术。例如采用回归技术,用一组变量测定人们的社会经济地位,用另一组变量测定人们的现代化观念,就可采用典型相关分析来分析社会经济地位和现代化观念之间的关系(见回归分析)。

图

多因分析中的因变量又可能同时是另一变量的自变量,从而形成多级的因果链(图4),这时可采用路径分析技术。

图 多变量的综合与提取

当多个变量间存在一定的相关性时,可利用聚类分析、因素分析、主成分分析法对信息进行综合、提取与归类(见因子分析)。

多变量分析在社会研究中的应用正逐步得到推广。但各种统计技术的运用,无不取决于模型的选择,而模型的选择是带有主观性的,研究者必须对研究对象作深入的定性研究,以便主观上作出符合客观实际的模型选择。

本文标签:多变量分析  duobianliangfenxi