杨裕民
2023-02-02
更新时间:2023-02-03 20:21:22作者:百科
[拼音]:chouyang diaocha
[外文]:sampling survey
从研究总体中抽取部分单位加以调查并用所得结果推论和说明总体特性的调查类型。从总体中取出部分的过程叫抽样,抽出的这一部分单位称作样本。抽样方法分为概率与非概率两种。前者依据抽样理论和严格的抽样程序,使总体中每个单位被抽取的概率为已知;后者根据研究任务的要求和对调查对象的分析,主观选取样本。抽样调查一般指用概率抽样方法进行的调查。
抽样调查始于1891年挪威的人口调查。社会学中首先采用严格控制的抽样方法的是英国统计学家A.L.鲍利于第一次世界大战前在英格兰和威尔士所作的 5城镇调查。第二次世界大战后,抽样调查获得了迅速推广,成为社会调查的主流。
总体具有异质性,是采用抽样调查技术的第一个原因。若总体的每一单位在各方面完全相同,则取其中的一个单位便可代表总体,无需抽样。另一原因是具有异质性的总体太大,鉴于时间、人财、物力与技术等原因无法对每一单位进行调查,需要抽样调查,通过局部研究总体。由样本概化总体的抽样调查方法基于两个基本假定:一是部分含于整体之中并与总体有同样的特征、现象与过程;二是部分可以更清晰地反映群体的生活、态度和特性。总体的异质性和样本与总体的范围不同,使得在用样本代表总体时总有误差,即抽样误差,其大小反映了样本的代表性程度。误差越大,代表性越低;误差越小,代表性越高。抽样调查成功与否主要取决于所选样本代表性的高低。
影响样本代表性的因素有:
(1)抽样方法的选择。概率抽样是最佳抽样方法,首先,它避免了抽样者在抽样过程中有意或无意的偏差,也称系统性误差。虽然概率样本不能精确地代表总体,但比其他类型的样本更具代表性。其次,可以对用样本推论总体时的误差作出定量的估计。抽样调查中常用的概率抽样方法有简单随机抽样、等距抽样、分层抽样、整群抽样和多阶段抽样等。在相同的情况下,由这些方法得到的样本具有不同的代表性。
(2)对总体的界定与了解。总体是在理论上有明确定义的研究单位的集合体。严格的概率抽样可获得代表性较高的样本,但这是建立在对总体的正确界定和精确了解上。否则,尽管抽样方法是随机的,仍难免失败。1936年美国《文学摘要》关于总统选举民意测验的失败,就是因为对总体的错误界定。它以电话簿和汽车注册簿上的选民为总体,忽略了没有家庭电话和私人汽车的选民。
(3)样本的大小,又称样本容量。指样本内所含单位的数量。一个概率样本的大小与其代表性密切相关,样本越小,代表性越低;样本越大,代表性越高。但样本越大,抽样成本越高。样本数的确定应考虑3个因素:a.容许误差的大小。容许误差越小,所需样本越大。b.确定总体的性质。在一定的代表性要求下,总体越大,所需样本越大;当总体达到足够大时,样本则不需再增大;样本异质性越高,所需样本亦越大。c.客观制约,即能够用于此项研究的人、财、物及时间等。样本越大,代表性越高,抽样成本亦越高。确定样本大小的原则,是在同等的耗费下获最大的代表性,或在同等的代表性下,使耗费最小。
抽样调查的主要程序是:界定总体→编制总体名单→确定样本大小和选择抽样方法→抽取样本→搜集资料→评估样本的正误和估计总体。
抽样调查的主要优点:成本低,速度快;结果可作定量分析;调查人员少,可进行专业训练,能提高调查结果的准确性;可获得丰富的资料,应用的范围也比总体调查广。近代抽样理论和抽样技术以及电子计算机的发展,更进一步扩大了它的应用范围。与非概率抽样相比,概率抽样成本高。另外,由于种种原因,有些研究根本无法进行概率抽样调查。例如,调查全国贪污犯,由于无法获得贪污犯的总体名单,所以概率抽样就不可能。