第一章 调查专用术语(三、抽样调查术语)


 
第一章 调查专用术语
 
三、抽样调查术语
 
抽样调查
抽样调查是指在所要研究的某特定现象之母群体中,依随机原理抽取一部份作为样本,将样本研究结果,在抽样信赖水准内,推算母群体可能特性,作为研究母群体的依据。抽样调查作为科学研究方法中重要技术之一。
母群体
母群体是在调查研究中,调查研究对象的集合体。例如:调查XXX中学生情况,则在XXX地区所有的中学生总数,便是调查研究的母群体。
抽样架构
抽样架构是调查人员对母体群的划分结构,通过母群体结构组织相应的抽样,或是整体抽样单位的详细名单,以供抽样之用。
例如:以XXX会计师为抽样单位,则XXX地区会计师协会的名册,便是抽样架构。如果以学校班级为抽样单位,则学校60班班级名册便是抽样构架。
抽样单位
抽样单位在是调查人员依据抽样架构,按照抽样标志进一步划分的个别单位,调查人员将其称之为“抽样单位”。
例如XXX地区每一会计师即为一抽样单位。在上例中,每一班级都是抽样单位。
元素
元素是指构成母群体中最基本的最小的要素,也是接受调查的最小单位,母群体就是由这些最小的元素构成的,所以把它称之为元素,通常是指人。上例中,班上每一位学生既为元素。
样本
样本从抽样架构中抽出取来的抽样单位总和。样本就是这样的基本单元,有时是个人,有时是家庭,有时是公司等。不要以为这是个很容易明确的问题。尽管,样本单位通常就是样本自己,但很多时候需要进一步探讨。例如,入户访问时,不能规定必须访问开门的人,因为往往是保姆开门,那么应该访问哪位家庭成员呢?这些,调研人员都要给出明确规定。例如百事可乐抽出350家庭做测试称为样本。从XXX地区会计师协会抽出90名会计师作调查,称为样本。
抽样框
抽样框是代表调研总体对象的样本列表。完整的抽样框中,每个调研对象应该出现一次,而且,只能出现一次。完整的抽样框是存在的。例如:“沪深两地股票上市公司”,就是完整抽样框,并且每天与我们见面。再如:在为工商银行研究储户对银行提供新服务的需求时,可以很方便地获取储户的数据库,作为相当完整的抽样框。然后,经过编程就能命令计算机完成简单随机抽样。这当然是最理想的抽样。但大部分情况下,调研人员无法获得完整的抽样框,只能用别的代替,如黄页簿、工商局企业登记库、行业年鉴等。抽样框的不完整,导致了抽样框误差的产生,但我们可以通过保证样本的代表性,使误差在合理的范围之内。
样本量
样本量是从调查总体中抽取调查样本的个数总量。调查总体越大,调查样本数量越大;调查总体越小,调查样本数量越小。同样的调查总体规模,调查样本量越多,调研精度越高。在最理想的状况下,统计精度只是与样本量的平方根成正比。而对于一个特定的抽样调研,在达到一定的样本量后,再增加样本量对提高它的统计准确度就起不了多大的作用,而现场调研的费用却成倍增加,实在是不合算。例如,要研究爱斯基摩人是什么肤色的人种,只要抽取几个样本就足够了,但是,如果要研究他们的平均身高,几个样本就太不合理。
样本量的确定是控制在必要的最低限度。但最低限度的样本量到底是多少,对这个问题的回答还是应该回到我们的调研目的,只要样本量足够让调研者发现问题或获知解决问题的信息,这是我们希望的最低限度样本量。
精确度
精确度是用以衡量估计值精确可依赖的程度,如在物价统计中,经济家若认为物价如上升0.02将影响经济决策,则精确度即须订在0.02。
准确度
准确度是衡量母全体特性与实际母全体特性间之差异。两者之差异愈小,代表准确度愈高。
抽样误差
总体的异质性和样本与总体范围的差异性,在用样本的统计值推算总体的参数值时总会有偏差,这种偏差就是抽样误差,抽样误差可用统计方法估计。
容忍误差
在抽样调查时,调查者所要求的精确度不是百分之百,而是在设定母群体平均数上下各多少百分点作为误差容忍范围,称为容忍误差。
信赖水准
信赖水准是调查分析人员在用样本估计数推论母群体大小时,正确估计的概率有多少的数值。如果信赖水准是95﹪,即正确估计概率为95%,调查者以此来表示其正确估计程度。
置信水平与置信区间
置信水平是指总体参数值落在样本统计值某一正负区间内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围.以样本估计数推论母群体大小时,正确估计的概率有多少。信赖水准是95﹪,即正确估计概率为95%,调查者以此来表示其正确估计程度。
简单随机抽样
简单随机抽样为其它各种随机抽样方法的基础,在抽样时,母群体中每一个抽样单位被选为样本之机率相同,母体中全部个体,完全采取均匀机率分布抽取样本,使每一个体被抽出之机率均为己知并且相等。随机抽样具有健全之统计理论基础,可用机率理论加以解释,是一种客观而科学的抽样方法,在市场调查中通常都用随机抽样。
双重随机抽样
先对母群体做一次初步抽样,搜集一些有关母群体之信息,根据所获得之信息,再做一次比较精密之抽样。通常对母群体认识极为贫乏之下,可用本法。第一次抽样,因所要信息较少,故样本数通常较大。第二次进行比较深入调查,样本数较小。
逐次随机抽样
此方式之抽样,开始只抽取少量样本,根据此少量样本之结果来决定是否接受某一假设,或应继续抽取样本,直到能够决定接受或摈弃假定为止。逐次抽样法应是费用较低且实用的一种方法。
分段随机抽样
先由一母体中抽取n个单位随机样本(PUS),再由PUS中抽出m个单位(SSU),就SSU进行调查,称二段抽样。若续从SSU抽取更小单位进行调查,称为三段抽样。三段以上,称多段调查。分段抽样之调查费用节省且处理方便,应用范围很广,且有限母群体或无限母群体,均可采用。
 
01:二段抽样法样本数分配示例表
 
类型
第一阶段
第二阶段
母体数
抽样率
样本数(a)
母体数
抽样率
样本数(b)
40
12.5%
5
5
40.0%
2
40
25.5%
10
10
20.0%
2
49
50.0%
20
20
42.5%
8
 
分层随机抽样(聚类抽样)
是将总体按照某种标准划分为一些子群体,每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群中所有个体合起来作为总体的样本。
分层的基础有赖抽样设计者之经验及判断。理想上分层之数目愈多愈好。因为层数愈多,每层之样本单位愈相似,样本估计值之精确度愈高。但成本与机率之考虑,层数不宜超过六层。
 
01:分层抽样图标
 
       系统随机抽样
将母群体之每单位加以编号,先计算样本区隔,在1~N/n间随机选出一个号码作为第一个样本单位,依定距循序抽出样本。此法优点,抽样操作简单。有发生抽样误差的可能为其缺点。
复合随机抽样
将母体分为若干层,用系统抽样法选取样本。因此有分层抽样及系统抽样优点。
非随机抽样
在抽样时,抽样单位被选为样本之机率为不可知。
便利随机抽样
调研人员根据方便在样本的选择时,只考虑到接近样本或衡量便利,任意选择样本。例如:在街头上任意找几个人询问其对某电信业务的看法和印象。收集和处理数据项目目标及调研计划经批准之后,实质性调研工作就开始了。
配额随机抽样
按照调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样式,样式中各层(类)所占比例与他们在总体中所占比例一样。而且定额抽样中各层样本是非随机抽取的。此方法因调查偏好及方便,丧失精确度。配额抽样对发现细分市场很有好处,对同一总体分组的标准,应因具体的调研项目和目标不同而不同,要具体问题具体对待。抽样配额分配表,此配额由访问员选定,不做任何修正。
 
02:按照消费者的收入和年龄特征进行配额随机抽样示例表
 
年龄
收入
30岁以下
35岁以下
合计
1000元以下
21%
27%
48%
1000元以上
12%
40%
52%
合计
33%
67%
100%
 
判断随机抽样
在母体的结构体极不相同且样本数很小的时候,根据抽样设计者之判断来选择样本个体,设计者必须对母体有关特征具有相当了解。在编制物价指数时,有关产品项目选择及样本地区之决定,即采用判断抽样。
雪球随机抽样
先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。例如单亲家庭计抽样属之。
重点抽样
在整体中选择占重要地位或占绝大比重的个体作为样本调查。
典型抽样
在整体中选择具有一定典型意义或代表性的个体作为样本。
分群抽样
调查对象整体可分为若干相似的群体,可选择个别的群体作为样本来源。
例如:XX牌清洁剂做产品测试,在某个城市,每个城区各随机抽取2个街道,每个街道又随机抽取3个居委会,每个居委会又随机抽取3个居民小区,每个小区又随机抽取15户家庭进行访问。这不仅使得调研实施非常方便,而且保证了样本的足够分散、随机。
同样本调查(追踪调查)
同样本调查又称追踪调查,是企业为了研究同一对象发展变化情况,利用同一样本作长期的观察的调查。通过集中精力对样本变化分析可以从中得出相关规律。
在研究消费者品牌忠诚度或消费者购买行为时,一般经常会使用这种方式。
轮换样本调查
轮换样本调查是指每次调查为观察母体各方面不同情况,采取换取部份样本手法,得到母体总体变化趋势的调查方式。
企业如果维持部份样本可以达到调查的连续性及稳定性,同时又可降低调查成本。
分裂调查
分裂调查是指企业在每次调查采用的方式是一部份采用新样本(重复调查),一部份采用相同样本(同样本调查)的调查方式。