■出售外链〓提升排名┿【QQ:1012189958】 1号站 1号站平台 1号站娱乐 一号站平台 拉菲娱乐 拉菲2 拉菲娱乐 万达平台 万达平台 万达平台 万达平台 万达娱乐 万达娱乐 万达娱乐 东森平台 东森平台 东森平台 东森娱乐 东森娱乐 东森娱乐 杏彩平台 杏彩平台 杏彩平台 杏彩平台 杏彩娱乐 杏彩娱乐 杏彩娱乐 杏彩娱乐 杏彩娱乐 凤凰平台 凤凰平台 凤凰平台 凤凰平台 凤凰平台 凤凰娱乐 凤凰娱乐 凤凰娱乐 凤凰娱乐 凤凰娱乐 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 娱乐天地 世爵平台 世爵平台 世爵平台 世爵平台 翡翠平台 世爵娱乐 世爵娱乐 世爵娱乐 世爵娱乐 翡翠平台 翡翠平台 翡翠平台 翡翠娱乐 翡翠娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 畅博娱乐 华宇平台 华宇平台 华宇平台 华宇平台 华宇平台 华宇平台 华宇平台
当前位置:主页 > 调查 >

调查数据的加权处理技术

  • 发布时间:2017-08-25 10:30
  • 来源:网络整理

调查数据的加权处理技术

很多人在进行统计分析和市场研究的时候,都涉及到对数据进行加权的问题,这是一个搞数据分析和从事市场研究的人都会碰到的问题,需要大家正确理解并解释,并采用合理的操作技术和处理方法。

什么是加权呢?  简单地说,就是要“让一些人变得比另一些人更重要!”

要能够比较好的理解加权,首先你要了解抽样设计,特别是设计权数:每个样本单位所代表的被调查总体的单位数。设计权数由抽样设计决定,用Wd表示。

设计权数Wd=1/入样概率;

入样概率:在抽样设计中,如果一个样本的入样概率=1/50,那么该样本的设计权数=50。也就是说,这个样本代表了总体中的50个单位。

    关于自加权抽样设计:如果所用样本的设计权数是相等的,那么这样的抽样设计是自加权的。也就是说,总体中的每个单元被抽中的可能性相等,具有等可能性、具有相等的入样概率。如果是自加权的,在总体均值、比例估计时不用考虑设计权数,对总量的估计只要扩大样本。

满足自加权的抽样设计:等概率抽样、简单随机抽样、系统抽样、分层抽样—各层大小成比例,每层内简单随机抽样、多阶段抽样—最后阶段等概率,其它阶段与单位大小成比例概率抽样。

不等概率抽样往往不满足自加权,对于不等概率抽样,正确使用设计权数就尤为重要了!


下面我们看看如何进行加权处理!

加权:通过对总体中的各个样本设置不同的数值系数(即加权因子-权重),使样本呈现希望的相对重要性程度;

基本加权等于:设计加权=某个变量或指标的期望比例/该变量或指标的实际比例;

调查数据的加权处理技术

什么情况下要进行加权?

情景1:我们在抽样调查得到的样本结构与总体人口统计结构状况不相符,我们可以通过加权来消除/还原这种结构差异,达到纠偏的目的;

例如,在城市和农村各调查300样本,城市与农村人口比例“城市:农村=1:2”(假设),在分析时我们希望将城市和农场看作一个整体,这时候我们就可以赋予农村样本一个2倍于城市样本的权重;

情景2:除了人口统计结构,有时候我们在调查样本的某些变量或指标上样本的代表性可能也会相对总体的实际状况过高/过低,此时,需要加权进行调整;

这类不匹配大多是我们“故意”而为(通过“追加”样本实现),比如在配额抽样的时候,设置配额要求某类被访者对某产品的使用者必须达到50%,但实际情况是总体市场中实际使用者仅有10%;
有时,则是“非情愿”的出现,比如设置了能反映总体的配额比例,但实际操作却出现了比例偏高/偏低;

情景3:在样本组配额实验设计中,进行不同子总体对比检验,也会通过加权来调整不同组间的样本属性不相匹配的情形(通常设有相同的配额,但执行有可能会出现差异);通常,加权对结果产生的差异很小,更多的是对结果从准确度上进行修饰;

情景4:所测试样本出现了较多的缺失值,需要加权来纠正结果;对于面向特定客户的专项研究,在调查前基本都协议有要完成的样本量,故这种情形较少;


加权方法:

采用因子加权:对满足特定变量或指标的所有样本赋予一个权重,通常用于提高样本中具有某种特性的被访者的重要性;例如,研究一种香烟的口味是否需要改变,那么不同程度吸食者的观点也应该有不同的重要性对待:例如:重度吸食者=3,经常吸食者=2,偶尔/不抽烟=1,记住:实际应用时候,如果“经常/偶尔”的基数足够大,往往单独分析,不进行加权处理;

采用目标加权:对某一特定样本组赋权,以达到们预期的特定目标;例如:我们想要:品牌A的20%使用者 = 品牌B的50%使用者;或者品牌A的20%使用者 = 使用品牌A的80%非使用者;

采用轮廓加权:多因素加权,因子/目标加权不同(一维的),轮廓加权应用于对调查样本相互关系不明确的多个属性加权;面对多个需要赋权的属性,轮廓加权过程应该同时进行,以尽可能少的对变量产生扭曲;

调查数据的加权处理技术

我们应该知道,无论加权的动机是什么,但操作过程是一样的:

依不同属性变量/指标将样本分为多个组(加权组),然后根据所希望各个组代表的个体规模赋予不同的权重;即明确分析子集/样本组,通常,经常以人口结构变量、地域变量作为分类指标;明确各个分析子集/样本组中个体的代表性强弱(权重);