Estimation and Sampling Theory 估计与抽样理论
本文最后更新于102 天前,其中的信息可能已经过时,如有错误请留言

抽样方法

简单随机样本

抽样方法定义了如何选择样本。最基本的是简单随机样本(SRS):
若总体中每个元素被选中的概率相等,且每个大小为 n 的可能样本被选中的可能性相同,则该样本为简单随机样本。
示例:假设有 10 个信封,每个标有唯一字母(A-J),其中 4 个装有折扣券。研究人员无放回地抽取 4 个信封。若每组 4 个信封被选中的概率相等,则这是一个 SRS。有放回抽样允许同一个信封被多次抽取,以确保独立性。

多数现实样本并非简单随机样本

在应用研究中,获取真正的简单随机样本通常不切实际。即使在狭窄定义的场景中(如从单一大学抽取学生),参与者也未必能真正代表目标总体的随机子集。因此,研究人员常依赖其他抽样策略,以下概述几种关键方法:

分层抽样

在分层抽样中,总体按已知特征(如地理位置、收入阶层或临床诊断)划分为互斥的子组(层),然后从每个层中随机抽样。这比简单随机抽样更高效,尤其当某些子组较罕见时。
示例:在评估工业污染健康影响的环境研究中,从整个城市随机抽样可能导致居住在污染源附近的参与者极少。为更好理解暴露影响,研究人员可将总体分为居住在工业区附近和较远的群体,然后对高暴露区域的个体进行过采样(有意过度代表)。

雪球抽样

当目标总体隐蔽或难以接触时,常使用雪球抽样。该方法从识别少量合格参与者开始,然后请他们推荐其他符合条件的人,如此递归直至达到所需样本量。
示例:在城市无家可归者研究中,研究人员可能先访谈少量街头流浪者,再请每位参与者推荐其他愿意参与的人,使样本通过人际网络扩展。
雪球抽样常用于研究流动性强或难以触及的群体,但其引入抽样偏差 —— 倾向于过度代表某些社交网络。

方便抽样

方便抽样指选择研究人员容易接触到的参与者,无论其代表性如何。这可能是心理学和社会科学中最常见的抽样形式。
示例:许多研究招募修读入门课程的本科生,这不仅将样本限制在狭窄的人口特征中,学生还可能因个人兴趣自行选择参与研究,引入更多偏差。
方便样本并非本质无效,但其推广性通常有限。研究人员必须仔细考虑其中的权衡,并在报告结果时透明说明抽样方法。

尽管简单随机样本仍是推断的黄金标准,但实际中很少能实现。研究人员常需在其他抽样方案中选择,每种方案各有优劣。认识抽样对推断的影响是开展可靠且可解释的统计分析的关键。

样本非随机是否重要?

情况并非绝对:有偏样本确实可能扭曲结论,但并非所有抽样偏差都有问题。

在某些情况下(如分层抽样),偏差是故意且已知的。这些技术通过确保子组的充分代表性,常能改善研究设计。此外,存在正式方法(本课程不涉及)可对这类偏差进行统计调整,使其影响降低。

核心观点是:随机抽样是手段而非目的。仅当有偏抽样方法对所研究的特定心理或科学现象引入扭曲时,才会成为问题。

示例:两项测量工作记忆容量的研究中,研究 1 从所有周一出生的人中随机抽样,研究 2 从单一国家人口中随机抽样。尽管研究 1 的限制看似随意,但尚无证据表明出生日期与工作记忆相关;而研究 2 可能引入无意的文化、教育或语言偏差 —— 这些因素可能影响记忆任务表现。矛盾的是,就所研究的认知特质而言,研究 1 的样本可能更能代表全球人口。

由此得出两条重要建议:

  • 设计研究时,仔细考虑希望推广到的总体,并努力适当抽样。
  • 评估使用方便样本的研究时,仅当能明确说明抽样程序如何引入相关偏差时,才进行实质性批判。

总体参数与样本统计量 Population Parameters and Sample Statistics

某概率分布(通常是正态分布),其总体均值 \(\mu = 100\),总体标准差 \(\sigma = 15\)。这些值称为总体参数,描述完整分布的特征。

现从该分布中随机抽取 \(n = 100\) 人的样本,可能得到如下数据:\(102, 97, 88, 110, 93, …, 105, 99, 91\) 从该样本可计算样本统计量,如样本均值 \(\bar{x} = 98.5\) 和样本标准差 \(s = 15.9\)。由于抽样过程中的随机变异,这些值通常与真实总体参数略有差异。

样本统计量是总体参数的估计量:

  • 总体均值 \(\mu\) 由样本均值 \(\bar{x}\) 估计;
  • 总体方差 \(\sigma^{2}\) 由样本方差 \(s^{2}\) 估计。

大数定律 The Law of Large Numbers

当样本量 \(N \to \infty\) 时,样本均值 \(\bar{X}_{N} \to \mu\)(即真实总体均值)。

在前面的例子中,\(N = 100\) 的样本均值与真实总体均值较为接近。但在许多应用中,需要更高的精度。
自然的解决方案是收集更大的样本。例如,从 \(\mu = 100\)、\(\sigma = 15\) 的总体中抽取 \(N = 10,000\) 人的智商样本,其样本均值和标准差很可能非常接近总体值。

均值的抽样分布和其他变量的抽样分布Sampling Distribution of the Mean

“样本平均值”本身也是一种随机变量,而这种随机变量的分布,就叫做样本均值的抽样分布

假设你有一个很大的总体,比如一整个城市学生的数学成绩(太多了,不可能全统计)

每次:

  • 随机挑出 5 个学生(这是你的“样本”)
  • 记录这 5 个人的平均分
  • 然后把样本扔掉,重新再挑另外 5 个人,再算一个平均分

不断重复这个过程,比如上千次,就会得到很多个样本平均数,构成样本均值的抽样分布

其他统计量的抽样分布:
抽样分布不仅限于均值。任何样本统计量(如中位数、最大值或方差)都有对应的抽样分布,描述该统计量在重复样本中的变化。例如,若每次实验记录 5 个抽样个体的最大智商,则最大值得抽样分布往往右偏,因为最大值通常超过总体均值

中心极限定理(CLT)

统计学的基本结论之一是中心极限定理(CLT),它描述了样本量增大时均值抽样分布的行为。

定理 1 蕴含三个关键事实:

  1. \(\bar{X}_{N}\) 的抽样分布以真实均值 \(\mu\) 为中心;
  2. 抽样分布的标准差称为标准误(SE),即 \(SE = \frac{\sigma}{\sqrt{N}}\);
  3. 当 N 增大时,无论原始总体分布形状如何,抽样分布近似正态。

这解释了为何正态分布在统计推断中如此普遍:即使总体非正态,随着 N 增大,均值的抽样分布仍趋向正态。这一性质使我们能利用正态分布近似构造置信区间和进行假设检验。

样本均值,样本方差估计总体均值,总体标准差(贝塞尔修正)

1. 估计总体均值

比如想知道整个大班学生的平均成绩(总体均值\(\mu\)),我们就抽 100 个学生(样本)来考试,算出这 100 人的平均分(样本均值\(\bar{X}\),比如 98.5 分)。这个样本平均分就是对总体平均分的最佳猜测,这就是 “点估计”

2. 估计总体标准差(为什么要 “贝塞尔校正”)

因为从总体中抽样这个过程会让数据进一步集中,而低估总体方差(因为方差越大说明数据的离散程度越大)。所以为了增大样本方差,应该处以一个比n更小的数字,所以选择n

用样本算标准差时,如果直接除以样本量n,会系统性地低估总体的真实变异。为了纠正这个偏差,就需要 “贝塞尔校正”—— 把分母从n改成\(n-1\)

为什么除n-1而不是n-2、3…

因为用除以n-1的样本方差估计总体方差是无偏估计,并不说完全没有偏差,而是满足下面这个式子ES ^2..

例题:

学习笔记如有侵权,请提醒我,我会马上删除
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇