抽样分布定义

  |   2024年3月13日

什么是抽样分布?

抽样分布是从特定总体中抽取的大量样本获得的统计量的概率分布。给定总体的抽样分布是总体统计中可能出现的一系列不同结果的频率分布。

统计学中,总体是从中抽取统计样本的整个池。总体可以指整个群体的人、物体、事件、医院就诊或测量结果。因此,总体可以说是对按共同特征分组在一起的受试者的聚合观察。

  • 抽样分布是通过从较大总体中重复抽样得出的统计数据。
  • 它描述了统计数据的一系列可能结果,例如某些变量的平均值或众数,因为它确实存在于总体中。
  • 研究人员分析的大部分数据实际上来自样本,而不是总体。

了解抽样分布

院士、统计学家、研究人员、营销人员、分析师等提取和使用的大量数据实际上是样本,而不是总体。样本是总体的子集。例如,一位医学研究人员想要将 1995 年至 2005 年在北美出生的所有婴儿的平均体重与同一时间段内在南美出生的婴儿的平均体重进行比较,但无法在合理的时间内得出整个北美人口的数据。十年间发生了超过一百万次分娩。相反,他只会使用每个大陆 100 个婴儿的体重来得出结论。以200名婴儿的体重为样本,计算出的平均体重为样本平均值。

现在假设医学研究人员不是从各大洲仅抽取 100 个新生儿体重的样本,而是从一般人群中重复随机抽取样本,并计算每个样本组的样本平均值。因此,对于北美,他提取了美国、加拿大和墨西哥记录的 100 个新生儿体重数据,如下:来自美国选定医院的 4 个 100 个样本、来自加拿大的 5 个 70 个样本和来自墨西哥的 3 个 150 条记录,总计1200 名新生婴儿的体重分为 12 组。他还收集了南美洲12个国家各100个出生体重的样本数据。

每个样本都有自己的样本均值,样本均值的分布称为样本分布。

为每个样本集计算的平均权重是均值的抽样分布。不仅仅是可以根据样本计算平均值。其他统计数据,例如标准差、方差、比例和范围可以根据样本数据计算。标准差和方差衡量抽样分布的变异性。

总体中的观测值数量、样本中的观测值数量以及用于抽取样本集的程序决定了抽样分布的变异性。抽样分布的标准差称为标准误差。虽然抽样分布的平均值等于总体平均值,但标准误差取决于总体的标准差、总体规模和样本规模。

了解每个样本集的均值彼此之间以及与总体均值的分布程度将表明样本均值与总体均值的接近程度。抽样分布的标准误差随着样本量的增加而减小。

特别注意事项

总体或一组数字样本将服从正态分布。然而,由于抽样分布包括多组观测值,因此它不一定具有钟形曲线形状。

按照我们的例子,北美和南美婴儿的人口平均体重呈正态分布,因为有些婴儿体重不足(低于平均值)或超重(高于平均值),而大多数婴儿介于两者之间(在平均值附近) )。如果北美新生儿的平均体重为 7 磅,则北美记录的 12 组样本观察中每组的样本平均体重也将接近 7 磅。

但是,如果将 1,200 个样本组中每个样本组中计算出的每个平均值绘制成图表,则所得形状可能会导致均匀分布,但很难确定地预测实际形状会是什么。研究人员从超过一百万体重数据的人群中使用的样本越多,图表就越开始形成正态分布。

推荐阅读

相关文章

衡量股价波动性的最佳指标是什么?

在选择投资证券时,交易者会查看其历史波动性,以帮助确定潜在交易的相对风险。许多指标衡量不同背景下的波动性,每个交易者都有自己的最爱。深入了解波动性的概念及其确定方式对于成功投资至关重要。波动性最简单的定义是价格变动程度的反映。价格大幅波动(触及新高和新低或波动不稳定)的股票被认为是高度波动的。

你是投资还是赌博?

赌博被定义为在偶然事件上押注——即使结果是随机的,通常预期回报为负。然而,当考虑交易时,赌博呈现出比定义所呈现的更为复杂的动态。许多交易者在不知不觉中进行赌博——交易的方式或原因与市场上的成功完全相反。在本文中,我们将探讨赌博渗透到交易实践中的隐藏方式,以及可能促使个人进行交易(也可能是赌博)的刺激因素。

前 5 名基金家族

如今有如此多不同的投资选择,以至于很难知道从哪里开始。仅在美国,就有 800 个基金家族投资于美国开放式共同基金和交易所交易基金(ETF),投资额约为 23.2 万亿美元。然而,某些基金系列始终提供更低的成本、更多的品种和更多的创新选择。虽然有很多优秀的选择,但这五个领先的基金家族拥有大多数人想要的东西。

新兴市场与前沿市场的区别

每个投资者都知道低买高卖的普遍建议。但那些寻求巨额资本回报的人可能不得不等待数月或数年才能看到他们的资金呈指数级增长,尤其是在投资 IBM Corp.、可口可乐公司和微软等蓝筹股时。因此,激进的投资者可能会决定投资在欠发达的国际市场交易的小型公司的股票,以获取更大的资本收益。

2008 年金融危机如何影响银行业

在短期内,2008 年的金融危机影响了银行业,导致银行因抵押贷款违约而蒙受损失、银行同业拆借冻结以及对消费者和企业的信贷枯竭。从长远来看,金融危机通过巴塞尔协议 III 在国际和美国通过多德-弗兰克华尔街改革和消费者保护法案催生了新的监管行动,从而影响了银行业。重点金融危机后采取的措施旨在保护银行及其成员。

评估董事会

您可以从查看公司董事会在其年度报告中的披露中学到很多东西,但需要时间和知识来了解反映在董事会组成和职责中的公司治理质量水平的线索。理论上,董事会对股东负责,应该对公司的管理层负责。但在许多情况下,董事会已成为首席执行官 (CEO) 的仆人,而首席执行官通常也是董事会主席。

相关词条

当前收入定义

什么是当前收入?当期收入是指近期至短期内预期的现金流量。当前收益投资是一种投资策略,旨在识别支付高于平均水平的分配的投资。常见的当前收入来源包括股息和利息支付。股息是公司定期向股东支付的现金。整个风险范围的投资组合可以专注于当前的收入投资策略,专注于产生短期收入(而不是长期增长)。

SEC 表格 F-3

什么是 SEC 表格 F-3? SEC F-3 表格是一种监管表格,用于注册符合特定标准的外国私人发行人使用的证券。如果适用,此表格,也称为“注册声明”,必须根据 1933 年证券法向美国证券交易委员会(SEC) 提交。重点摘要外国发行人使用 SEC F-3 表格向证券交易委员会 (SEC) 注册证券。

可转债套利

什么是可转债套利?可转换债券套利是一种套利策略,旨在利用可转换债券与其标的股票之间的错误定价。该策略通常是市场中性的。换句话说,套利者通过可转换债券和标的股票的多头和空头头寸的组合,寻求以最小的波动性产生一致的回报,而不受市场方向的影响。

债券基金定义

什么是债券基金?债券基金,也称为债务基金,是一种集合投资工具,主要投资于债券(政府、市政、公司、可转换债券)和其他债务工具,例如抵押贷款支持证券(MBS)。债券基金的主要目标通常是为投资者创造月收入。大多数投资者都可以使用债券共同基金和债券交易所交易基金(ETF)。摘要债券基金主要投资于固定收益证券的投资组合。

可转换债券定义

什么是可转换债券?可转换债券是一种产生利息的固定收益公司债务证券,但可以转换为预定数量的普通股或股票。从债券到股票的转换可以在债券有效期内的特定时间进行,通常由债券持有人自行决定。作为一种混合证券,可转换债券的价格对利率、标的股票价格和发行人信用等级的变化特别敏感。

置信区间定义

什么是置信区间?在统计学中,置信区间是指总体参数在一定比例的时间内落在一组值之间的概率。要点置信区间显示参数落在平均值附近的一对值之间的概率。置信区间衡量抽样方法的不确定性或确定性程度。它们通常是使用 95% 或 99% 的置信水平构建的。了解置信区间置信区间衡量抽样方法的不确定性或确定性程度。