系统抽样:它是什么,以及如何在研究中使用它?

  |  

什么是系统抽样?

系统抽样是一种概率抽样方法,它从一个较大的总体中,按照一个随机的起始点,以固定的周期性间隔抽取样本成员。这个间隔称为抽样间隔,可以通过总体规模除以所需的样本规模来计算。尽管样本总体是预先选定的,但如果周期性间隔是预先确定的,且起始点是随机的,那么系统抽样仍然被认为是随机的。

如果对一定规模的大量人群进行正确的系统抽样,可以帮助研究人员(包括市场营销和销售专业人员)获得关于一大群人的代表性结果,而无需接触到他们中的每一个人。

要点总结

  • 系统抽样是一种概率抽样方法,它从较大的总体中按固定的周期间隔抽取随机样本。
  • 固定的周期性间隔,称为抽样间隔,是通过将总体规模除以所需的样本规模来计算的。
  • 该方法的优点包括消除聚集选择现象和数据污染概率低。
  • 缺点包括特定模式的过度代表或代表不足,以及数据被篡改的风险更大。
  • 系统抽样主要有三种类型:随机系统抽样、线性系统抽样和圆形系统抽样。

理解系统抽样

由于对总体进行简单随机抽样效率低下且耗时,统计学家会转向其他方法,例如系统抽样。通过系统方法选择样本量可以快速完成。一旦确定了固定的起始点,就可以选择一个固定的区间来方便地选择参与者。

当数据被操纵的风险较低时,系统抽样优于简单随机抽样。如果数据被操纵的风险较高,研究人员可以通过操纵区间长度来获得预期结果,那么简单随机抽样则更为合适。

系统抽样因其简便性而受到研究人员和分析人员的青睐。研究人员通常假设结果能够代表大多数正常总体,除非每隔n个数据样本中都存在不成比例的随机特征(这种情况不太可能发生)。换句话说,总体需要展现出一定程度的自然随机性,并符合所选的度量标准。如果总体具有某种标准化的模式,那么意外抽取到非常常见案例的风险就更加明显。

与其他抽样方法一样,系统抽样也需要在选择参与者之前先确定目标人群。目标人群可以根据符合研究目的的任何特征来确定。一些选择标准可能包括年龄、性别、种族、居住地、教育程度或职业。

统计推断中,抽取总体样本的方法有很多种。系统抽样是随机抽样的一种形式。

创建系统样本的步骤

您可以按照以下步骤创建系统样本:

  1. 明确目标人群 这是您正在进行抽样的群体。
  2. 确定样本量 为了对总体有一个较为全面的了解,你需要从总体中抽取多少样本?
  3. 给每个成员分配一个号码:如果你要观察的群体由 10,000 人组成,那就让他们排成一列,并给他们编号。
  4. 确定采样间隔 这可以通过将总体规模除以所需的样本规模来实现。
  5. 选择一个起点 这可以通过选择一个随机数来实现。
  6. 确定样本成员 如果起始点为 15,采样间隔为 100,则样本的第一个成员将是 115,依此类推。

系统抽样示例

举一个系统抽样的例子,假设在一个拥有10000人的总体中,统计学家每隔100人抽取一个样本。抽样间隔也可以是系统性的,例如每隔12小时抽取一个新的样本。

再举一个例子,如果你想用系统抽样法从50000人的总体中随机抽取1000人,那么所有潜在的参与者都必须列在一个名单上,并选择一个起始点。名单形成后,从选定的起始点开始计数,每隔50人抽取一个作为参与者,因为50000÷1000=50。

例如,如果选定的起始点是 20,则会选择列表中的第 70 个人,然后是第 120 个人,依此类推。当到达列表末尾且需要更多参与者时,计数将循环回到列表开头以完成计数。

要进行系统抽样,研究人员首先必须知道目标人群的规模。

系统抽样的类型

一般来说,生成系统样本的方法有三种:

  • 系统随机抽样:系统抽样的经典形式,其中在预定的时间间隔内选择对象。
  • 线性系统抽样:不是随机选择抽样间隔,而是按照线性路径创建跳跃模式。
  • 循环系统抽样:样本在结束之后从同一点重新开始。

系统抽样与整群抽样

系统抽样和整群抽样的区别在于它们从总体中抽取样本点的方式。整群抽样将总体划分成若干个群,而系统抽样则使用从总体中抽取的固定间隔来创建样本。

系统抽样从总体中随机选择一个起始点,然后根据总体的大小,从总体中固定的时间间隔内抽取样本。整群抽样将总体划分为若干群,然后从每个群中抽取一个简单随机样本。

与其他抽样方法相比,整群抽样的精确度较低。然而,它可以节省样本获取成本。整群抽样是一种两步抽样程序。当难以获得总体的全部样本时,可以使用整群抽样。例如,要获得杂货店所有顾客的名单进行访谈可能比较困难。

然而,我们可以先随机抽取一部分门店作为样本,这是流程的第一步。第二步是对这些门店的顾客进行随机抽样访谈。这是一个简单的手动流程,可以节省时间和金钱。

系统抽样的局限性

统计学家在进行系统抽样时必须考虑的一个风险是,用于抽样间隔的列表的组织方式。如果列表中的总体呈周期性排列,且与抽样间隔相匹配,则所选样本可能存在偏差。

例如,某公司的人力资源部门想抽取一部分员工作为样本,询问他们对公司政策的看法。员工被分成20人一组,每组由一名经理负责。如果用于抽取样本的名单是按团队聚集排列的,那么根据抽样间隔的不同,统计人员可能会只抽到经理(或者根本抽不到经理)。

系统抽样有哪些优势?

系统抽样操作简便,易于理解,因此通常受到研究人员的青睐。其核心假设是,抽样结果能够代表大多数正常总体,从而保证了对整个总体的均匀抽样。

此外,由于其流程特性,系统抽样相比其他抽样方法具有更高的控制程度。系统抽样的风险也较低,因为数据被污染的可能性很小。

系统抽样的缺点是什么?

系统抽样的主要缺点在于需要知道总体规模。如果不知道总体中参与者的具体人数,系统抽样就无法有效进行。例如,如果统计学家想要调查特定地区无家可归者的年龄,但无法准确获取该地区无家可归者的数量,那么他们就无法获得总体规模或起点。另一个缺点是,总体需要具有一定的自然随机性,否则抽取到相似个体的风险就会增加,从而违背抽样的目的。

整群抽样和系统抽样有何区别?

整群抽样和系统抽样的区别在于它们从总体中抽取样本点的方式。整群抽样将总体划分为若干群,然后从每个群中抽取一个简单随机样本。系统抽样则先从总体中随机选择一个起始点,然后根据总体的大小,从总体中固定的区间抽取样本。整群抽样虽然成本可能更低,但其抽样误差通常比系统抽样更大。

归纳总结

抽样是得出关于一大群人、物品或其他感兴趣事物结论的有效方法。系统抽样是最常用的方法之一,因为它比其他方法更经济、更省时。当然,它并非完美无缺。但是,如果您拥有一个数据量庞大且各区间之间没有明显规律的数据集,系统抽样能够以相对较低的成本提供可靠的样本。

推荐阅读

相关文章

特斯拉电池业务的经济学

特斯拉 ( TSLA ) 是一家总部位于加州帕洛阿尔托的美国汽车和能源公司。该公司生产电动汽车和太阳能电池板以及电池和航空产品。2018 年末,美国证券交易委员会的一场诉讼提高了特斯拉的知名度。诉讼称,特斯拉首席执行官埃隆·马斯克在推特上就公司私有化的可能性发表了“虚假和误导性言论”。

无法申报销货成本 (COGS) 的行业

一般来说,美国国税局(IRS) 允许公司扣除用于制造或购买其业务销售产品的商品成本。出于会计和税务目的,这些列在销售商品成本 (COGS) 的条目行项目下。对于生产流程较长且销货成本较高的制造或采矿行业的公司来说,这种减少可能是一个重大好处。

什么是第三轮薪资保护计划 (PPP) 资金?

圆形的立法资金到期日1 HR 748 - CARES 法案3490亿美元2020年4月16日2 HR 266 - PPP 和医疗保健增强法3100亿美元2020年8月8日3 HR 133 - 综合拨款法,

10 位最著名的对冲基金经理

对冲基金经理经常被媒体对其巨额薪水的审查、投资者对高得离谱的费用(通常是“二加二十”)的回击、最近的糟糕表现以及政府在披露和监管方面的尝试所困扰。尽管看似无法克服的负面头条新闻和他们的薪水保证的阶级斗争,但那些始终处于顶端的对冲基金经理(并且在对冲基金行业中存在明显的等级制度)是金融业的明星。

拥有高资本支出 (CapEx) 的公司有哪些例子?

资本支出或资本支出是公司为确保盈利未来而投资于自身的金额。例如,Verizon 和 AT&T 等电信巨头正在大力投资无线网络基础设施,以支持 5G 的推出。资本支出比率是投资者用来评估公司未来前景的衡量标准。该比率显示了一家公司在支付其经营活动费用和向股东派发股息后,为其资本支出融资的舒适程度。

简单随机样本:优点和缺点

统计学是应用数学的一个分支,它通过研究较小的事件或对象来帮助我们了解大型数据集。简而言之,您可以通过检查较小的样本来推断大量人口。统计分析通常用于识别许多不同领域的趋势,包括商业和金融。个人可以利用统计研究的结果对他们的资金、业务和投资做出更好的决策。研究人员通常从一个简单的随机样本开始。

相关词条

非经常性损益定义

什么是非经常性损益?非经常性损益是指一次性、极不频繁的利润或费用,不来自公司正常的业务运营。这些一次性项目在公司的损益表中单独报告(扣除所得税后),并且不计入每股收益(EPS) 计算中。摘要非经常性项目是指公司财务报表中不经常出现或不寻常的条目。

营业亏损 (OL):定义、计算方法和原因

什么是营业亏损(OL)?当公司的营业费用超过毛利(或服务型公司的收入)时,就会出现营业亏损。公司的营业利润是扣除利息和税金前的利润。利息和税金不像销售成本、销售、一般和管理费用那样被视为营业费用。通常,公司的收入足以支付营业费用并实现营业利润。

综合纳税申报表

什么是综合纳税申报表?合并纳税申报表是附属公司集团的企业所得税申报表,这些公司选择在单一申报表上报告其合并纳税义务。纳税申报表的目的是让通过许多合法附属机构经营业务的公司被视为一个单一实体。合并的常见项目包括资本收益、净亏损和某些扣除额,例如慈善捐款或净营业亏损。

持续增长率 (SGR):定义、含义和局限性

什么是可持续增长率(SGR)?可持续增长率(SGR)是公司或社会企业无需通过额外股本或债务为增长融资即可维持的最大增长率。换句话说,它是公司在不从外部借款的情况下利用自己的内部收入实现增长的速度。 SGR 涉及在不增加财务杠杆的情况下最大化销售和收入增长。实现 SGR 可以帮助公司防止过度杠杆化并避免财务困境。

私人公司定义

什么是私人公司?私人公司是私人拥有的公司。私营公司可以发行股票并拥有股东,但它们的股票不在公共交易所交易,也不通过首次公开募股(IPO) 发行。因此,私营公司无需满足美国证券交易委员会 (SEC) 对上市公司的严格申报要求。一般来说,这些业务的股票流动性较差,估值也更难确定。摘要私人公司是私人拥有的公司。

数学中的统计:定义、类型和重要性

什么是统计学?统计学是应用数学的一个分支,涉及从定量数据中收集、描述、分析和推断结论。统计学背后的数学理论很大程度上依赖于微分和积分、线性代数和概率论。从事统计工作的人被称为统计学家。他们特别关心如何根据小样本的行为和其他可观察特征得出关于大群体和一般事件的可靠结论。