示例:它在統計學中的含義、類型和示例

  |  

什麼是樣品?

樣本是指從較大羣體中劃分出來的較小、易於管理的版本。它是包含較大總體特徵的子集。當總體規模過大,無法涵蓋所有可能的成員或觀測值時,統計檢驗中就會使用樣本。樣本應能代表整個總體,並且不應反映出對特定屬性的任何偏倚。

研究人員和統計學家使用多種抽樣技術,每種技術都有其自身的優點和缺點。

要點總結

  • 在統計學中,樣本是從較大總體中劃分出來的分析子集。
  • 使用樣本可以讓研究人員以更易於管理的數據,並及時開展研究。
  • 如果樣本足夠大,隨機抽取的樣本偏差不大,但獲得這樣的樣本可能既昂貴又耗時。
  • 在簡單隨機抽樣中,總體中的每個實體都是相同的,而分層隨機抽樣則將總體分成更小的組。

理解樣本

樣本是從總體中抽取的一組無偏觀測值。簡單來說,總體是指特定羣體或情境中包含的所有觀測值(例如,個體、動物、物品、數據等)。換句話說,樣本是總體的一部分,是總體的一個子集。樣本廣泛應用於各種研究領域。科學家、市場營銷人員、政府機構、經濟學家和研究團隊等都會使用樣本進行研究和測量。

利用全體人羣進行研究會面臨諸多挑戰。研究人員可能難以輕易接觸到全體人羣。而且,由於某些研究的性質,研究人員可能難以及時獲得所需結果。因此,人們會採用抽樣調查。使用數量較少但能代表全體人羣的樣本,既可以得出有效的結果,又能節省時間和資源。

研究人員使用的樣本必須與更廣泛的人羣相符,才能做出準確的推斷或預測。樣本中的所有參與者都應具有相同的特徵和品質。因此,如果研究對象是大學一年級男生,那麼樣本應該是符合這一描述的一小部分男性。同樣,如果一個研究小組對50歲以上單身女性的睡眠模式進行研究,那麼樣本應該只包括這一年齡段的女性。

特殊考慮

假設有一組學術研究人員想要了解有多少考生備考CFA考試的時間少於40小時卻仍然通過了考試。由於每年全球有超過20萬人參加CFA考試,如果要聯繫到每一位考生,將會耗費大量的時間和資源。

事實上,等到收集並分析完總體數據後,幾年時間可能已經過去,屆時新的羣體可能已經出現,分析結果也就失去了意義。研究人員可以採取的替代方案是,從總體中抽取樣本,並從該樣本中獲取數據。

爲了獲得無偏樣本,樣本選擇必須是隨機的,這樣總體中的每個人都有相等且可能的概率被納入樣本組。這類似於抽獎,也是簡單隨機抽樣的基礎。

爲了獲得無偏樣本,選擇必須是隨機的,這樣總體中的每個人都有相同的機會被添加到該組中。

抽樣類型

簡單隨機抽樣

如果總體中的每個個體都完全相同,那麼簡單隨機抽樣是理想的選擇。如果研究人員並不在意樣本對象是全男性、全女性還是男女混合,那麼簡單隨機抽樣可能是一種不錯的選擇方法。

假設2021年有20萬考生參加了CFA考試,其中40%爲女性,60%爲男性。因此,從總體中抽取的隨機樣本應該包含400名女性和600名男性,總共1000名考生。

但如果我們需要知道學習時間不足40小時後通過考試的男性和女性的比例呢?在這種情況下,分層隨機抽樣比簡單隨機抽樣更合適。

分層隨機抽樣

這種抽樣方法,也稱爲比例隨機抽樣或配額隨機抽樣,將總體劃分爲若干較小的羣體,這些羣體被稱爲層。同一層內的人羣具有相似的特徵。

如果年齡是研究人員希望納入數據的重要因素,該怎麼辦?他們可以使用分層隨機抽樣技術,爲每個年齡組創建不同的層。從每一層中抽取樣本都必須是隨機的,這樣該年齡組中的每個人都有被納入樣本的概率。例如,兩位參與者 Alex 和 David 分別 22 歲和 24 歲。樣本選擇不能基於任何優先機制而偏向其中一人。他們兩人在各自年齡組中被選中的概率應該相等。分層結構可能如下所示:

地層(年齡)人口數量樣本中包含的數量
20-24 30,000 150
25-29 70,000 350
30-34 40,000 200
35-39 30,000 150
40-44 20,000 100
>44 10,000 50
全部的20萬1,000

根據表格,人口已按年齡組劃分。例如,2021年有30,000名年齡在20至24歲之間的人蔘加了CFA考試。按照同樣的比例,樣本組中將有(30,000 ÷ 200,000) × 1,000 = 150名屬於該年齡組的考生。Alex或David——或者兩人都可能,或者兩人都不可能——可能包含在這150名隨機抽取的考生樣本中。

在確定樣本量時,還可以納入更多分層因素。一些研究人員在決定如何創建樣本時,可能會考慮受測者的職業、國家、婚姻狀況等因素。

示例

2021年,世界人口接近79億,其中女性佔49.6%,男性佔50%。任何國家的總人口數也可以被視爲一個人口規模。一個城市的學生總數可以被視爲一個人口規模,一個城市裏的狗的總數也可以被視爲一個人口規模。可以從這些人口規模中抽取樣本用於研究目的。

沿用我們之前提到的CFA考試示例,研究人員可以從總共20萬名考生(即總體)中抽取1000名CFA考生作爲樣本,並對這1000名考生進行所需的數據分析。然後,研究人員將計算該樣本的平均值,以此來估計那些學習時間不足40小時卻仍然通過CFA考試的考生的平均比例。

所選取的樣本組不應存在偏差。這意味着,如果1000名CFA考試參與者的樣本均值爲50,那麼20萬名考生的總體均值也應約爲50。

爲什麼分析師使用樣本而不是測量總體?

通常情況下,由於總體規模過大或分佈過於廣泛,無法對每個成員進行測量,而且測量每個成員既費時又費錢。因此,通過抽樣,我們可以利用統計方法對總體進行推斷。

什麼是簡單隨機抽樣?

這種抽樣方法使用從總體中隨機選擇的受訪者或數據點。當樣本量足夠大時,隨機抽樣可以消除偏差。

爲什麼隨機樣本可以用於推斷?

統計學定律表明,通過樣本可以對總體進行準確的測量和評估。方差分析(ANOVA) 、線性迴歸以及更高級的建模技術之所以有效,是因爲大數定律中心極限定理

您需要多大的樣本?

這取決於總體規模和您想要進行的分析類型(例如,您使用的置信區間)。功效分析是一種根據您的需求,通過數學方法評估所需最小樣本量的技術。另一個經驗法則是,您的樣本量應該足夠大,但不應超過總體規模的10%。

推薦閱讀

相關文章

召回對公司有何影響?

公司面臨着多種類型的風險——既有內部風險,也有外部風險。有些風險可以通過戰略規劃來預測和消除,而有些風險則很難在一開始就識別出來。召回就是其中一種風險——通常在產品或服務上市後發生。沒有哪家公司願意經歷召回。這是因爲召回會改變公司的財務狀況和市場表現,並對其聲譽造成負面影響。

增值合併與稀釋合併:有何區別?

增值合併與稀釋合併:概述如果併購交易完成後收購公司的每股收益(EPS) 增加,則稱該交易具有增值性。如果交易導致收購公司的每股收益下降,則該交易具有稀釋性。投資者應謹慎對待這種分析。並非每筆增值交易都是好的,也並非每筆稀釋性交易都是壞的。稀釋和增值是科學術語,指化學物質或元素的濃度。

如何計算經營槓桿程度?

經營槓桿程度是多少?經營槓桿率(DOL) 是用於評估公司銷售額百分比變化後營業收入變化情況的指標。公司的運營槓桿涉及根據銷售額評估固定成本和可變成本。固定成本不隨生產水平而變化;因此,可變成本必須包含在計算中。要點: DOL 是反映公司銷售額百分比變化後營業收入變化的指標。

混合辦公室的經濟影響

混合辦公,一種結合了遠程和辦公室工作的安排,似乎有望成爲許多白領的新常態。該模型旨在利用我們在 COVID-19 大流行的第一年學到的關於工作場所生產力和工作與生活平衡的知識來創建一個新設置,以最大限度地提高辦公室和遠程工作的好處並最大限度地減少不利因素。當然,混合工作將有其自身的經濟優勢和劣勢。

Z 分數與標準偏差:有什麼區別?

Z 分數和標準偏差:概述儘管金融業可能很複雜,但對基本數學構建模塊的計算和解釋的理解仍然是成功的基礎,無論是在會計、經濟學還是投資領域。標準差和 Z 分數就是兩個這樣的基礎。 Z 分數可以幫助交易者衡量證券的波動性。分數顯示了一個值與平均值的距離(高於或低於)。

簡單隨機樣本:優點和缺點

統計學是應用數學的一個分支,它通過研究較小的事件或對象來幫助我們瞭解大型數據集。簡而言之,您可以通過檢查較小的樣本來推斷大量人口。統計分析通常用於識別許多不同領域的趨勢,包括商業和金融。個人可以利用統計研究的結果對他們的資金、業務和投資做出更好的決策。研究人員通常從一個簡單的隨機樣本開始。

相關詞條

分類板

什麼是分類板?分類董事會是公司董事會(BOD) 的一種結構,其中一些董事的任期不同,通常爲 1 至 8 年,具體取決於他們的特定分類。在分類制度下,較長的任期通常授予更高級的董事會職位(即董事會主席)。一個典型的機密董事會將在董事會上擁有三到五類職位,每類職位的服務條款長短不一,允許進行錯綜複雜的選舉。

總投資現金回報率 (CROGI)

什麼是總投資現金回報率 (CROGI)?總投資現金回報率 (CROGI) 是衡量公司財務業績的指標,用於衡量公司利用其投資資本產生的現金流量。 CROGI 的計算方法是將稅後總現金流除以總投資。 CROGI 很重要,因爲投資者想要確定一家公司如何有效地利用其投資於自身的資金。

減記定義

什麼是減記?減記是當資產的公允市場價值(FMV) 低於賬面賬面價值並因此成為減值資產時,資產賬面價值減少的會計術語。要減記的金額是資產的賬面價值與企業通過以最佳方式處置資產可以獲得的現金金額之間的差額。減記與增記相反,如果資產的全部價值變得毫無價值並從賬戶中完全消除,則將成為減記。

系統抽樣:它是什麼,以及如何在研究中使用它?

什麼是系統抽樣?系統抽樣是一種概率抽樣方法,它從一個較大的總體中,按照一個隨機的起始點,以固定的週期性間隔抽取樣本成員。這個間隔稱爲抽樣間隔,可以通過總體規模除以所需的樣本規模來計算。儘管樣本總體是預先選定的,但如果週期性間隔是預先確定的,且起始點是隨機的,那麼系統抽樣仍然被認爲是隨機的。

數學中的統計:定義、類型和重要性

什麼是統計學?統計學是應用數學的一個分支,涉及從定量數據中收集、描述、分析和推斷結論。統計學背後的數學理論很大程度上依賴於微分和積分、線性代數和概率論。從事統計工作的人被稱爲統計學家。他們特別關心如何根據小樣本的行爲和其他可觀察特徵得出關於大羣體和一般事件的可靠結論。

代表性示例:定義、重要性和示例

什麼是代表性樣本?代表性樣本是指從總體中抽取的一個子集,旨在準確反映總體的特徵。例如,一個有30名學生(15名男生和15名女生)的班級,其代表性樣本可能包含6名學生:3名男生和3名女生。當總體規模較大時,樣本在統計分析中非常有用,因爲它們包含了總體中規模較小、易於管理的子集。