新聞中心
一、數(shù)據(jù)的概括性度量
1、統(tǒng)計學(xué)概括:
統(tǒng)計學(xué)是應(yīng)用數(shù)學(xué)的一個分支,主要通過利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化的分析、總結(jié),并進(jìn)而進(jìn)行推斷和預(yù)測,為相關(guān)決策提供依據(jù)和參考。統(tǒng)計學(xué)主要又分為描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)。給定一組數(shù)據(jù),統(tǒng)計學(xué)可以摘要并且描述這份數(shù)據(jù),這個用法稱作為描述統(tǒng)計學(xué)。另外,觀察者以數(shù)據(jù)的形態(tài)建立出一個用以解釋其隨機(jī)性和不確定性的數(shù)學(xué)模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統(tǒng)計學(xué)。
2、數(shù)據(jù)的概括性度量:
1)集中趨勢的度量:
眾數(shù):眾數(shù)(Mode),是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù),有時眾數(shù)在一組數(shù)中有好幾個。用M表示。
中位數(shù):中位數(shù)(Median)是指將數(shù)據(jù)按大小順序排列起來,形成一個數(shù)列,居于數(shù)列中間位置的那個數(shù)據(jù)。中位數(shù)用Me表示。計算公式:
四分位數(shù):四分位數(shù)(Quartile)把所有數(shù)值由小到大排列并分成四等份,處于三個分割點(diǎn)位置的數(shù)值就是四分位數(shù)。QL=下四分位數(shù),即第25百分位數(shù)( n / 4);QU=上四分位數(shù),即第75百分位數(shù)( 3n / 4)。
平均數(shù):算術(shù)平均數(shù)(arithmetic mean)算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù)。
2)離散趨勢的度量:
四分位差:四分位差(quartile deviation),也稱為內(nèi)距或四分間距(inter-quartile range),它是上四分位數(shù)(QU,即位于75%)與下四分位數(shù)(QL,即位于25%)的差。
極差:全距(Range),又稱極差,是用來表示統(tǒng)計資料中的變異量數(shù)(measures of variation),其大值與最小值之間的差距
方差:方差(variance)(樣本方差)是各個數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù),通常以σ2表示,方差的計算公式為:
標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差 (Standard Deviation),也稱均方差(Mean square error), 。
離散系數(shù):離散系數(shù)又稱變異系數(shù),CV(Coefficient of Variance)表示。CV(Coefficient of Variance):標(biāo)準(zhǔn)差與均值的比值。離散系數(shù)越小,數(shù)據(jù)的離散程度就越小,反之,亦然。
3)偏度與峰度的度量:
偏態(tài)系數(shù):偏度(Skewness)亦稱偏態(tài)、偏態(tài)系數(shù),偏度是統(tǒng)計數(shù)據(jù)分布偏斜方向和程度的度量,是統(tǒng)計數(shù)據(jù)分布非對稱程度的數(shù)字特征。Sk>0時,分布呈正偏態(tài)(右偏),Sk<0時,分布呈負(fù)偏態(tài)(左偏)。
峰態(tài)系數(shù):(Kurtosis)峰度系數(shù)是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標(biāo)。在正態(tài)分布情況下,峰度系數(shù)值是3。>3的峰度系數(shù)說明觀察量更集中,有比正態(tài)分布更短的尾部;<3的峰度系數(shù)說明觀測量不那么集中,有比正態(tài)分布更長的尾部,類似于矩形的均勻分布。峰度系數(shù)的標(biāo)準(zhǔn)誤用來判斷分布的正態(tài)性。峰度系數(shù)與其標(biāo)準(zhǔn)誤的比值用來檢驗正態(tài)性。如果該比值絕對值大于2,將拒絕正態(tài)性。
3、Python代碼實現(xiàn):
#以下代碼基于Python3.5環(huán)境編寫
import numpy as np
import stats as sts
scores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23,
32, 34, 43, 41, 21, 23, 26, 26, 34, 42,
43, 25, 24, 23, 24, 44, 23, 14, 52,32,
42, 44, 35, 28, 17, 21, 32, 42, 12, 34]
#集中趨勢的度量
print('求和:',np.sum(scores))
print('個數(shù):',len(scores))
print('平均值:',np.mean(scores))
print('中位數(shù):',np.median(scores))
print('眾數(shù):',sts.mode(scores))
print('上四分位數(shù)',sts.quantile(scores,p=0.25))
print('下四分位數(shù)',sts.quantile(scores,p=0.75))
#離散趨勢的度量
print('大值:',np.max(scores))
print('最小值:',np.min(scores))
print('極差:',np.max(scores)-np.min(scores))
print('四分位差',sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))
print('標(biāo)準(zhǔn)差:',np.std(scores))
print('方差:',np.var(scores))
print('離散系數(shù):',np.std(scores)/np.mean(scores))
#偏度與峰度的度量
print('偏度:',sts.skewness(scores))
print('峰度:',sts.kurtosis(scores))
網(wǎng)站題目:Python統(tǒng)計學(xué)一數(shù)據(jù)的概括性度量詳解-創(chuàng)新互聯(lián)
網(wǎng)站鏈接:http://ef60e0e.cn/article/hjeee.html