中文名 | 統計特征 | 外文名 | statistical characteristics |
---|---|---|---|
兩大類型 | 差異性特征、規律性特征 | 主要特征 | 極差、標準差、變異系數、眾數等 |
特????點 | 反映總體的各個個體間的分布情況 | 應用領域 | 統計學 |
極差亦稱為全距或誤差范圍,它是測定數據中最大值與最小值之差,說明數據的伸展情況。優點是計算簡單,缺點是沒有反映觀測值離散情況。在相同實驗次數下的兩組數據,極差大的一組數據要比極差小的一組數據更為分散。
標準偏差也稱為標準離差、標準差或均方差,它是衡量樣本數據波動性(離散程度)的指標。 標準偏差有兩點不同于誤差的平均值:①不必考慮誤差的正、負號;②增強了大的誤差數據的作用,所以能較好地反映測定數據的精密度,因此也用標準偏差來量度精密度。
標準偏差有兩個重要的作用:
(1)測定研究對象變異程度的大小。變異程度就是各個數值相差的程度。其他條件相同,標準偏差大,變異程度大;標準偏差小,變異程度小。標準偏差的這種作用在比較兩個或多個樣本變異程度的大小上可以清楚地看出。
(2)作為量度誤差的標準單位。標準偏差還可以作為檢驗不同樣本是否有本質差別的標準單位。許多重要的統計方法,如顯著性檢驗法,都是以標準偏差的應用作為基礎的。
標準偏差是反映樣本數據的絕對波動狀況。當測量較大的量值時,絕對誤差一般較大:測量較小的量值時,絕對誤差一般較小,因此,用相對波動的大小,即變異系數更能反映樣本數據的波動性。
變異系數將有限次測定次數的標準偏差除以對測定值的平均值,得到一個相對值。標準偏差的單位與平均值相同,所以變異系數與測量的單位無關,是個純數。
算數平均值是一組數據集中位置最有用的統計特征量,經常用樣本的算數平均值來代表總體的平均水平。
在一組數據中,按其大小次序排序以排在正中間的一個數表示總體的平均水平,稱之為中位數,或中值。 平均值有時會因極值的影響而出現虛假的集中位置。人們把觀測值按大小順序排列,將排在中間的數稱為中位數。觀測次數為奇數時,中位數有1個;當觀測次數為偶數時.中位數為中間兩個數的平均值。例如某實驗室的每天藥品消耗的中位數為6瓶,物理學家用半衰期來衡量放射性同位數的衰變速度,用的就是放射性原子蛻變時間的中位數,如果要計算某種放射性原子蛻變所需時間的平均值,必須等所有原子蛻變完畢才有可能。顯然,這是不能辦到的,因為這需要漫長的時間。
眾數是指一組數據中,出現次數最多的變量值,眾數不一定是平均值。例如,某實驗室最近18天每天藥品的消耗量分別為8,7,6,7,5,4,5.6,8,7,5,6,4,7,6,5,7,4瓶,7瓶出現次數最多,所以眾數為7。 2100433B
統計特征是統計學的基本概念之一,在用數理統計方法研究總體時,人們所關心的實際上并非組成總體的各個個體本身,而主要是考察與它們相聯系的某個(或某些)特征。研究有關特征在總體的各個個體間的分布情況,稱所要考察的特征為總體的統計特征。
無論是在空域,還是頻域,在進行隱寫分析時,除了使用一階統計特征之外,還可以使用共生矩陣,這時高階統計特征?;叶裙采仃囀欠治隹臻g關系的一種統計方法,當對圖像中像素對中的分布進行統計時。
整棟樓統計
圖形里面有,將鋼筋導入圖形,匯總計算,全選你要統計的構件,在狀態欄的左下角就能看到個數了。
格式:pdf
大?。?span id="3kkheok" class="single-tag-height">420KB
頁數: 2頁
評分: 4.6
在巖土工程中,人們普遍應用統計方法計算巖土的物理力學參數。統計學方法在對離散巖土的實驗數據進行處理時,將與中值差異性較大的數據稱之為孤值,并認為其代表性較差,對其忽略不計,取剩余數據平均值為巖土特征值。應用這種方法處理數據結果,剔除孤值會導致結果存在人為偏差現象,不剔除孤值又會導致結果出現系統誤差?;诖祟悊栴}的干擾,相關學者逐漸應用數學理論分析巖土特征,隨機模糊統計方法應運而生。
水文特征統汁的內容一般包括3個方面:
①主要河流的特征資料,如流域或水系的集水面積、河流長度、測站的地理位置、資料年限以及流域或水系多年平均的降水量(以水深mm表示)、徑流深、徑流系數、降水和徑流總量(以立方米表示)、徑流模數等統計值;
②多年的和逐年的水文特征統計資料,如各測站年、月的降水、蒸發、水位、流量、泥沙、水化學成分、水溫、冰情等各種特征統計值;
③其他有關綜合性的參考資料,如主要河流入海水量和出入國境水量的統計值,全國的、流域的、地區的水資源評價成果等。
水利(電力)部水文局于1956年第1次組織匯編《全國主要河流水文特征統汁》,1975年和1982年(含臺灣省水文特征資料)兩次修訂。20世紀50年代后期至70年代,各流域、省、直轄市、自治區以及部分地區和縣,相繼匯編了各流域和各地區的水文特征統汁并經數次修訂補充,總數達百余冊。為了便于應用,在全國性水文圖集、地區性水文圖集以及水文手冊中也曾刊載主要河流的水文特征統計資料,有些水文實驗站為專門目的(如官廳水庫水文泥沙的實驗研究),也出版過特征資料,提供生產和科研部門應用。
分配數列有兩個構成要素。即總體按某標志所分的組和各組對應的次數或頻率。
分配數列的第一個構成要素就是總體按某標志所分的組。根據分組標志的不同,分配數列可分為品質分配數列和變量分配數列。按品質標志分組形成的分配數列叫品質分配數列,簡稱品質數列;按數量標志分組形成的分配數列叫變量分配數列,簡稱變量數列。變量數列又可以分為單項式數列和組距式數列,組距式數列又可以分為等距數列和不等距數列。它們都是由相應的統計分組形成的。
對品質數列來說,由于用品質標志來區分事物的各種類型表現得比較明確,因此,品質數列一般比較穩定,能較好地反映總體各單位的分布特征。但對變量數列來說,因為事物性質的差異是用數量界限來表現的,而數量界限往往會受人們主觀認識的影響,同一數量標志分組可能會出現多種分布狀態。這就涉及各組頻數和頻率的問題。
分配數列的第二個構成要素就是各組對應的單位數——次數,次數也叫頻數,常用
在變量分配數列中,頻數或頻率表明對應組標志值的作用程度。頻數或頻率數值越大,表明該組標志值對總體水平所起的作用也越大;反之,頻數或頻率數值越小,表明該組標志值對總體水平所起的作用越小。
分配數列中各組的頻數或頻率不能為0,如果某一組的頻數或頻率為0,應刪除這一組。
有時候,為了更簡便地概括總體各單位的分布特征,還需要編制累計頻數數列和累計頻率數列。累計方法有向上累計和向下累計兩種。
向上累計就是向變量的上限方向累計,是指將各組頻數或頻率由變量值較低的組向變量值較高的組累計,各累計數的意義是各組上限以下的累計頻數或頻率。當我們關注標志值較小的各組分布情況時,可采用向上累計方法。
向下累計就是向變量的下限方向累計,是指將各組頻數或頻率由變量值較高的組向變量值較低的組累計,各累計數的意義是各組下限以上的累計頻數或頻率。當我們關注標志值較大的各組分布情況時,可采用向下累計方法。
分析變量的分布狀況,一般應采用等距數列。此時,各組的頻數或頻率就能很好地反映變量的分布狀況。如果是不等距數列,則應采用各組的次數密度或頻率密度才能正確反映變量的分布狀況。次數密度和頻率密度的計算公式如下:
次數密度=某組次數/該組組距;頻率密度=某組頻率/該組組距
社會經濟現象總體的性質不同,其次數分布的特征也不同。各種社會經濟現象總體的次數分布,歸納起來主要有鐘型分布、U型分布、J型分布和洛倫茲分布四種類型。
鐘型分布
鐘型分布是正態分布的俗稱,其特征是“中間高,兩頭低”,即靠近中間的變量值分布的次數多,靠近兩邊的變量值分布的次數少,形如古鐘(見圖1)。
在社會經濟現象中,鐘型分布多表現為對稱分布。對稱分布的特征是中間的變量值分布的次數最多,以標志變量中心為對稱軸。兩側變量值分布的次數隨著與中心變量值距離的增大而漸次減少,并且圍繞中心變量值兩側呈對稱分布。這種分布在統計學中稱為正態分布。在社會經濟現象中,許多變量的分布近似于正態分布類型。如從業人員的年收入、農作物單產、零件尺寸、學生考試成績、社會財富分布等。正態分布在社會經濟統計學中具有重要意義。這是因為,一方面。社會經濟現象中大部分分布呈近似正態分布;另一方面,正態分布理論是抽樣推斷的基礎。
U型分布
U型分布的特征與鐘型分布正好相反,靠近中間的變量值分布的次數少,靠近兩端的變量值分布的次數多,形成“兩頭高,中間低”的U字型分布。例如,人口死亡現象按年齡分布便是如此。由于人口總體中幼兒和老年人死亡人數較多,而中年人死亡人數較少,因此,死亡人數按年齡分組便近似地表現為U型分布,如圖2所示。
J型分布
在社會經濟現象中,一些統計總體分布曲線呈J型,即次數隨著變量值的增加而增加。如農作物產量按土地面積分布、人口數按零售商品銷售額分布、工人數按總產值分布、庫存量按庫存費用分布等,如圖3所示。也有次數隨著變量值的增加而減少的倒J型分布。如企業數按投資額分布、人口數按年齡大小分布等,如圖4所示。
洛倫茲分布
洛倫茲分布曲線是美國統計學家洛倫茲(M.Lorenz)提出來的,專門用以研究社會收入分配的平等問題。
在圖5中。橫軸OH表示人口的累計百分比,縱軸OM表示收入的累計百分比,弧線OL為洛倫茲曲線。洛倫茲曲線的彎曲程度有著重要的意義,它反映了收入分配的不平等程度。彎曲程度越大,收入分配越不平等,反之亦然。
洛倫弦曲線與對角線之間的部分A 叫做“不平等面積”,直角三角形OHL的面積(A B)叫做“完全不平等面積”。不平等面積與完全不平等面積之比,就是基尼系數,也稱集中系數:基尼系數=
基尼系數等于1,表示收入分配絕對不平等;基尼系數等于0,表示收入分配絕對平等?;嵯禂凳呛饬浚粋€國家或地區貧富差距的標準之一。按照聯合國有關組織規定:基尼系數若低于0.2表示收入平均;0.2-0.3表示比較平均;0.3=0.4表示相對合理;0.4-0.5表示收入差距較大;0.5以上表示收入差距懸殊。通常把0.4作為收入分配差距的“警戒線”。發達國家的基尼系數在0.26-0.38之間,我國2013年全國居民收入的基尼系數為0.473。
洛倫茲曲線的拓展可以運用于其他社會經濟現象,研究總體各單位標志變異狀況——變量分布的均勻性或分布的集中程度,因此,洛倫茲曲線又稱集中曲線。如研究產品市場份額在各企業的集中度以及分析固定資產投資額在各地區的集中度等 。
隨著水文資料系列的增長,特征統計值逐漸趨于相對穩定,應用價值也愈大。鑒于水文年鑒一般要隔一兩年才能刊印出來,為彌補這一缺陷,自1980年起水利(電力)部水文局專門選編一批具有代表性的重點測站的資料, 于每年年初發布上一年的《全國主要河流水文公報》。20世紀80年代以來,水利部水文局組織各流域機構建立了水文和水資源數據庫,其中包括了各種水文特征統計資料,可通過計算機網絡形式隨時提供給用戶使用。