Hur stor är en 2a
Standardavvikelse
I detta förra avsnittet tittade oss tillsammans med hjälp från variationsbredd samt kvartiler vid observationsvärdenas spridning runt medianen, dock man är kapabel även existera intresserad från mått för hur något sprids vilket gäller spridning runt medelvärdet.
Jag behöverdetta vanligaste måttet vid spridning runt medelvärdet existerar standardavvikelse, vilket oss bör bekanta oss tillsammans med inom detta avsnitt.
Definition från standardavvikelse
Med standardavvikelsen menar oss en mått vid den genomsnittliga avvikelsen ifrån medelvärdet inom enstaka serie observationsvärden. Ju större standardavvikelsen existerar, desto större existerar spridningen bland våra observationsvärden.
När oss bör beräkna standardavvikelsen börjar oss tillsammans för att beräkna medelvärdet på grund av observationsvärdena (vilket oss på denna plats betecknar tillsammans med m) samt sedan kalkylerar oss hur många varenda enskilt observationsvärde (här betecknat tillsammans med x) avviker ifrån detta medelvärde.
Avvikelsen ifrån medelvärde på grund av en observationsvärde förmå oss därför nedteckna som
$$x-m$$
där x existerar observationsvärdet samt m existerar medelvärdet på grund av serien.
I nästa steg kvadrerar oss fanns samt enstaka från dessa avvikelser ifrån medelvärdet, vilket får mot resultat dels för att varenda våra kvadrerade avvikelser blir positiva, dels för att stora avvikelser inom kvadrerad struktur blir ännu större inom jämförelse tillsammans med små kvadrerade avvikelser.
Den kvadrerade avvikelsen till en observationsvärde blir därför
$$(x-m)^2$$
När oss besitter dessa kvadrerade avvikelser till vart samt en från våra observationsvärden önskar oss ju äga reda vid hur massiv den genomsnittliga kvadrerade avvikelsen existerar.
Därför summerar oss samtliga kvadrerade avvikelser samt dividerar denna summa tillsammans antalet observationsvärden, vilket ger oss följande:
$$\frac{\sum {(x-m)^2}}n$$
där n existerar antalet observationer.
Nu existerar oss nästan klara, dock detta värde oss får från formeln ovan äger ej identisk objekt likt observationsvärdena.
på grund av för att rätta mot detta kalkylerar oss roten ur vår genomsnittliga kvadrerade avvikelse.
Sammanfattningsvis får oss därför nästa formel på grund av standardavvikelsen:
$$\sigma = \sqrt{\frac{\sum {(x-m)^2}}{n}}$$
där ∑ existerar summan från detta vilket följer mot motsats till vänster, x existerar en enskilt observationsvärde, m existerar medelvärdet, samt n existerar antalet observationer.
Standardavvikelse
Låt oss idag titta vid numeriskt värde konkreta modell vid kalkyl från standardavvikelse tillsammans med hjälp från fallen tillsammans åldersspridningen nära våra båda middagar, vilket oss existerar bekanta tillsammans ifrån dem tidigare statistikavsnitten.
Vid släktmiddagen äger oss deltagare tillsammans nästa åldrar (observationsvärden) samt medelvärde, \(m_s\):
$$1,\, 4,\, 3,\, 15,\, 72,\, 41,\, 30,\, 27,\, 72,\, 8,\, 42,\, 36,\, 33,\, 46,\, 44$$
$$medelvärde\, (m_s) = 31,6\,år$$
Vid kompismiddagen äger oss deltagare tillsammans med nästa åldrar (observationsvärden) samt medelvärde, \(m_k\):
$$30,\, 31,\, 33,\, 34,\, 35,\, 34,\, 28,\, 34,\, 33,\, 34,\, 36,\, 35,\, 32,\, 31,\, 32$$
$$medelvärde\, (m_k)=32,8\,år$$
Nu är kapabel oss räkna ut avvikelsen ifrån medelvärdet till vart samt en från dessa observationsvärden.
I tabellen nedan besitter oss räknat ut avvikelsen till såväl släktmiddagen likt kompismiddagen:
Släktmiddag | \(m_{s}\)=31,6 | Kompismiddag | \(m_{k}\)=32,8 |
\(x_{s}\) | \((x_{s}-m_{s})\) | \(x_{k}\) | \((x_{k}-m_{k})\) |
1 | -30,6 | 28 | -4,8 |
3 | -28,6 | 30 | -2,8 |
4 | -27,6 | 31 | -1,8 |
8 | -23,6 | 31 | -1,8 |
15 | -16,6 | 32 | -0,8 |
27 | -4,6 | 32 | -0,8 |
30 | -1,6 | 33 | 0,2 |
33 | 1,4 | 33 | 0,2 |
36 | 4,4 | 34 | 1,2 |
41 | 9,4 | 34 | 1,2 |
42 | 10,4 | 34 | 1,2 |
44 | 12,4 | 34 | 1,2 |
46 | 14,4 | 35 | 2,2 |
72 | 40,4 | 35 | 2,2 |
72 | 40,4 | 36 | 3,2 |
När oss för tillfället besitter beräknat avvikelsen ifrån medelvärdet på grund av vart samt en från observationsvärdena, bör oss kvadrera dessa avvikelser.
Dessa kvadrerade avvikelser kalkylerar oss samt redovisar inom nästa tabell:
Släktmiddag | \(m_{s}\)=31,6 | Kompismiddag | \(m_{k}\)=32,8 |
\(x_{s}\) | \((x_{s}-m_{s})^2\) | \(x_{k}\) | \((x_{k}-m_{k})^2\) |
1 | 936,36 | 28 | 23,04 |
3 | 817,96 | 30 | 7,84 |
4 | 761,76 | 31 | 3,24 |
8 | 556,69 | 31 | 3,24 |
15 | 275,56 | 32 | 0,64 |
27 | 21,16 | 32 | 0,64 |
30 | 2,56 | 33 | 0,04 |
33 | 1,96 | 33 | 0,04 |
36 | 19,36 | 34 | 1,44 |
41 | 88,36 | 34 | 1,44 |
42 | 108,16 | 34 | 1,44 |
44 | 153,76 | 34 | 1,44 |
46 | 207,36 | 35 | 4,84 |
72 | 1632,16 | 35 | 4,84 |
72 | 1632,16 | 36 | 10,24 |
Nu summerar oss dem kvadrerade avvikelserna på grund av dem båda serierna samt kalkylerar standardavvikelsen på grund av dem båda middagssällskapen.
För släktmiddagen får vi
$$\sigma_s=\sqrt{\frac{\sum {(x_s-m_s)^2}}{n}}=\sqrt{\frac{7215,6}{15}}\approx21,9$$
och på grund av kompismiddagen
$$\sigma_k=\sqrt{\frac{\sum {(x_k-m_k)^2}}{n}}=\sqrt{\frac{64,4}{15}}\approx2,1$$
Som oss ser besitter oss såsom väntat ett betydligt större spridning inom fallet tillsammans släktmiddagen (21,9 år) än nära kompismiddagen (2,1 år) även då oss idag tittar vid spridningen ifrån medelvärdet.
Standardavvikelse nära stickprovsundersökningar
I våra exempelfall på denna plats ovanför äger oss räknat vid standardavvikelsen inom all populationen (åldern vid samtliga deltagare nära respektive kvällsmål plats känd), dock utför man ett större statistisk analys tittar man oftast bara vid en stickprov från populationen man undersöker.
Standardavvikelsen till en stickprov får oss genom formeln
$$s = \sqrt{\frac{\sum (x-m)^{2}}{n-1}}$$
Skillnaden mot den vanliga formeln på grund av standardavvikelsen består inom för att man inom detta denna plats fallet dividerar tillsammans (n - 1) istället till n. Anledningen mot för att man använder detta värde existerar för att man genom stickprovsundersökningar inom praktiken äger märkt för att detta ger ett förbättrad uppskattning från den faktiska standardavvikelsen inom bota populationen angående man utför så.
Ett vanligt användningsområde på grund av standardavvikelsen existerar nära normalfördelning, vilken oss kommer för att bekanta oss tillsammans inom nästa avsnitt.