Hoe de standaarddeviatie in Excel te berekenen (stap voor stap)

Excel wordt veel gebruikt voor statistieken en data-analyse. Standaarddeviatie is iets dat vrij vaak wordt gebruikt in statistische berekeningen.

In deze tutorial laat ik je zien hoe de standaarddeviatie in Excel te berekenen (met behulp van eenvoudige formules)

Maar voordat ik erop inga, wil ik u snel een kort overzicht geven van wat standaarddeviatie is en hoe deze wordt gebruikt.

Wat is standaarddeviatie?

Een standaarddeviatiewaarde zou u vertellen hoeveel de dataset afwijkt van het gemiddelde van de dataset.

Stel dat u een groep van 50 personen heeft en u hun gewicht noteert (in kg).

In deze dataset is het gemiddelde gewicht 60 kg en de standaarddeviatie 4 kg. Het betekent dat het grootste deel van het gewicht van de mensen binnen 4 kg van het gemiddelde gewicht ligt (dat zou 56-64 kg zijn).

Laten we nu de standaarddeviatiewaarde interpreteren:

  • Een lagere waarde geeft aan dat de gegevenspunten dichter bij de gemiddelde (gemiddelde) waarde liggen.
  • Een hogere waarde geeft aan dat er wijdverbreide variatie is in de gegevenspunten. Dit kan ook het geval zijn wanneer er veel uitbijters in de dataset zijn.

Standaarddeviatie berekenen in Excel

Hoewel het gemakkelijk is om de standaarddeviatie te berekenen, moet u weten welke formule u in Excel moet gebruiken.

Er zijn zes standaarddeviatieformules in Excel (acht als je ook rekening houdt met databasefuncties).

Deze zes formules kunnen in twee groepen worden verdeeld:

  1. De standaarddeviatie van de steekproef berekenen: de formules in deze categorie zijn STDEV.S, STDEVA en STDEV
  2. De standaarddeviatie voor een hele populatie berekenen: de formules in deze categorie zijn STDEV.P, STDEVPA en STDEVP

In bijna alle gevallen gebruik je de standaarddeviatie voor een steekproef.

Nogmaals, in termen van leken, gebruik je de term 'populatie' als je alle datasets in de hele populatie wilt beschouwen. Aan de andere kant gebruik je de term 'steekproef' wanneer het gebruik van een populatie niet mogelijk is (of het is onrealistisch om dit te doen). In zo'n geval kies je een steekproef uit de populatie.

U kunt de steekproefgegevens gebruiken om de standaarddeviatie te berekenen en voor de gehele populatie af te leiden. Een mooie uitleg ervan lees je hier (lees de eerste reactie).

Dus. dit beperkt het aantal formules tot drie (STDEV.S, STDEVA en STDEV-functie)

Laten we nu deze drie formules begrijpen:

  • STDEV.S - Gebruik dit als uw gegevens numeriek zijn. Het negeert de tekst en logische waarden.
  • STDEVA - Gebruik dit als u tekst en logische waarden in de berekening wilt opnemen (samen met getallen). Tekst en ONWAAR worden als 0 beschouwd en WAAR als 1.
  • STDEV - STDEV.S werd geïntroduceerd in Excel 2010. Daarvoor werd de STDEV-functie gebruikt. Het is nog steeds inbegrepen voor compatibiliteit met eerdere versies.

U kunt er dus gerust vanuit gaan dat u in de meeste gevallen de STDEV.S-functie zou moeten gebruiken (of de STDEV-functie als u Excel 2007 of eerdere versies gebruikt).

Laten we nu eens kijken hoe we het in Excel kunnen gebruiken.

STDEV.S-functie gebruiken in Excel

Zoals vermeld, gebruikt de STDEV.S-functie numerieke waarden, maar negeert de tekst en logische waarden.

Hier is de syntaxis van de STDEV.S-functie:

STDEV.S(getal1,[getal2],… )

  • Nummer 1 - Dit is een verplicht argument in de formule. Het eerste getalargument komt overeen met het eerste element van de steekproef van een populatie. U kunt ook een benoemd bereik, een enkele array of een verwijzing naar een array gebruiken in plaats van argumenten gescheiden door komma's.
  • Nummer 2,… [Optioneel argument in de formule] U kunt maximaal 254 extra argumenten gebruiken. Deze kunnen verwijzen naar een gegevenspunt, een benoemd bereik, een enkele array of een verwijzing naar een array.

Laten we nu eens kijken naar een eenvoudig voorbeeld waarin we de standaarddeviatie berekenen.

Voorbeeld - Berekenen van de standaarddeviatie voor gewichtsgegevens

Stel dat u een dataset heeft zoals hieronder weergegeven:

Gebruik de volgende formule om de standaarddeviatie met behulp van deze dataset te berekenen:

=STDEV.S(A2:A10)

Als u Excel 2007 of eerdere versies gebruikt, beschikt u niet over de STDEV.S-functie. In dat geval kunt u de onderstaande formule gebruiken:

=STDEV(D2:D10)


De bovenstaande formule retourneert de waarde van 2,81, wat aangeeft dat de meeste mensen in de groep binnen het gewichtsbereik van 69,2-2,81 en 69,2+2,81 vallen.

Merk op dat wanneer ik zeg 'de meeste mensen', dit verwijst naar de normale verdeling van de steekproef (dat wil zeggen 68% van de steekproefpopulatie ligt binnen één standaarddeviatie van het gemiddelde).

Merk ook op dat dit een zeer kleine sample set is. In werkelijkheid moet u dit misschien doen voor een grotere verzameling steekproefgegevens waar u de normale verdeling beter kunt observeren.

Ik hoop dat je deze Excel-zelfstudie nuttig vond.

U zal helpen de ontwikkeling van de site, het delen van de pagina met je vrienden

wave wave wave wave wave