De Beschrijvende Statistiek als deelgebied van de statistiek verzamelt gegevens, analyseert deze en stelt de resultaten voor onder de vorm van grafieken of berekent statistische parameters waarmee in enkele getallen de gegevensverzameling kan worden beschreven. Bovendien is het vaak niet mogelijk over de waarden van alle elementen van een populatie te beschikken, en dan verkrijgen we de gegevens door middel van een steekproef op een gedeelte van de populatie, waaruit we dan de informatie afleiden inzake enkele kenmerken van de gehele populatie. De procedures die verder in dit hoofdstuk worden uitgelegd hebben voornamelijk betrekking op deze laatste situatie.
In andere gevallen zijn de gegevens waarmee de Beschrijvende Statistiek werkt, afkomstig van waarnemingen bij het uitvoeren van een toevalsexperiment. In dat geval worden de waarnemingen van een steekproef gebruikt om een theoretisch model op te stellen dat het experiment beschrijft.
Op het gebied van Statistiek, werkt wiris , zoals gebruikelijk is in de statistiek, met decimale getallen, in tegenstelling tot andere kennisgebieden.
We zien hoe een steekproef van 3 nullen en 4 enen kan voorgesteld worden.
In het eerste geval hebben we een Lijst beschouwd met de elementen van de steekproef; in het tweede geval gebruiken we een Deler , waarbij aangegeven wordt hoeveel maal elke waarde voorkomt. We bekijken nu enkele bewerkingen die we kunnen uitvoeren op steekproeven.
We sluiten de inleiding af met de opmerking dat het mogelijk is om verschillende steekproeven met willekeurige variabelen te groeperen, met behulp van een Deler. De gedetailleerde uitleg van deze mogelijkheid bevindt zich in de beschrijving van
Multisample in de alfabetische index.
Laten we, voordat we verder gaan, enkele verhelderende voorbeelden bekijken:
In dit onderdeel worden de functies uitgelegd die wiris kan toepassen op een geheel van gegevens (waargenomen van een statistische variabele), x={x1,x2,...,xn}.
variantie: commando variantie
Berekent de variantie volgens de afgeleide definitie. Deze is als volgt: waarbij n=lengte(x), m x=gemiddelde(x).
|
mediaan: commando mediaan
Indien x1,x2,...,xn een geordende steekproef is, wordt deze bepaald als
xk
|
als |
n=2k-1 |
(xk+xk+1)/2 |
als |
n=2k |
, waarbij k een geheel getal is. Indien de steekproef niet geordend is, volstaat het deze te ordenen en de vorige definitie toe te passen.
|
kwartiel: commando kwartiel
Berekent de verschillende kwartielen van de steekproef. Zie de volledige definitie van het commando kwartiel in de alfabetische index.
|
modus: commando modus
Berekent de meest voorkomende waarde in de steekproef. Indien er meer dan één waarde is die het maximum aantal keren verschijnt, krijgen we een lijst met de verschillende modewaarden.
|
wiris beschikt over verschillende functies met als argument een steekproef van bivariate gegevens, dit betekent een steekproef met de vorm (x1,y1),(x2,y2),...,(xn,yn). Merk op dat we er bij deze voorbeelden van uit moeten gaan dat ze bivariate gegevens voorstellen, hoewel de gegevens van beide variabelen onafhankelijk van elkaar kunnen worden ingevoerd.
Alle commando's inzake bivariate gegevens kunnen als argument een lijst ontvangen met punten in plaats van twee lijsten met getallen. Op een vrij natuurlijke wijze beschouwt wiris dat de abscissen van de punten de waarden van de eerste variabele zijn en dat de geordende abscissen de waarden van de tweede variabele zijn, waargenomen in de elementen van de steekproef.
correlatie: commando correlatie
Berekent de correlatiecoëfficiënt van Pearson voor een verzameling van bivariate gegevens van een steekproef. Deze parameter geeft de graad van 'lineaire relatie' aan tussen twee steekproeven.
|
regressielijn: commando regressielijn
Bij een gegeven steekproef met de gegevens (x1,y1),(x2,y2),...,(xn,yn), berekent dit commando de regressielijn op basis van de kleinste kwadratenmethode, met x als voorspellende variabele en y als responsvariabele.
|
|