Statistiek Flashcards ionicons-v5-c

Statistiek

Verzameling + bewaring data in samenvattende vormMethode om data te analyseren

Explanandum

Te verklaren, wrm is iets zoals het isresponsvariabele

Explanans

Predictorvariabele (voorspellen)

Onderzoekseenheden

Over wie of wat je uitspraak doet

Variabelen

Kenmerken die variëren

Steekproef

Deeltje van onderzoekspopulatie

Onderzoekspopulatie

Groep die je onderzoekt

Respondenten

Personen die uiteindelijk bevraagd worden

Beschrijvende statistiek

Op een overzichtelijke en samenvattende wijze weergeven van kenmerken- Kunt niet veralgemenen- Geen causaliteit

Inductieve/inferentiële statistiek

Veralgemenen Hypothesen (onderzoeks (+), nul(-), alternatieve)

Beschrijvende onderzoeksvraag

Kwantitatieve opsomming/beschrijving van het fenomeen

Verkennende onderzoeksvraag

Aftasten nieuwe veronderstellingen (tss beschrijven en verklaren)

Verklarende onderzoeksvraag

Geobserveerde verschillen, veranderingen verklaren

Statistische eenheden

Onderzoekseenheden waarover men een uitspraak wil doen

Univariate analyse

1 kenm varieert

Bivariate analyse

2 variabelen

Multivariate analyse

Meerdere variabelen (+2)

Exclusiviteit

Niet overlappen, slechts 1 criterium aan de basis van de opdeling (zo objectief mogelijk)slechts 1

Exhaustiviteit

Alle onderzoekseenheden moet je kunnen classificerenniets ontbreekt

Dichotomie

Variabele die slechts 2 categorieën kan aannemen

Polytomie

Variabele die meerdere categorieën kan aannemen (2+)

Categorische data-analyse

Statistische analysetechnieken die beschikbaar zijn voor lage meetniveaus

Discrete variabelen

Beperkt tot telbare (1,2,3) (1,5)

Continue variabelen

Alle mogelijke waarden (1; 3; 5,897; ...)

Parameters van centraliteit

Centrale tendensen

Parameters van spreiding

Waargenomen verschillen

Incidentie

Aantal nieuwe gevallen

Prevalentie

Totaal aantal nieuwe personen in bepaalde conditie in een populatie op een bepaald moment

Modus

Frequentie die vaakst voorkomt

Kwantielen

Geordende rij kun je indelen in om het even welk aantal groepen met gelijk aantal elementen

Variatieratio

Proportie die niet tot modale categorie behoort

ID

Mate van concentratie van de waarnemingen over de categorieën

Symmetie

Mediaan = gemiddelde

Positieve asymmetrie

Mediaan kleiner dan gemiddelde (R)

Negatieve asymmetrie

Mediaan groter dan gemiddelde (L)

Kurtosis

= afplatting-> vgl met standaardnormale verdeling- Platykurtische: platter- Meso: gemiddelde afplatting- Lepto: scherper

Whisker

Uitschieters liggen hier niet opSnorharen van de boxplot (eindigt met max en min)

Tegenfeitelijk

Brengt gevolg teweeg dat niet zo zou zijn zonder ingrijpen of manipulatie

Generatieve causaliteit

Brengt gevolg teweeg door in gang zetten van een mechanisme

Robuuste afhankelijkheid van causaliteit

X = oorz Y als X bestaatX = oorz Y als X temporeel eerder komt dan YX = oorz Y als geen schijnverband is

Confounder

Controlevariabele

Reciproque (sym)

Wederzijdse invloed

Spurieuze relatie (sym)

Schijnverband

Contingentie of kruistabel

Categorische variabelenR*K

Celfrequenties

Aantal keer bepaalde combinatie van categorische variabelen voorkomt

Steekproefomvang

Som van de celfrequenties

Scatterplot

Puntenwolk Metrische variabelenVerzameling van alle elementen uit de sp waarbij we voor elk element de waarde op de X en Y variabele kunnen aflezen

Associatiematen

The tools of trade bij kwantitatief criminologisch onderzoek

Marginalen

Rij en kolomtotalen

Oddsratio

Voorkomen en niet voorkomen van een gebeurtenis uitdrukken=kruisproductratio

Chi-kwadraat

Waargenomen frequenties wijken systematisch af van verwachte frequenties of niet?

Residu

Verschil predictie en geobserveerde waarde

Model fit

Hoe goed past het model bij de geobserveerde data

Determinatiecoëfficient

Verhouding verklaarde variantie tov totale variantie

Aliënatiecoëfficient

Proportie van de totale variatie in Y die niet door X kan worden verklaard(1 - R2)

Statistische inferentie

Houdt zich met onzekerheid bezig door:- schatting- hypothesen testen of toetsen

Dark-figure problematiek

Verborgen problematiek

Aselecte sp

Elke eenheid uit empirische populatie heeft bekende/ berekende kans om in sp opgenomen te worden

Unbiased estimate

Zuivere onvertekende schatter

Significantietoets

Procedure om gegevens te vgl met een vooropgestelde hypothese (nl. 0-hypo)

Overschrijdingskans

Meet kans op het krijgen van een uitkomst die even extreem of extremer dan waargenomen voorkomt

Type-1 fout

Correcte nulhypothese verwerpen

Type-2 fout

Foute nulhypothese aanvaarden

Probabiliteit

Uitdrukking van waarschijnlijkheid of waarheidsgehalte van de nulhypo

Power

Kans dat statistische test leidt tot correcte verwerping van valse nulhypothese

Total SS

WGSS + BGSS

Binnengroepsvariatie (WGSS)

Som van gekwadrateerde afwijkingen van individuele scores van hun eigen groepsgemiddelde

Tussengroepsvariatie (BGSS)

Som van gekwadrateerde afwijkingen van groepsgemiddelde van het algemene gemiddelde

Degrees of freedom

Aantal waarnemingen min 1

Eta-kwadraat

Verhouding tss BGSS en totale variatie in Y

Partiële correlatiecoëf

Correlatie tss 2 variabelen onder statistische controle van 1 of meerdere storende variabelen

Suppressie-effect

Kan ervoor zorgen dat resultaten verkeerd worden ingeschat

Multicollineariteit

Samenhang tss onafhankelijke variabelen-> hoe sterker hoe meer misleidend de resultaten

Partiële overlap

Onderlinge samenhangHierdoor mag je geen 2 afz biv analyses optellen

Multivariate multiple regressie

Meerdere onafh en afh variabelen

Totale R2

Hoeveel van de variantie in Y kan worden verklaard op basis van onafhankelijke variabelen samen

Homoscedasticiteit

Variatie van de afhankelijke variabele is voor elke waarde van de onafhankelijke variabele gelijkSpreiding constant

Heteroscedasticiteit

Variatie van de afhankelijke variabele verschilt voor elke waarde van de onafhankelijke variabeleSpreiding in errorterm neemt toe met voorspelde waarden

Normaliteit

Zowel univariaat als multivariaat

Additiviteit

Vgl model die bestaat uit alle mgl interactie-effecten met statistisch model die enkel hoofd-effecten bevat

Lineariteit

Verband is lineair

Uitbijters/outliers

Meer dan 2 std boven gestandaardiseerde verwachte waarde

Exogene variabele

Onafhankelijke

Endogene variabele

Afhankelijke

Mediatorvariabele

Staat tss oorz en gevolg relatieHelpt om causaliteit beter te verklaren

Moderatorvariabele

3e onafhankelijke variabele

Mediatie

Door opeenvolging van directe effecten kunnen in de padanalyse op natuurlijke wijze indirecte wijze worden gemodelleerd