Statistiek Flashcards
Statistiek
Verzameling + bewaring data in samenvattende vormMethode om data te analyseren
Explanandum
Te verklaren, wrm is iets zoals het isresponsvariabele
Explanans
Predictorvariabele (voorspellen)
Onderzoekseenheden
Over wie of wat je uitspraak doet
Variabelen
Kenmerken die variëren
Steekproef
Deeltje van onderzoekspopulatie
Onderzoekspopulatie
Groep die je onderzoekt
Respondenten
Personen die uiteindelijk bevraagd worden
Beschrijvende statistiek
Op een overzichtelijke en samenvattende wijze weergeven van kenmerken- Kunt niet veralgemenen- Geen causaliteit
Inductieve/inferentiële statistiek
Veralgemenen Hypothesen (onderzoeks (+), nul(-), alternatieve)
Beschrijvende onderzoeksvraag
Kwantitatieve opsomming/beschrijving van het fenomeen
Verkennende onderzoeksvraag
Aftasten nieuwe veronderstellingen (tss beschrijven en verklaren)
Verklarende onderzoeksvraag
Geobserveerde verschillen, veranderingen verklaren
Statistische eenheden
Onderzoekseenheden waarover men een uitspraak wil doen
Univariate analyse
1 kenm varieert
Bivariate analyse
2 variabelen
Multivariate analyse
Meerdere variabelen (+2)
Exclusiviteit
Niet overlappen, slechts 1 criterium aan de basis van de opdeling (zo objectief mogelijk)slechts 1
Exhaustiviteit
Alle onderzoekseenheden moet je kunnen classificerenniets ontbreekt
Dichotomie
Variabele die slechts 2 categorieën kan aannemen
Polytomie
Variabele die meerdere categorieën kan aannemen (2+)
Categorische data-analyse
Statistische analysetechnieken die beschikbaar zijn voor lage meetniveaus
Discrete variabelen
Beperkt tot telbare (1,2,3) (1,5)
Continue variabelen
Alle mogelijke waarden (1; 3; 5,897; ...)
Parameters van centraliteit
Centrale tendensen
Parameters van spreiding
Waargenomen verschillen
Incidentie
Aantal nieuwe gevallen
Prevalentie
Totaal aantal nieuwe personen in bepaalde conditie in een populatie op een bepaald moment
Modus
Frequentie die vaakst voorkomt
Kwantielen
Geordende rij kun je indelen in om het even welk aantal groepen met gelijk aantal elementen
Variatieratio
Proportie die niet tot modale categorie behoort
ID
Mate van concentratie van de waarnemingen over de categorieën
Symmetie
Mediaan = gemiddelde
Positieve asymmetrie
Mediaan kleiner dan gemiddelde (R)
Negatieve asymmetrie
Mediaan groter dan gemiddelde (L)
Kurtosis
= afplatting-> vgl met standaardnormale verdeling- Platykurtische: platter- Meso: gemiddelde afplatting- Lepto: scherper
Whisker
Uitschieters liggen hier niet opSnorharen van de boxplot (eindigt met max en min)
Tegenfeitelijk
Brengt gevolg teweeg dat niet zo zou zijn zonder ingrijpen of manipulatie
Generatieve causaliteit
Brengt gevolg teweeg door in gang zetten van een mechanisme
Robuuste afhankelijkheid van causaliteit
X = oorz Y als X bestaatX = oorz Y als X temporeel eerder komt dan YX = oorz Y als geen schijnverband is
Confounder
Controlevariabele
Reciproque (sym)
Wederzijdse invloed
Spurieuze relatie (sym)
Schijnverband
Contingentie of kruistabel
Categorische variabelenR*K
Celfrequenties
Aantal keer bepaalde combinatie van categorische variabelen voorkomt
Steekproefomvang
Som van de celfrequenties
Scatterplot
Puntenwolk Metrische variabelenVerzameling van alle elementen uit de sp waarbij we voor elk element de waarde op de X en Y variabele kunnen aflezen
Associatiematen
The tools of trade bij kwantitatief criminologisch onderzoek
Marginalen
Rij en kolomtotalen
Oddsratio
Voorkomen en niet voorkomen van een gebeurtenis uitdrukken=kruisproductratio
Chi-kwadraat
Waargenomen frequenties wijken systematisch af van verwachte frequenties of niet?
Residu
Verschil predictie en geobserveerde waarde
Model fit
Hoe goed past het model bij de geobserveerde data
Determinatiecoëfficient
Verhouding verklaarde variantie tov totale variantie
Aliënatiecoëfficient
Proportie van de totale variatie in Y die niet door X kan worden verklaard(1 - R2)
Statistische inferentie
Houdt zich met onzekerheid bezig door:- schatting- hypothesen testen of toetsen
Dark-figure problematiek
Verborgen problematiek
Aselecte sp
Elke eenheid uit empirische populatie heeft bekende/ berekende kans om in sp opgenomen te worden
Unbiased estimate
Zuivere onvertekende schatter
Significantietoets
Procedure om gegevens te vgl met een vooropgestelde hypothese (nl. 0-hypo)
Overschrijdingskans
Meet kans op het krijgen van een uitkomst die even extreem of extremer dan waargenomen voorkomt
Type-1 fout
Correcte nulhypothese verwerpen
Type-2 fout
Foute nulhypothese aanvaarden
Probabiliteit
Uitdrukking van waarschijnlijkheid of waarheidsgehalte van de nulhypo
Power
Kans dat statistische test leidt tot correcte verwerping van valse nulhypothese
Total SS
WGSS + BGSS
Binnengroepsvariatie (WGSS)
Som van gekwadrateerde afwijkingen van individuele scores van hun eigen groepsgemiddelde
Tussengroepsvariatie (BGSS)
Som van gekwadrateerde afwijkingen van groepsgemiddelde van het algemene gemiddelde
Degrees of freedom
Aantal waarnemingen min 1
Eta-kwadraat
Verhouding tss BGSS en totale variatie in Y
Partiële correlatiecoëf
Correlatie tss 2 variabelen onder statistische controle van 1 of meerdere storende variabelen
Suppressie-effect
Kan ervoor zorgen dat resultaten verkeerd worden ingeschat
Multicollineariteit
Samenhang tss onafhankelijke variabelen-> hoe sterker hoe meer misleidend de resultaten
Partiële overlap
Onderlinge samenhangHierdoor mag je geen 2 afz biv analyses optellen
Multivariate multiple regressie
Meerdere onafh en afh variabelen
Totale R2
Hoeveel van de variantie in Y kan worden verklaard op basis van onafhankelijke variabelen samen
Homoscedasticiteit
Variatie van de afhankelijke variabele is voor elke waarde van de onafhankelijke variabele gelijkSpreiding constant
Heteroscedasticiteit
Variatie van de afhankelijke variabele verschilt voor elke waarde van de onafhankelijke variabeleSpreiding in errorterm neemt toe met voorspelde waarden
Normaliteit
Zowel univariaat als multivariaat
Additiviteit
Vgl model die bestaat uit alle mgl interactie-effecten met statistisch model die enkel hoofd-effecten bevat
Lineariteit
Verband is lineair
Uitbijters/outliers
Meer dan 2 std boven gestandaardiseerde verwachte waarde
Exogene variabele
Onafhankelijke
Endogene variabele
Afhankelijke
Mediatorvariabele
Staat tss oorz en gevolg relatieHelpt om causaliteit beter te verklaren
Moderatorvariabele
3e onafhankelijke variabele
Mediatie
Door opeenvolging van directe effecten kunnen in de padanalyse op natuurlijke wijze indirecte wijze worden gemodelleerd