Missing values in SPSS

Missing values in SPSS

Missing values (ontbrekende gegevens) zijn gegevens of datapunten van een variabele die ontbreken. Het kan bijvoorbeeld veroorzaakt worden doordat een respondent vergeet een bepaalde vraag in een enquête in te vullen. Of een datum ontbreekt (in experimenteel onderzoek) door een mechanische fout. Een andere oorzaak is dat een respondent weigert een vraag te beantwoorden. Mogelijk omdat deze gevoelig ligt. Missing values kunnen een significant effect hebben op de conclusies die je kunt trekken op basis van de data. Dit betekent (in veel gevallen) niet dat we de data die we wel hebben in de vuilnisbank moeten gooien. Datatechnisch gezien kun je ook met missing values te maken krijgen wanneer je bijvoorbeeld in een enquête verschillende 'routes' toepast: verschillende typen respondenten (bv. klanten en prospects) krijgen verschillende vragen op basis van hun kenmerken of antwoorden. Wanneer je hier één dataset van maakt zullen er lege velden zijn, welke op de juiste wijze getypeerd dienen te worden, afhankelijk van de onderzoeksvraag die je wilt beantwoorden of hypothesedie je wilt toetsen.

Missing values coderen

Nu we weten wat missing values zijn en wanneer je hiermee te maken krijgt, een uitleg over hoe je hiermee om dient te gaan in SPSS. We dienen namelijk aan SPSS te vertellen wanneer een waarde of leeg veld als missing value wordt behandeld, maar vervolgens ook hoe een missing value wordt behandeld. Dit gaat min of meer volgens hetzelfde principe als het coderen van variabelen: we kiezen een bepaalde numerieke waarde die het ontbrekende datapunt vertegenwoordigt. Deze waarde vertelt SPSS dat er sprake is van een missing value in een bepaald geval, bijvoorbeeld voor een specifieke respondent voor een bepaalde variabele. In de analyse negeert SPSS de datapunten die zijn aangemerkt als missing value. Uiteraard dien je ervoor te waken dat de numerieke waarde die je toekent aan missing values niet overeenkomt met een van de numerieke waarden die je in de codering van de variabelen hebt gebruikt. Stel dat je het getal 7 toekent aan missing values en hetzelfde getal komt ook in de antwoorden van je enquête. SPSS zal dan alle antwoorden die als 7 gecodeerd zijn als missing value behandelen.

Numerieke waarde toekennen aan missing value

Het toekennen van een numerieke waarde aan een missing value gaat als volgt:
  1. Klik in de Variable View in de rij van de betreffende variabele in de cel onder de kolom Missing.
  2. Vervolgens klik je op het blauwe hokje met drie puntjes dat verschijnt. Hiermee activeer je het venster Missing Values (zie afbeelding onder). De standaardinstelling is No missing values. Als dit inderdaad het geval is met jouw dataset dan hoef je hier niets aan te veranderen.
  3. Er zijn twee manieren om missing values te definiëren. De eerste optie is Discrete missing values. Dit zijn enkelvoudige waarden die de ontbrekende data vertegenwoordigen. Je kunt maximaal drie verschillende discrete missing values invoeren. Je kunt voor meerdere waarden kiezen als je voor jezelf de betekenis van de missing value wilt differentiëren (bv. 6 = 'niet van toepassing', 7 = 'weet ik niet' en 99 = 'geen antwoord ingevuld'). De tweede optie is Range plus one optional discrete misssing value. Deze optie is handig wanneer je data tussen die tussen twee punten valt buiten de analyse wilt houden. Tenslotte kun je bij deze laatste optie nog kiezen voor een aanvullende discrete missing value.
missing-values-in-spss

Listwise of pairwise deletion?

Wanneer je de missing values hebt gecodeerd en je aan je analyse begint duikt er een nieuw vraagstuk op met betrekking tot missing values: listwise of pairwise deletion? Listwise betekent dat elke case (bijv. een respondent) met een missing value buiten de analyse wordt gehouden. Pairwise houdt in dat SPSS alleen de missing values laat vallen en de rest van de case behoudt. Bijvoorbeeld, van een respondent die haar leeftijd niet heeft ingevuld, neem je wel ingevulde velden mee. Beide methoden hebben doen dus totaal verschillende aannamen over de manier waarop met data wordt omgegaan. Je zult doen even moeten nadenken, met het doel van jouw onderzoek in je achterhoofd, wat de meest passende vorm is om met missing values om te gaan. In SPSS kun je jouw keuze aangeven in het optiescherm bij de betreffende analyse die je gaat uitvoeren (hier onder een voorbeeld).

missing-values-pairwise-listwise-deletion
Yoni
Door

Yoni

op 12 Jul 2020

Beste Luuk, Ik voer onderzoek naar werkdruk en burn-out in het onderwijs. Voor mijn statische analyse zou ik mijn Likertschaal Nooit Zelden Soms Vaak Altijd (score van 1 tot 4 dus) willen omzetten naar score van 0 tot 10 in SPSS, hoe krijg ik dat voor me mekaar.Ik had het volgende reeds bedacht [ (omzetten 1-4 naar 0-10 met formule: (a=1, b=4, A=0, B=10): Y = (B-A)*(x-a)/(b-a)+A concreet: bijv je hebt 2 op 4; wordt een score op 10 van: Y = 10*(2-1)/(4-1)+0= 3,33 In SPSS dus de formule in (DE te berekenen variabele bijv werkdruk gemiddeld op 10) = (10*werkdruk gemiddeld op 4 - 1)/3, en zo voor de 9 andere schalen] maar kan je me concreet in SPSS 25 aanduiden / of een bron bieden waar/hoe deze stappen, al dan niet visueel, worden gedaan, ben vrijwel een leek hierin. Het is een beetje dringend. Alvast bedankt voor je hulp. Groeten, Yoni

Luuk Tubbing
Door

Luuk Tubbing

op 12 Jul 2020

Beste Yoni, Het omzetten van een variabele doe je met de functionaliteit 'Compute Variable'. Als je dit googeled vind je talloze tutorials. Overigens weet ik niet of ik jouw uitleg goed begrijp. Ik tel een 5-puntsschaal (Nooit, Zelden, Soms, Vaak, Altijd), niet 1-4... Als je dit omzet naar 1-10 (0 zou ik gebruiken voor non-respons/missing values/nvt) is het een kwestie van de score met 2 vermenigvuldigen . Waarom wil je trouwens de scores omzetten? Dit kan namelijk voor de lezer van jouw scriptie een verkeerd beeld geven. Op een 10-puntsschaal krijg je vanzelfsprekend meer verfijnde scores dan op een 5-puntsschaal. Als je van 5 naar 10 omzet mis je de tussenliggende (oneven) scores. Groeten, Luuk

Yanne
Door

Yanne

op 10 Apr 2020

Beste Luuk,Ik voer onderzoek naar de impact van het geslacht van de bedrijfsleiding op de vraag naar formeel risicokapitaal. Hierbij zijn enkele determinanten gekend (zoals ondernemingsgrootte, ...) die de vraag naar formeel risicokapitaal beïnvloeden en hierbij verschillen tussen mannen en vrouwen. Ik voer hierbij meervoudige logistische regressies uit. Enerzijds met als afhankelijke variabele 'geslacht' en anderzijds met als afhankelijke variabele 'de voorkeur voor het gebruiken van formeel risicokapitaal'. Beide variabelen zijn dus binair gecodeerd. Mijn model bestaat uit ongeveer 15 onafhankelijke variabelen. Nu heb ik het probleem dat bij twee van deze variabelen slechts 25 van de 81 respondenten een antwoord aangeduid hebben. Ik ken hierbij dus 56 missing values. De variabelen zijn beide schaalvariabelen. Nu vroeg ik mij af hoe ik hier in deze specifieke case mee kan omgaan. Als ik de LOGIT regressie met inbegrip van de twee variabelen met weinig respons wil uitvoeren krijg ik de melding: 'perfect prediction obtained: no MLE exists' op het programma Gretl. Bij SPSS bekom ik bij block : method = enter ook geen tabel met de uitkomsten van de logistische regressie. Wanneer ik de twee variabelen weglaat bekom ik wel een model. Ik vraag mij af hoe ik deze twee variabelen toch kan betrekken bij het onderzoek.

Mariska
Door

Mariska

op 17 Mar 2020

Hi Luuk, Ik ben mijn data aan het coderen en loop nu tegen een hele lage chronbach alfa aan bij de ja/nee/n.v.t. vragen. Ik denk dat ik ze niet goed heb gecodeerd Ik heb twee soorten vragen in mijn vragenlijst zitten 1 de vijfpunt likerschaal en de ja/nee/n.v.t vragen. Ik heb de ja/nee/nvt gecodeerd als ja=3, nee=2, en nvt=1. En kom nu op een crohnbachalfa van 0.428. De andere vragen waar geen ja/nee/nvt in zit komen allemaal wel op een 0.8/0.9.

Luuk Tubbing
Door

Luuk Tubbing

op 17 Mar 2020

Hi Mariska, Waarschijnlijk heeft dat niets te maken met het coderen. Wellicht krijg je een lage Cronbach's Alpha omdat de vraagstelling inconsistent is (bijv. omdat een deel van de vragen negatief/ontkennend geformuleerd is, zonder dat je hier rekening mee houdt in de codering) of omdat de vragen simpelweg niet hetzelfde meten (dat is wat je toetst).

Feray
Door

Feray

op 22 Jan 2020

Hoi,Bedankt voor de heldere uitleg! Dit heb ik allemaal toegepast, maar de Chi2 toets pakt het niet. Dit is aan de hand:1. Ik heb een dataset met jongeren en een dataset met ouders samengevoegd tot één dataset (add cases). 2. Beide datasets (dus zowel jongeren als ouders) hebben antwoord gegeven op eenzelfde vraag (eenzelfde variabele) 3. Deze variabele bevat nu in de samengestelde dataset de antwoorden van zowel jongeren als ouders. 4. Ik wil graag een Chi2 toets uitvoeren (de variabele heeft 3 categorien) om te kijken of de antwoorden significant van elkaar verschillen tussen jongeren en ouders, en of dat misschien enkel door toeval komt. 5. Nu maak ik vanuit deze gecombineerde (jongeren + ouders) variabele, twee nieuwe variabelen. Een variabele bevat enkel de antwoorden van jongeren, en dus GEEN antwoorden van ouders. En een variabele met enkel de antwoorden van ouders, en dus GEEN antwoorden van jongeren. 6. Wanneer ik de missing values als '99' aangeef in variable view, en vervolgens de Chi2 toets aanzet, krijg ik de melding "The crosstabulation of tiener * parents is empty". Dit kreeg ik overigens ook voordat ik de missing values erin plaatste. 7. Wanneer ik een dubbel check met descriptives doe, zie ik zowel bij ouders als bij jongeren de correcte aantal respondenten. Het ligt dus echt aan het feit dat bij allebei de nieuwe variabelen een hoop vakjes leeg zijn.P.S. Ik weet niet zo goed of we die lege vakjes missing values kunnen noemen, omdat de antwoorden van de andere groep populatie wel bestaat in de dataset (alleen zijn die geexcludeerd uit die ene nieuwe variabele).Zie jij wat hier misgaat en wat ikzelf over het hoofd zie? Hoe kan ik toch een Chi2 uitvoeren (eventueel binnen de originele variabele)?? Zou het enórm waarderen als je mij hierbij zou kunnen helpen!Groetjes, Feray

Luuk Tubbing
Door

Luuk Tubbing

op 22 Jan 2020

Hoi Feray, Punt 5 volg ik niet. Waarom heb je die twee nieuwe variabelen gemaakt? Is dat om de jongeren en ouders te kunnen herkennen in de data? Normaliter zou ik dat doen door een kolom toe te voegen waar je aangeeft om welke groep het gaat (bijv. 'leeftijdsgroep' als variabele, met 'tiener' en 'oudere' als waarden). Of praten we langs elkaar heen? Groetjes, Luuk

Ymkje
Door

Ymkje

op 29 Jul 2019

Beste Luuk, Is het mogelijk om een bepaald aantal van mijn system missings een andere waarde toe te kennen dan de rest? De context: ik probeer de gewerkte uren van twee groepen over tijd met elkaar te vergelijken. Ik heb dus twee groepen, maar nu heb ik in groep 2 meer missings values dan in groep 1. De missing values moeten worden gecodeerd als een '0', gezien deze mensen nul uren werken. Maar doordat het aantal missings in groep 2 groter is dan in groep 1, trekt dit het gemiddelde naar beneden. Nu dacht ik, wat nou als ik een gedeelte van de missings van groep 2 aanvul met het gemiddelde gewerkte uren van groep 2 totdat het er evenveel zijn als in groep 1, dan wordt het gemiddelde veel minder naar beneden getrokken. Is dit mogelijk? En zo ja, hoe?

Luuk Tubbing
Door

Luuk Tubbing

op 30 Jul 2019

Beste Ymkje, ik snap niet precies wat het probleem is en waarom je dit op deze wijze wilt oplossen. De 0 moet je niet zien als 0 uren gewerkt, maar als een missing value. Normaal gesproken laat je de missing values uit de berekening van het gemiddelde. Kom je hier verder mee? Groeten, Luuk

Emma
Door

Emma

op 21 May 2019

Hoi Luuk, Voor mijn afstudeer onderzoek heb ik door 5 artsen 50 patiënten laten beoordelen op 3 categorieën. 1. waar kwamen de patiënten mee langs (hierbij moesten triggers worden gedefinieerd uit een lijst. Indien het event niet op de trigger lijst stond kon er 'niet van toepassing' worden ingevuld. 2. aan de hand van de medicatie die ze gebruikten heb ik laten beoordelen of het event door de medicatie veroorzaakt zou kunnen zijn (causaliteit; let op, hierbij heb ik ze ook de keuze niet van toepassing gegeven, als er geen medicatie in gebruik was die voor het 'event/trigger' zou kunnen zorgen. 3. Als het even/trigger door medicatie veroorzaakt was, moesten ze ook de mogelijke kans op vermijdbaarheid invullen (zeker, misschien, niet vermijdbaar). Ook hier kan dus niet van toepassing worden ingevuld (indien geen trigger uit de lijst, of niet causaal). Nu wil ik de 'nvt' omzetten in een 0 waarde, aangezien het geen missing value is, maar ook een antwoord. Hier wil ik later een Fleiss Kappa over berekenen om te zien hoe eens alle artsen het met elkaar zijn. Hoe vul ik een missing value in? (dat het een 'waarde)' krijgt?Groet,Emma

Luuk Tubbing
Door

Luuk Tubbing

op 21 May 2019

Beste Emma, Ik begrijp je vraag niet precies. Wellicht is deze te complex voor deze plaats. Ik doe toch een poging. Nvt omzetten in een 0-waarde zou ik zelf met Excel doen (met zoeken en vervangen) en dan de dataset opnieuw in SPSS inladen. Als je Googled op 'SPSS convert string to numeric' vind je het antwoord denk ik wel. In bovenstaande artikel staat uitgelegd hoe je een missing value invult. Is dit een antwoord? Succes! Groet, Luuk

Katrien
Door

Katrien

op 15 May 2019

Hoi Luuk,Mijn databestand bestaat uit 79 cases (proefpersonen), 2 relevante afhankelijke variabelen (uitkomsten op taak A en taak B), 1 onafhankelijke between-subjectfactor (conditie 1 en conditie 2) en 1 onafhankelijke within-subjectfactor (voormeting en nameting).Ik ga hierop twee 2x2 repeated measures ANOVA's uitvoeren (1 voor iedere afhankelijke variabele).Voor variabele A (taak A) heb ik missing values bij 4 cases Voor variabele B (taak B) heb ik missing values bij 6 cases De missing values bij taak A en B zijn echter bij compleet andere proefpersonen.Vraag 1: Ik dacht dat pairwise deletion dan het beste zou zijn, omdat ik anders 10 cases moet excluderen van analyse. Klopt dat? Bij listwise deletion zou ik gelijk nog maar 69 cases hebben.. Ik weet niet precies of mijn power dan te laag wordt..Vraag 2: In het geval dat pairwise deletion inderdaad het beste is - hoe rapporteer ik dan de 'participants characteristics' in de methodesectie? rapporteer ik deze dan toch over het totaal aantal (79 participanten) - of apart voor de 75 cases voor afhankelijke variabele A (taak A) en de 73 cases voor afhankelijke variabele B (taak B).Met vriendelijke groet,Katrien

Luuk Tubbing
Door

Luuk Tubbing

op 17 May 2019

Hoi Katrien, Pairwise lijkt mij inderdaad de meest passende keuze. In de methodesectie rapporteer je de karakteristieken over het totaal en eventueel ook nog over subgroepen (als die doelbewust verschillend zijn qua karakteristieken - een taak lijkt mij geen karakteristiek). Helder? Succes! Met vriendelijke groet, Luuk

Bettine
Door

Bettine

op 18 Apr 2019

Dag Luuk, Ik ben bezig met de missing values en verschilllende data die ik niet in mijn analyse wil hebben te filteren. Ik heb een variabele aangemaakt die ik 'accepted' heb genoemd waarbij data een '1' krijgt die wel mee mag doen en data een '2' krijgt die niet hoeft mee te doen. Ik heb laatst iets gedaan waardoor er streepjes in de eerste rij van de data kwam te staan die ik een 2 had gegeven. Echter, ik heb SPSS toen afgesloten en is dit toen ook weggegaan. Het probleem is dat ik nu niet meer weet hoe ik dit heb gedaan. Ik heb heel internet afgezocht maar kom steeds uit op missing values niet meenemen, maar dit is iets anders dan wat ik bedoel. Ik hoop dat u mijn vraag begrijpt en mij kan helpen! Ik hoor graag van u.Groet, Bettine

Floor
Door

Floor

op 01 May 2019

Ik zit nu met hetzelfde probleem en krijg de streepjes niet meer weg. Wat ging er precies mis en hoe is het opgelost?

Bettine
Door

Bettine

op 18 Apr 2019

Ik heb het al gevonden!

Nadianne van den Ende
Door

Nadianne van den Ende

op 19 Mar 2019

Beste Luuk, Ik heb geprobeerd het antwoord te vinden in eerdere reacties, maar ben het volgens mij nog niet tegengekomen. Ik heb voor 1 enquête 2 strata, ik doe namelijk onderzoek naar leerlingen die een maatschappelijk programma volgen op school. 1 strata volgt alleen de workshops en de andere strata volgt zowel de workshops als de maatschappelijke voetbalcompetitie. De eerste 20 vragen van mijn enquête gaan over de workshops en kunnen beide strata beantwoorden. Daarna volgen er vragen die over de voetbal gaan en is strata 1 klaar met de enquête. Hoe verwerk ik dit juist in SPSS? Ik ga de 2 strata namelijk ook vergelijken om te kijken of zij de workshops wellicht anders beoordelen. Moet ik dan als ik strata 1 invul de vragen over de voetbal als missing value ''niet van toepassing'' coderen?

Luuk Tubbing
Door

Luuk Tubbing

op 20 Mar 2019

Beste Nadianne, deze vraag wordt regelmatig gesteld. Voor de vragen over voetbal analyseer je dan alleen de groep die het heeft ingevuld. Je kunt met een variabele aangeven welke groep het was of hier aparte dataset maken met alleen de voetbalresultaten. Helder? Groeten, Luuk

Lieke
Door

Lieke

op 14 Feb 2019

Beste Luuk, In mijn onderzoek heb ik meerdere databases samengevoegd. Als gevolg hiervan zijn er voor één patiënt meerdere regels aangemaakt. Het samenvoegen van de databases heeft echter tot gevolg dat bijv. geboortedatum en operatiezijde vaak slechts alleen in de eerste regel over de patiënt zijn ingevuld (omdat dit slechts in één van de samengevoegde bestanden beschreven staat). Hierdoor zijn er veel missende waarden in de samengevoegde database, wat in de praktijk geen missende waarden zijn. Graag zou ik deze velden (voor het draaien van de database van lang naar breed) alsnog vullen. Kunt u mij vertellen hoe ik dit aan kan pakken? Is hier een specifieke syntax voor? Alvast bedankt. Met vriendelijke groet, Lieke

Michel
Door

Michel

op 27 Mar 2020

Hartstikke bedankt voor je snelle reactie, Luuk! Ik had dat niet zo snel verwacht. Merge files zorgt er helaas voor dat alleen de bovenste case wordt gekoppeld aan de nieuwe variabele, zoals Lieke ook bij haar onderzoek omschrijft. Ik heb SQL gedownload maar oef dat is een syntax al syntax en die taal spreek ik nog niet helemaal. Ik heb de gegevens niet in mooie Excel tabellen, dus als ik met SPSS toch die datatransformatie kan doen zou fijn zijn. Het kan evt ook handmatig kopiëren en plakken maar dat is minder aangezien het 13000 cases zijn en sws minder goed te verantwoorden. Ik hoor het graag als ik het automatisch kan oplossen met SPSS!

Michel
Door

Michel

op 25 Mar 2020

Hi, Ik heb hetzelfde probleem! Heb jij een oplossing?! Handmatig is het niet te doen en ook niet goed te verantwoorden. SQL ben ik niet bekend mee en Excel doet ook niet wat ik wil. Dus bij deze een oproep hoe ik het kan oplossen.

Luuk Tubbing
Door

Luuk Tubbing

op 25 Mar 2020

Hi Michel, Als je 'merge files in spss' googelt vind je het antwoord. Er zijn allerlei manieren om twee bestanden in SPSS samen te voegen.

Luuk Tubbing
Door

Luuk Tubbing

op 14 Feb 2019

Beste Lieke, Daar kan ik je helaas niet mee helpen wat betreft SPSS. Zelf gebruik ik voor dergelijke datatransformaties MS Excel (mbv de 'vlookup' functie) of SQL ('joinen' van verschillende tabellen), aangezien SPSS daar niet goed in is. Met vriendelijke groet, Luuk

Jildou
Door

Jildou

op 29 Jan 2019

Hoi Luuk, Ik ben bezig met mijn masterscriptie en wil graag het gemiddelde van twee groepen weergeven. Nu heb ik variabelen die uit meerdere items bestaan en op sommige items hebben repsondenten geen antwoord gegeven, maar ik wil wel graag dat het gemiddelde van de variabele (op de ingevulde items) wordt weergegeven. Hoe kan ik dit instellen? Want pairwise deletion neemt de variabelen waarvan 1 item niet is ingevuld niet mee in het gemiddelde....mvg

Luuk Tubbing
Door

Luuk Tubbing

op 29 Jan 2019

Hoi Jildou, pairwise deletion betekent dat SPSS alleen de missing values laat vallen en de rest van de case behoudt. Het gemiddelde wordt dan dus berekend over de overgebleven waarden.

Jantien
Door

Jantien

op 02 Jan 2019

Hi! Bij de enquête voor mijn master thesis kregen respondenten één van de zes condities voor zich (in wezen dezelfde vragenlijst maar dan met verschillend stimulus material). Deze categorieën wil ik met elkaar vergelijken om te kijken welke van de stimulus material de meeste invloed heeft op de onafhankelijke variabelen. Nu is het alleen zo dat elke respondent veel system missing values heeft, omdat 5 condities niet ingevuld zijn. Ook zijn er verschillende routes binnen de enquête (waardoor sommige vragen wel/niet beantwoord worden). Hoe kan ik dit het beste/makkelijk weergeven in de dataset, gezien alle responses door elkaar staan en niet gefilterd zijn? Met of zonder missing values? Ook in verband met de factor analyse en Cronbach's alfa. Alvast bedankt!

Luuk Tubbing
Door

Luuk Tubbing

op 13 Jan 2019

Hi Jantien, ik snap je vraag niet goed. Kun je deze specifieker maken? Wat bedoel je met weergeven in de dataset? Het gaat er uiteindelijk om dat je per analyse de juiste groep respondenten includeert. Uiteraard alleen degenen die de vragen hebben beantwoord, ervan uitgaande dat het niet mogelijk was om vragen over te slaan (los van vooraf bepaalde routes). Groeten, Luuk

Britt
Door

Britt

op 17 Nov 2018

Hoi! Ik onderzoek het effect van geslacht en ervaring op financiële beslissingen met een regressie-analyse in een steekproef van 165 mensen. Ik heb een paar missing values. Moet ik de regressie-analyse doen met "listwise deletion" of "pairwise deletion"?

Luuk Tubbing
Door

Luuk Tubbing

op 17 Nov 2018

Hoi Britt, Dat kan ik o.b.v. deze informatie niet bepalen, want hangt af van de aard/reden van deze missing values. Je kunt pairwise toepassen als de respondenten met missing values representatief zijn voor de populatie.

Katrin
Door

Katrin

op 28 Jul 2018

Dag Luuk, Bedankt voor de uitleg allereerst. Ik heb inderdaad -2 als discrete missing value aangeduid in mijn data. Ik ben momenteel mijn missing values aan het proberen aanvullen in SPSS (volgens een youtube tutorial). Ik analyseer dus mijn missing values, alles correct. Transform, random number generators,... Dan doe ik multiple imputation, impute missing values en geef alles aan. En dan scan ik m'n data om zo de constraints aan te duiden, maar na het scannen geeft hij dan aan dat mijn min value = 1 en heeft hij 0 meegerekend als onbekende waarde, terwijl dat nergens zo staat aangeduid. Ik loop echt muurvast hierop helaas.

Luuk Tubbing
Door

Luuk Tubbing

op 29 Jul 2018

Dag Katrin, Bedankt voor je vraag. Op basis van deze uitleg kan ik niet aangeven waar precies het probleem en de oplossing zit. Als je behoefte hebt aan persoonlijke hulp hierbij kun je je hier aanmelden: https://deafstudeerconsultant.nl/scriptiehulp/ Dan wordt je door een van onze begeleiders verder geholpen. Groeten, Luuk

Jildou
Door

Jildou

op 22 Jul 2018

Hoi Luuk, Dit stappenplan heb ik al gevolgd. Als ik nu een nieuwe variabele maak door de verschillende items bij elkaar op te tellen (zoals in mijn eerste vraag beschreven), dan houdt SPSS er automatisch rekening mee dat dit wordt gedeeld door het aantal opgetelde waarden te delen door het aantal antwoorden (waarbij je de missing values buiten beschouwing laat)? Of moet ik dat zelf instellen door 'if 99...' oid?Met vriendelijke groet, Jildou

Luuk Tubbing
Door

Luuk Tubbing

op 22 Jul 2018

Hoi Jildou, ik weet niet of SPSS automatisch rekening houdt met missing variables bij gebruik van de compute functie van SPSS. Mijn antwoorden gaan over het berekenen van gemiddelden in het algemeen (los van SPSS) en omgaan met missing values (los van de compute functie). Hoe beide functies samenwerken durf ik niet te zeggen.

Jildou
Door

Jildou

op 21 Jul 2018

Hoi, Ik maak gebruik van een enquête voor mijn onderzoek. Verschillende vragen meten 1 variabele. Nu wou ik voor het meten van het gemiddelde en standaarddeviatie van de variabele de data van de verschillende vragen bij elkaar optellen. Maar doordat ik missing heb, geeft dit een vertekend resultaat van het gemiddelde (deze wordt niet meegenomen namelijk, maar kan net zo goed een laag gemiddelde veroorzaken). Hoe kan ik dit voorkomen?Bijvoorbeeld voor het meten van contact worden 5 vragen met als antwoordcategorie van 1 t/m 5 lopend van 1 = weinig contact en 5 = veel contact bij elkaar opgeteld. De missing zorgen ervoor dat hetl lijkt alsof er weinig contact is, maar de missing geeft juist aan dat een respondent het niet weet. Hoe kan ik dit het best oplossen?

Luuk Tubbing
Door

Luuk Tubbing

op 22 Jul 2018

Hi Jildou, in bovenstaande artikel staat uitgelegd hoe je missing values buiten je berekening kunt houden. Beter dan dat kan ik het niet uitleggen.

Jildou
Door

Jildou

op 21 Jul 2018

Dag Luuk,Wat fijn dat je zo snel reageert. Dat is een goede manier lijkt mij. Zo geven de missing values geen vertekent beeld van het eigenlijke gemiddelde. Is er ook een manier hoe ik dit het best kan verwerken in SPSS? Want hier kom ik helaas niet helemaal uit.Met vriendelijke groet, Jildou

Luuk Tubbing
Door

Luuk Tubbing

op 21 Jul 2018

Hoi Jildou, Dit kun je oplossen door de opgetelde waarden te delen door het aantal antwoorden (waarbij je de missing values buiten beschouwing laat). Het gaat er dus niet zozeer om hoe je de berekening uitvoert, maar welke waarden je wel of niet includeert. Helder? Extra tip: rapporteer naast het gemiddelde ook de mediaan (de middelste waarde in de verdeling). Deze geeft een goed beeld van het 'typisch' antwoord, terwijl een gemiddelde vertekend kan zijn door een scheve verdeling en outliers (hoewel jij geen extreme outliers zult hebben, omdat je een ordinale schaal gebruikt). Succes! Groeten, Luuk

HenkJan
Door

HenkJan

op 11 Jul 2018

Zou je ipv dit hierboven de missing values ook gewoon als nul kunnen invoeren? Voordat je in SPSS inleest

Luuk Tubbing
Door

Luuk Tubbing

op 11 Jul 2018

Ook als je van te voren de missing values een 0-waarde geeft zul je deze in SPSS moeten definiëren, zodat SPSS weet welke waarden als missing gezien moeten worden en deze op de juiste manier meeneemt in berekeningen.

Smithd0
Door

Smithd0

op 15 Jun 2018

This website is mostly a walkby for all the info you wished about this and didnt know who to ask. Glimpse right here, and also youll undoubtedly uncover it. ggcdkkdgeaefcfec

John
Door

John

op 23 May 2018

Beste, Bedankt voor jullie leerzame uitleg steeds op de website. Ik heb een vraag m.b.t. hercoderen van een 'tegenstellings' vraag in mijn enquete. De vraag is als volgt:Ik denk dat deze technologie.. Veel slechter voor X zal zijn 1 2 3 4 5 Veel beter voor X zal zijn Zeer weinig zal bijdragen aan Y 1 2 3 4 5 Zeer veel zal bijdragen aan Y Ik neem aan dat ik de 1-5 gewoon codeer net als een normale vraag(1 = veel slechter, 2=slechter, 3=neutraal, veel=beter, 5=veel beter, etc.) ? Of bestaat er voor tegenstellings vragen een speciale manier?Mvg, John

Luuk Tubbing
Door

Luuk Tubbing

op 25 May 2018

Beste John, fijn dat je de uitleg op onze website leerzaam vind. Zover ik weet is er niet zoiets als een 'tegenstellingsvraag' die om aparte behandeling vraagt. Het gaat er uiteindelijk om dat een vraag valide (meten wat je beoogd te meten) en betrouwbare (nauwkeurig en precies) antwoorden oplevert. Belangrijk is dat de meetschalen voor de respondent begrijpelijk en consistent zijn. Dus zoveel mogelijk dezelfde schalen toepassen, gelijke intervallen en labeling van antwoorden gebruiken, etc.

Sara
Door

Sara

op 12 May 2018

Beste Luuk, Ik wil graag een gemiddelde score van mijn vragenlijst omzetten in procenten. Nu heeft mijn likert schaal: 1 = >90% 2 = 75% 3 = 50% 4 = 25% 5 = 10% al percentage gekoppeld aan cijfers. Alleen zijn mijn gemiddeldes andere waardes zoals 2,69. Hoe kan ik de 2,69 omzetten in percentages aan de hand van deze likertschaal?Met vriendelijke groet, Sara

Luuk Tubbing
Door

Luuk Tubbing

op 13 May 2018

Beste Sara, Waar wil je deze percentages voor gebruiken? Het is namelijk ongebruikelijk en misleidend om resultaten van een Likertschaal als percentages te rapporteren. Wil je dit toch doen, dan zou ik de hoogste waarde labelen als 100% (nu >90%) en de laagste als 0% (nu 10%). Dan heb je telkens een interval van 25%. Het omzetten doe je door de waarden te hercoderen: Transform > Recode into Different Variables. Met vriendelijke groet, Luuk

Ella
Door

Ella

op 16 Apr 2018

Beste Luuk,Bedankt voor de uitleg! Ik ben bezig met mijn scriptie, maar weet niet hoe ik precies met de missings om moet gaan. Ik doe een longitudinaal onderzoek, waarbij ik de cases wil wissen die op het derde meetmoment een bepaalde vraag niet hebben beantwoord. Deze cases staan in de variable view geregisteerd als -999, system missing. Als ik vervolgens bij de data view kijk, staat er inderdaad soms -999, maar ook heel vaak gewoon een leeg hokje (-). Wat is dan het verschil hier tussen? En hoe zorg ik ervoor dat ik de cases die op het derde meetmoment niet hebben geantwoord uit de dataset haal?Ik hoop dat ik mijn probleem zo duidelijk heb uitgelegd, alvast bedankt voor je reactie!

Luuk Tubbing
Door

Luuk Tubbing

op 16 Apr 2018

Beste Ella, Wat het verschil is in betekenis tussen een leeg hokje en -999 hangt af van wat degene die het heeft gecodeerd hiermee bedoelt. Zorg er eerst voor dat je alle missing values eenduidig codeert. Vervolgens kun je deze listwise of pairwise verwijderen uit de dataset. Deze stappen staan in het artikel hierboven beschreven. Groeten, Luuk

Sara
Door

Sara

op 13 Apr 2018

Beste Luuk,Ik ben momenteel ook bezig mijn masterscriptie en ik kom niet echt uit. Ik heb een vragenlijst met een 6punts likert schaal, waarbij de 6 staat voor weet ik niet.Ik wil deze vragenlijst beschrijven met beschrijvende statistiek (gemiddelde etc.) Alleen kwam ik er achter dat ik de 6 niet als hoge waarde kan hebben, omdat mijn resultaten dan niet zullen kloppen. Nu ben ik erop gekomen om de Likertschaal te hercoderen.Nu vroeg ik me af of ik van de 6 een 0 mag maken als waarde? Dus dat ik dit doe: 6 = 0 5 = 1 4 = 2 3 = 3 2 = 4 1= 5Ik heb vanuit school uit altijd geleerd dat de 6 = 1 wordt en de 1 = 6, maar als ik dit doe, dan kloppen mijn resultaten alsnog niet, want dan zal de score 1 het gemiddelde verpesten.Ik hoop dat je mijn vraag een beetje begrijpt

Luuk Tubbing
Door

Luuk Tubbing

op 16 Apr 2018

Beste Sara, Deze hercodering is prima. Echter kan de nul ook het gemiddelde verstoren. Het gaat erom dat je deze waarde buiten de analyse laat van (in ieder geval) de centrummaten.

Tessa
Door

Tessa

op 17 Mar 2018

Hee Luuk, Ik heb een vraag, ik heb 15 vragen samengevoegd tot een nieuwe variabele, nu wil ik enkel de respondenten meenemen die op deze variabele niet meer dan 5 missende waardes hebben, weet jij toevallig hoe ik dit in SPSS moet doen. Met google kan ik het niet vinden... Zou heel fijn zijn als je dit toevallig weet! Groet, Tessa

Luuk Tubbing
Door

Luuk Tubbing

op 17 Mar 2018

Hee Tessa, Ik zou niet weten hoe je dit op een nette manier kunt doen. Je kunt natuurlijk handmatig uitzoeken welke respondenten je niet wilt meenemen en bij hen de toegevoegde variabele verwijderen. Succes! Groet, Luuk

Rob
Door

Rob

op 16 Jun 2017

Hoi Luuk, ik heb een vraag over missing values i.c.m. een binary logistic regression. Is het mogelijk om aan missing values een waarde te hangen (die verder niet in de dataset voorkomt) zonder deze in de Variable View aan te geven als missing value? Of beinvloedt dit de resultaten van de andere values? Wanneer ik de missing value namelijk wel aangeef, krijg ik een foutmelding in de output. Alvast bedankt! Groeten, Rob

Luuk Tubbing
Door

Luuk Tubbing

op 16 Jun 2017

Hoi Rob, Het is zeker mogelijk om aan missing values een waarde te hangen (zie uitleg in bovenstaande artikel). Dit zal de resultaten van de andere values niet mogen beinvloeden. Ik kan zo niet beoordelen waarom (en welke) foutmelding je krijgt. Succes Rob! Groeten, Luuk

Judith
Door

Judith

op 23 May 2017

Hallo, Als je missende waardes hebt op je afhankelijke variabele, kan je de deelnemers dan net zo goed verwijderen of niet? Ik hoor het graag, alvast bedankt voor de hulp. Groeten, Judith

Luuk Tubbing
Door

Luuk Tubbing

op 24 May 2017

Hallo Judith, klopt. Deze deelnemers als non-response meetellen. Groeten, Luuk

Eva
Door

Eva

op 19 May 2017

Hallo, ik heb een vraagje hoe je missende waardes uit je analyses kan halen. Ik doe een onderzoek naar agressie bij kinderen. De training bestond uit 5 sessies. Ik wil graag alleen kinderen meenemen in de analyse die minstens 5 sessies hebben bijgewoond. Nu komt uit elke sessie ook weer data van een voormeting, trainingsmeting en nameting. Hoe kan ik dit in SPSS het beste de betreffende personen verwijderen (of als missing erin zetten)?

Luuk Tubbing
Door

Luuk Tubbing

op 20 May 2017

Hallo Eva, daar zijn allerlei manieren voor. Je kunt bijvoorbeeld missing values van de cases die je wel wilt meenemen met een ander getal coderen dan de missing values van de cases die je niet wilt meenemen. Daar kun je dan je selectie op maken met de bovenstaande artikel beschreven methode. Helder Eva? Succes!

Eva
Door

Eva

op 07 May 2017

Hallo Luuk, ik heb een vraag over het verwerken van missings in een tabel, want ik neem aan dat je deze niet zomaar achterwege kan laten. Ik heb 94 dossiers onderzocht en bij een bepaalde vraag zijn er twee missings en voor de andere 92 dossiers geldt allemaal het zelfde antwoord namelijk JA. Bij Valid Percent staat 100%. Ik heb geleerd dat je altijd naar Valid Percent moet kijken. Maar dat zijn niet de 94 dossiers maar 92. Zet je dan bovenaan de tabel (n=94) en in de tabel JA - 100% (92) en verklaar je dan het verschil van 2 in de begeleidende tekst? Ik hoop dat mijn vraag zo duidelijk is. Alvast heel erg bedankt.Vriendelijke groeten,Eva

Luuk Tubbing
Door

Luuk Tubbing

op 08 May 2017

Hallo Eva, Bedankt voor je vraag. Ik begrijp de vraag echter niet helemaal en in vermoed dat ik voor het antwoord meer informatie nodig heb, zoals wat het doel is van de tabel waar je het over hebt en wat het belang is van de variabele waar de missing values zitten. Vriendelijke groeten, Luuk

Eva
Door

Eva

op 19 May 2017

Ik heb bijvoorbeeld 5 sessies en daarin moesten de kinderen een test doen. Een aantal kinderen hebben niet alle sessies bijgewoond en deze wil er er graag uit hebben. Ik wil alleen de kinderen meenemen die minstens vier sessies hebben bijgewoond.

Roos
Door

Roos

op 03 May 2017

Hoi Luuk,Fijn en duidelijk artikel. Hoe ik de missende waarde kan opgeven via het menu begrijp ik nu. Maar is het ook mogelijk om dit via de syntax te doen? De syntax die ik gebruik moet vaak door verschillende mensen worden gebruikt. En elke keer het enorme databestand meesturen is geen optie. Ik hoop dat jij een idee hebt.Mvg, Roos

Luuk Tubbing
Door

Luuk Tubbing

op 07 May 2017

Hoi Roos, Daar kan ik je helaas niet mee verder helpen. SPSS is een veelgebruikte tool, dus ik denk dat Google je wel verder kan helpen. Succes! Mvg, Luuk

Renske
Door

Renske

op 22 Feb 2017

Beste Luuk,Ik ben aan mijn scriptie aan het schrijven en loop vast op een bepaalde variabele. Van 12 verschillende items wil ik een somscore maken. Alle 12 de items worden gescoord op een Likert-schaal van 1 tot 6. Nu is het zo dat in mijn data-set sommige scores niet goed zijn ingevoerd. Zo staan er scores met allerlei decimalen tussen (bijv 1.38 of 4.45). Deze wil ik dus niet meenemen als ik de somscore ga maken.Ik wil deze afwijkende scores omzetten in missings, zodat ik die gemakkelijk kan excluderen bij het maken van de somscores en andere analyses. Ten eerste, is dit handig? En ten tweede, hoe kan ik dit doen?

Luuk Tubbing
Door

Luuk Tubbing

op 23 Feb 2017

Beste Renske, Als het niet al te veel verschillende getallen zijn kun je deze handmatig coderen als missing variable, zoals in bovenstaande artikel beschreven. Ik ben zelf niet bekend met een methode in SPSS om regels (bijv. 'maak van alle getallen met decimaal een missing variable') voor exclusie of missing variables toe te passen. Daar gebruik ik zelf Excel of SQL voor. Succes Renske! Groeten, Luuk

Esther
Door

Esther

op 20 Feb 2017

Ik doe een studie naar migraine en wittestofafwijkingen. Ik heb bij zowel de controlegroep als de migrainegroep gekeken naar het wel of niet aanwezig zijn van cardiovasculaire risicofactoren, echter heb ik vrij veel missing values. Is het dan handig om het percentage en het aantal mensen van bijvoorbeeld het wel hebben van diabetes in de groep met bekende data aan te geven en dan in de discussie te spreken over dat er vrij veel missing values waren?Alvast bedankt voor uw reactie.

Luuk Tubbing
Door

Luuk Tubbing

op 20 Feb 2017

Hoi Esther, de aantallen/percentages in het resultatenhoofdstuk, nog zonder duiding. Bespreking van de invloed van non-respons/missing values op de resultaten in het discussiehoofdstuk. Helder? Groeten, Luuk

richard
Door

richard

op 28 Jan 2017

Hoi Luuk,504 respondenten hebben de eerste 4 vragen beantwoord (demografische gegevens). Vervolgens hebben 466 respondenten (missing 38) de vragen over hun motivatie ingevuld. Daarna hebben 435 (69) respondenten de rest van de vragen ingevuld. Het aantal dat de totale vragenlijst heeft ingevuld is dus 435.Welke aantallen pak je nu wanneer je de respons (demografische gegevens) beschrijft? Pak je dan die 504 respondenten of de 435 respondenten die de totale vragenlijst hebben ingevuld?Ik ben benieuwd!Groeten, Richard

Luuk Tubbing
Door

Luuk Tubbing

op 28 Jan 2017

Hoi Richard, Goede vraag! Het is zeker relevant om ook de demografische gegevens van de 'afvallers' te analyseren, zodat je evt verschillen met de respondenten kunt ontdekken. Als respons neem je het aantal respondenten dat de door jou beoogde vragen heeft ingevuld. Als het complex wordt kun je ook een tabelletje maken waarin je gefaseerd het aantal respondenten weergeeft, zodat direct helder is waar de 'afvallers' zitten. Helder? Succes met je verdere analyse! Groeten, Luuk

Richard
Door

Richard

op 28 Jan 2017

Hoi Luuk, Bedankt voor je snelle antwoord. Hier kan ik zeker wat mee. Groetjes, Richard

Elvir
Door

Elvir

op 17 Jan 2017

Hoi Luuk, Ik vermoed dat ik iets niet heb vermeld of verkeerd heb verwoord. Enkel de ontevreden gasten kunnen reden aangeven waarom ze ontevreden zijn over het schoonmaakaspect. Dit zijn respondenten die het schoonmaakaspect met tussen 1-6 hebben beoordeeld (beoordelingscijfer). Dit houdt in dat iemand die een 7 heeft geggeevn, geen vervolgvraag krijgt. Ik vermoed echter dat diegene toch een bepaalde mening en of knelpunt ondervindt. (mijn onderzoek gaat over knelpunten in kaart brengen). Mijn vraag is of dit representatief is en of ik dit moet onderbouwen in de discussie hoofdstuk of conclusie hoofdstuk?Groet,

Luuk Tubbing
Door

Luuk Tubbing

op 17 Jan 2017

Hoi Elvir, Dat is dan een beperking van de verzamelde data. Inderdaad goed om te bespreken in het discussiehoofdstuk van je scriptie. Het blijft speculeren of de groep die een 7 of hoger heeft gegeven klachten hebben ondervonden over de schoonmaak en wat het verschil is met de '1-6 groep'. Daar kun je in het discussiehoofdstuk ook op ingaan als je daar goede onderbouwing voor hebt. Is dit een antwoord op jouw vraag? Groeten, Luuk

Elvir
Door

Elvir

op 16 Jan 2017

Hoi Luuk,Voor mijn onderzoek analyseer ik het doorlopende klanttevredenheidsonderzoek. Dit onderzoek richt zich op de gasten van de organisatie. Over een periode van 4 maanden hebben de gasten online 2600 enquêtes ingevuld. Mijn onderzoek richt zich op het schoonmaak aspect. Van deze 2600 ingevulde enquêtes geeft geeft 720 respondenten aan dat ze ontevreden zijn over schoonmaak. Echter kunnen ook de tevreden gasten een reden geven waaraan schoonmaak tekort schiet bij de organisatie te denken valt aan vieze vloeren.Mijn vraag is hoe ik dit moet interpreteren?

Luuk Tubbing
Door

Luuk Tubbing

op 17 Jan 2017

Hoi Elvir, bedankt voor je vraag. Hoe je dat moet interpreteren hangt ervan af wat jouw onderzoeksvraag is. Als je (ook) geïnteresseerd bent in de relatie tussen algehele tevredenheid en tevredenheid over het schoonmaakaspect, dan is dit relevante informatie. Als je alleen in het schoonmaakaspect geïnteresseerd bent dan kun je de rest negeren. Is dit een antwoord op jouw vraag? Groeten, Luuk

Marèl
Door

Marèl

op 21 Dec 2016

Hoi Luuk,In onze opdracht moeten wij een logistic regression uitvoeren. Hierbij moeten wij de missing values buiten beschouwing houden. Waar moet je dit aangeven in SPSS?Groeten, Marèl

Luuk Tubbing
Door

Luuk Tubbing

op 22 Dec 2016

Beste Marel, zoals hierboven beschreven: een aparte code toekennen aan de missing values. Of bedoel je dat niet met buiten beschouwing laten?

Maartje
Door

Maartje

op 05 Dec 2016

Hallo! Voor mijn onderzoek moeten kinderen een vragenlijst invullen over uitstelgedrag, alleen zijn er bij veel respondenten missing values, doordat vragen niet zijn ingevuld. Kan ik dan beter de respondenten eruit halen of alleen de ingevulde waardes meenemen? Of ligt dat aan het aantal missings?Groetjes, Maartje

Luuk Tubbing
Door

Luuk Tubbing

op 05 Dec 2016

Hallo Maartje, bedankt voor je vraag. Dat hangt inderdaad af van het aantal missing values, maar ook van de mogelijke reden van niet invullen en de homogeniteit van de groep. Het kan zijn dat degenen die vragen hebben overgeslagen bijv. typische 'uitstellers' zijn, waardoor je een vertekent beeld krijgt. Groetjes, Luuk

Madelon
Door

Madelon

op 02 Dec 2016

Ik heb vraag 8 en vraag 8a. En vraag 8a hoef je alleen in te vullen als je vraag 8 met ''ja'' hebt beantwoord. Vraag 8a wordt dus soms niet ingevuld, omdat een persoon bij vraag 8 ''nee'' heeft ingevuld, maar moet ik dan alle niet ingevulde vragen van 8a met -99 invoeren. Of moet ik het anders in SPSS zetten?

Luuk Tubbing
Door

Luuk Tubbing

op 02 Dec 2016

Dag Madelon, Als het een groep blijft wel, maar als je met deze vraag een tweedeling wilt maken, dan krijg je twee verschillende datasets en is er geen sprake van missing values. Groeten, Luuk

Stijn
Door

Stijn

op 21 Nov 2016

Hallo,Ik ben bezig met een enquête. Mijn vraag is hoe ik de data verwerk van respondenten die een vraag hebben overgeslagen. In mijn enquête komt er namelijk bij een vraag (5) voor dat je bij "nee" naar vraag 7 moet gaan en dus vraag 6 overslaat. Bij deze respondenten staat er bij 6 dus niets. Hoe kan ik dit het beste verwerken? Ik hoop dat mijn vraag een beetje duidelijk is.Alvast bedankt,Stijn

Luuk Tubbing
Door

Luuk Tubbing

op 22 Nov 2016

Hallo Stijn, Goede vraag. In feite zijn er geen missing values, want het gaat om twee verschillende groepen (groep "ja" en groep "nee") en dus twee verschillende (sub)datasets. Groeten, Luuk

Rachana
Door

Rachana

op 30 Jul 2016

Hoi Luuk,In mijn onderzoek hebben enkele respondenten mijns inziens teveel vragen niet ingevuld. Ik wil enkel de patienten die minder dan 4 missende waarden hebben meenemen in de analyse. Is er een manier om dit te ontwerpen in SPSS?Alvast bedankt voor je hulp!Groetjes Rachana

Rachana
Door

Rachana

op 30 Jul 2016

Nog een aanvulling: ik wil deze patienten (nog) niet uit mijn dataset gooien. Zat zelf te denken om dit te doen d.m.v. 'select cases', maar dat betekent dat je een nieuwe variabele zou moeten aanmaken met 1=4 missing. Ik weet echter niet of dit kan en hoe ik dat moet doen.Ik hoop dat mijn vraag zo duidelijk is!

Luuk Tubbing
Door

Luuk Tubbing

op 01 Aug 2016

Hoi Rachana, bedankt voor jouw vraag. Een mogelijkheid om hier automatisch op te filteren met SPSS is mij niet bekend (lees: die heb ik nooit gebruikt). Zelf gebruik ik MS Excel (vooral de 'IF' functie: https://support.office.com/en-us/article/IF-function-69aed7c9-4e8a-4755-a9bc-aa8bbff73be2) om de datasets voor te bewerken. Uiteindelijk zul je dan inderdaad je nieuwe variabele moeten aanmaken. Een variabele aanmaken gaat als volgt: https://deafstudeerconsultant.nl/statistiek-met-spss/de-spss-omgeving/een-numerieke-variabele-creeren-met-spss/. Kom je hier verder mee? Groeten, Luuk

MO
Door

MO

op 27 Jul 2016

Hoihoi!Ik heb een vraagje, ik heb 403 respondenten die mijn enquete hebben ingevuld en niet iedereen heeft alle vragen ingevuld. Hoe zit dat met het beschrijven van de resultaten? Moet je dan bij elke vraag zeggen hoeveel mensen de vraag hebben ingevuld en hoeveel procent daarvan een bepaald antwoord heeft gegegeven? Of kun je gewoon zeggen, van de 403 respondenten zegt .... % van hen het volgende:... Of moet je dan zeggen van : op deze vraag hebben 396 respondenten gereageerd, hieruit blijkt dat ...% van hen het volgende vindt:..... Dankjewel alvast voor je hulp!!:D

Luuk Tubbing
Door

Luuk Tubbing

op 29 Jul 2016

Hoi, het belangrijkste is dat je transparant bent over de response, mogelijke oorzaken van non-response en de gevolgen hiervan voor de validiteit van je conclusies (laatste twee punten bespreek je in de discussie). De volgorde is minder belangrijk. Kom je hier verder mee?

Luuk Tubbing
Jennifer
Door

Jennifer

op 13 Jul 2016

Hoi! Ik heb een vraag en ik hoop dat je me kunt helpen. Ik heb van 510 participanten de mate van angst gemeten (baseline) en na 2 jaar weer (follow-up). Nu zijn er in de tussentijd 109 participanten uitgevallen en nu moet ik kijken of deze groep selectief is, ik denk door middel van een Independent samples t-test. Van de follow-up heb ik vd uitvallers natuurlijk geen data, dus ik neem aan dat ik de data van de baseline hiervoor moet gebruiken en die 109 participanten af moet zetten tegen de overige 401 participanten(?). Maar, bij de t-test moet je dus een grouping variable invullen maar ik weet niet hoe ik deze groep moet maken zodat ik de test uit kan voeren. Heb jij hier een idee over? Alvast bedankt voor het meedenken!

Milou
Door

Milou

op 12 Jul 2016

Beste Luuk,Een korte vraag over missing data: ik heb in mijn thesis bij ongeveer 0% van alle respondenten missing data. Alle missing data is veroorzaakt omdat respondenten halverwege de lijst gestopt zijn met invullen (mijn enquête was behoorlijk lang). Moet ik hun antwoorden meenemen of hun antwoorden weggooien? Of misschien iets anders?Nb. De data die mist zijn de onafhankelijke variabelen.Alvast bedankt!

Milou
Door

Milou

op 12 Jul 2016

Ik bedoelde 9% haha

Luuk Tubbing
Door

Luuk Tubbing

op 12 Jul 2016

Beste Milou,Dat hangt deels af van de vraagstelling van jouw onderzoek, maar in principe is het niet wenselijk om half ingevulde enquêtes in je analyse mee te nemen, zeker wanneer dat betekent dat je bepaalde relaties (tussen afhankelijke en onafhankelijke variabelen) niet meer kunt leggen voor een deel van de respondenten. Een interessante vraag is altijd: hebben de afgehaakte respondenten andere eigenschappen dan de respondenten die de enquête hebben afgerond.Anyway, welke keuze je ook maakt, je zult dit goed moeten onderbouwen in je scriptie en helder moeten zijn over de afwegingen en beperkingen.Kom je hier verder mee?Groeten,Luuk

Dimri
Door

Dimri

op 07 Jul 2016

Beste Luuk,Het verhaal over de missing values is voor mij duidelijk na het lezen van bovenstaand artikel. Voor mij is het wel onduidelijk over welke value ik moet geven aan het cijfer 0. Ik heb als voorbeeld een vraag: Wat is/zijn de voornaamste reden(en) voor het gebruik van een hartslagmeter. Deze vraag bestaat uit meerkeuze antwoorden. Als een respondent heeft gekozen voor: Het meten van het omslagpunt, staat deze met 1 aangegeven. Dit is duidelijk dat ik deze de naam moet geven van het meten van het omslagpunt. Als de respondent niet voor dit antwoordt heeft gekozen staat er een: 0. Moet ik deze 0 benoemen bij value? Of is dit niet nodig?

Luuk Tubbing
Door

Luuk Tubbing

op 07 Jul 2016

Beste Dimri, Als ik het goed begrijp heb je dus ja/nee-vragen of checklistvragen? Dan zeg ik: ja = 1, nee = 0. De specifieke duiding van de getallen (buiten missing values) is vaak niet van wezenlijk belang om de analyse goed uit te kunnen voeren, maar wel voor de presentatie van de resultaten. Begrijpen we elkaar? Groeten, Luuk

Dimri
Door

Dimri

op 07 Jul 2016

Ik bedoelde meer dat ik een meerkeuze vraag heb. In één kolom staat dan 1 keuze antwoordt: bijvoorbeeld het meten van het omslagpunt staat dan als 1 als iemand deze heeft geselecteerd. Als iemand een andere meerkeuze antwoordt heeft geselecteerd staat in een ander kolom bij bijvoorbeeld looptechniek een 1. Als de respondent het omslagpunt niet meet staat in die kolom een 0 maar de respondent wel de looptechniek analyseren dan staat er in een nieuwe kolom een 1. Beetje lastig uit te leggen maar hoop dat het duidelijk is. Moeten deze 0 dus ook benoemd worden? Want dit is eigenlijk wat een respondent niet heeft aangevinkt bij de meerkeuzevraag in de enquete

Luuk Tubbing
Door

Luuk Tubbing

op 07 Jul 2016

Ok, het zijn dus meerkeuzevragen, maar de antwoorden zijn wel binair (ja/nee) gecodeerd? Idealiter (maar ik weet niet welke analyses je gaat doen) heeft elke keuze een eigen nummer (1= omslagpunt, 2= looptechniek, etc.), omdat de vragen afhankelijk zijn van elkaar (je kunt maar één antwoord kiezen). Dan heb je maar één kolom per vraag met één getal per rij, i.p.v. per vraag een rij met een verzameling van enen en nullen. Hoe dan ook is het handig om alle keuzemogelijkheden te coderen. Is dat een antwoord op jouw vraag?

Marlous
Door

Marlous

op 21 Jun 2016

Hoi Luuk, Ook ik ben momenteel bezig met mijn masterscriptie. Ik heb mijn missing values gecodeerd als '99'. Nu heb ik van de verschillende items (47 items), 5 variabelen gemaakt door middel van een meanscore. Echter, als ik kijk naar de meanscore per respondent berekent spss ook een meansscore voor de gene die een missing value hebben. Bijvoorbeeld een variabele bestaat uit 10 items en een respondent mist 2 items, dan berekent spss wel een meansore voor deze respondent over de 8 overige items. Ik ga een logistische regressie uitvoeren. Neemt spss dan de meanscores mee van de respondenten die missingvalues hebben? En dus een meanscore hebben met minder items? Het is toch de bedoeling dat spss deze respondenten niet meeneemt in de analyze? Want bij een logistische regressie kan je niet kiezen voor pair/listwise verwijderen? Ik hoop dat je mij kunt helpen :)Dankjewel, Groeten Marlous

Luuk Tubbing
Door

Luuk Tubbing

op 21 Jun 2016

Hoi Marlous, Bedankt voor je vraag. Bij logistische regressie worden alle cases met missing values als listwise behandeld, hetgeen betekent dat ze niet worden meegenomen in de analyse. Het is niet mogelijk om een pairwise analyse te doen (wel in de syntax editor met het commando '/MISSING=INCLUDE'). Helder? Groeten, Luuk

Marlous
Door

Marlous

op 21 Jun 2016

Hoi Luuk, Bedankt voor je snelle antwoord. Klopt het dat spss wél een meanscore berekent voor de respondenten met missing values? Maar deze uiteindelijke score wordt dus NIET meegenomen in de logistische regressie? Groeten Marlous

Luuk Tubbing
Door

Luuk Tubbing

op 21 Jun 2016

Hoi Marlous, antwoord op jouw tweede vraag is ja. Antwoord op jouw eerste vraag: ik weet niet precies waar je op doelt en waarom deze vraag relevant is, misschien omdat het lang geleden is dat ik voor het laatst logistische regressie heb gedaan. Gr, Luuk

Danya
Door

Danya

op 16 Jun 2016

Hallo Luuk, Ik ben momenteel bezig met data in spss waarbij er geen missing values zijn maar ik toch in de output van een frequentieverdeling missing system zie staan. Ik heb de reacties in surveymonkey nogmaals gecheckt maar daar staan geen missings in (had voor versturen enquete ook de optie dat het niet mogelijk is een antwoord over te slaan aangevinkt) Hoe kan het dat dit nu wel in mijn spss output staat? Moet ik dit negeren en alleen kijken naar percent ipv valid percent?Groeten, Danya

Luuk Tubbing
Door

Luuk Tubbing

op 17 Jun 2016

Hallo Danya, dat kan ik op afstand niet beoordelen aangezien ik niet weet welke handelingen je hebt uitgevoerd en hoe jouw dataset eruit ziet. Groeten, Luuk

Emma
Door

Emma

op 31 May 2016

Hoi Luuk, ik ben bezig met een onderzoek en daarbij heb ik 1 vragenlijst gebruikt voor twee verschillende groepen. Ik ben begonnen met een aantal algemene vragen en daarna is vraag gesteld of de respondent "A" of "B" is. Daarna werd deze naar de goede vragenlijst doorgestuurd. Hierdoor heb ik dus een gedeelte dat voor iedereen is ingevuld (het begin) en daarna een gedeelte alleen door A/B. Hoe moet ik hier omgaan met de missing values? De aparte vragenlijsten zijn overigens wel gespiegeld voor A/B. Dezelfde vragen werden gesteld alleen bekijkt A het uit een ander perspectief dan B. De lengte voor de individuele vragenlijst is dus ook even lang.

Luuk Tubbing
Door

Luuk Tubbing

op 31 May 2016

Hoi Emma, dat hangt er helemaal vanaf welke analyses je gaat doen. Als je de twee groepen statistisch met elkaar gaat vergelijken is het handig om dezelfde vragen van beiden groepen naast elkaar te hebben (onder dezelfde variabele/kolom). In dat geval raad ik je aan om eerst in Excel dezelfde vragen/variabelen van beide groepen naast elkaar te zetten voordat je deze in SPSS importeert. Als je de twee groepen apart gaat analyseren zou ik twee aparte datasets maken. Dan heb je sowieso geen missing values, want dan kun je de niet-ingevulde vragen (kolommen) helemaal weglaten. Het coderen van missing values is dus te vermijden. Is dit een antwoord op jouw vraag?

Emma
Door

Emma

op 02 Jun 2016

Hoi Luuk, bedankt voor je reactie ik kan hier zeker wat mee! Alleen is mijn vraag nu; hoe moet ik deze dan coderen? Hoe splits ik de ene groep van de andere groep? Deze twee groepen staan namelijk helemaal door elkaar. Het is dus niet zo dat 1 t/m 50 groep A is en 51 t/m100 groep B. Hoe zou ik deze twee van elkaar kunnen splitsen dat ik twee datasets heb? Of hoe zou ik het via excel aan kunnen pakken?

Luuk Tubbing
Door

Luuk Tubbing

op 02 Jun 2016

Hoi Emma, graag gedaan. In Excel kun je met de filter een van de kolommen sorteren die de twee groepen onderscheidt. Dus één van de vragen die de ene groep wel en de andere groep niet heeft ingevuld, zodat de lege cellen boven- of onderaan komen en daarmee de groepen worden gescheiden. Is het idee helder? Als je technisch niet weet hoe Excel werkt is het handiger om dit even te Googelen dan dat ik hier een heel Excel handboek ga schrijven ;)

Ema
Door

Ema

op 02 Jun 2016

Hoi Luuk, bedankt voor deze tip! Ik ga even uitzoeken in excel hoe ik het kan filteren. Bedankt voor de hulp!

Dané
Door

Dané

op 25 May 2016

Beste Luuk, Voor mijn scriptie doe ik onderzoek naar het eetgedrag van adolescenten in een klas en de invloed van het eetgedrag van populaire leeftijdgenoten daarop. Om te bepalen wat voor eetgedrag adolescenten hebben zijn er meerdere food frequency vragen afgenomen (hoe vaak je in een week fruit / groente / snoep etc.) deze vraag is op een 7 punts Likert schaal beantwoord die loopt van 1 (nooit) t/m 7 (iedere dag meerdere keren). Nu zijn er een aantal respondenten die deze vraag niet hebben ingevuld en dus geen waarde hebben in SPSS. Moet in deze respondenten als missing behalen? En als dat zo is hoe moet ik dat doen, want deze mensen hebben geen waarden?

Luuk Tubbing
Door

Luuk Tubbing

op 25 May 2016

Beste Dané, als het wel de bedoeling was dat deze vraag werd ingevuld dan zijn dat inderdaad missing values (tip voor de volgende keer: maak vragen verplicht), maar je hoeft niet telkens de hele respondent weg te gooien. Een stappenplan: - Je vult eerst de lege velden in met een getal. Dat gaat als volgt: ga naar Transform – Recode into Same Variables; alle variabelen naar rechts; vink System or User-Missing aan; voer rechts een waarde in (bijv. 0 of 99) en voeg deze toe. - Codeer de missing values naar het gekozen getal (zoals in t artikel beschreven, met discrete missing values) - Bij de analyses kies je voor exclude cases pairwise. Kom je verder met dit antwoord? Succes! Groetjes, Luuk

Laura
Door

Laura

op 13 May 2016

Hoi! Ik doe voor mijn sctiptie een patienttevredenheidsonderzoek in een ziekenhuis door middel van een vragenlijst met gesloten vragen, nu hebben patienten sommige vragen niet ingevuld. Als ik wat u heeft uitgelegd ga toepassen in SPSS worden dan alleen de lege hokjes(niet ingevulde antwoorden) niet meegenomen bij de analyses of worden dan alle antwoorden die de persoon heeft gegeven bij de vragenlijst niet meegenomen? Een andere site heeft het namelijk over Listwise deletion of missing values en Pairwise deletion of missing values. Het is namelijk de bedoeling dat alleen de lege hokjes niet moeten worden meegenomen in de analyses maar wel de rest van de antwoorden die de patient heeft gegeven.Met vriendelijke groet, Laura

Luuk Tubbing
Door

Luuk Tubbing

op 15 May 2016

Hoi Laura, bedankt voor jouw vraag. Bovenstaande artikel gaat over het coderen van missing values. Het pairwise dan wel listwise excluderen van missing values kun je aangeven in het optiemenu bij de betreffende analyse> Dat ziet er ongeveer zo uit: http://phantichspss.com/wp-content/uploads/2015/09/list11.jpg In jouw geval is pairwise van toepassing. Groet, Luuk

Brecht
Door

Brecht

op 08 May 2016

Beste Luuk, Voor mijn masterproef doe ik onderzoek naar genderverschillen en jobtevredenheid bij bedienden tussen de 30 en 45 jaar. Mijn eerste twee vragen in mijn enquete waren "bevindt u zich tussen de 30 en 45 jaar?" en "Bent u bedende?". Wanneer de respondenten "nee" antwoorden, worden ze direct naar het einde van de enquete gestuurd. Nu ben ik bezig aan de analyse van mijn data. De "nee" antwoorden op de vragen zijn dus missing values. Maar hoe moet ik hiermee omgaan? Want als ik bij discrete missing value '2' ingeef, veranderd er niet aan mijn data view en staan deze er nog steeds tussen. Of kan ik deze zelf verwijderen uit de data view? Want van deze respondenten is er geen data omdat ze niet voldeden aan de criteria, dus zijn verwaarloosbaar. Alvast bedankt!

Luuk Tubbing
Door

Luuk Tubbing

op 09 May 2016

Beste Brecht, bedankt voor je vraag. De "nee" antwoorden zijn geen missing values (valt buiten de onderzoekspopulatie) en kun je inderdaad zelf verwijderen. Succes!

Suzanne
Door

Suzanne

op 03 May 2016

Beste Luuk, Ik heb bij variable view de missings nu gedefinieerd als 99, echter staan ze in data view nog gewoon als lege cel. Neemt SPSS deze missings automatisch goed mee?

Luuk Tubbing
Door

Luuk Tubbing

op 03 May 2016

Beste Suzanne, op afstand durf ik niet te zeggen waar dat aan ligt. Als je bovenstaande procedure volgt gaat dat verder automatisch ja.

Sanne
Door

Sanne

op 03 May 2016

Hoi, ik heb een vraag. Ik wil graag een missing value toevoegen (namelijk 0, dit staat voor n.v.t.) voor alle vragen in mijn vragenlijst. Moet dit per vraag gedaan worden of is er ook een snellere manier? Anders ben ik echt heel lang bezig. Groetjes, Sanne

Luuk Tubbing
Door

Luuk Tubbing

op 03 May 2016

Dat durf ik niet te zeggen, want ik weet niet hoe jouw dataset eruit ziet. Bedoel je dat je per vraag een kolom gaat toevoegen met n.v.t.? Zo ja, dan kun je de velden in deze kolom leeg laten en een vaste waarde geven door ze als missing value te definiëren.

Sophie
Door

Sophie

op 22 Apr 2016

Thanks voor de top uitleg. Ik heb al mijn missing aangepast in mijn data en dat ging goed. Maar ik heb nu in totaal 161 respondenten en bij een bepaalde vraag mis ik 2 antwoorden, dus 2 respondenten. Nu wil ik een tabel maken zodat n=159 100%, maar dit krijg ik niet voor elkaar. Ik krijg gewoon n=159 en dat is bijv. bij elkaar 98%. Hoe zorg ik er voor dat de missing niet wordt meegerekend en dat n=159 100% wordt?

Luuk Tubbing
Door

Luuk Tubbing

op 03 May 2016

Hoi Sophie, jouw reactie had ik over het hoofd gezien. Is jouw probleem nog actueel?

Iris
Door

Iris

op 22 Apr 2016

Beste Luuk, Voor mijn masterscriptie doe ik onderzoek naar de taalontwikkeling van jonge kinderen. Deze is op drie leeftijden gemeten, wat zorgt voor longitudinale data. Nou is er van een aantal participanten data van alle drie de meetmomenten, maar sommigen hebben alleen nog maar meegedaan aan het eerste meetmoment (omdat ze nog niet oud genoeg zijn voor de volgende meetmomenten). Van hen is er dus nog geen data op het 2e en 3e moment, maar die komt in de toekomst wel (niet meer tijdens mijn scriptie). Moet ik deze data die nog niet verzameld is, wel allemaal markeren als missings (999)? Of kan ik deze cellen dan gewoon leeg laten? Alvast bedankt!

Luuk Tubbing
Door

Luuk Tubbing

op 22 Apr 2016

Beste Iris, je kunt als inclusiecriterium stellen dat er per kind drie meetmomenten beschikbaar moeten zijn. Dan zijn de ontbrekende waarden geen missing values meer (de meting moet immers nog plaatsvinden), maar data die buiten de scope van jouw onderzoek valt. De incomplete regels kun je dan uit je dataset verwijderen. Wel zul je helder moeten hebben of je dan niet het risico loopt om echte missing values (bijv. kinderen die niet kwamen opdagen voor een meting) verwijderd, als die niet apart zijn gecodeerd. Als dit risico bestaat, dan wel in je scriptie vermelden, bijv. in het discussiehoofdstuk. Helpt dit antwoord jou verder? Groet, Luuk

Rowan
Door

Rowan

op 07 Apr 2016

Hoi Luuk,Ik doe onderzoek naar factoren die de koopintentie van consumenten en prospects beïnvloeden op dag-deal websites zoals Social Deal. In mijn online enquête heb ik onderscheid gemaakt tussen consumenten en prospects, waardoor consumenten andere vragen te zien krijgen als prospects, en andersom. Met andere woorden; deze vragen zijn dus logisch 'gerout' en het gaat totaal over 5 vragen die gerout zijn. De overige vragen over de factoren zijn wel hetzelfde voor consumenten en prospects. Nu heb ik in SPSS in 'Variable View' bij de geroute vragen dus soms lege vakjes. Is het voldoende om in Variable View bij die lege vakjes overal een 99 invullen, zodat SPSS 'snapt' dat bij die vragen - afhankelijk of je consument of prospect bent - soms niks in hoeft te worden gevuld?Alvast bedankt!

Rowan
Door

Rowan

op 07 Apr 2016

Sorry, in dit onderstaande stuk bedoelde ik met Variable view Data view!Nu heb ik in SPSS in 'Variable View' bij de geroute vragen dus soms lege vakjes. Is het voldoende om in Variable View bij die lege vakjes overal een 99 invullen, zodat SPSS 'snapt' dat bij die vragen - afhankelijk of je consument of prospect bent - soms niks in hoeft te worden gevuld?

Luuk Tubbing
Door

Luuk Tubbing

op 08 Apr 2016

Hoi Rowan, bedankt voor je vraag. Interessant onderzoek trouwens :) Zoals in bovenstaande artikel beschreven, kun je in de Variable View aangeven welke waarde/codering een missing value (een lege cel in de Data View) krijgt, zodat je dit niet handmatig hoeft in te voeren. Je kiest dan voor de optie Discrete missing values en voert het gewenste getal in (zie bovenstaande instructie). Is dat een antwoord op jouw vraag? Groetjes, Luuk

Gill
Door

Gill

op 02 Apr 2016

Beste, Ik doe een onderzoek die peilt naar het zoekgedrag van werklozen over een periode van 5 weken. Elke week moeten de respondenten dezelfde weekvragenlijst invullen over de organisatie waar ze de laatste week gesolliciteerd hebben. Het spreekt voor zich dat sommige respondenten niet zullen solliciteren in die week en dus ook die vragen niet hoeven te beantwoorden. Al die cellen blijven dus leeg en dit verschijnt ook zo in SPSS. Hoe raadt u mij aan om hier mee rekening te houden aangezien mijn onderzoek uitgaan van een within subject design.

Luuk Tubbing
Door

Luuk Tubbing

op 04 Apr 2016

Dat hangt van het onderzoeksdoel en of je non-respons gelijk kunt stellen aan niet solliciteren. Ik zie in ieder geval twee stappen: (1) wel/niet gesolliciteerd en (2) antwoord op vragen. De lege velden zou ik niet als missing values behandelen, omdat het (per week) om een andere deelpopulatie gaat (wél gesolliciteerd).

Tanya
Door

Tanya

op 28 Mar 2016

Hey. Dit hebben we al een paar keer geprobeerd, maar er veranderd niets bij data view en de cellen blijven leeg. Wat kan hier de oorzaak van zijn?

Luuk Tubbing
Door

Luuk Tubbing

op 29 Mar 2016

Hey Tanya, dat durf ik niet te zeggen op afstand. Mvg, Luuk

Nini
Door

Nini

op 24 Mar 2016

Hoi! Allereerst bedankt voor je heldere uitleg. Ik heb nog een vraag. Moet je missing values ook bij 'values' definiëren of moet dit alleen bij 'missing values' (zoals jij hierboven beschreven hebt)? Bijvoorbeeld: 1 = Zeer ontevreden 2 = Ontevreden 3 = Neutraal 4 = Tevreden 5 = Zeer tevreden 99 = Niet ingevuld (missing value)Alvast bedankt! Groetjes Nini

Luuk Tubbing
Door

Luuk Tubbing

op 24 Mar 2016

Hoi Nini, bedankt voor het compliment en jouw vraag. Je hoeft missing values niet bij values te definiëren. Het heeft geen invloed op de analyses (daarvoor geldt de procedure uit bovenstaande artikel), maar het kan natuurlijk wel handig zijn, bijvoorbeeld omdat je deze informatie wilt gebruiken bij het presenteren van resultaten.

E.B.
Door

E.B.

op 08 Dec 2020

Beste Luuk,Hoe zou jij omgaan met dubbele waardes? Als mensen twee antwoorden ingevuld hebben terwijl je aangegeven hebt dat het er maar 1 mocht zijn. Dus ze hebben op een 5-puntschaal bijvoorbeeld 2 en 3 ingevuld? Als missing of de laagste of hoogste kiezen overal?Alvast bedankt!

Silke
Door

Silke

op 06 May 2021

Beste Luuk,Ik ben momenteel bezig met onderzoek naar student zijn vs niet student zijn. Nu hebben ongv 2000 participanten ingevuld wat hun werkzaamheden zijn (student, parttime werken, fulltime werken etc.). Ik wil nu een dummy variabele maken om een regressieanalyse te doen met 2 groepen: student en niet-student. Ik heb 1 item waar mensen antwoord hebben gegeven dat ze student zijn, en 8 items dat participanten antwoord hebben gegeven dat ze iets anders doen, aka geen student zijn. Nu heb ik de indruk dat ik alleen naar de kolom \'student zijn\' moet kijken om een dummy variabele te maken. Het enige probleem is dat er een aantal participanten zijn waar er een - in plaats van een 0 staat als ze geen student zijn. Is dit dan een missende waarde? Hoe kan ik ervoor zorgen dat ook deze (-) participanten worden meegenomen in de analyse als ik een dummy variabele maak?

Tina
Door

Tina

op 31 May 2021

Beste Luuk, Ik ben bezig met het analyseren van vragenlijst. We hebben 12 vragen bij 500 mensen afgenomen. Nu wil ik het gemiddelde van de 12 vragen berekenen. In principe tel je dan gewoon alle 12 vragen bij elkaar op en \12. Maar er zijn een aantal missings. Het schijnt mogelijk te zijn om een statistical mean te berekenen, gecorrigeerd voor de missings (dus waar een missing is \11) en daar het gemiddelde van genomen. Klopt dat? Hoe zou ik dat moeten doen? Dankjewel!

Robin
Door

Robin

op 18 Jun 2021

Hoi Luuk,Voor mijn scriptie ben ik bezig met een onderzoek, waarbij ik gegevens van gezinnen onderzoek dmv een regressie-analyse. Zojuist ben ik er achter gekomen dat ik op 1 van de controlevariabelen een aanzienlijk aantal missende waardes heb (15.9%). Nu vraag ik me af of jij misschien weet in hoeverre dit, voor een controlevariabele, een probleem is. Zou het voldoende zijn om dit in de discussie te melden? Of bestaat hier nog een handige oplossing voor? Groetjes Robin

Jada
Door

Jada

op 15 Sep 2021

Hai Luuk, ik doe onderzoek naar het effect van een warming up. Hiervoor volgen deelneemsters 8 weken een gestandaardiseerde warming-up. Deze dienen ze 3xpw (2 trainingen en 1 wedstrijd) uit te voeren. Er zullen ongetwijfeld gemiste trainingen en/of wedstrijden zijn in die 8 weken. Hoe kan ik die missing data het beste verwerken?

Jada
Door

Jada

op 15 Sep 2021

Mijn vraag is niet helemaal correct; de data die ik invoer zijn kniehoeken voor en na interventie. Hoe kom ik erachter of ik bij het missen van 1 vd 2 metingen een deelneemster moet uitsluiten van analyse of die ene waarde wel mee mag nemen?Mocht je er ervaring mee hebben, of iemand anders; de training moet 8 weken duren om een effect te kunnen meten. Idealiter zijn dit 3 trainingsmomenten per week. Wat als een deelneemster niet 8 weken lang 3 keer per week heeft deelgenomen?

Reactie plaatsen

Sneller afstuderen met een scriptiecoach?