NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGAVE I SOS1002 SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE Eksamensdato: 28. mai 2010 Eksamenstid: 5 timer Studiepoeng: 15 Antall sider bokmål: 2 (Formler: se side 7) Antall sider nynorsk: 2 (Formler: se side 7) Number of pages in English: 2 (Formulas: page 7) Tillatte hjelpemiddel: Kalkulator (alle typer) Sensurdato: 18. juni 2010 Faglig kontakt under eksamen: Arild Blekesaune (73 59 17 54) Sensurtelefon: 815 48014 __________________________________________________________________________ BOKMÅL Alle de tre oppgavene skal besvares. De tre oppgavene teller hver en tredjedel av den samlede karakteren. Oppgave 1 På neste side ser du en tabell med to regresjonsmodeller basert på data fra den norske delen av ”European Social Survey” fra årene 2002, 2004, 2006 og 2008. Utvalget skal behandles som et sannsynlighetsutvalg fra populasjonen, hvor alle respondentene er personer på 15 år og eldre som var bosatt i Norge. Den avhengige variabelen nettbruk måler svarene på spørsmålet: ”Hvor ofte bruker du Internett, World Wide Web eller e-post til privat bruk, enten hjemme eller på jobben?”. De opprinnelige svarkategoriene ”Har ikke nettilgang, verken hjemme eller på jobben”, ”Bruker aldri”, ”Mindre enn en gang i måneden”, ”En gang i måneden”, ”Flere ganger i måneden”, ”En gang i uken” og ”Flere ganger i uken” er slått sammen i en kategori med verdien 0, mens de som har svart ”Hver dag” er kodet med verdien 1. Videre er variabelen mann kodet med verdien 1 for menn og verdien 0 for kvinner, mens variabelen alder er kodet i antall tiår med en desimal. Forklar hva tabell 1 viser. 1 Tabell 1. Internettbruk fordelt etter alder og kjønn (N=7095) Mann (kvinne=0, mann=1) Alder (antall 10-år) Årstall (dummyer med 2002 som referanse) År 2004 År 2006 År 2008 Alder kvadrert Samspill Mann*År 2004 Mann*År 2006 Mann*År 2008 Konstant B 0,635 -0,662 0,616 1,180 1,767 2,725 Modell1 S.E. p 0,059 0,000 0,019 0,000 OR 1,888 0,516 B 0,693 0,561 0,076 0,080 0,090 1,851 3,256 5,851 0,103 0,000 0,000 0,000 0,000 15,264 Modell 2 S.E. p 0,100 0,000 0,100 0,000 OR 2,000 1,753 0,610 1,303 1,932 -0,127 0,107 0,113 0,128 0,011 0,000 0,000 0,000 0,000 1,841 3,681 6,906 0,881 0,028 -0,158 -0,139 0,025 0,151 0,161 0,181 0,233 0,855 0,325 0,441 0,914 1,028 0,854 0,870 1,026 B = logistiske regresjonskoeffisienter S.E. = regresjonskoeffisientenes standardfeil p = signifikanssannsynligheten OR = oddsratioet er antilogaritmen av B (exp(B)) Oppgave 2 Seks av ni oppgaver skal besvares. Hver besvarelse skal være på inntil ½ side. a) b) c) d) e) f) g) h) Multippel regresjonskoeffisient Deterministisk og ikke-deterministisk årsaksforklaring Systematiske og tilfeldige utvalgsfeil Kjikvadratfordelingen Tosidig test Konfidensintervall Samspillseffekt Forklar og illustrer forskjellen mellom sentraltendens og spredning. Navngi to mål på sentraltendens og to mål på spredning. i) Når skal man bruke korrelasjonsmålet tau-c, og når skal man bruke Cramers V? Forklar forskjellen mellom disse målene. Oppgave 3 De sentrumsnære skolene og idrettslagene i Trondheim er bekymret for at studenter "okkuperer" ballbinger og fotballbaner på kveldstid. Dette sliter på anleggene og fortrenger yngre brukere. For å få mer informasjon om dette problemet går Trondheim kommune (TK) og Studentsamskipnaden (SiT) sammen og engasjerer Trondheim Øst Forskningsfabrikk (TØFF), hvor du er ansatt som forsker. a) Du vil undersøke studenters opplevelse av disse nærmiljøressursene. Hva slags metoder kan du bruke for å generere kvalitative data? b) Du er usikker på hvor stort dette "okkupasjons"-problemet egentlig er og hvordan det fortoner seg. Du ser for deg at du kan benytte observasjon for å få mer kunnskap. Hvordan kan du gjøre dette og hva slags data kan du generere? c) Hvordan kan du vurdere og redegjøre for kvaliteten av det arbeidet du har gjort? d) Du finner ut at tilsvarende problemer finnes i Bergen. Beskriv 3 typer av generalisering som du kan benytte for at også Bergen kommune kan kunne nyttiggjøre seg resultatene dine? 2 NYNORSK Du skal svare på alle dei tre oppgåvene. Dei tre oppgåvene tel kvar for seg ein tredjedel av den samla karakteren. Oppgåve 1 Nedanfor ser du ein tabell med to regresjonsmodellar basert på data frå den norske delen av ”European Social Survey” frå åra 2002, 2004, 2006 og 2008. Utvalet skal behandlast som eit sannsyneutval frå populasjonen, kor alle respondentane er personar på 15 år og eldre som var busette i Noreg. Den avhengige variabelen nettbruk måler svara på spørsmålet: ”Kor ofte bruker du Internett, World Wide Web eller e-post til privat bruk, enten heime eller på jobben?”. Dei opphavlege svarkategoriane ”Har ikkje nettilgang, verken heime eller på jobben”, ”Bruker aldri”, ”Mindre enn ein gong i månaden”, ”Ein gong i månaden”, ”Fleire gonger i månaden”, ”Ein gong i veka” og ”Fleire gonger i veka” er slått saman i ein kategori med verdien 0, mens dei som har svart ”Kvar dag” er koda med verdien 1. Vidare er variabelen mann koda med verdien 1 for menn og verdien 0 for kvinner, medan variabelen alder er koda i tiår med ein desimal. Forklar kva tabell 1 viser. Tabell 1. Internettbruk fordelt etter alder og kjønn (N=7095) Mann (kvinne=0, mann=1) Alder (antal 10-år) Årstal (dummyar med 2002 som referanse) År 2004 År 2006 År 2008 Alder kvadrert Samspel Mann*År 2004 Mann*År 2006 Mann*År 2008 Konstant B 0,635 -0,662 0,616 1,180 1,767 2,725 Modell1 S.E. p 0,059 0,000 0,019 0,000 OR 1,888 0,516 B 0,693 0,561 0,076 0,080 0,090 0,851 3,256 5,851 0,103 0,000 0,000 0,000 0,000 15,264 Modell 2 S.E. p 0,100 0,000 0,100 0,000 OR 2,000 1,753 0,610 1,303 1,932 -0,127 0,107 0,113 0,128 0,011 0,000 0,000 0,000 0,000 1,841 3,681 6,906 0,881 0,028 -0,158 -0,139 0,025 0,151 0,161 0,181 0,233 0,855 0,325 0,441 0,914 1,028 0,854 0,870 1,026 B = logistiske regresjonskoeffisientar S.E. = standardfeilen til regresjonskoeffisientane p = signifikanssannsyne OR = oddsratioet er antilogaritmen av B (exp(B)) Oppgåve 2 De ska svare på seks av ni oppgåver. Kvart svar skal vere på inntil ½ side. a) b) c) d) e) f) g) h) Multippel regresjonskoeffisient Deterministisk og ikkje-deterministisk årsaksforklaring Systematiske og tilfeldige utvalsfeil Kjikvadratfordelinga Tosidig test Konfidensintervall Samspeleffekt Forklar og illustrer skilnaden mellom sentraltendens og spreiing. Namngje to mål på sentraltendens og to mål på spreiing. i) Når skal ein bruke korrelasjonsmålet tau-c, og når skal ein bruke Cramers V? Forklar skilnaden mellom desse måla. 3 Oppgåve 3 Dei sentrumsnære skolane og idrettslaga i Trondheim er uroa for at studentar "okkuperer" ballbingar og fotballbaner på kveldstid. Dette sliter på anlegga og fortrenger yngre brukarar. For å få meir informasjon om dette problemet går Trondheim kommune (TK) og Studentsamskipnaden (SiT) saman og engasjerer Trondheim Øst Forskingsfabrikk (TØFF), kor du er tilsett som forskar. a) Du vil undersøkje studentar si oppleving av desse nærmiljøressursane. Kva slag metodar kan du bruke for å generere kvalitative data? b) Du er usikker på kor stort dette "okkupasjons"-problemet eigentleg er og korleis det fortonar seg. Du ser for deg at du kan nytte observasjon for å få meir kunnskap. Korleis kan du gjere dette og kva slag data kan du generere? c) Korleis kan du vurdere og gjere reie for kvaliteten av det arbeidet du har gjort? d) Du finner ut at liknande problem finst i Bergen. Beskriv 3 typar av generalisering som du kan nytte for at også Bergen kommune kan kunne nyttiggjere seg resultata dine? 4 ENGLISH All three tasks are to be answered. All the three tasks are equally weighted. Task 1 Table 1 shows two regression models based on data from the Norwegian part of the ”European Social Survey” from the years 2002, 2004, 2006 and 2008. The sample is to be treated as a probability sample from the population, where all respondents are aged 15 years and older, and where all respondents were resident in Norway. The variable netuse measures the answers on the question: “How often do you use the internet, the World Wide Web or e-mail – whether at home or at work – for your personal use?”. The original answer categories “No access at home or work”, “Never use”, “Less than once a month”, “Once a month”, “Several times a month”, “Once a week”, and “Several times a week” have been merged into a new category with the value of 0, whereas the respondents that answered ”Every day” have been given the new value of 1. Furthermore, the variable Man has been given the value 1 for men and 0 for women, whereas the variable Age is coded in decades with one decimal. Explain what the table shows. Table 1. Internet use by age and sex (N=7095) Man (woman=0, man=1) Age (in decades) Year (dummy variables with 2002 as reference category) Year 2004 Year 2006 Year 2008 Age squared Interaction Man*Year 2004 Man*Year 2006 Man*Year 2008 Constant B 0,635 -0,662 0,662 1,180 1,767 2,725 Model1 S.E. p 0,059 0,000 0,019 0,000 OR 1,888 0,516 B 0,693 0,561 0,076 0,080 0,090 0,851 3,256 5,851 0,103 0,000 0,000 0,000 0,000 15,264 Model 2 S.E. p 0,100 0,000 0,100 0,000 OR 2,000 1,753 0,610 1,303 1,932 -0,127 0,107 0,113 0,128 0,011 0,000 0,000 0,000 0,000 1,841 3,681 6,906 0,881 0,028 -0,158 -0,139 0,025 0,151 0,161 0,181 0,233 0,855 0,325 0,441 0,914 1,028 0,854 0,870 1,026 B = logistic regression coefficients S.E. = standard errors p = significance OR = odds ratios are antilogarithm of B (exp(B)) Task 2 Answer six of the nine exercises. Each answer should not exceed ½ page. a) b) c) d) e) f) g) h) Multiple regression coefficient Deterministic and non-deterministic explanations of causality Sampling error and sampling-related error Chi square distribution Two-sided test Confidence interval Interaction effect Explain and illustrate the difference between central tendency and dispersion. Name two measures for central tendency and two for dispersion. 5 i) When you are measuring correlations, when are you to use tau-c, and when are you to use Cramer’s V? Explain the differences between these measures. Task 3 The schools and football clubs close to Trondheim city centre are worried about students 'occupying' football-bins and grounds during evenings. Increasing wear on the grounds and reducing access for younger kids are experienced as major problems. To gather more information about the situation Trondheim municipality (TK) and the Student Union (SiT) have asked Trondheim East Research Factory (TØFF), where you are employed as researcher, to do a study. a) You want to study the students' experience of these neighbourhood resources. Which methods will you use to generate qualitative data? b) You are uncertain about how large this 'occupying'-problem actually is, and what it is like. You are keen to use observation to gain more insight. How can you do that, and what kind of data will you generate? c) How will you assess and account for the quality of the work you have done? d) You discover that the city of Bergen has much of the similar problems. Describe three types of generalisation that you may use so that Bergen municipality may also apply your results. 6 Formler som kan komme til nytte: (O E) 2 Kjikvadratet: E 2 Pˆ 1 der O er observert fordeling, og E er fordeling ved statistisk uavhengighet der P sannsynlighet og L er predikert logit (L = β0 + β1X1 + β2X2 + … + βkXk) 1 e-L ˆ Cramer V Kjikvadratet N (k 1) Kendalls Tau c der k er antall kategorier i variabelen med færrest verdier 2k ( L U ) n 2 (k 1) der L er par ordnet likt, og U er par ordnet ulikt Kritiske verdier i normalfordelingen: Kjikvadratfordelingen: A n ta ll fr ih e ts g r . df 1 2 3 4 5 6 0 ,9 9 0 ,0 0 0 2 0 ,0 2 0 ,1 2 0 ,3 0 0 ,5 5 0 ,8 7 0 ,9 0 0 ,0 2 0 ,2 1 0 ,5 8 1 ,0 6 1 ,6 1 2 ,2 0 0 ,5 0 0 ,4 6 1 ,3 9 2 ,3 7 3 ,3 6 4 ,3 5 5 ,3 5 S a n n s y n lig h e t 0 ,2 0 0 ,1 0 1 ,6 4 2 ,7 1 3 ,2 2 4 ,6 1 4 ,6 4 6 ,2 5 5 ,9 9 7 ,7 8 7 ,2 9 9 ,2 4 8 ,5 6 1 0 ,6 5 0 ,0 5 3 ,8 4 5 ,9 9 7 ,8 2 9 ,4 9 1 1 ,0 7 1 2 ,5 9 0 ,0 2 5 ,4 1 7 ,8 2 9 ,8 4 1 1 ,6 7 1 3 ,3 9 1 5 ,0 3 0 ,0 1 6 ,6 4 9 ,2 1 1 1 ,3 4 1 3 ,2 8 1 5 ,0 9 1 6 ,8 1 0 ,0 0 1 1 0 ,8 3 1 3 ,8 2 1 6 ,2 7 1 8 ,4 7 2 0 ,5 2 2 2 ,4 6 7