NTNU
Norges teknisk-naturvitenskapelige universitet
Institutt for sosiologi og statsvitenskap
EKSAMENSOPPGAVE I SOS1002
SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE
Eksamensdato: 28. mai 2010
Eksamenstid: 5 timer
Studiepoeng: 15
Antall sider bokmål: 2 (Formler: se side 7)
Antall sider nynorsk: 2 (Formler: se side 7)
Number of pages in English: 2 (Formulas: page 7)
Tillatte hjelpemiddel: Kalkulator (alle typer)
Sensurdato: 18. juni 2010
Faglig kontakt under eksamen: Arild Blekesaune (73 59 17 54)
Sensurtelefon: 815 48014
__________________________________________________________________________
BOKMÅL
Alle de tre oppgavene skal besvares.
De tre oppgavene teller hver en tredjedel av den samlede karakteren.
Oppgave 1
På neste side ser du en tabell med to regresjonsmodeller basert på data fra den norske delen av
”European Social Survey” fra årene 2002, 2004, 2006 og 2008. Utvalget skal behandles som
et sannsynlighetsutvalg fra populasjonen, hvor alle respondentene er personer på 15 år og
eldre som var bosatt i Norge. Den avhengige variabelen nettbruk måler svarene på spørsmålet:
”Hvor ofte bruker du Internett, World Wide Web eller e-post til privat bruk, enten hjemme
eller på jobben?”. De opprinnelige svarkategoriene ”Har ikke nettilgang, verken hjemme eller
på jobben”, ”Bruker aldri”, ”Mindre enn en gang i måneden”, ”En gang i måneden”, ”Flere
ganger i måneden”, ”En gang i uken” og ”Flere ganger i uken” er slått sammen i en kategori
med verdien 0, mens de som har svart ”Hver dag” er kodet med verdien 1. Videre er
variabelen mann kodet med verdien 1 for menn og verdien 0 for kvinner, mens variabelen
alder er kodet i antall tiår med en desimal. Forklar hva tabell 1 viser.
1
Tabell 1. Internettbruk fordelt etter alder og kjønn (N=7095)
Mann (kvinne=0, mann=1)
Alder (antall 10-år)
Årstall (dummyer med 2002 som referanse)
År 2004
År 2006
År 2008
Alder kvadrert
Samspill
Mann*År 2004
Mann*År 2006
Mann*År 2008
Konstant
B
0,635
-0,662
0,616
1,180
1,767
2,725
Modell1
S.E.
p
0,059
0,000
0,019
0,000
OR
1,888
0,516
B
0,693
0,561
0,076
0,080
0,090
1,851
3,256
5,851
0,103
0,000
0,000
0,000
0,000
15,264
Modell 2
S.E.
p
0,100
0,000
0,100
0,000
OR
2,000
1,753
0,610
1,303
1,932
-0,127
0,107
0,113
0,128
0,011
0,000
0,000
0,000
0,000
1,841
3,681
6,906
0,881
0,028
-0,158
-0,139
0,025
0,151
0,161
0,181
0,233
0,855
0,325
0,441
0,914
1,028
0,854
0,870
1,026
B = logistiske regresjonskoeffisienter
S.E. = regresjonskoeffisientenes standardfeil
p = signifikanssannsynligheten
OR = oddsratioet er antilogaritmen av B (exp(B))
Oppgave 2
Seks av ni oppgaver skal besvares. Hver besvarelse skal være på inntil ½ side.
a)
b)
c)
d)
e)
f)
g)
h)
Multippel regresjonskoeffisient
Deterministisk og ikke-deterministisk årsaksforklaring
Systematiske og tilfeldige utvalgsfeil
Kjikvadratfordelingen
Tosidig test
Konfidensintervall
Samspillseffekt
Forklar og illustrer forskjellen mellom sentraltendens og spredning. Navngi to mål på
sentraltendens og to mål på spredning.
i) Når skal man bruke korrelasjonsmålet tau-c, og når skal man bruke Cramers V?
Forklar forskjellen mellom disse målene.
Oppgave 3
De sentrumsnære skolene og idrettslagene i Trondheim er bekymret for at studenter
"okkuperer" ballbinger og fotballbaner på kveldstid. Dette sliter på anleggene og fortrenger
yngre brukere. For å få mer informasjon om dette problemet går Trondheim kommune (TK)
og Studentsamskipnaden (SiT) sammen og engasjerer Trondheim Øst Forskningsfabrikk
(TØFF), hvor du er ansatt som forsker.
a) Du vil undersøke studenters opplevelse av disse nærmiljøressursene. Hva slags
metoder kan du bruke for å generere kvalitative data?
b) Du er usikker på hvor stort dette "okkupasjons"-problemet egentlig er og hvordan det
fortoner seg. Du ser for deg at du kan benytte observasjon for å få mer kunnskap.
Hvordan kan du gjøre dette og hva slags data kan du generere?
c) Hvordan kan du vurdere og redegjøre for kvaliteten av det arbeidet du har gjort?
d) Du finner ut at tilsvarende problemer finnes i Bergen. Beskriv 3 typer av
generalisering som du kan benytte for at også Bergen kommune kan kunne nyttiggjøre
seg resultatene dine?
2
NYNORSK
Du skal svare på alle dei tre oppgåvene.
Dei tre oppgåvene tel kvar for seg ein tredjedel av den samla karakteren.
Oppgåve 1
Nedanfor ser du ein tabell med to regresjonsmodellar basert på data frå den norske delen av
”European Social Survey” frå åra 2002, 2004, 2006 og 2008. Utvalet skal behandlast som eit
sannsyneutval frå populasjonen, kor alle respondentane er personar på 15 år og eldre som var
busette i Noreg. Den avhengige variabelen nettbruk måler svara på spørsmålet: ”Kor ofte
bruker du Internett, World Wide Web eller e-post til privat bruk, enten heime eller på
jobben?”. Dei opphavlege svarkategoriane ”Har ikkje nettilgang, verken heime eller på
jobben”, ”Bruker aldri”, ”Mindre enn ein gong i månaden”, ”Ein gong i månaden”, ”Fleire
gonger i månaden”, ”Ein gong i veka” og ”Fleire gonger i veka” er slått saman i ein kategori
med verdien 0, mens dei som har svart ”Kvar dag” er koda med verdien 1. Vidare er
variabelen mann koda med verdien 1 for menn og verdien 0 for kvinner, medan variabelen
alder er koda i tiår med ein desimal. Forklar kva tabell 1 viser.
Tabell 1. Internettbruk fordelt etter alder og kjønn (N=7095)
Mann (kvinne=0, mann=1)
Alder (antal 10-år)
Årstal (dummyar med 2002 som referanse)
År 2004
År 2006
År 2008
Alder kvadrert
Samspel
Mann*År 2004
Mann*År 2006
Mann*År 2008
Konstant
B
0,635
-0,662
0,616
1,180
1,767
2,725
Modell1
S.E.
p
0,059
0,000
0,019
0,000
OR
1,888
0,516
B
0,693
0,561
0,076
0,080
0,090
0,851
3,256
5,851
0,103
0,000
0,000
0,000
0,000
15,264
Modell 2
S.E.
p
0,100
0,000
0,100
0,000
OR
2,000
1,753
0,610
1,303
1,932
-0,127
0,107
0,113
0,128
0,011
0,000
0,000
0,000
0,000
1,841
3,681
6,906
0,881
0,028
-0,158
-0,139
0,025
0,151
0,161
0,181
0,233
0,855
0,325
0,441
0,914
1,028
0,854
0,870
1,026
B = logistiske regresjonskoeffisientar
S.E. = standardfeilen til regresjonskoeffisientane
p = signifikanssannsyne
OR = oddsratioet er antilogaritmen av B (exp(B))
Oppgåve 2
De ska svare på seks av ni oppgåver. Kvart svar skal vere på inntil ½ side.
a)
b)
c)
d)
e)
f)
g)
h)
Multippel regresjonskoeffisient
Deterministisk og ikkje-deterministisk årsaksforklaring
Systematiske og tilfeldige utvalsfeil
Kjikvadratfordelinga
Tosidig test
Konfidensintervall
Samspeleffekt
Forklar og illustrer skilnaden mellom sentraltendens og spreiing. Namngje to mål på
sentraltendens og to mål på spreiing.
i) Når skal ein bruke korrelasjonsmålet tau-c, og når skal ein bruke Cramers V? Forklar
skilnaden mellom desse måla.
3
Oppgåve 3
Dei sentrumsnære skolane og idrettslaga i Trondheim er uroa for at studentar "okkuperer"
ballbingar og fotballbaner på kveldstid. Dette sliter på anlegga og fortrenger yngre brukarar.
For å få meir informasjon om dette problemet går Trondheim kommune (TK) og
Studentsamskipnaden (SiT) saman og engasjerer Trondheim Øst Forskingsfabrikk (TØFF),
kor du er tilsett som forskar.
a) Du vil undersøkje studentar si oppleving av desse nærmiljøressursane. Kva slag
metodar kan du bruke for å generere kvalitative data?
b) Du er usikker på kor stort dette "okkupasjons"-problemet eigentleg er og korleis det
fortonar seg. Du ser for deg at du kan nytte observasjon for å få meir kunnskap.
Korleis kan du gjere dette og kva slag data kan du generere?
c) Korleis kan du vurdere og gjere reie for kvaliteten av det arbeidet du har gjort?
d) Du finner ut at liknande problem finst i Bergen. Beskriv 3 typar av generalisering som
du kan nytte for at også Bergen kommune kan kunne nyttiggjere seg resultata dine?
4
ENGLISH
All three tasks are to be answered.
All the three tasks are equally weighted.
Task 1
Table 1 shows two regression models based on data from the Norwegian part of the
”European Social Survey” from the years 2002, 2004, 2006 and 2008. The sample is to be
treated as a probability sample from the population, where all respondents are aged 15 years
and older, and where all respondents were resident in Norway. The variable netuse measures
the answers on the question: “How often do you use the internet, the World Wide Web or e-mail –
whether at home or at work – for your personal use?”. The original answer categories “No access
at home or work”, “Never use”, “Less than once a month”, “Once a month”, “Several times a
month”, “Once a week”, and “Several times a week” have been merged into a new category with
the value of 0, whereas the respondents that answered ”Every day” have been given the new
value of 1. Furthermore, the variable Man has been given the value 1 for men and 0 for
women, whereas the variable Age is coded in decades with one decimal. Explain what the
table shows.
Table 1. Internet use by age and sex (N=7095)
Man (woman=0, man=1)
Age (in decades)
Year (dummy variables with 2002 as
reference category)
Year 2004
Year 2006
Year 2008
Age squared
Interaction
Man*Year 2004
Man*Year 2006
Man*Year 2008
Constant
B
0,635
-0,662
0,662
1,180
1,767
2,725
Model1
S.E.
p
0,059
0,000
0,019
0,000
OR
1,888
0,516
B
0,693
0,561
0,076
0,080
0,090
0,851
3,256
5,851
0,103
0,000
0,000
0,000
0,000
15,264
Model 2
S.E.
p
0,100
0,000
0,100
0,000
OR
2,000
1,753
0,610
1,303
1,932
-0,127
0,107
0,113
0,128
0,011
0,000
0,000
0,000
0,000
1,841
3,681
6,906
0,881
0,028
-0,158
-0,139
0,025
0,151
0,161
0,181
0,233
0,855
0,325
0,441
0,914
1,028
0,854
0,870
1,026
B = logistic regression coefficients
S.E. = standard errors
p = significance
OR = odds ratios are antilogarithm of B (exp(B))
Task 2
Answer six of the nine exercises. Each answer should not exceed ½ page.
a)
b)
c)
d)
e)
f)
g)
h)
Multiple regression coefficient
Deterministic and non-deterministic explanations of causality
Sampling error and sampling-related error
Chi square distribution
Two-sided test
Confidence interval
Interaction effect
Explain and illustrate the difference between central tendency and dispersion. Name
two measures for central tendency and two for dispersion.
5
i) When you are measuring correlations, when are you to use tau-c, and when are you to
use Cramer’s V? Explain the differences between these measures.
Task 3
The schools and football clubs close to Trondheim city centre are worried about students
'occupying' football-bins and grounds during evenings. Increasing wear on the grounds and
reducing access for younger kids are experienced as major problems. To gather more
information about the situation Trondheim municipality (TK) and the Student Union (SiT)
have asked Trondheim East Research Factory (TØFF), where you are employed as researcher,
to do a study.
a) You want to study the students' experience of these neighbourhood resources. Which
methods will you use to generate qualitative data?
b) You are uncertain about how large this 'occupying'-problem actually is, and what it is
like. You are keen to use observation to gain more insight. How can you do that, and
what kind of data will you generate?
c) How will you assess and account for the quality of the work you have done?
d) You discover that the city of Bergen has much of the similar problems. Describe three
types of generalisation that you may use so that Bergen municipality may also apply
your results.
6
Formler som kan komme til nytte:
(O  E) 2
Kjikvadratet:   
E
2
Pˆ 
1
der O er observert fordeling, og E er fordeling ved
statistisk uavhengighet
der P sannsynlighet og L er predikert logit (L = β0 + β1X1 + β2X2 + … + βkXk)
1  e-L
ˆ
Cramer V 
Kjikvadratet
N (k  1)
Kendalls Tau  c 
der k er antall kategorier i variabelen med færrest verdier
2k ( L  U )
n 2 (k  1) der L er par ordnet likt, og U er par ordnet ulikt
Kritiske verdier i normalfordelingen:
Kjikvadratfordelingen:
A n ta ll
fr ih e ts g r .
df
1
2
3
4
5
6
0 ,9 9
0 ,0 0 0 2
0 ,0 2
0 ,1 2
0 ,3 0
0 ,5 5
0 ,8 7
0 ,9 0
0 ,0 2
0 ,2 1
0 ,5 8
1 ,0 6
1 ,6 1
2 ,2 0
0 ,5 0
0 ,4 6
1 ,3 9
2 ,3 7
3 ,3 6
4 ,3 5
5 ,3 5
S a n n s y n lig h e t
0 ,2 0
0 ,1 0
1 ,6 4
2 ,7 1
3 ,2 2
4 ,6 1
4 ,6 4
6 ,2 5
5 ,9 9
7 ,7 8
7 ,2 9
9 ,2 4
8 ,5 6
1 0 ,6 5
0 ,0 5
3 ,8 4
5 ,9 9
7 ,8 2
9 ,4 9
1 1 ,0 7
1 2 ,5 9
0 ,0 2
5 ,4 1
7 ,8 2
9 ,8 4
1 1 ,6 7
1 3 ,3 9
1 5 ,0 3
0 ,0 1
6 ,6 4
9 ,2 1
1 1 ,3 4
1 3 ,2 8
1 5 ,0 9
1 6 ,8 1
0 ,0 0 1
1 0 ,8 3
1 3 ,8 2
1 6 ,2 7
1 8 ,4 7
2 0 ,5 2
2 2 ,4 6
7