Forsterkning, betingede forsterker, straff.pdf

advertisement
Forsterkning, betingede
forsterker, straff
MALKA212
V-2011
Erik Arntzen
HiAk
9.03.2011
EA
1
1
Treterms kontingensen
For å kunne formulere interaksjonen mellom en organisme og dens
omgivelser må det ifølge Skinners spesifiseres
1) Den foranledning en respons opptrer under - SD
2) Selve responsen - R
3) De forsterkende konsekvenser - SR
Forholdet mellom disse kalles:
Forsterkningsbetingelsene eller forsterkningskontingensene.
SD : R - SR
9.03.2011
EA
2
2
Fra Pierce og Cheney (2008)
9.03.2011
EA
3
3
Different operant chambers
9.03.2011
EA
4
4
Et operant kammer for duer.
9.03.2011
EA
5
5
Cumulative Recorder
9.03.2011
EA
6
6
From Ferster (1953)
9.03.2011
EA
7
7
Kymograph
9.03.2011
EA
8
8
From Lattal (2004)
9.03.2011
EA
9
9
From Lattal (2004)
9.03.2011
EA
10
10
From Asano and Lattal (2008)
9.03.2011
EA
11
11
From Asano and Lattal (2008)
9.03.2011
EA
12
12
From Catania (2007)
9.03.2011
EA
13
13
Cumulative Record skjematisk
9.03.2011
EA
14
14
Effektivitet ved en forsterker eller
forsterkning
•
•
•
•
Rate
Kvalitet
Magnitude
Delay
• Det er den tidsperioden mellom responsen som
har produsert forsterkeren og til forsterkeren
faktisk blir presentert.
9.03.2011
EA
15
15
Immediacy of Reinforcment
• Direct effects or reinforcement is based on
temporal relation between behavior and
consequence (Michael, 2004.)
• The less delay, the more effective the
reinforcement.
• Behavior closest to reinforcement is
strengthened.
9.03.2011
EA
16
16
Delayed consequences
• Do not reinforce behavior directly
• Affect behavior through instructional control
and rule following
• Rule: verbal description of a behavioral
contingency
• Rule governed behavior: If behavior occurs
because of a rule rather than direct effect of
reinforcement.
9.03.2011
EA
17
17
Etablering av responser og delay
• Thorndike (1911) fant blant annet at det var
en negativ relasjon mellom
responservervelse og delay av
konsekvensene.
9.03.2011
EA
18
18
Varianter ved bruk av delays
• Delays med en distinkt eller bestemt stimulus
• Brukt ofte lys av
• Variasjoner i farge på lys
• Spaker som trekkes tilbake
• Delays med ikke-tilbakestilte intervaller eller
med tilbakestilling av intervallene.
• Delays med fast eller variabel varighet
9.03.2011
EA
19
19
Den vanligste måten studere effektene
av delay på.
• Avhengig av kontekst så kan delay of
reinforcement øke eller redusere atferd, eller
ikke ha noen effekt sammenlignet med
umiddelbar forsterkning.
• Det mest vanlig er at man iverksetter en
prosedyre med delayed reinforcement etter
en periode med umiddelbar forsterkning.
• Dette fører typisk til at responsraten reduseres
noe.
9.03.2011
EA
20
20
Differensiering av operante responser
med delayed reinforcement
• Skinner (1938) var den første som
differensierte operante responser med
delayed reinforcement. Han gjorde blant
annet et eksperiment med rotter og viste at
det var mulig å etablere spaktrykk med et
delay opp til 8 sekunder. Delayet var ikke
signalisert.
9.03.2011
EA
21
21
Shaping med delay
• Prosedyren var ikke-tilbakestillende
usignalisert delay
• Sammenligning av umiddelbar forsterkning, 1
s delay og 10 s delay
• Resultatene viste at det var ingen
nevneverdige forskjeller mellom umiddelbare
og 1 s delay.
• Ved 10 s delay var det ikke mulig. Duene
fortsatte å vise masse forskjellig type atferd i
intervallet
9.03.2011
EA
22
22
Innføring av et delay etter steady
state responding
• Ferster (1953) antok at effektene av
signaliserte delays ville bli mindre påvirket
dersom det ble benyttet en
titreringsprosedyre.
• Resultatene viste at responderingen ble
opprettholdt på et VI 60 s skjema med 120 s delay
• Ferster og Hammer (1956) viste i en studie
med bavianer at intervallet kunne strekkes
gradvis opp til 24 timer.
9.03.2011
EA
23
23
Anvendelse av delay etter at atferden er
oppretthold på umiddelbar forsterkning
• Korte intervaller på rundt 0.5 sekunder i
usignaliserte og i tilbakesettende delays ofte
fører til at responderingen relativt til hva som
er funnet ved umiddelbar forsterkning.
• Når det er sagt så er det viktig å presisere at
den mest typiske effekten ved delayed
reinforcement brukt etter umiddelbar
forsterkning er at man får en reduksjon i
responsraten relativt til hva som er observert
ved umiddelbar forsterkning.
9.03.2011
EA
24
24
Ulike termer
A - B - C
SK2
{
SK
{
SD : R
-
SR
SE (Setting hendelser)
EO/MO (Etablerende eller motivasjonelle operasjoner)
9.03.2011
EA
25
25
Fire grunnleggende forhold mellom stimuli som
etterfølger atferd og effekt på atferd:
Operasjon:
Stimulus som følger
etter atferden
10.03.2010
Effekt på atferd
Økning
Reduksjon
Presentasjon
Positiv forsterkning ”Type 1
punishment”
Fjerning
Negativ
forsterkning
EA
”Type II
punishment”
26
26
Fra Cooper et al. (2007)
10.03.2010
EA
27
27
Viktige forhold ved den atferdsanalytiske
opplæringsmodellen
• Etablering av ny atferd
• Endre stimuluskontrollen for atferden
• Generalisering av atferd over tid
(opprettholdelse), situasjoner og
atferdskategorier
9.03.2011
EA
28
28
Vanskeligheter med å lage gode
nok ”fagmiljøer” for å behandle
alvorlige atferdsproblemer
Difficult or controversial programming for very difficult
behavior problems should be limited to those settings
in which the necessary expertise and environmental
support are available
(Foxx, 1982).
9.03.2011
EA
29
29
Viktige hovedmål
• Økt grad av selvstendighet
• Bredest mulig atferdsrepertoar
• Etablering av alternative atferdstopografier for å
redusere problematferd
9.03.2011
EA
30
30
Tre viktige forhold for å skille ut
hva som er problematferd:
!Atferden ekskluderer klienten i å delta i
sosiale situasjoner.
!Atferden er uforenelig med opplæring av nye
viktige ferdigheter.
!Atferden er skadelig for klienten og/eller
andre.
9.03.2011
EA
31
31
Klassifikasjon av atferd
Overskuddsatferd. Kategorien referer til atferd som er for
høyfrekvent eller for intens i forhold til normene som gjelder for
situasjonene den forekommer i.
Underskuddsatferd. Denne kategorien omfatter for lavfrekvent
og for lite intens atferd i forhold til de situasjonene den
forekommer i.
Mangelatferd. Atferd som klienten ikke har i sitt atferdsrepertoar,
men som det er ønskelig at han skal lære.
Atferd under feil stimuluskontroll. Denne kategorien omfatter
atferd som er lite funksjonell i forhold til de situasjoner den
forekommer under.
9.03.2011
EA
32
32
Eksemplifisering av typer av
problematferd
" Selvskadende atferd
" Selvstimulerende atferd
Tvangsmessig atferd
"
Utagerende atferd
"
Mangel på oppmerksomhet
"
Mangel på språklig atferd
"
Mangel på korrekt toalettatferd
"
Manglende typer av selvstendighetsatferd
"
9.03.2011
EA
33
33
Ulike former for problematferd:
! Selvskadende atferd
! Aggressiv og ødeleggende atferd
! Stereotyp atferd
! Selvstimulerende atferd
! Tvangsmessig atferd
! Passivitet
! I tillegg en del som kan kategoriseres som
mangelatferd (grising med avføring, enurese
etc.)
9.03.2011
EA
34
34
Definisjon av selvskading (SIB)
• Initiert av personen selv
• Repeterende
• Har som resultat at responsene påfører individet
skade.
Selvskadende atferd regnes som enhver atferd initiert av
individet selv, som direkte resulterer i fysisk skade på det
individet. Fysisk skade antas å innbefatte "gul og blå",
istykkerriving, blødninger (indre eller ytre), brudd- og brist av
bein, og annen vevødeleggelse (Murphy & Wilson, 1985).
9.03.2011
EA
35
35
Definisjon av låsing
Vanlige topografier ved låsing (”self-restraint”) er
innvikling av lemmer i klær, møbler eller deler av
kroppen; disse responsene er vanligvis inkompatible
med individets selvskading og blir sett på som at de
forhindrer de selvskadende responsene.
(Smith, Iwata, Vollmer, & Pace,
1992)
9.03.2011
EA
36
36
Ulike topografier ved selvskading
9.03.2011
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
hodedunking
slag mot hodet
biting på kroppsdeler
trykking mot øye
hårnapping
riving og kloring
slag mot andre kroppsdeler
negleutdraging
skjære seg
sparke seg
gniing av to kroppsdeler mot hverandre
hoppe på stive bein
pica
ruminasjon
provoserte brekninger
hyperventilering
provoserte kramper
EA
37
37
Paradigmeskifte innen anvendt
atferdsanalyse
• Prinsippet om minst restriktive alternativ
• “Least Restrictive Alternative” (LRA)
• Fra å være en diskusjon om aversive vs.
ikke-aversive behandling til å være en
diskusjon om funksjonell vs. ikke-funksjonell
behandling
• LRA-modellen forfekter at behandlingen skal
være basert på funksjon og ikke topografi.
• Kunnskapen om atferdens funksjon har gitt
mer nøyaktige behandlingsopplegg, samt at
en del nye prosedyrer er framkommet.
9.03.2011
EA
38
38
Minst restriktive prosedyre
• Prinsippet om bruk av den minst restriktive
prosedyre har vært et anerkjent prinsipp
innen atferdsanalyse over lang tid.
• Det innebærer at andre mindre restriktive
prosedyrer skal prøves ut først og dersom
disse viser seg å være ineffektive, så kan
man diskutere bruken av straffeprosedyrer.
9.03.2011
EA
39
39
Et mulig tiltakshierarki
Funksjonsbasert
Ikke-funksjonelle
forsterkningsbaserte prosedyrer
Prosedyrer som innebærer
bruk av restriktivitet
9.03.2011
EA
40
40
Rangering fra liten til stor grad
av restriktive prosedyrer:
9.03.2011
1)
2)
3)
4)
5)
6)
7)
Etablering av ferdigheter
Differensielle forsterkningsprosedyrer og NCR
Ekstinksjon
Reprimander
Positiv praksis
«Time-out»
- ikke-ekskluderende
«Time-out»
- ekskluderende
8)
9)
10)
11)
«Response Cost»
Restitusjonsprosedyrer
Presentasjon av aversive stimuli kontingent på atferd
- ikke-smertefulle stimuli
Presentasjon av aversive stimuli kontingent på atferd
- smertefulle stimuli
EA
41
41
I henhold til bruk av aversive
virkemidler er det vanlig å dele slike
prosedyrene inn i fem kategorier:
1)
2)
3)
4)
5)
9.03.2011
aversive lyder
aversiv smak
aversive lukter
fjerning eller fordreining av visuelle stimuli
uvanlig aversiv fysisk berøring
EA
42
42
Kontinuerlig atferdstrøm
• Private og offentlige hendelser
• Hendelsene kan da både være atferd og stimuli
• Skille er bestemt av tilgang til disse
hendelsene.
• Kan være en del av en atferdskjede
”Private and public events have the same kind of physical dimensions.”
(Skinner, 1963, p. 953)
”The skin is not at all that important as boundary” (Skinner, 1969).
9.03.2011
EA
43
43
Fra Cooper et al. (2007)
• Generelt kan en si at atferd er aktiviteten hos levende
organismer.
• Atferd brukes for å referere til en større klasse av
responser som deler visse typer topografiske
dimensjoner eller funksjoner.
• Respons referer til en spesifikk tilfelle av en atferd.
• Responstopografi referer til en fysisk form av atferd.
• En responsklasse er en gruppe responser som varierer
i topografi, men som produserer den samme effekten
på miljøet.
• Et repertoar refererer til alle typer av atferd som en
person kan framvise eller til et sett av typer av atferd
som er relevant i en type setting eller oppgave.
9.03.2011
EA
44
44
En respons
En respons er en bit av atferdsstrømmen som er
avgrenset ved at forekomst av liknende atferdsbiter er
funksjonelt relatert til bestemte stimuli.
9.03.2010
EA
45
45
En stimulus
En stimulus er hendelse som er avgrenset ved at
liknende hendelser er funksjonelt relatert til
bestemte typer responser.
9.03.2010
EA
46
46
Viktige begreper ved forsterkning
Begrep
Restriksjoner
Forsterker (substantiv)
En stimulus
Forsterkende (adjektiv)
En egenskap ved en
stimulus
En prosedyre eller en
prosess
En prosedyre eller en
prosess
Forsterkning (substantiv)
Å forsterke (verb)
10.03.2010
EA
47
47
Forsterkere virker på atferd og de er
definert ut fra økning av responsraten og
ikke om man liker dem eller ikke
“Reinforcers do not work because they make the organism
“feel good” or because the organism “likes” them”
(Catania, 1992, p.81)
9.03.2011
EA
48
48
En positiv forsterker
En positiv forsterker er en hvilken som helst
stimulus som blir presentert (tilført) umiddelbart på
en respons, og som øker sannsynligheten for
liknende type av responser i framtiden.
9.03.2010
EA
49
49
Eksempel med bruk av positiv
forsterkning
9.03.2011
EA
50
50
Nok et eksempel på det samme
9.03.2011
EA
51
51
En negativ forsterker
En negativ forsterker er en hvilken som helst
stimulus som blir terminert (fjernet) umiddelbart på
en respons, og som øker sannsynligheten for
liknende type av responser i framtiden.
9.03.2010
EA
52
52
En litt annen definisjon, men ikke
akkurat helt korrekt !
Fra en eksamensoppgave på
profesjonsstudiet i psykologi: ”Negativ
forsterkning er akkurat det samme, bortsett
fra at man øker styrken av responsen ved å
unngå forsterkning”.
9.03.2011
EA
53
53
Forsterkning er navnet på relasjonen
mellom responser og miljøet. Denne
relasjonen inkluderer minst tre
komponenter:
1.
2.
3.
9.03.2011
Responsen må ha konsekvenser.
Økt sannsynlighet for at liknende responser
forekommer i framtida.
Økningen må forekomme fordi responsene har
disse konsekvensene og ikke for noen annen grunn.
EA
54
54
Kontigens vs. Uavhengighet
A
Kontingens
B
A
Uavhengighet
B
10.03.2010
EA
55
55
Typer av forsterkere:
• Ubetingede forsterkere (noen ganger også
betegnet som primær forsterkere) er hendelser
eller stimuli som har en åpenbar biologisk
betydning for organismen, for eksempel mat og
vann.
• Betingede forsterkere er hendelser eller stimuli
som gjentatt ganger blir paret med stimuli som
allerede er effektive forsterkere, for eksempel ros,
smil.
• Dersom betingede forsterkere er paret med en
rekke andre forsterkere i en rekke situasjoner blir
disse generaliserte betingede forsterkere, for
eksempel penger, tegnøkonomibrikker
9.03.2011
EA
56
56
9.03.2011
EA
57
57
9.03.2011
EA
58
58
9.03.2011
EA
59
59
Betinget forsterkning
• S-S forklaring på betinget forsterkning
• Klassisk betinging
• Diskriminativ stimulus forklaring på betinget
forsterkning
• Operant betinging
• Stimulusen må være diskriminativ for å bli en
betinget forsterker.
9.03.2011
EA
60
60
Generaliserte betinget forsterkning
• En generalisert betinget forsterker er enhver
hendelse eller stimulus som er korrelert med
eller utbyttbar med mange kilder til ubetinget
forsterkning.
• Generalisert betinget forsterkning er ikke
avhengig av deprivasjon eller metning av en
spesiell forsterker.
• Generalisert sosial forsterkning.
• Tegnøkonomibrikker og penger som
generaliserte betingede forsterkere.
Fra Pierce og Cheney (2008)
9.03.2011
EA
61
61
Betingede forsterkere og kjeding
• Tradisjonelt:
SD
Trykkerespons !
R
klikkelyd for vannmekanisme !
SR
vann
• Molekylært nivå:
SD
Synet av spaken
vannmekanismen
R1
!
SR/SD
Klikkelyd fra vannmekanisme !
9.03.2011
SR
trykkerespons !
R2
går til vannluka !
EA
klikkelyd fra
SR
vann
62
62
Baklengs kjeding
9.03.2011
EA
63
63
Skinner (1953):
A conditioned reinforcer is generalized when it is paired with
more than one unconditioned reinforcer. The generalized
reinforcer is useful because the momentary condition of the
organism is not likely to be important. The operant strength
generated by a single reinforcement is observed only under an
appropriate condition of deprivation – when we reinforce with
food, we gain control over the hungry man. But if a conditioned
reinforcer has been paired with reinforcers appropriate to many
conditions, at least one appropriate state of deprivation is more
likely to prevail upon a later occasion. A response is therefore
more likely to occur. When we reinforce with money, for
example, our subsequent control is relatively independent of
momentary deprivations.
(p. 77)
9.03.2011
EA
64
64
To motsatte prosesser
9.03.2011
EA
65
65
Ekstinksjon
Ekstinksjon som prosedyre er at den
forsterker som tidligere etterfulgte/
opprettholdt en bestemt type respons blir
holdt tilbake eller ikke gjør det lenger.
Ekstinksjon som prosess refererer til at
hyppigheten av denne type respons først
øker noe for deretter å avta som et resultat
av ekstinksjonsprosedyren.
9.03.2010
EA
66
66
Ekstinksjon vs. ”glemsel”
• I løpet av ekstinksjonen så avtar atferden
over tid
• Glemsel er kun et resultat av tiden har gått.
• Skinner (1938)
• Markowitz et al. (1975)
Gå fram
9.03.2011
EA
67
67
Extinction vs. forgetting
Gå tilbake
9.03.2011
EA
68
68
Effektene av ekstinksjon
9.03.2011
EA
69
69
Responding during extinction
9.03.2011
EA
70
70
Extinction
9.03.2011
EA
71
71
Satiation
9.03.2011
EA
72
72
Reinforcement and extinction
9.03.2011
EA
73
73
Fra Catania (2007)
9.03.2011
EA
74
74
Extinction from Catania (2007)
9.03.2011
EA
75
75
Spontaneous Recovery
9.03.2011
EA
76
76
Spontaneous recovery
Catania (2007)
9.03.2011
EA
77
77
Mechner notation system
9.03.2011
EA
78
78
Mechner notation system
9.03.2011
EA
79
79
Probabilities from Catania (2007)
9.03.2011
EA
80
80
Klassebegrepet
En operant er en klasse av responser som
er under kontroll av de samme diskriminative
stimuli og forsterkende hendelser
9.03.2011
EA
81
81
Classes of behavior
9.03.2011
EA
82
82
Descriptive vs. Functional
operant
9.03.2011
EA
83
83
Definisjon av shaping
Forming (shaping) av en bestemt
respons-topografi består av at
kriteriet for hvilke responsformer
som leder til forsterkning endres
gradvis i en bestemt retning.
9.03.2010
EA
84
84
Eksempel
9.03.2011
EA
85
85
9.03.2011
EA
86
86
Shaping
A means of reinforcing the behavior as it
becomes closer to the desired outcome.
Reinforce successive approximations of the
behavior
9.03.2011
EA
87
87
Fading vs. Shaping
• Fading is used to bring an already
learned behavior under the control of a
different stimulus. Shaping is used to
teach a new behavior
• The behavior itself does not change
when fading is used; only the
antecedent stimulus varies. In shaping
the behavior itself is changed
• In fading, the teacher manipulates
antecedents. In shaping,
consequences are manipulated
9.03.2011
EA
88
88
9.03.2011
EA
89
89
Sample Task Analysis
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
9.03.2011
Locate the phone
Find the phone number
Choose correct change
Pick up the receiver with left hand
Put receiver to ear and listen to dial tone
Insert first coin
Insert second coin
Dial seven-digit number
Wait for ring a minimum of 5 times
If someone answers, initiate conversation
If busy, hang up phone and collect money
EA
90
90
Response Chaining
• Used to link a series of functionally related
responses, each associated with a particular
stimulus condition
9.03.2011
EA
91
91
Example of a response chain
“Go to first
stop sign”
CUE
“See yellow house
on left”
Reinforcer + cue
“Turn right”
“Go two stop
lights”
First response
Second Response
9.03.2011
EA
92
92
Forward Chaining
• Procedure where all the steps are performed
in sequence, but only the first task step is
instructed and reinforced.
9.03.2011
EA
93
93
Shaping
A means of reinforcing the behavior as it
becomes closer to the desired outcome.
Reinforce successive approximations of the
behavior
9.03.2011
EA
94
94
“Boy, have I got this guy trained:
every time I press the lever, he
gives me a piece of cheese”
9.03.2011
EA
95
95
Operant betinging
# Responser blir ”emitted”
# En stimulus kontrollerer responsen i den forstand at
sannsynligheten for responsen endres når en spesiell stimulus,
som hvis nærvær tidligere har ledet til forsterkning, er tilstede.
# Kontingens
• Vi sier at det er en kontingent (avhengig av) forhold mellom
spaktrykk og mat.
• Dersom det er et kontingent forhold mellom to hendelser A
og B, så betyr det at B bare forekommer og bare dersom A
forekommer. På den måten er B avhengig av A eller sagt på
en annen måte at A predikerer B, ettersom når A
forekommer, så forekommer B. Dersom A ikke forekommer,
så vil B ikke forekomme. Mat (B) er kontingent i forhold
spaktrykk (A) eller sagt på en annen måte er mat (B) en
konsekvens av spaktrykk (A).
9.03.2010
EA
96
96
Fortsetter
#
$
$
$
$
Forandringer i atferd som et resultat av en respons blir
utsatt forsterkning:
raten av responsen øker relativt til baseline nivå.
raten av responsen øker relativt til raten av andre
responser som forekommer i situasjonen.
mønsteret eller sekvensen forandrer seg til en sløyfe
som hele tiden gjentar seg.
formen eller topografien av responsen blir mer
stereotyp og krever et minimum av anstrengelse
forandring i responsvariabilitet og blir influert av
individets biologiske forberedthet til å utføre de
responsene som konsekvensene er arrangert for.
9.03.2010
EA
97
97
Fortsetter
•Arbitræritet
" i den forstand at ingen er spesielt interessert i spaktrykk som sådan.
" at responser kan bli modifisert ved sine konsekvenser.
" spaktrykk eller trykking på en tast er valgt ettersom de er lette å
observere og registrere.
" kan lett utføres med ulik frekvens og med forskjellig mønster.
9.03.2010
EA
98
98
From Tolman
9.03.2011
EA
99
99
A fourteen-unit T-maze
9.03.2011
EA
100
100
From Tolman and Honzik (1930)
9.03.2011
EA
101
101
Cognitive Map
• The animal develops a picture of the
environment in his mind by moving about in
this environment.
• Once “the lay of the land” is developed the
animal can reach its goal from any direction,
individual responses, even individual routes
to goal do not matter.
9.03.2011
EA
102
102
Expectations
• During the development of the cognitive map
the animal develops expectations on where
to find the goal.
• Tentative expectations early on in cognitive
map development are called hypotheses. An
expectation that is consistently confirmed is
called means-end readiness.
9.03.2011
EA
103
103
9.03.2011
EA
104
104
9.03.2011
EA
105
105
Catania (2007)
9.03.2011
EA
106
106
9.03.2011
EA
107
107
From Statton (1897)
• When I moved my head or body so that my
sight swept over the scene, the movement
was not felt to be solely in the observer, as in
normal vision, but was referred both to the
observer and to objects beyond ! I did not
feel as if I was visually ranging over a set of
motionless objects, but the whole field of
things swept and swung before my eyes.”
(p. 342)
9.03.2011
EA
108
108
From Skinner (1953)
”Events which are found to be reinforcing are of two sorts. Some
reinforcements consist of presenting stimuli, of adding something –
for example, food, water, or sexual contact – to the situation. These
we call positive reinforcers. Others consist of removing something
– for example, a loud noise, a very bright light, extreme cold or
heat, or electric shock – from the situation. These we call negative
reinforcers. In both cases the effect of reinforcement is the same –
the probability of response is increased. We cannot avoid this
distinction by arguing that what is reinforcing in the negative case
is the absence of the bright light, loud noise, and so on; for it is
absence after presence which is effective, and this only another
way of saying that the stimuli is removed. (p. 73)
9.03.2011
EA
109
109
Michael (1975)
• Confusion between negative reinforcement
and punishment
• If stimuli are presented or removed depend
on the context.
9.03.2011
EA
110
110
Problems raised with respect to
such a distinction
• Aversive stimulus vs. negative reinforcer
• Difficulties with distinguishing stimulus
changes which are presentations from those
which are removals or withdrawals.
9.03.2011
EA
111
111
Iwata (2006)
•
•
9.03.2011
In many cases stimulus changes involve pre- and
postchange conditions in which it is possible to
determine if the relevant stimulus is present or absent
Prechange and postchange conditions % facilitates
the development of effective contingencies
EA
112
112
Fra Hineline
• ”The addition of one event is the removal of another, and
vice versa: Adding heat is removing cold; adding food is
decreasing deprivation; adding a smile removes a frown.
However, there is a fundamental asymmetry, for if a
stimulus or situation is to be reducible or removable by
some response, that response must occur in its presence.
In contrast, positively reinforced responses necessarily
occur in the absence of the stimuli upon which
reinforcement is based.”
(pp. 496-497)
9.03.2011
EA
113
113
On the distinction between positive and
negative reinforcement
9.03.2011
EA
Catania (2007)
114
114
Variability
• One possibility is that the strengthening effects of
positive and negative reinforcement are in some
important way different from one another
• The two kinds of reinforcement involve underlying
physiological structures or processes.
9.03.2011
EA
115
115
Stereotypy
From Schwartz (1982). Four left
and four right presses in any order
were required.
He found that both pigeons and
college students developed a
stereotyped pattern of responding.
9.03.2011
EA
116
116
Variability
• Critic raised by Neuringer:
• Response requirements in the Schwartz study resulted in
response stereotypy.
Furthermore, Neuringer and co-workers have done
experiments showing the opposite results of Schwartz
(1982):
• Experiments have shown that pigeons show variability
when reinforcement contingencies were arranged for such
behavior (Page and Neuringer, 1985).
• Other experiments by Neuringer (2002, 2004) with humans
have shown that reinforcement contingencies may
generate novel behavior.
9.03.2011
EA
117
117
• Positiv straff. 1) Skinner definerer straff som
presentasjon av en negativ forsterker
kontingent på en respons, 2) Azrin definerer
straff som en hvilken som helst stimulus som
blir presentert (tilført) kontingent (avhengig
av) på en respons, og som minsker den
framtidige sannsynligheten for liknende typer
responser.
9.03.2011
EA
118
118
• Negativ straff. 1) Skinner definerer straff
som er fjerning av en positiv forsterker
kontin-gent på en respons. 2) Azrin definerer
straff som en hvilken som helst stimulus som
blir terminert (fjernet) kontingent (avhengig
av) på en respons, og som minsker den
framtidige sannsynligheten for liknende typer
responser.
9.03.2011
EA
119
119
To definisjoner av straff
1. Azrin og Holz (1966)
Straff er en prosedyre der
a) responser har konsekvenser
b) hyppigheten av disse responsene synker
c) nedgangen i responshyppigheten skjer forsi responsene
har disse konsekvensene, og ikke av andre grunner.
2. Skinner
Straff er en prosedyre der responser etterfølges av enten
• Fjerning av en positiv forsterker, eller
• Presentasjon av en negativ forsterker (aversiv stimulus)
Positive og negative forsterkere må på forhånd være
identifisert i henholdsvis positive og negative
forsterkningsprosedyrer.
9.03.2011
EA
120
120
9.03.2011
EA
121
121
Fra Cooper et al. 2007
Foranledning
Si navnet på en
kjøttetende
dinosaur
Fæl lukt under
kjøkkenbenken
Glatt
vei
Spørsmål i
”popup” boks
på skjermen: ”Vil
du varsles
dersom du sletter
9.03.2011
uleste
beskjeder?”
Atferd
Konsekvens
”Tyrannosaurus
Rex”
Tar ut søpla
Kjører i normal
hastighet
Klikker på ”Nei”
”Supert”
Framtidig frekvens Operasjon/prosedyre
av atferd i lignende
situasjoner
Positiv
forsterkning
Den fæle
lukta
forsvinner
Kjører inn i
bilen foran
Viktig e-post
beskjeder blir slettet
EA
Negativ
forsterkning
Positiv
straff
Negativ
straff
122
122
9.03.2011
EA
123
123
Escape and Avoidance
9.03.2011
EA
124
124
9.03.2011
EA
125
125
Negativ forsterkning
Det er atferd som øker i frekvens når den etterfølges av at en
stimulus blir fjernet. På samme måte som positiv forsterkning øker
denne frekvensen av atferd og den er benevnt som negative fordi
den involverer fjerning
To typer:
• Flukt
• Responsen framkommer i nærvær av den aversive
stimulusen og derav fjerner denne
• Atferd fjerner stimulusen fra situasjonen
• Unngåelse
• Responsen forhindrer den aversive stimulusen
• Atferd gjør at hendelsen unngås.
• ”Postponement” og ”deletion” prosedyrer
9.03.2011
EA
126
126
Nondiscriminated avoidance
9.03.2011
EA
127
127
Avoidance paradox
• Murray Sidman (1989) “Successful
avoidance meant that something – the
shock – did not happen, but how could
something that did not happen be a
reinforcer?”
9.03.2011
EA
128
128
Discriminated avoidance
9.03.2011
EA
129
129
Sidman (1953)
• To klokker styrer formidlingen av elektrisk
støt
• En klokke tiden mellom støtene SS intervall
• En klokke tiden mellom respons og støt RS
intervall
• Støt kan unngås fullstendig ved avoidance
responser
• Støtene er også av så kort varighet at det
ikke er mulig med noe fluktrespons.
9.03.2011
EA
130
130
Spaktrykking hos en rotte i en
Sidman avoidance prosedyre
9.03.2011
EA
131
131
Lenker
• http://www.psychology.uiowa.edu/Faculty/
Wasserman/Glossary/
reinforcement.html#positive%20reinforcer
• http://www.youtube.com/watch?
v=wfraBsz9gX4
• http://psych.athabascau.ca/html/prtut/
reinpair.htm
9.03.2011
EA
132
132
Eksempler
1. Ei rotte blir plassert i et operant kammer og får
umiddelbart et mildt elektrisk støt i beina. Rotta
trykker på en spak og støtet opphører. Rotta får
et nytt støt og trykker spaken igjen, støtet
opphører på nytt. Rottas spaktrykkeatferd er
styrket ved konsekvensen at støtet opphører.
2. Å kjøre i kø er en negativ betingelse for de fleste
av oss. Du kjører hjemmefra en morgen og
dermed slipper unna køen. Neste morgen drar
du også tidligere hjemmefra og igjen unngår du
køen. Atferden din å dra tidlig hjemmefra er
forsterket ved at du unngår kø.
9.03.2011
EA
133
133
Eksempler
Stimulus
Atferd som blir forsterket
Innsektsbitt som klør
Klør på det.
Øyne som klør
Gnir dem.
For sterkt lys
Skygger for
Kaldt luftdrag
Lukker vindu
For mye støy
Skrur ned høreapperatet
For nye syting
Kjedelig undervisning
Bekymre seg for en test
Hodepine
9.03.2011
Nervøs
Overdøve sytingen med
radioen eller gi etter og dem
hva de vil
Dagdrømme, tegne
kruseduller, lukke ute
Se på tv eller studere for å
lindre dårlig samvittighet
Ta en smertelindrende
tablett
Puste dypt,
avslapningsøvelser
EA
134
134
Related documents
Download