Uploaded by KIMICOACH

Valero-Varela Polemica programas de reforzamiento

advertisement
LA POLEMICA SOBRE PROGRAMAS DE REFORZAMIENTO EN
HUMANOS
La polémica se origina cuando a través de la sección de preguntas y respuestas se recibe la
siguiente pregunta a la que responde Luis Valero:
Pregunta: ejemplos de tipos de reforzamiento: razón continuo / intervalo continuo /
razón intermitente / intervalo intermitente.
Respuesta (Luis Valero):
En otra pregunta sobre programas de reforzamiento de esta pagina, encontraras mas
explicaciones sobre este tema. Revisa la nomenclatura o traducción de tus textos.
Aunque los programas de reforzamiento surgieron en un contexto experimental de
laboratorio, se han aplicado extensamente al comportamiento humano, y pueden ser la
explicación en algunos comportamientos cotidianos. Aquí van unos ejemplos:
1.- Razón fija (no razón continuo), supone la aparición del reforzador cada numero de
respuestas especificas. Por ejemplo, cada 5 cuentas que el niño hace bien, la maestra le pone
una buena nota. Cada 10 clientes nuevos que consigue un vendedor, el jefe le da una prima
económica.
2.- Razón variable (no razón intermitente), el reforzador aparece cada numero variable de
respuestas de una ocasión a otra. Por ejemplo, el vendedor a domicilio consigue vender una
enciclopedia cuando visita 8, 6, 14, 2, 18... domicilios. En el aprendizaje de la lectura, la
maestra refuerza al niño al terminar cada frase, lo que supone 2, 10, 8, 4, 6... palabras por
frase.
3.- Intervalo fijo (no intervalo continuo), supone que el reforzador estará disponible en la
primera respuesta después de superado un tiempo siempre fijo. Por ejemplo, la película se
interrumpe y estará disponible de nuevo en la TV después de 6 min. de anuncios (por eso se
hace zapping en los anuncios). Todos los exámenes suelen tener un intervalo fijo de tiempo
(Febrero y Junio), por eso se estudia mas los días inmediatamente antes del examen.
4.- Intervalo variable (no intervalo intermitente), implica que el reforzador estará disponible en
la primera respuesta después de un tiempo variable de una ocasión a la siguiente. Por ejemplo,
una persona pidiendo limosna en una acera, recibirá unas monedas a los 3, 15, 6, 8, 24, 4...
minutos. Viendo un partido de futbol, el gol puede aparecer a los 2, 8, 40, 32, 6, 25... minutos.
Tras esta respuesta Julio Varela muestra su desacuerdo y responde de la siguiente manera:
Respuesta (Julio Varela):
Desde mi punto de vista, la "aplicación" de los programas de reforzamiento al
comportamiento humano, en general carece de fundamento teórico y empírico. Se justifica
sobre argumentaciones muy debatibles.
Tomemos como base los ejemplos proporcionados anteriormente. Se comenta que
"aunque los programas de reforzamiento surgieron en un contexto experimental de laboratorio,
se han aplicado extensamente al comportamiento humano, y pueden ser la explicación en
algunos comportamientos 'cotidianos' ".
1 Se reconoce implícitamente que el conocimiento generado en el laboratorio puede ser
diferente al que puede generarse fuera de él. Si a esto aunamos que Skinner escribió "La
conducta de los organismos" (1938), teniendo en consideración EXCLUSIVAMENTE la conducta
de la rata, dentro de un ambiente que NO es natural de la rata, habría que considerar con
mucho cuidado cómo es que dichos programas de reforzamiento se hayan aplicado
extensamente al comportamiento humano. En consecuencia, en la aplicación se asumen, al
menos dos aspectos:
a) El conocimiento generado en un ambiente experimental de laboratorio es válido para
situaciones no experimentales fuera del laboratorio y, b) El ser humano se comporta
cotidianamente de la misma manera que las ratas en ambientes no naturales.
Difícilmente estos aspectos pueden sostenerse por sí mismos. Los ejemplos
proporcionados para ilustrar la aplicación de los programas de reforzamiento son poco
defendibles si se les analiza con cuidado.
En el primer ejemplo se dice que un programa de "Razón fija, supone la aparición del
reforzador cada número de respuestas específicas. Por ejemplo, cada 5 cuentas que el niño
hace bien, la maestra le pone una buena nota. Cada 10 clientes nuevos que consigue un
vendedor, el jefe le da una prima económica". Existen abismales diferencias entre estos
ejemplos y la forma en que se conceptúa y trabaja con los programas de reforzamiento en el
laboratorio. En la situación experimental de laboratorio, a) la rata está privada de alimento; b)
ante los mismos estímulos siempre efectúa la misma respuesta discreta y simple (apretar una
palanca); c) no se establece relación alguna entre la rata y el experimentador; y d) el
reforzador (alimento) reduce el estado de privación específica. Al asumirse que el conocimiento
se puede extrapolar, en el caso del niño implicaría que las 5 cuentas SON LA MISMA
RESPUESTA y que en cada caso se presenta una sola respuesta que, a su vez, es discreta y
simple. ¿Las cinco cuentas son las mismas? El profesor que ponga la misma cuenta 5 veces
para evaluar a su alumno, puede empezar a empacar sus maletas. En este caso, ¿"la misma
respuesta" se refiere a "sumar"? Esto marca una gran diferencia ya que se está considerando a
la respuesta como si fuera una categoría genérica (sumar).
¿De qué está privado el niño? La rata está privada de alimento y el reforzamiento
decrementa ese estado de privación. El ejemplo asume que la buena nota es el reforzamiento
para el niño ¿la buena nota decrementa su privación de buenas notas? Por último, damos por
hecho que entre el maestro y el alumno existe una relación social que no puede ser descartada.
Los 10 clientes nuevos. ¿Esto querría decir que nuestro vendedor estrella, ante los
clientes, dio siempre la misma respuesta? ¿Dio UNA sola respuesta para conseguir a cada uno
de los clientes? Parafraseando, de acuerdo al conocimiento experimental del laboratorio,
¿podríamos entonces decir que siempre apretó la palanca ante los mismos estímulos y que su
estado de privación fue reforzado? Imaginemos que el profesor y el jefe de ventas está de
malas. ¿El reforzador -la nota y la prima económica- actuarán a pesar de que el "reforzamiento"
se presente de mala manera? Con esto queremos enfatizar que entre el sujeto y el
"experimentador" existe una relación que no ocurre en la investigación de laboratorio con
animales y reto a cualquier psicólogo a que en su trabajo ignore la relación que establece con
las personas a quienes trata profesionalmente. Ante el caso de que el "reforzador" se dé de
mala manera, podríamos preguntar: ¿es el reforzador per se el que afecta al individuo o es el
reforzador y las circunstancias en que éste se presenta? Esta pregunta puede parecer un sin
sentido pero una investigación reciente demuestra que no es así.
Ribes, Torres y Carbajal (2002) hicieron la misma pregunta. Experimentalmente, en el
laboratorio, con ratas macho, ante un programa de reforzamiento IF, el reforzamiento se
presentó SIN luz del alimentador y se redujeron al máximo los sonidos del alimentador para
facilitar su entrega. El reforzador empleado fue agua. ¿Los resultados? ¡Sorpresa! En las
primeras 44 horas de experimentación Ribes y colaboradores NO encontraron el famoso festón
2 en ninguno de los sujetos. A partir de la sesión 45, algunos registros mostraron algo que, con
muchas reservas, podría calificarse como el patrón de pausa-carrera, típico del IF.
El segundo ejemplo se refiere al programa de razón variable (RV) que se describe como
el programa en el que "el reforzador aparece cada número variable de respuestas de una
ocasión a otra. Por ejemplo, el vendedor a domicilio consigue vender una enciclopedia cuando
visita 8, 6, 14, 2, 18... domicilios. En el aprendizaje de la lectura, la maestra refuerza al niño al
terminar cada frase, lo que supone 2, 10, 8, 4, 6... palabras por frase".
Hacemos las mismas preguntas que en el caso anterior. Afirmar que en estos ejemplos
se aplica un programa de reforzamiento RV, lleva implícito que el vendedor efectúa UNA sola
respuesta, que siempre es la misma y que los domicilios son la misma situación de estímulo.
Esto, sinceramente, va mucho más allá del concepto de "clase de respuesta y de estímulo". Si
esto puede mantenerse en una discusión, entonces los planetas son de la misma clase de
estímulos que las habichuelas en tanto que ambos "son estímulos". En la caja de Skinner
(bautizada así por Clark L. Hull), los estímulos, la palanca, la respuesta, las luces, el comedero,
siempre SON LOS MISMOS. No varían, lo cual es una máxima de la metodología empleada:
mantener todas las cosas iguales excepto la condición de la variable independiente. ¿No resulta
difícil mantener que el niño y el vendedor están ante un programa RV?.
Bajo la lógica del AEC, leer la oración: "Mi mamá me pegó ayer", equivale a leer "John
Wayne mató un bandolero". Es lo mismo, dado que las dos oraciones tienen el mismo número
de palabras (cinco). Pero, ocurre que cada una de las palabras es totalmente diferente a todas
las demás. ¡Cómo se explica esto en el AEC? Pues no lo explica. ¿Es equivalente decir Mi que
John?, ¿Por qué no tomamos en cuenta el número de letras leídas para reforzar? Si esto se
hiciera, 16 letras (de la primer oración) es un número diferente de 24 letras (segunda oración).
No es claro porqué hay que considerar a las palabras y no a las letras, las oraciones, los
párrafos o las páginas. Sin embargo, hay infinidad de trabajos que emplean una de estas
medidas para reportar su "tasa de respuestas" pero sin justificar porqué una respuesta equivale
a una palabra, a una letra, a una oración, etc. ¡Uy! Esto se opone cada vez más al conocimiento
generado en el laboratorio.
El ejemplo proporcionado en el tercer caso, dice que el programa de Intervalo fijo,
supone que el reforzador estará disponible en la primera respuesta después de superado un
tiempo siempre fijo. Por ejemplo, la película se interrumpe y estará disponible de nuevo en la
TV después de 6 min. de anuncios (por eso se hace zapping en los anuncios). Todos los
exámenes suelen tener un intervalo fijo de tiempo (Febrero y Junio), por eso se estudia mas los
días inmediatamente antes del examen. Veamos.
La investigación que se ha generado en el laboratorio sobre el programa de intervalo
fijo lleva nada más 60 años. Se ha efectuado en ratas, pichones, monos, niños con síndrome
down, en autistas y con sujetos con diversas perturbaciones conductuales. ¿Alguien sabe algo
más de lo que se sabía hace 60 años? La investigación de Ribes y colaboradores (2002) pone
de manifiesto que algunas preguntas experimentales han sido equivocadas en el AEC. En otras
palabras, la ejecución de festón ante el IF parece ocurrir por los arreglos prefijados por la
experimentación y con base en el tipo de equipo usado. Sin lugar a dudas me atrevo a afirmar
que esto es lo que sucede. Es un efecto de la operación misma. No es ningún principio básico.
Como se sugiere generalmente, pareciera que es "natural" (que forma parte de un
principio conductual) el que cuando se define un criterio temporal los organismos (sean
personas o animales) "esperen hasta el último momento para responder". ¡Ah caray! En los
ejemplos, ¿cuál es el reforzamiento del que están privados los telespectadores y los
estudiantes? ¿Cuáles son las respuestas pausa-carrera al efectuar el zapping? ¿Cuál es la
respuesta que se emite a manera de festón al ver la TV? Resulta muy intrincado determinar
cuál es el reforzamiento ya que si éste es ver el programa deseado, entonces ¿se trata de un
reforzamiento continuo, mientras se observa el programa deseado? La "pausa" del zapping sólo
complica más las cosas ya que pudiera interpretarse por algunos como conducta adjuntiva (
3 habría que aclarar si el zapping también está bajo un programa IF). Si ver TV está bajo un IF,
al igual que el zapping, entonces ¿estamos hablando de un programa de reforzamiento
compuesto? ¿El zapping no calificaría más como una respuesta de evitación? Muchas preguntas
se podrían derivar de esto. Sin duda, esto es terriblemente complicado de explicar y justificar
teniendo como base el conocimiento obtenido en la investigación básica con animales. Por otro
lado, si los estudiantes están privados de notas, entonces la solución debiera ser que se les den
notas más frecuentemente. Pero ¿cuál es el reforzamiento para qué estado de privación del
telespectador?.
Mantener esta argumentación de la ejecución ante el IF (pausa-carrera) conduce a
considerar que el ser humano y los animales por naturaleza (PRINCIPIO BASICO) dejan al
último las cosas que tienen que hacer cuando se da un límite. NO lo puedo aceptar. Y hay que
tener cuidado porque esto justifica muchas de las prácticas y políticas empresariales y
educativas neoliberales que ven a los trabajadores y alumnos como sujetos indolentes. Si esto
es cierto, sería válido para los gerentes de las empresas y profesores, en tanto que se trata de
un principio básico. ¡Cuidado¡.
En el cuarto ejemplo relativo al programa de Intervalo variable, se dice que "implica
que el reforzador estará disponible en la primera respuesta después de un tiempo variable de
una ocasión a la siguiente. Por ejemplo, una persona pidiendo limosna en una acera, recibirá
unas monedas a los 3, 15, 6, 8, 24, 4... minutos. Viendo un partido de fútbol, el gol puede
aparecer a los 2, 8, 40, 32, 6, 25... minutos". Las mismas preguntas anteriores además de las
que siguen. Si esto es cierto, ¿cualquier limosnero debiera aprender que está bajo un programa
de IV? o bien, ¿que los jugadores de fútbol podrán hacer un gol bajo un programa de IV?
¿Quién puso el programa para el limosnero o para el futbolista? En el caso del futbolista, de
manera simplista se podría decir que para lograr el gol (reforzamiento), se emitió [término
injustificable en un conductismo radical ya que parece indicar que el organismo "saca" una
respuesta. ¿De dónde la saca?] siempre la misma respuesta: patear una pelota (lo que se
parece a apretar la palanca). En el caso del limosnero podríamos conceder éste hace lo mismo
(Una limosnita, por el amor de Dios), sólo que puede haber una diferencia ya que en ocasiones
le pueden dar un duro (perdón, un eu-duro), 100 pelas, 20 pelas, 200 pelas. ¡Híjole! La misma
respuesta es reforzada con densidad diferente. Esto se ha investigado en el laboratorio y los
efectos son diferentes que cuando se emplea siempre la misma cantidad de reforzamiento (un
pelet o tres segundos de acceso al bebedero, por ejemplo). En el laboratorio se sabe que el
Experimentador (aunque esto no forme parte del reporte público, que conocemos como
"publicación") es quien determina el programa de reforzamiento a usarse. ¿Puede
argumentarse que la naturaleza es la responsable de los programas de reforzamiento?.
Entre muchas otras cosas, pareciera que en el trabajo "aplicado" se pretende emular el
trabajo experimental del laboratorio con lo que ocurre en el mundo cotidiano. Yo mantengo que
eso es una falacia mayor al área de Asia (para mantenerme en el juego de las analogías). Es
difícil concluir que la respuesta que se da, siempre es la misma, que es discreta y que es una
sola; que no tienen nunca contacto con el "programador"; que se desempeñan de igual manera
que una rata en el laboratorio.
Definitivamente, no estoy de acuerdo con este tipo de tesis sean experimentales y del
laboratorio y que pretenden aplicarse de manera laxa o acrítica para "programar" y explicar el
comportamiento humano. Nunca he escuchado que una rata me hable; nunca he visto un cartel
de protesta de ningún pichón; nunca he leído que el chimpancé, los gorilas y los monos rehsus
aprendan a sumar; nunca he tenido conocimiento de que los delfines mejoren su sintaxis
"comunicativa"; nunca he sabido que los corderos toquen a fanfarria cuando llega su líder o
toquen a retirada cuando aparece el depredador; sigo observando que las abejas "reina" nacen
y mueren siendo reina mientras que las abejas peón nacen y mueren con la misma categoría.
Los animales no generan muchas de las habilidades que el humano sí puede aprender. Veo que
los niños cometen más errores de ortografía; juegan en la Internet de manera sostenida en
lugares y juegos muy diversos; escuchan menos a sus padres; algunos consumen drogas
mediante convenios monetarios; hablan un idioma cada vez más estereotipado que ellos
4 generan; escriben horrores en su "chateo" con los amigos; reclaman cada vez más derechos;
leen con deficiencias más materiales excitantes; los adultos gobiernan con muchas más mañas,
presiones y se auxilian de los "formadores de imagen"; venden más productos innecesarios;
realizan películas más tediosas; escriben novelas efímeras que son producto de su imaginación;
crean, cantan y venden por miles canciones pa'l verano (no relacionar con las Ketchap);
inventan formas más seguras para clonar tarjetas de crédito; etc., etc. ¿Y esto que hacen los
humanos se explica con base en el conocimiento de los programas de reforzamiento, generado
en la investigación básica con animales?.
La explicación del comportamiento humano con base en los programas de
reforzamiento no es sostenible. Supongamos (simplificando, como lo hace la interpretación de
los programas de reforzamiento aplicada al comportamiento humano) que el mensaje anterior
fue UN estimulo. Mi respuesta es ésta (respuesta = ¿una?). ¿Cuál es mi reforzamiento? ¿De qué
estoy privado? [Cuidado con interpretaciones psicoanalíticas]. Y sobre todo: ¿BAJO QUE
PROGRAMA DE REFORZAMIENTO ESTOY? O, por psicólogo y pertenecer a ConTextos, ¿no
estoy bajo ningún programa?. Siguiendo la lógica lineal y unicista de los skinnerianos, podría
argumentarse que al responder estoy bajo un programa:
1) De razón variable. Esto implica que he enviado mensajes antes de éste, con relación a este
tema. Cierto, contesté a Chema que este tema me interesaba. Una sola respuesta, ante
estímulos diferentes y sin que pueda definir cual es mi privación (Vosotros diréis).
2) De tiempo variable. Cierto es que a veces respondo, a veces no. ¿es esto un programa?
Vamos,
invito
a
cualquiera
que
me
explique
y
justifique
esto.
3) De tiempo fijo. Puede ser que los lunes responda más prolijamente pero esto (desde mi
particular consideración) no se debe a que esté bajo un programa de tiempo fijo, CREO que se
debe a que los fines de semana tengo más tiempo en casa, para responder).
4) De razón fija. Si queréis mi participación, cuando haya recibido 20 mensajes,
irremediablemente, para conseguir el reforzador que Vosotros proporcionáis, enviaré un
mensaje (no importa su contenido, dado que cumplirá con el requisito de que sea "mensaje".
Esto cumple con la clase genérica de estímulos y respuestas, ¿no?).
Referencia
Ribes E., Torres C. y Carbajal Y. (2002). El arte del FI. Presentación en Coloquio Interno del
Centro de Estudios e Investigaciones en Comportamiento. 20 de octubre.
La réplica de Luis Valero fue la siguiente:
Respuesta (Luis Valero):
Vamos a la discusión, porque ninguno de tus argumentos me ha convencido de que no existan
programas de reforzamiento en la vida cotidiana. Lo que si puede ocurrir es que algunos de los
ejemplos puedan ser un poco forzados, o bien que puedan ser explicados también por otras
variables simultáneamente, y no sólo por programas de reforzamiento. Y, desde luego, no en
todas las conductas tiene que haber programas de reforzamiento. Las condiciones
fundamentales para poder hacer esa generalizacion de los programas de reforzamiento a la
vida codiana sería: (1) una respuestas repetida, de alta frecuencia, y (2) una contingencia de
reforzamiento positivo que aparece de forma intermitente, algunas respuestas reciben
reforzamiento y otras de la misma clase no lo tienen. Si ambas se dan, es una cuestión
empírica comprobar que al cambiar el programa de reforzamiento cambia también la conducta,
y en los ejemplos que puse se da así.
Pero, respecto a tu respuesta lo que creo mas grave, es que criticas la posibilidad de
generalización de los hallazgos en la experimentación animal a la vida cotidiana de los
5 humanos.. El contexto experimental es solo una manipulación del investigador de la situación
para aislar variables importantes en el fenómeno que estudia y neutralizar otras variables que
puedan no ser relevantes o necesarias para ese fenómeno. Que ese contexto se le llame
natural o no es un concepto diferente, porque el único contexto natural del hombre seria el
campo, las cuevas y la caza de animales. Si el contexto natural de la rata es la alcantarilla o la
caja Skinner es una cuestión de evolución histórica. Tan natural puede ser apretar una tecla en
el ordenador en un experimento, como pulsar la tecla de la maquina tragaperras, como escribir
unos números en un papel, o este mismo mensaje electrónico.
Cuando se hace una generalización del laboratorio al comportamiento diario de las
personas, se hace una extensión de ese fenómeno a otro diferente, pero cuya naturaleza o
función son similares. Esa generalización, en principio, debe hacerse también experimental
mediante replicaciones, y creo que los programas de reforzamiento están mas que
comprobados en humanos. La mayoría de los artículos de JEAB no parecen tener otro objetivos
en sus laboratorios.
Lo que sí es un error es la generalización puramente formal, de topografía. Creer que
las respuestas en el laboratorio y en la vida cotidiana deben ser las mismas para poder
generalizar entre ellas. Precisamente, lo que se trata es una generalización funcional, es decir,
la relación funcional que cumplen esas respuestas. Si vamos al detalle, tampoco la rata da la
misma respuesta ante la tecla: da con el hocico, con la boca, con el lateral, con mas intensidad
o con menos, da en el centro de la tecla, en un lateral, rozándola, con la parta, con el rabo, etc.
(Estuve dos años moldeando pollos en caja Skinner, y apliqué muchos programas de
reforzamiento, simples y compuestos). En la disposición de un experimento, se definen todas
ellas como una única clase de respuestas (pulsar la tecla), aunque su forma sea diferente, y
todas ellas obtienen el reforzador, que también puede durar mas o menos segundos, estar mas
o menos húmedo o seco, estar mas molido o menos, etc.
En los ejemplos que puse, definimos como una misma clase de respuestas, por
ejemplo, hacer una cuenta de sumar, y esa respuesta se repite una y otra vez si consideramos
el tiempo total de clase o los semestres completos de un curso. Y habitualmente la maestra/o
alaba la corrección de las operaciones, lo bonito de los números, lo limpia que le ha quedado la
libreta, o solo dice "muy bien". Esa unidad puede considerarse, sin lugar a dudas, como una
misma clase de respuestas y recibe reforzamiento positivo de la profesora. Igualmente se
puede considerar desde un punto de vista funcional la respuesta "vender una enciclopedia",
cuando el vendedor llama a la puerta, saluda, ofrece los libros, y obtiene una contestación del
ama de cada que le abre la puerta. Si ese vendedor durante varios días, acude puerta tras
puerta, perfectamente puedo considerarse una misma clase de respuesta, y analizar el posible
programa de reforzamiento que la mantiene; precisamente porque a veces consigue
reforzamiento y a veces no. Si las conductas de hacer cuentas y vender libros no pueden
considerarse una clase de respuestas, tampoco la de la rata pulsando la tecla, porque la
topografía de cada respuesta es diferente.
De igual forma, se suele considerar la "palabra escrita" como unidad de medición del
lenguaje (hablado y escrito), también como una clase de respuesta, en este caso, "leer en voz
alta". Se pueden hacer análisis mas finos o mas gruesos, y tomar unidades mas pequeñas
(fonemas, sonidos, movimientos bucales) y mas gruesas (párrafos, frases, páginas, discursos).
En ese ejemplo, y cuando la maestra está enseñando la lectura habitualmente refuerza al final
de cada frase, y si está mal alguna le hace repetir la palabra (como unidad). Además entre los
objetivos educativos que marca el propio Ministerio de Educación, Cultura y Deportes (en
España), por ejemplo, el objetivo es conseguir que el niño con 10 años lea correctamente con
una velocidad de 100 palabras por minuto. Por tanto, la unidad necesariamente es la palabra,
que a veces será reforzada y a veces no, luego puede estar bajo algún programa de
reforzamiento.
Por ultimo, también, es una generalización funcional asumir que la acción, el drama o el
chismorreo que aparece en un programa de TV es reforzador para el espectador. No hay
6 ningún parecido formal entre un pellet y una película de TV. Pero asumiendo precisamente esa
generalización desde el laboratorio a la vida cotidiana, asumimos que los personajes y la acción
de una película son un reforzador, y la clase de respuesta es "mirar la TV", aunque su
topografía pueda cambiar y hacerse desde un sillón, desde el sofá, la cama, de pie, en el suelo,
de lado, tras el cristal de un escaparate, etc. Todas ellas las consideramos una misma clase de
respuestas, si ese es el fenómeno que queremos estudiar, y el reforzador serán las imágenes
de la tele. Si esa respuesta se da continuamente (media 4 horas/persona/día), puedo
considerar -sin temor a equivocarme- que es una conducta mantenida bajo un programa de
reforzamiento. Aunque no me atreva a adivinar cual es la "privación" en este caso. Y, ¿es igual
la privación de comida durante un día en una rata, que la privación de una semana de TV
porque se ha roto el aparato?.
Lo que sí llevas razón, es que quizás el zapping sea una respuesta de evitación. Pero
ahí te he pillado, porque ahora eres tú quien esta generalizando gratuitamente que los anuncios
son aversivos, y la respuesta sobre el mando a distancia elimina esa estimulación visual. Hay
programas dedicados exclusivamente a lo anuncios, o sea que también pueden ser
reforzadores.
Nota: respecto a la experimentación que mencionas (Ribos, Torres y Carbajal , 2002): Sin
conocer mas del procedimiento de ese experimento, podría interpretar simplemente que no
aparecen festones de IF porque no hay reforzadores condicionados evidentes respecto al agua,
y por tanto, confirma una de las hipótesis explicativas sobre por qué funcionan los programas
de reforzamiento, y es que la misma respuesta se mantiene aun sin reforzamiento explícito,
porque esta recibiendo algún tipo de reforzador condicionado.
Y la cosa no queda ahí...Julio responde de nuevo y avanza la siguiente línea de debate...
Respuesta (Julio Varela):
Con base en tu respuesta, me parece que cometí omisiones (no es un oxímoron*) y no
fui lo suficientemente explícito en mi mensaje anterior. Teniendo esto en cuenta, por el
momento no contesto a tus argumentos, necesito más tiempo para no perdernos en aspectos
secundarios pero, para contribuir a la discusión recomiendo las siguientes referencias:
Ribes E. Relationship among behavior theory, experimental research, and behavior modification
techniques. Psychological Record, 1977, 2, 417-24.
Varela J. Crítica a algunos conceptos y procedimientos del análisis experimental aplicado a la
educación. Presentado en el IV Congreso Mexicano de Análisis de Conducta. Monterrey, México,
1978.
En estos artículos se posiblemente se fundamente con mayor detalle mis reparos a la
interpretación (¿generalización?, ¿extrapolación?) de los programas de reforzamiento a partir de
la investigación con animales. No estoy en contra de la investigación con animales (creo que es
imprescindible como parte de la psicología comparada). Estoy en contra de que los resultados
se usen de manera acrítica y laxa para explicar el comportamiento humano. En tu mensaje hay
material para largas y productivas discusiones.
* oximoron. Se le llama a la combinación de palabras contradictorias e incongruentes como
puede ser bondad despiadada.
7 En este momento del debate Jorge Campo ha decido intervenir y aporta la siguiente reflexión:
Respuesta (Jorge Campo):
He leído el artículo de Julio que nos ha enviado en su segunda entrega y me encuentro
con una duda que ya ha sido señalada en parte por Luis en su respuesta.
Se trata del concepto de ambiente "natural". Tal como lo veo, no me resulta un término
preciso si no más bien arbitrario y no sujeto a ninguna parametrización. Mediante el ejemplo,
voy a intentar ofrecer las razones por la que dicho término, entiendo no debiera ser usado.
Julio por ejemplo, señala que: "Los observadores siempre son otra variable interviniente
en la situación. Su actividad la pueden realizar por medio del análisis de filmación o mediante
espejos unidireccionales, pero el alto costo o la inexistencia del equipo o instalación, hace que
generalmente se realice en forma directa e interviniendo en el "hábitat" de los sujetos
observados".
Si no entiendo mal, estos observadores inciden en la, llamemosle "artificialidad" de las
observaciones. Igualmente se señalan factores sociales, otros elementos situables por mí y a
grosso modo, bajo el paraguas de "economías abiertas", etc.
Mi entendimiento entonces es que la concepción de Julio sobre "naturalidad" no es más
que el conjunto de todas las circunstancias intervinientes en el segmento de conducta objeto de
estudio, y que entiendo que el AEC obvia.
En este sentido, estaría de acuerdo en que sin estos ámbitos, estaríamos dejando muy
cojo cualquier acercamiento a nuestro objeto de estudio. Y estaría de acuerdo en la idea de:
"Situar a la investigación con humanos en ambientes naturales no como la aplicación de algo,
pues en realidad esto ha conducido a una situación pragmática".
Ahora bien, si el concepto de "ambiente natural" significa además aquellas situaciones
en las que no se dan las constricciones del laboratorio, me temo que no estaría de acuerdo ya
que no encuentro forma de distinguir qué circunstancias representan lo natural y cuáles no, tal
como señala Luis.
Si lo "natural" representara algo más que lo dejado pragmáticamente a un lado por el
AEC, entonces habría que explicar qué exactamente, qué lo diferencia tanto de lo escogido por
el AEC , como de lo no escogido y además por qué es diferente.
Mi punto entonces es que si por "ambientes naturales" señalamos al conjunto de
características, variables, etc., dejadas a una lado por el AEC, entonces estaré de acuerdo. Si
por el contrario, "natural" se conceptúa con respecto a su antónimo "artificial", entonces me
temo que no podré estar de acuerdo al no entender qué exactamente los diferencia.
Claves como el confinamiento o el control experimental, entiendo que no son válidas,
precisamente porque estamos interesados en la conducta de nuestros sujetos experimentales.
Y bautizar nuestros arreglos, muchos o pocos, como "naturales" o "artificiales" y opacamente
en relación al sujeto, pueden resultar un sinsentido por no formar parte como tales, de dicho
estudio...aunque puedan y deban ser conceptuados como condicionantes de nuestro
experimento, pero no al nivel de ser tildados de tal o cual característica.
8 Así pues y resumiendo mi postura, es que dichos condicionantes deben ser tenidos en
cuenta (no lo han sido por el AEC), pero a la vez, no deben ser tildados de "naturales" o
"artificiales".
Concluyo señalando que no estoy seguro de que la postura de Julio sea esta
exactamente y que a primera vista, me parece que mi opinión está a medio camino entre la de
Julio y la de Luis y que tal vez mis precisiones puedan dar lugar a un cierto entendimiento entre
las dos posiciones (caso de que sean dos o no sea ya que simplemente no han sido más que
ligeramente esbozadas y por lo tanto están pendientes de explicitación).
A pesar de lo escrito, mis reflexiones son de nuevo en voz alta y sujetas a cambio
dependiendo de vuestras intervenciones.
Luis aparece de nuevo para precisar algunas cosas y aportar algunas referencias:
Respuesta (Luis Valero):
Los programas de reforzamiento surgieron como un hallazgo experimental, y se
publicaron por primera vez en el libro de Skinner "La conducta de los organismos" (1966/79),
pronto apareció un primer texto programado (educativo) para enseñar esos programas de
reforzamiento (Thompson y Grabowski, 1972/78). Ahí aparecen ya ejemplos humanos,
extraídos de experimentos de laboratorio, en los que se comprueban las características de estos
programas también en sujetos humanos. Muchos de esos ejemplos son de instrucción
programada, discriminación visual en niños, efectos motivacionales con luces y fichas, pero
también su uso con habilidades de la vida diaria en niños con retraso (barrer y hacer la
habitación, control en el retrete). Y el libro de Honig (1966/75) define explícitamente las
características de todos los programas de reforzamiento y les da los nombres con que
actualmente los conocemos, incluyendo programas de reforzamiento diferencial y programas
complejos. Los tomos sobre "control de la conducta humana" de Ulrich, Stachnik y Mabry
(1970/77) son una recopilación de todas las extensiones que se hicieron de los hallazgos de
laboratorio a la conducta humana, incluyendo programas de reforzamiento y técnicas de fichas,
que suponen precisamente la utilización de programas de razón.
Todos estos estudios iniciales suponen una generalización directa de los programas de
reforzamiento en laboratorio a su aplicación en contextos humanos, aunque muchas veces
también de laboratorio. En todos los casos, los hallazgos son similares a los encontrados en
animales, y muestran una gran utilidad para aumentar y mantener de forma constante
conductas escolares o habilidades de la vida diaria, especialmente útiles los programas de razón
variable.
Los programas de economía de fichas de Ayllon y Azrin (1968/74) son también una
aplicación directa de esos programas de reforzamiento, y donde más se ha experimentado la
variedad de usos de programas de reforzamiento. Esta se puede considerar unas de las
generalizaciones mas "geniales" a la vida cotidiana. De hecho, no falta supermercado, banco o
gasolinera que no ofrezca reforzadores variados por un numero especifico de puntos,
conseguidos según un número fijo de conductas de consumo (compras). Su uso tan general, no
solo muestra que funcionan y dan mayores beneficios a las empresas que los utilizan, sino que
también son aceptados como algo cotidiano por todo el mundo.
Una extensión inmediata de los programas de reforzamiento fue hacia el estudio de la conducta
en las máquinas tragaperras (lo mas parecido en su forma a una caja Skinner). El libro
educativo de Whaley y Malott (1971/78) muestra ejemplos de esos comportamientos
gobernados por la máquina (leer la narración de "luna de miel para tres") y el uso de
programas de reforzamiento con niños o personas con alcoholismo ("el bar de Coral Gables").
9 Se puede permitir una fácil generalización a los programas de reforzamiento utilizados
por los fabricantes de tragamonedas para mantener su negocio. Como práctica de la asignatura
de evaluación, mis alumnos han de realizar una observación directa, con todos sus parámetros
y características, del comportamiento de una o varias personas ante la máquina tragaperras.
Según los datos obtenidos en múltiples trabajos de esos alumnos, aparece casi siempre un
programa RV-8 manteniendo la conducta de meter moneda tras moneda. No es un programa
muy elevado, pero la mantiene largo tiempo y de forma bastante efectiva.
Textos de modificación de conducta más actuales también presentan esa utilización de
los programas de reforzamiento en la vida cotidiana. Así el texto de Martin y Pear (1999) dedica
un capítulo completo a cómo aumentar comportamientos mediante programas de
reforzamiento, y muestra fotos y otros ejemplos, además de los que yo pude describir en otras
respuestas anteriores. Muchos de esos ejemplos están sacados de experimentos ya publicados.
Algo similar ocurre en el texto de Kazdin (1984/96), donde expone varios ejemplos del uso de
programas de reforzamiento, para mantener la atención de los alumnos, conductas de
participación, habilidades sociales, o el uso de loterías para mantener la conducta de grupos. Y
el texto de Domjan (1999) también dedica un capítulo a explicar los programas de
reforzamiento y su utilización, incluyendo un ejemplo (obtenido del experimento de George y
Hopkins, 1989) sobre el incremento en la productividad de unos camareros reforzados según un
programa de razón fija por clientes, además de su sueldo habitual.
Por último, mencionar que en la revista JABA dedicada a la experimentación más
aplicada sobre conducta, pueden encontrarse 6 artículos en 2001 específicos sobre el estudio
de los cambios en programas de reforzamiento y sus efectos sobre comportamiento humano,
en su mayoría niños con problemas; además de una revisión sobre las relaciones entre
contingencias de reforzamiento en laboratorio y en el entorno social, entre la investigación
básica y aplicada (Vollmer y Hackenberg, 2001).
La generalización de los programas de reforzamiento a la vida cotidiana, pues, ha
seguido una progresión desde el laboratorio con animales, al estudio también en laboratorio
con humanos, al uso en contextos institucionales o escolares, al uso en otros problemas clínicos
e incluso su extensión social y comunitaria. En suma, la generalización no es sólo mía, no es
gratuita, ni demasiado atrevida.
Referencias:
•
•
•
•
•
•
•
•
•
•
Ayllon, T. Y Azrin, N. (1968/74). Economía de fichas. México: Trillas.
Domjan, M. (1999). Principios de aprendizaje y conducta. Mexico:
Thomson.
George, J.T. y Hopkins, B.L.(1989). Multiple effects of performancecontingent pay for waitpersons. Journal of Applied Behavior Analysis,
22, 131-141.
Honig, K. (1966/75). Conducta operante. Mexico: Trillas.
Kazdin, A.E. (1984/96). Modificación de la conducta y sus aplicaciones
prácticas. Mexico: Manual Moderno.
Martin, G. Y Pear, J. (1999). Modificación de conducta. Qué es y cómo
aplicarla. Madrid: Prentice Hall.
Skinner, B.F. (1966/79). La conducta de los organismos. Barcelona:
Fontanella.
Thompson, T. y Grabowski, J.G. (1972/78). Programas de
reforzamiento y análisis multioperante. Mexico: Trillas.
Ulrich, R., Stachnik, T. Y Mabry, J. (1970/77). Control de la conducta
humana (3 tomos). Mexico: Trillas.
Vollmer, T.R. y Hackenberg, T.D. (2001). Reinforcement contingencies
and social reinforcement: some reciprocal relations between basic and
applied research. Journal of Applied Behavior Analysis, 34, 241-253.
10 •
Whaley, D.L. y Malott, R.W. (1971/78). Psicología del comportamiento.
Barcelona: Fontanella.
Ahora es Julio el que retoma el tema y va a centrar un poco el debate...
Respuesta (Julio Varela):
Mi intención en este debate-plática es ofrecer argumentos que pongan bajo la crítica
algunos conceptos y procedimientos que se han presentado desde hace mucho tiempo como
inmutables, como parte del credo, como suficientemente probados por medios experimentales,
pero
que
desde
mi
perspectiva
adolecen
en
su
fundamento
conceptual.
Además, para mí, otro objetivo de esta plática-debate es arribar a conclusiones claras, sean de
acuerdo o desacuerdo. Con el ánimo anterior, y habiéndome pertrechado durante el tiempo
invernal, propongo 10 aspectos a debatir que cubren los aspectos críticos expuestos
por ti y por Jorge. Pretendo que discutamos uno a la vez.
LOS 10 PUNTOS A DEBATIR
1. Posibilidad de que la aplicación de los programas explique el grueso de la conducta humana.
2. ¿Qué es una situación natural?
3. Definición de programa de reforzamiento.
4. Los ejemplos de programa de reforzamiento, dados como indiscutibles, son los de las
máquinas tragaperras.
5. ¿Qué se aprende bajo un programa de reforzamiento?
6. El concepto de clase en el análisis operante.
7. Generalización de los resultados del laboratorio relativos a la conducta de un animal = la
conducta de un sujeto humano. ¿Por qué no al revés?
8. ¿Conducta del individuo = conducta del grupo?
9. ¿Y dónde quedó la necesaria privación?
10. Los estudios sobre programas de reforzamiento usualmente se
por el tipo de respuesta, el tipo de sujetos empleados, y el tipo de reforzadores.
caracterizan
Descritos los puntos anteriores, procedo a abordar El Primer Punto.
1. No critico la posibilidad de aplicar el procedimiento de un programa de reforzamiento. Critico
la ligereza de su "aplicación" (extensión, generalización, transpolación) acrítica y ateórica para
considerar al grueso de la conducta humana. En este punto, sólo quiero preguntar si dicho
procedimiento puede dar cuenta de la mayor parte (o totalidad) de conducta
humana.
Espero respuestas, comentarios, críticas o cualquier nota humorística. Pero ... ¡tened cuidado
en vuestras respuestas!
11 ¡¡Bien, Luis vuelve a la carga!!...con el punto 1, claro...
Respuesta (Luis Valero):
Pues, muy de acuerdo, vamos a discutir ese punto. Seguro que al final encontramos
muchos más aspectos de consenso que de separación.
En ese primer punto, pues, NO creo que los programas de reforzamiento puedan
explicar "el grueso de la conducta humana", sino que pueden explicar como y porque se
mantienen con gran probabilidad y a largo plazo comportamientos en los que el reforzamiento
es intermitente.
Si se dan esas dos características: alta probabilidad de respuesta y aparición
intermitente de consecuencias reforzantes, podría afirmarse que esa respuesta está bajo un
programa de reforzamiento.
NO creo que sea excesiva ni gratuita la generalización que se ha hecho de los
programas de reforzamiento. Precisamente, los ejemplos que mostré en el otro texto -alguno
son míos y otros de publicaciones- son bastante moderados en esa generalización. El paso de
un programa de reforzamiento en una situación experimental a una situación en la vida
cotidiana -en esos ejemplos- es casi inmediata. Sólo se trata buscar una respuesta de alta
probabilidad y averiguar el reforzador intermitente que la mantiene.
Por último, es una cuestión empírica comprobar si esas conductas de la vida cotidiana
se mantienen o no bajo programa de reforzamiento. Basta con hacer un experimento y
cambiarlo. Por ejemplo, en la máquina tragaperras el RV8 por IF15'; o en la tarea de lectura el
RV10 por IF10'; o en el pescador el IV30' por otro de RF5 y veríamos los cambios.
Julio responde...y esto continua:
Respuesta (Julio Varela):
Con mucho interés he leído tu respuesta. Gracias.
Primer punto de acuerdo: los programas de reforzamiento NO pueden explicar el
"grueso de la conducta humana". Siendo así, pregunto, ¿podemos considerar que los
programas de reforzamiento podrían explicar lo "delgado de la conducta humana"?
Si los programas no explican el grueso de la conducta ¿vale la pena tanto esfuerzo e
investigación en el estudio y argumentación basada en ellos? Sé que algunos dirán que sí, yo
opino que se ha gastado demasiado tiempo y no ha representado gran ventaja para el
entendimiento del comportamiento humano complejo.
Segundo, posible, punto de acuerdo: señalas que los programas pueden explicar
porqué y cómo algunos comportamientos se mantienen. Si con esto te refieres a los
procedimientos empleados, estamos de acuerdo. Si es alguna otra arista, debiéramos hacerla
explícita, antes de poder declarar esto como acuerdo.
Los demás aspectos de tu respuesta (generalización, paso de una situación
experimental a una de la vida cotidiana, tipos de programas y las máquinas tragaperras), me
gustaría abordarlos más adelante, en diferentes puntos de los que te planteé. ¿Tenemos dos
acuerdos? ¿Sólo uno?
12 Y aquí vuelve Luis:
Respuesta (Luis Valero):
Tenemos dos puntos de acuerdo.
Los programas de reforzamiento pueden explicar esa característica ("delgada") del
comportamiento que es que resulta más probable cuando no siempre tiene reforzamiento. Y lo
explica por el procedimiento, por la manipulación y forma en que se presentan los reforzadores,
no por otras propiedades abstractas.
Estoy de acuerdo en que se le ha dedicado muchísima experimentación de laboratorio,
quizás en exceso en comparación con otras áreas. Quizás sea debido más al entorno cultural y
motivacional de los "científicos de laboratorio" en USA, puesto que es una investigación muy
estructurada, muy programada y sin grandes complicaciones. Los aparatos lo hacen casi todo.
Y además la revista oficial (JEAB) parece que es lo único que le interesa.
Entre nosotros, también los investigadores cognitivos llevan décadas haciendo
experimentos sobre el "efecto stroop", con cientos de variaciones, y no pasan de ahí. O sea
que...
Quizás en este tema, no ha habido grandes descubrimientos después de los de Estes y
Skinner, pero si se pueden señalar los distintos "programas complejos", la "ley de igualación", y
el "análisis probabilístico" en la predicción de la conducta en un momento determinado de
programa. Aunque es difícil ver la aplicación de estos hallazgos a la vida cotidiana humana.
Un nuevo participante entra en acción...y Esteve Freixa i Baqué comenta
Respuesta (Esteve Freixa i Baqué):
El nombre de estos dos cómicos geniales de mi niñez (yo no soy de la generación esa
de la que Chema nos ha mandado la carta nostálgica) me ha venido (aunque no estoy seguro
de haberlos escrito bien) a la memoria al intentar hacer un par de comentarios sobre el debate
de los programas de refuerzo, pues he visto que se esta debatiendo del "grueso" de la
conducta y del "flaco" de la conducta, y eso me ha recordado "el gordo y el flaco" de antaño".
Yo no pretendo participar al debate al nivel ejemplar al que lo están llevando Julio y
Luis, pues no tengo ni la fineza y rigor teórico del primero ni las horas de laboratorio del
segundo. Se trata pues de un simple comentario sin pretensiones.
La verdad es que me sorprendió mucho descubrir la posición de Julio, tan estricta y
rigurosa, que me da la impresión de que, si se aplica a la letra, ninguna generalización,
extrapolación, transposición no seria posible. Es cierto que hay diferencias entre un
experimento bien controlado en laboratorio y la vida cotidiana, pero también las hay entre la
mosca del vinagre (la famosa drosofila) i nosotros, y sin embargo la casi totalidad de la
investigación en genética se ha realizado y se realiza con la mosca esa para aplicarse luego a
seres tan distintos de ella como Julio, Luis i yo, por ejemplo.
O sea que, quizás de una manera algo primaria, intuitiva y ligera, pero me siento
mucho mas próximo de la posición de Luis que de la de Julio.
13 Me pregunto: si no se puede extrapolar, para qué investigamos con animales? Nuestra
vocación no es (en todo caso la mía no es) llegar a ser especialistas de condicionar animales,
domadores de bichos de circo. Ya cuando Skinner entreno dos palomas a jugar al ping pong,
sus opositores le criticaron diciendo que eso era lo único a lo que podía servir el conductismo: a
montar números de circo. Pero no me da la impresión que ese fuese el propósito de Skinner...
Como lo digo por boca de la rata de Skinner de mi cuento filosófico (Elucubraciones:
Memorias de una rata de laboratorio):
""No me quiso decir cómo lo había logrado, pero me dio a entender que había
descubierto lo que hacen ELLOS con los “gráficos”, los “datos” y toda su retahíla de aparatos.
Estudian las leyes de la conducta para predecirla y controlarla. Yo soy más bien escéptico al
respecto, por la sencilla razón de que ya ejercen un control total sobre nosotros (a pesar del
episodio de Brot). Pero Pestanya me decía que no es en absoluto para controlarnos a nosotros
que hacen todo esto; que nosotros, al fin y al cabo, no les importamos ni un pepino (la cual
cosa, tengo que reconocerlo, concuerda perfectamente con lo que estaba diciendo hace un
momento respecto al desprecio que nos demuestran). Se trata, según Pestanya, de controlarse
entre ELLOS, es decir, unos ELLOS a otros ELLOS. Parece ser que a esto le llaman “Psicología”.
Así pues, detrás de la última puerta, el “más allá” que para nosotros representa la
libertad y la dignidad, (su mundo de ELLOS, en suma), ¿sería una especie de inmensa jaula en
la que ciertos ELLOS obligarían a darle a la palanca a otros ELLOS? Pero, ¿para obtener qué?
¿Nuevos “gráficos”? Esto es lo que no logro entender. ¿Qué coño harían con esos nuevos
“gráficos”?
Realmente, cuantas más cosas sabemos, más interrogantes nuevos se nos presentan.
Pero, si Pestanya tuviese razón, ello significaría que ELLOS también están bajo control, bajo
control de otros ELLOS como ELLOS. Es más: incluso estos otros ELLOS deben estar sujetos a
las leyes de la conducta, si es cierto que, como lo pretende Pestanya, tales leyes existen.""
Copyright@Conducta.org Grupo Contextos -­‐ 2001 14 
Download