Uploaded by Samuel Dagoberto Gutierrez

Libro RCM Moury

advertisement
MANTENIMIENTO CENTRADO EN
LA CONFIABILIDAD
Segunda Edicion
John Moubray
Industrial Press Inc.
CONTENIDOS
Prologo
Reconocimientos
x
xii
1
Introducción al
Confiabilidad
Mantenimiento
Centrado
en
la 1
1.1
1.2
1.3
1.4
1.5
El cambiante mundo del mantenimiento
Mantenimiento y RCM
RCM: Siete preguntas básicas
Aplicando el Proceso de RCM
Que logra el RCM
1
6
7
16
18
2
2.1
2.2
2.3
2.4
2.5
Funciones
Descripción de Funciones
Niveles de Desempeño
El contexto operativo
Diferentes tipos de funciones
Como se debería enunciar las funciones
21
22
22
28
35
44
3
3.1
3.2
Fallas Funcionales
Falla
Fallas Funcionales
45
45
46
4
4.1
4.2
4.3
4.4
4.5
4.6
4.7
Análisis Modos de Falla y Efectos.
Que es un modo de falla?
Por que se debe analizar los modos de fallas?
Categorías de modos de falla
Cuantos detalles?
Efectos de las fallas
Fuentes de información sobre modos y efectos
Niveles de Análisis y la planilla informativa
53
53
55
58
64
73
77
80
5
Consecuencias de las fallas
90
5.1
5.2
5.3
5.4
5.5
5.6
5.7
Técnicamente Viable y beneficioso.
Funciones ocultas y evidentes.
Consecuencias medioambientales y de seguridad
Consecuencias operativas
Consecuencias no operativas
Consecuencias de fallas ocultas
Conclusión
90
92
94
103
108
111
127
6
6.1
6.2
Mantenimiento Proactivo 1 : Tareas Preventivas
Viabilidad Técnica y tareas preventivas
Edad y deterioro
129
129
130
2
6.3
6.4
6.5
Fallas relacionadas a la edad y mantenimiento preventivo
133
Tareas de restauración programada y de descarte 134
programado
Fallas que no están relacionadas a la edad
140
7
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
Mantenimiento Proactivo 2: Tareas Predictivas
Fallas Potenciales y mantenimiento en- condición
El Intervalo P-F
Aptitud Técnica de las tareas en condición
Categorías de las técnicas en-condición
Tareas en-condición: Algunos peligros
Curvas P-F lineares y no lineares
Como determinar el intervalo P-F
Cuando es conveniente llevar a cabo tareas en condición
Seleccionando tareas Proactivas
144
144
145
149
149
155
157
163
166
167
8
8.1
8.2
8.3
8.5
Acciones de Default
Acciones de Default
Búsqueda de fallas
Intervalos de tareas de búsqueda de falla.
La viabilidad técnica de la búsqueda de fallas
170
170
171
175
185
9
9.1
9.2
9.3
Otras acciones de Default
Mantenimiento no programado
Rediseño
Rondas de Control
187
187
188
197
10
10.1
10.2
10.3
10.4
El Diagrama de Decisión de RCM
Integrar consecuencias y tareas
El proceso de Decisión de RCM
Completando la planilla informativa
Computadoras y RCM
198
198
198
209
211
11
11.1
11.2
11.3
11.4
11.5
11.6
11.7
Implementando las Recomendaciones de RCM
Implementación – los pasos clave
La auditoria de RCM
Descripción de tareas
Implementando cambios excepcionales.
Paquetes de trabajo
Planificación de mantenimiento y sistemas de control
Informar los defectos
212
212
214
218
220
221
224
233
12
12.1
12.2
Análisis actuarial y datos de fallas.
Los seis patrones de fallas
Datos de historia técnica
235
235
250
13
13.1
13.2
13.3
Aplicando el proceso de RCM
¿Quien sabe?
Grupos de revisión de RCM
Facilitadores
261
261
266
269
3
13.4
13.5
13.6
13.7
Estrategias de Implementación
RCM en la perpetuidad
Como no aplicar el RCM
Ganando experiencia en RCM
277
284
286
291
14
14.1
14.2
14.3
14.4
Que logra el RCM
Midiendo el desempeño del mantenimiento
Efectividad del mantenimiento
Eficiencia del mantenimiento
Que logra el RCM?
292
292
293
304
307
15
15.1
15.2
15.3
Una Breve Historia de RCM
La experiencia de las aerolíneas
La evolución de RCM2
Otras versiones de la norma de RCM y SAE
318
318
321
Apéndice 1
Apéndice 2
Apéndice 3
Apéndice 4
Jerarquía de los bienes y diagramas de bloque funcionales
Errores humanos
Un riesgo continuo
Monitoreo de condición
327
335
343
348
4
PROLOGO
La humanidad continúa dependiendo, cada vez en mayor grado, de la prosperidad generada
por las empresas altamente mecanizadas y automatizadas. También somos más y más
dependientes del suministro ininterrumpido de electricidad o de trenes que funcionen con
puntualidad. Más que nunca, estos dependen a su vez de la integridad continua de los activos
físicos.
Sin embargo cuando estos activos fallan, no solo se perjudica este bienestar, y no solo se
interrumpen estos servicios, sino que nuestra propia supervivencia se encuentra amenazada.
Las Fallas en equipos han jugado un papel fundamental en los peores accidentes e incidentes
medioambientales en la historia de la industria- incidentes que se convirtieron en iconos,
como ser Amoco Cadiz, Chernobil, Bhopal y Piper Alpha. Como resultado, los procesos
causantes de estas fallas, y lo que debe hacerse para controlarlas están ocupando un lugar
realmente prioritario, específicamente, a medida en que se vuelve evidente cuantas de estas
fallas son causadas, por exactamente las mismas actividades generadas para prevenirlas.
La primera industria en confrontar este problema fue la industria internacional de aviación
civil. Basándose en investigaciones que desafían muchas de nuestras más firmes y más
arraigadas creencias sobre mantenimiento, esta industria desarrollo un marco estratégico
completamente nuevo, para asegurar que cualquier bien continúe funcionando exactamente
como sus usuarios quieren que lo haga. Estos sistemas conocidos dentro de la industria de
aviación como MSG3, y fuera de esta como Mantenimiento Basado en la Garantía de
Funcionamiento, o RCM (Reliability-Centered Manteinance).
El mantenimiento Basado en la Garantía de Funcionamiento, fue desarrollado a lo largo de 30
años. Uno de los principales hitos en su desarrollo fue un informe encargado a American
Airlines por el Departamento de Defensa de los Estados Unidos y preparado por Stanley
Nowlan, y el ya fallecido Howard Heap en 1978. El informe brindaba una descripción
comprensiva del desarrollo y aplicación del RCM, detallada por la industria de aviación. Este
fue la base de ambas ediciones de este libro y de gran parte del trabajo realizado en este
campo fuera de la industria aérea, durante los últimos 15 años.
Desde principios de 1980, el autor y sus asociados ayudaron a diversas compañías en la
aplicación del RCM, en cientos de plantas industriales alrededor del mundo- trabajo que llevó
al desarrollo de RCM2 para industrias diferentes a la aviación en 1990.
5
INTRODUCCION AL MANTENIMIENTO CENTRADO
EN LA CONFIABILIDAD.
1.1- El cambiante mundo del mantenimiento.
Durante los pasados 20 años, el mantenimiento cambió, quizás mucho más que cualquier otra
disciplina de gerenciamiento. El cambio se debe a un enorme incremento en el número y
variedad de bienes físicos (plantas, equipos, edificios) que deben ser mantenidos alrededor del
mundo, diseños mucho más complejos, nuevas técnicas de matenimiento, y cambiante
ideología con respecto a la organización y responsabilidades del mantenimiento.
El mantenimiento también responde a expectativas variables. Estas incluyen el hecho de
advertir cada vez más el alto grado en el que las fallas en equipos afectan la seguridad y el
medioambiente, una conciencia creciente de la conexión entre mantenimiento y calidad del
producto, y una presión cada vez mayor de alcanzar un alto rendimiento de las plantas y
controlar los costos.
Estos cambios están poniendo a prueba al máximo actitudes y capacidades en todas las ramas
de la industria. El personal de mantenimiento se ve obligado a adoptar un nuevo modo de
pensar y actuar, como ingenieros y como gerentes. Al mismo tiempo las limitaciones de los
sistemas de mantenimiento se están haciendo mas evidentes, no importa cuan computarizados
estén.
Ante la evidencia de esta avalancha de cambios, los jefes de las diversas áreas, están buscando
un nuevo método de mantenimiento. Quieren evitar los falsos comienzos y callejones sin
salidas que suelen conducir a mayores catástrofes. En cambio persiguen una estructura
estratégica que sintetice los nuevos desarrollos en un patrón coherente, de manera que
puedan ser evaluados sensiblemente, permitiendo escoger aquellos que mas se adapten a
ellos y a sus empresas.
Este libro describe una filosofía que provee justamente esa estructura ideológica. Se denomina
mantenimiento centrado en la Confiabilidad. (RCM)
Si se aplica correctamente, el RCM transforma la relación entre la empresa que lo usa, sus
bienes físicos existentes y el personal que opera y mantiene esos bienes. Además, permite que
nuevos bienes sean puestos eficientemente en servicio, con gran velocidad, confianza y
precisión.
Este capitulo provee una breve introducción al RCM, comenzando con un vistazo en cómo el
mantenimiento ha evolucionado durante los últimos 60 años.
Desde 1930, la evolución del mantenimiento se puede trazar a través de tres generaciones. El
RCM se esta convirtiendo rápidamente en el cimiento de la tercer generación, pero ésta solo
puede ser vista en perspectiva, a la luz de la primera y segunda generación.
La Primera Generación.
La primera generación cubre el periodo hasta la segunda guerra mundial. En esa época la
industria no era altamente mecanizada, de modo que los tiempos de inactividad no tenían
demasiada importancia. Esto significa que la prevención de fallas en equipos no era una
prioridad en la mente de la mayoría de los gerentes. Al mismo tiempo la mayoría de los
equipos eran simples y muy bien diseñados esto los hacia confiables y fáciles de reparar.
6
Como consecuencia, no había necesidad de mantenimiento sistemático de ningún tipo, más
allá que la limpieza, control y lubricación de rutina. La necesidad de habilidades específicas
era inclusive menor de lo que es ahora.
La Segunda Generación.
Todo cambió dramáticamente desde la segunda guerra mundial. Las presiones de la guerra
aumentaron la demanda de todo tipo de provisiones, mientras que la disponibilidad de mano
de obra disminuyó notablemente. Esto llevo a una mayor mecanización. Para 1950, las
maquinarias de todo tipo se habían multiplicado en número y complejidad. La industria estaba
comenzando a depender de ellas.
A medida que esta independencia creció, la inactividad tuvo un enfoque más cercano. Esto
trajo la idea de que las fallas técnicas podían y debían ser prevenidas, lo que trajo a su vez el
concepto de mantenimiento preventivo. En 1960 éste consistía principalmente en el
reacondicionamiento de los equipos, que se llevaba a cabo en intervalos fijos.
El costo de mantenimiento comenzó a incrementarse notablemente en comparación con otros
costos operativos. Esto llevo al crecimiento de la planificación de mantenimiento y
programas de control. Estos fueron una enorme contribución para comenzar a controlar el
mantenimiento, y actualmente forman parte oficial de las prácticas de éste.
Finalmente la cantidad de capital invertido en bienes físicos y los costos crecientes, llevo a
que los propietarios buscaran el modo de maximizar la vida de esos bienes.
La Tercera Generación
Desde mediados de 1970, el proceso de cambio en la industria ha conjugado un momentum
aun mayor. Los cambios pueden clasificarse bajo los títulos de nuevas expectativas, nuevas
investigaciones y nuevas técnicas.
Nuevas expectativas
El grafico 1.1 muestra como evolucionaron las expectativas del mantenimiento.
Tercera Generación
Segunda Generación
Primera
Generación
*Repara cuando
Se rompe.
1940
1950
*Mayor disponibilidad
de plantas.
* Vida de equipos más
extensa.
* Costos más bajos
1960
1970
*Mayor
disponibilidad
y
confiabilidad de las plantas.
* Mayor seguridad
* Mejor calidad del producto.
*
No
perjudican
el
medioambiente.
* Más extensa vida de los
equipos
* Mejor relación costoefectividad.
1980
1990
2000
Grafico 1.1
Crecientes expectativas en el mantenimiento.
7
El tiempo de inactividad afecta la capacidad productiva de los bienes físicos, reduciendo su
rendimiento, incrementando los costos operativos y afectando el servicio al cliente. Esto ya
era un problema de gran envergadura en 1960 y 1970, que perjudicaba a los sectores fabriles,
mineros y de transporte. Los efectos de la inactividad se agravan aun mas por la tendencia
mundial a adoptar sistemas de exactitud, donde al reducirse la cantidad de material a través de
la cadena de provisión, trae aparejado el hecho de que un número mínimo de fallas tienden a
interferir con la operación general de la planta. Recientemente, el crecimiento de la
mecanización y automatización trajo a aparejado que la garantía de funcionamiento y
disponibilidad se conviertan en planteamientos claves en sectores tan diversos como cuidado
de la salud, procesamiento de datos, telecomunicaciones y administración de edificios.
Una mayor automatización significa también que cada vez fallas afectan nuestra capacidad de
mantener los estándares elevados de calidad. Esto se aplica tanto a los servicios como a la
calidad del producto. Por ejemplo, las fallas en equipos pueden afectar la climatización
imprescindible en edificios, y la puntualidad de las redes de transportes puede ser clave en el
cumplimiento de fechas específicas de fabricación.
Estas fallas tienen series consecuencias medioambientales y de seguridad, en una época
cuando los estándares en estos aspectos son cada vez mas elevados. En algunos sectores del
mundo se esta llegando al punto donde una organización tiene que garantizar la seguridad de
la sociedad y el medioambiente, o en su defecto debe dejar de operar. Esto agrega aun más a
la magnitud de nuestra dependencia en la integridad de nuestros bienes físicos- hace que esto
vaya más allá de los costos, y se convierta simplemente en una cuestión de supervivencia
organizacional.
Al mismo tiempo que nuestra dependencia en los bienes materiales esta creciendo, también lo
se incrementan sus costos- de operación y de adquisición. Para asegurar el máximo retorno en
la inversión que ellos representan, debemos lograr que trabajen eficientemente durante la vida
útil que nosotros esperamos tengan. Finalmente el costo de mantenimiento en si mismo esta
también aumentando, en forma equitativa y como una proporción de los gastos generales.
Para algunas industrias, este representa el segundo o hasta inclusive el mayor gasto entre los
costos operativos. Como consecuencia en los últimos treinta años se posiciono desde el lugar
prácticamente sin importancia que ocupaba, a formar hoy en día parte de las prioridades de
los sistemas de control de costos.
Nueva Investigación
Difiriendo con expectativas mayores, las nuevas investigaciones están modificando muchos
de nuestros principios más arraigados sobre la relación entre antigüedad y fallas. En
particular, hay aparentemente cada vez una menor conexión entre la edad operativa de la
mayoría de lo bienes y que tan propensos son a fallar.
El grafico 1.2 muestra como las primeras apreciaciones sobre las fallas estaban totalmente
basadas en el principio de que a medida de que los bienes envejecen, tiene una mayor
tendencia a fallar. La advertencia creciente de “mortalidad infantil” llevo a que se expandiera
la idea de la Segunda Generación en la curva de “la bañera’.
8
Grafico 1.2 Una visión cambiante sobre las fallas en los equipo
Sin embargo, las investigaciones de la tercera generación revelaron que no uno o dos, sino
seis modos de fallas ocurren durante la practica. Como se discute mas detalladamente
adelante en este capitulo, una de las conclusiones mas importantes que emergen de este
estudio es el convencimiento de que, aunque se halla hecho exactamente lo planeado, un
enorme número de las operaciones tradicionales de mantenimiento no llevan a absolutamente
nada, mientras que otras son activamente contraproducentes y hasta peligrosas. Esto es
particularmente verídico en muchas acciones realizadas bajo nombre de mantenimiento
preventivo. Por otro lado, muchas tareas de mantenimiento que son esenciales para la
operación segura de sistemas industriales modernos y complejos, no figuran en los programas
asociados de mantenimiento.
En otras palabras, la industria en general esta poniendo una gran atención en realizar los
trabajos de mantenimiento en forma correcta, (hacer correctamente el trabajo), pero se
necesita hacer mucho mas para asegurar que los trabajos planificados, son los trabajos que
deben realizarse (hacer el trabajo correcto).
Nuevas Técnicas.
Hubo un crecimiento explosivo en los nuevos conceptos y técnicas de mantenimiento. Se
desarrollaron cientos de ellos en los últimos 20 años y cada semana emergen nuevos.
El grafico 1.3 muestra como el clásico énfasis en las reparaciones y el sistema administrativo
creció, hasta incluir muchos nuevos proyectos en los diferentes campos.
Tercera Generación
Segunda Generación
Primera
Generación
*Repara cuando
Se rompe.
1940
1950
*Reparaciones
Programadas.
*Sistemas para planificar
y controlar el trabajo.
*Computadoras grandes
y lentas.
1960
1970
* Monitoreo de condición.
* Diseño para confiabilidad
Mantenimiento.
* Estudios de Riesgos.
* Computadoras rápidas
pequeñas.
* Análisis de modos de falla
efectos.
* Sistemas Expertos
* Capacidades Múltiples
trabajo en equipo.
1980
1990
y
y
y
y
2000
9
Grafico1.3: Técnicas cambiantes de Mantenimiento.
Los nuevos proyectos incluyen:
* Herramientas de toma de dediciones. Como ser los estudios de riesgos, tipos de fallas y
análisis de los efectos y sistemas especializados.
*nuevas técnicas de mantenimiento, como ser monitoreo del estado
* El diseño de equipos poniendo gran énfasis en la confiabilidad y mantenibilidad.
*un cambio mayor e el pensamiento organizacional, a través de la participación, trabajo en
equipo y flexibilidad.
Como mencionamos anteriormente el mayor desafío que enfrenta el personal de
mantenimiento hoy en día, no es solo interiorizarse en estas técnicas, sino decidir cuáles son
útiles y valederas y cuáles no, para sus respectivas organizaciones. Si tomamos las decisiones
correctas, es posible mejorar el funcionamiento de los equipos y al mismo tiempo, mantener y
hasta reducir los costos de mantenimiento. Si tomamos las decisiones incorrectas, surgirán
nuevos problemas y los ya existen solo empeoraran.
Los desafíos que enfrenta el mantenimiento
La primera industria en enfrentar estos desafíos sistemáticamente fue la industria de aviación
comercial. Un elemento crucial de su respuesta fue el darse cuenta de que se debía poner
tanto esfuerzo en asegurar que el personal de mantenimiento esté haciendo el trabajo en
forma correcta, como en garantizar que se esta haciendo el trabajo correcto. Este proceso
llevo a su vez al desarrollo del método de toma de dediciones comprensivo, conocido dentro
de la aviación como MSG3, y afuera de ésta como Mantenimiento Centrado en la garantía de
Funcionamiento o RCM.( Reliability – Centered Maintenance)
En prácticamente cualquier rama del esfuerzo humano organizado, el RCM se esta volviendo
tan fundamental para la protección de los bienes materiales, como los libros de doble
contabilidad lo son para los bienes financieros. No existe ninguna técnica similar para
identificar el menor numero de actividades especificas y seguras que se deben realizar para
preservar el funcionamiento de de los bienes físicos, especialmente en situaciones críticas y
riesgosas. El reconocimiento cada vez mayor a nivel mundial del rol fundamental del RCM en
la formulación de estrategias de manejo de bienes físicos- y de la importancia de aplicarlo
correctamente- llevó a la Sociedad Americana de Ingenieros Automotrices 1999, a publicar
SAEStandar JA1011: “Criterios de Evaluación para los procesos de mantenimiento Centrado
en la garantía de funcionamiento.”
El proceso descrito en los capítulos 2 a 10 de este libro cumple con esta regulación. El resto
del libro plantea como debe aplicarse el RCM y como deben implementarse sus políticas de
solución de problemas, además de proveer un mayor detalle de planteos técnicos clave.
El resto de este capitulo presenta RCM en detalle.
10
1.2 Mantenimiento y RCM
Desde el punto de vista de la ingeniería, existen dos elementos para el manejo de cualquier
bien físico. Este debe ser mantenido y cada tanto ser modificado.
Los principales diccionarios definen Mantener, como causa de continuidad (Oxford) o
Conservar en el estado actual (Webster). Esto sugiere que mantener significa preservar algo.
Por otro lado, concuerdan en que modificar algo significa cambiar en algún aspecto. Esta
distinción entre mantener y modificar tiene profundas implicancias que son discutidas
ampliamente en capítulos siguientes. Sin embargo, nos concentramos en mantenimiento.
Cuando nos referimos a mantener algo, que es lo que pretendemos que continúe? Cual es el
estado actual existente que queremos preservar?
La respuesta a este planteo puede encontrarse en el hecho de que todo bien físico se pone en
servicio porque alguien desea que cumpla realice una tarea. En otras palabras, esperan que
este cumpla una o mas funciones. Entonces sucede que cuando nosotros mantenemos un bien,
lo que remos preservar es un estado en el que este siga cumpliendo con las funciones deseadas
por el usuario.
Mantenimiento: Asegurar que los bienes físicos continúen cumpliendo las funciones que
sus usuarios esperan.
Lo que los usuarios quieren dependerá en exactamente donde y como el bien esta siendo
usado (el contexto operativo). Esto lleva a la siguiente definición formal de mantenimiento
basado en la Garantía de Funcionamiento.
Mantenimiento Centrado en la garantía de funcionamiento: un proceso usado para
determinar que debe hacerse para asegurar que todo bien físico continúe funcionando
como sus usuarios lo desean en el presente contexto operativo.
1.3 RCM: Las siete preguntas básicas
El proceso de RCM incita a responder las siguientes siete preguntas sobre el bien o sistema
bajo revisión:
* ¿Cuales son las funciones y respectivos estándares de desempeño de este bien en su
contexto operativo presente?
* ¿En que aspecto no responde al cumplimiento de sus funciones?
* ¿Que ocasiona cada falla funcional?
* ¿Que sucede cuando se produce cada falla en particular?
*¿De que modo afecta cada falla?
* ¿Que puede hacerse para predecir o prevenir cada falla?
*¿Que debe hacerse si no se encuentra el plan de acción apropiado?
11
Estas preguntas tienen una breve introducción en los siguientes párrafos, y se consideran en
detalle en los capítulos 2 a 10.
Funciones y niveles de desempeño.
Antes de que sea posible aplicar un proceso, utilizado para determinar qué debe hacerse para
asegurar que todo bien físico continúe cumpliendo con su desempeño, del modo en que sus
usuarios esperan dentro de su contexto operativo presente, necesitamos hacer dos cosas:
* Determinar cual es la funcion que los usuarios quieren que cumpla.
* Asegurar que el bien es capaz de comenzar con lo que los usuarios esperan.
Es por esto que el primer paso del RCM es definir las funciones de cada bien en su contexto
operativo, como así también los estándares de desempeño deseados. Las funciones que los
usuarios pretenden que sus bienes desempeñen pueden dividirse en dos categorías:
* Funciones primarias: que sintetizan por que el bien fue adquirido en primer lugar. Esta
categoría de funciones cubren temas tales como velocidad, rendimiento, capacidad de
transportación o almacenamiento, calidad del producto y servicio al cliente.
* Funciones secundarias, que indican que se espera que todo bien produzca más que
simplemente su función primaria. Los usuarios también tienen expectativas en áreas como ser
seguridad, control, contención, confort, integridad estructural, economía, protección,
eficiencia de operación, cumplimiento con las normas medioambientales, y hasta la estética o
apariencia del bien.
Los usuarios de estos bienes se encuentran en la posición más óptima para saber exactamente
como aporta cada bien al bienestar físico y financiero de la organización como un todo., de
modo que es esencial que estén involucrados con el proceso de RCM desde un principio.
Si se realiza apropiadamente, este paso generalmente absorbe casi un tercio del tiempo
necesario para un análisis de RCM completo. También implica que el personal llevando a
cabo este análisis aprenda una cantidad considerable, que puede hasta ser atemorizante sobre
cómo los equipos trabajan verdaderamente.
Estas funciones se describen en detalle en el capitulo 2.
Fallas funcionales.
Los objetivos de mantenimiento son determinados por las funciones y respectivas
expectativas de desempeño del bien bajo consideración. Pero ¿como se alcanzan estos
objetivos?
El único suceso que puede hacer que un bien deje de funcionar al nivel requerido es algún tipo
de falla. Esto sugiere que el departamento mantenimiento alcanza sus objetivos, al adoptar un
acercamiento acertado al manejo de las fallas. Sin embargo, antes de que podamos aplicar la
conjunción de herramientas apropiadas, necesitamos identificar el tipo de fallas que pueden
presentarse.
12
El proceso de RCM realiza esto en dos niveles:
* Primero, identificando qué circunstancias llevaron a un estado fallido
* Luego investigando qué situaciones son las causantes de que un bien caiga en ese estado de
falla.
En el mundo de RCM, los estados de falla son conocidos como fallas funcionales, porque
ocurren cuando un bien es incapaz de cumplir una función a un nivel de desempeño que sea
aceptable por el usuario. En adición a la incapacidad total para funcionar, esta definición
abarca fallas parciales, donde el bien todavía funciona, pero a nivel inaceptable de
desempeño, (incluyendo también los casos donde no se alcanza el nivel de precisión o
calidad). Pero éstas solo pueden ser identificadas una vez que las funciones y desempeño
estándares hayan sido definidas con claridad.
Las fallas funcionales se discuten con mayor extensión en el capitulo 3.
Modos de fallas.
Como se menciona en los párrafos anteriores, una vez que hemos identificado cada falla
funcional, el próximo paso es tratar de identificar todas las posibles causas de este estado de
error. Estos eventos se conocen como modos de fallas. Los modos de falla “razonablemente
similares” incluyen aquellas fallas que ocurrieron en el mismo equipo o en similares,
operando en el mismo contexto, fallas que actualmente están siendo prevenidas por regimenes
de mantenimiento ya existentes, y aquellas fallas que no ocurrieron aun, pero que se
consideran como posibilidades muy reales en el contexto en cuestión.
Las listas de modos de fallas más tradicionales, incorporan fallas causadas por el deterioro o
el uso y desgaste normal. Sin embargo también puede incluir fallas causadas por errores
humanos (en parte por operarios y personal de mantenimiento) o por desperfectos de diseño
de modo que los posibles causantes de fallas en equipos pueden ser identificados y manejados
apropiadamente. Es también de suma importancia identificar la causa en detalle de modo que
no se desperdicien tiempo ni esfuerzo en tratar síntomas en lugar de causas. Por otro lado, Es
también de suma importancia asegurar que el tiempo no se desperdicia en el análisis mismo,
por concentrase en demasiados detalles.
Efectos de las fallas.
El cuarto paso en el proceso de RCM implica enlistar los efectos de las fallas, que describen
lo que sucede cuando se presenta cada modo de falla. Esta descripción debe incluir toda la
información necesaria para respaldar la evaluación de las consecuencias de las fallas, como
ser,
* Evidencias, (si las hubiera), de que la falla ocurrió
* En que manera, (si las hubiera), representa una amenaza para la seguridad del
medioambiente.
* De que modo, (si los hubiera) afecta la producción u operaciones.
* Que debe hacerse para reparar la falla.
Los modos de falla y efectos se discuten con mayor extensión en el capitulo 4.
13
El proceso de identificar funciones, fallas funcionales, modos y efectos de las fallas trae
aparejadas oportunidades sorprendentes de mejorar el desempeño y seguridad, y de eliminar
lo innecesario.
Consecuencias de las fallas.
Un análisis detallado de una empresa industrial promedio, tiende a arrojar entre tres y diez mil
posibles modos de fallas. Cada una de estas fallas afectan a la organización en alguna escala,
pero en cada caso los efectos son diferentes. Pueden afectar la operatividad. También pueden
afectar la calidad del producto, servicio al cliente, seguridad del medioambiente. Todas
significaran el gasto de tiempo y dinero para repararlas.
Son esas consecuencias las que ejercen la mayor influencia para que tratemos de prevenir
cada falla. En otras palabras, si una falla trae consecuencias serias, tenderemos a hacer todo lo
posible para tratar de evitarla. Por otro lado, si esta no afecta o afecta en un grado mínimo,
entonces quizás decidamos no hacer un mantenimiento de rutina que vaya más allá de la
limpieza y lubricación.
Uno de los puntos fuertes de RCM es que este reconoce que las consecuencias de las fallas
son mucho más importantes que sus características técnicas, en realidad reconoce que la única
razón de hacer cualquier tipo de mantenimiento proactivo no es para evitar las fallas en si,
sino evitar o al menos reducir las consecuencias que estas traen. El proceso de RCM clasifica
estas consecuencias en los siguientes cuatro grupos:
* Consecuencias de fallas ocultas: Las fallas ocultas no causan un impacto directo, pero
exponen a la empresa a fallas múltiples, con consecuencias serias y frecuentemente
catastróficas. (La mayoría de estas fallas están asociadas con sistemas de protección no libres
de fallas)
* Consecuencias medioambientales y de seguridad: Una falla trae consecuencias de
seguridad si potencialmente puede dañar o causar la muerte. Tiene consecuencias
medioambientales si provoca la violación de cualquier norma medioambiental corporativa,
regional, nacional o internacional.
* Consecuencias operativas: Una falla trae consecuencias operativas cuando afecta la
producción (rendimiento, calidad del producto, servicio al cliente o costos operativos, además
del costo directo de reparación.)
* Consecuencias no operativas: Las fallas evidentes que conforman esta categoría, no tienen
consecuencias ni de seguridad, ni de protección, de modo que solo implican el costo de
reparación.
Veremos mas adelante como los procesos de RCM usan estas categorías como la base de un
marco estratégico para la toma de decisiones de mantenimiento. Forzando una revisión
estructurada de las consecuencias de cada tipo de fallas, de acuerdo con las categorías antes
descriptas, integra los objetivos operativos, medioambientales y de seguridad; que son base de
la función de mantenimiento. Esto ayuda a poner la seguridad y el medioambiente en la
corriente principal del manejo de mantenimiento.
El proceso de evaluación de consecuencias quita énfasis a la creencia de que todas las fallas
son malas y deben ser prevenidas. De este modo enfoca la atención en las actividades de
mantenimiento que tienen mayor efecto en el desempeño de la organización, y no desgasta
energía en aquellas que tienen un menor o ningún efecto. También nos impulsa a pensar mas
14
abiertamente sobre los diferentes modos de manejar las fallas, en lugar de solo concentrarse
en la prevención. Las técnicas del manejo de fallas se dividen en dos categorías:
* Tareas Proactivas: son los trabajos realizados antes de que la falla ocurra, para prevenir que
el equipo llegue a un estado de falla. Esto abarca lo que se conoce tradicionalmente como
mantenimiento “predictivo” o “preventivo”. Aunque veremos más adelante que RCM utiliza
los términos restauración programada, descarte programado o mantenimiento en condición.
* Acciones de omisión: estas se encargan del estado de falla, y son utilizadas cuando no es
posible identificar una consigna proactiva efectiva. Las acciones de omisión incluyen
búsqueda de la falla, rediseño, y acudir a la falla.
El proceso de evaluación de consecuencias se discute en forma breve mas adelante en este
capitulo, y en forma mucho mas detallada en el capitulo 5. La sección siguiente de este
capitulo describe mas detalladamente las tareas proactivas.
Tareas proactivas:
Muchas personas siguen sosteniendo que el mejor modo de optimizar la capacidad de una
planta es tener una determinada rutina de mantenimiento proactivo. La sabiduría de la
segunda generación sostiene que esta debería consistir en la reparación o reemplazo de
componentes en intervalos fijos. El grafico 1.4 ilustra la visión de intervalo fijo en las fallas.
Grafico 1.4 La tradicional visión de las fallas.
El grafico 1.4 se basa en la convicción de que la mayoría de los ítems operan confiablemente
por un X periodo. El pensamiento clásico sugiere que los registros detallados de las fallas nos
permitirán determinar la vida del equipo y de ese modo hacer planes para tomar acciones
preventivas antes de que el ítem comience a fallar en el futuro.
Este modelo es útil para ciertos tipos de equipos simples, y para algunos más complejos con
modos de fallas dominantes. En particular las características de durabilidad se encuentran
cuando el equipo tiene contacto directo con el producto. Las fallas relacionadas a la edad se
asocian con frecuencia con la fatiga, corrosión, abrasividad y evaporación.
Sin embargo los equipos en general son mucho más complejos que veinte años atrás. Esto
llevo a cambios iniciales en los patrones de falla, como se muestra en el grafico1.5. Los
gráficos muestran la probabilidad condicional de falla versus la edad operativa, en un numero
de equipos eléctricos y mecánicos.
15
El patrón A es la tan conocida “curva de la bañera”. Comienza con una incidencia alta de falla
(conocida como mortalidad infantil) seguida por una probabilidad de falla condicional en
lento o constante crecimiento, luego por la zona de desgaste.
El patrón B muestra una probabilidad de falla creciente, finalizando en una zona de desgastesimilar al grafico 1.4.
Grafico 1.5 6 patrones de fallas.
El patrón C muestra una probabilidad de falla creciente pero no hay una edad de desgaste
identificable. El patrón D muestra una baja probabilidad de falla cuando el equipo es nuevo o
recién comprado, y luego una suba rápida a un nivel constante, mientras que el patrón E
muestra una permanente probabilidad condicional de fallas a cualquier edad, (fallas casuales)
El patrón F comienza con una mortalidad infantil alta, que disminuye eventualmente a una
probabilidad condicional de falla muy lenta.
Los estudios realizados a una aeronave civil mostraron que un 2% de los ítems respondían al
Patrón A, 2% al B, 5% al C, 7% al D, 14% al E y no menos del 68% al patrón F. ( El numero
de veces que estos patrones se presentan en aeronaves, no es necesariamente el mismo que
para la industria0. Pero no hay duda de que a medida que los equipos se vuelven mas
complejos, se pueden observar mas y mas patrones E y F.
Estos descubrimientos contradicen la creencia de que siempre hay una conexión entre
confiabilidad y edad operativa. Esta creencia lleva a la idea que cuanto mas frecuentemente se
examine un ítem, tendrá menos probabilidades de fallar. Hoy en día, esto es cierto muy de vez
en cuando. A menos que haya una probabilidad de fallas por desgaste dominante, los límites
de edad hacen poco y nada para mejorar la confiabilidad de ítems complejos. En realidad las
restauraciones programadas pueden aumentar las fallas generales, introduciendo la mortalidad
infantil en sistemas que de otro modo serian más estables.
Muchas organizaciones, al observar esto, optaron por abandonar la idea de mantenimiento
proactivo en su totalidad. En realidad esto podría ser lo correcto para fallas con consecuencias
menores. Pero cuando las consecuencias de las fallas son significantes, debe hacerse algo para
prevenir o predecir esas fallas, o al menos para reducir las consecuencias.
Esto nos trae otra vez a la cuestión de las tareas proactivas. Como se menciona anteriormente,
el RCM divide las tareas proactivas en tres categorías:
* Tareas de restauración programadas
* Tareas de descarte programadas
* Tareas en condición programadas.
16
Tareas de restauración y de descarte programadas.
Las tareas de restauración abarcan la refabricación de un componente, o la restauración de un
montaje antes de que termine su viva útil programada, sin tener en cuenta su condición en ese
momento. Del mismo modo, el descarte programado implica deshacerse de un ítem al, o antes
del tiempo programado, sin importar su condición en ese momento.
Colectivamente, estas tareas se conocen como mantenimiento preventivo. Solían ser por lejos
la forma de mantenimiento proactivo mas utilizada. Sin embargo, por las causas detalladas
anteriormente, se las utiliza notablemente menos que 20 años atrás.
Tareas en condición:
La necesidad continua de prevenir ciertos tipos de fallas, y la creciente incapacidad de las
técnicas clásicas para lograrlo, están muy por detrás del crecimiento de nuevos tipos de
manejos de fallas. La mayoría de estas técnicas se basan en que gran parte las fallas, dan
algún tipo de aviso de que están por ocurrir. Estos avisos se conocen como fallas potenciales,
y se definen como condiciones físicas identificables que indican que una falla funcional, esta
por ocurrir o esta en proceso de ocurrir.
Las nuevas técnicas se usan para detectar fallas potenciales de manera que se pueda tomar
acción para evitar las consecuencias que traerán si degeneran en fallas funcionales. Se las
denomina tareas en condición por que los ítems son controlados bajo la condición de que
estén dentro de sus patrones normales de funcionamiento. (El mantenimiento en-condición
incluye el mantenimiento preventivo, mantenimiento basado en la condición, y monitoreo de
condición.)
Si se los usa apropiadamente, las tareas en condición son una muy buena forma de manejar las
fallas, pero también pueden ser un gasto de tiempo muy costoso. RCM permite que se tomen
dediciones en esta área con confianza particular.
Acciones de omisión:
El RCM reconoce tres categorías principales:
* Descubrimiento de fallas: las tareas de detección de fallas implican controlar las funciones
encubiertas periódicamente para determinar si es que hubo fallas (mientras que las tareas en
condición implican chequear si algo esta fallando.
* Rediseño: implica realzar cambios en la capacidad interna del sistema. Esto implica
modificaciones en el hardware y cubre los cambios de procedimientos.
* Mantenimiento no programado: Como es nombre lo implica, esta omisión implica no
realizar ningún esfuerzo en anticipar o prevenir los modos de fallas a los que se aplica, de
modo que se permite que las fallas sucedan y luego se reparan. Este default también se conoce
como acudir a la falla.
Proceso de selección de tareas de RCM.
Una de las grandes fortalezas de RCM es el modo en que ofrece un criterio simple, preciso y
fácilmente entendible, para decidir cual de las tareas proactivas (si las hubiere) es la realizable
en cualquier contexto, y de ser así para decidir que tan seguido deben realizarse y quien debe
hacerlas. Este criterio se discute en detalle en los capítulos 6 y 7.
17
Si las tareas proactivas son técnicamente viables o no, depende de las características técnicas
de la tarea, y de la falla que se supone prevenga. Si es conveniente hacerlo depende de que tan
bien se manejen las consecuencias de las fallas. Si una tarea proactiva no cumple con los
requisitos de ser viable y productiva, entonces debe tomarse las acciones de default
correspondientes. A continuación se detalla la esencia del proceso de selección de tareas.
* Para fallas ocultas, vale la pena realizar una tarea proactiva si esta va a reducir el riesgo de
fallas múltiples asociadas con esa función, a un nivel tolerablemente bajo. Si hay seguridad en
elegir la tarea adecuada, entonces se debe llevar un proceso de detección de fallas. Si el
proceso adecuado para esto no se puede determinar, la decisión secundaria de omisión es que
el ítem, deba ser rediseñado (dependiendo e las consecuencias de fallas múltiples).
* Para fallas con consecuencias medioambientales y de seguridad, solo es valido realizar una
tarea proactiva, si esta reduce el riesgo de ese problema en si mismo, a un nivel muy bajo, de
no eliminarlo directamente. Si no se encuentra una solución que disminuya el riesgo a un
nivel tolerablemente bajo, el ítem debe ser rediseñado, o se debe cambiar de proceso.
* Si la falla trae consecuencias operativas, solo vale la pena realizar una tarea proactiva si el
costo total de realizarla durante un periodo de tiempo determinado, es menor que los costos de
las consecuencias operativas y de reparación durante el mismo periodo. En otras palabras, la
tarea debe tener un justificativo económico. Si no tiene esta justificación, la decisión de
default inicial es mantenimiento no programado (Si esto ocurre, y las consecuencias
operativas son aun inaceptables, entonces la segunda decisión de default es nuevamente el
rediseño.)
Si una falla tiene consecuencias no operativas, solo vale la pena realizar una tarea proactiva,
si el costo de ésta sobre un determinado periodo de tiempo es menor, al costo de reparación
durante el mismo periodo. De modo que estas tareas también deben tener un justificativo
económico. Si no lo tuviera, la decisión va a ser nuevamente un mantenimiento no
programado, y si los costos de reparación fueran demasiado altos, la decisión de default
secundaria es nuevamente el rediseño.
Esto significa que las tareas proactivas, se especifican únicamente para las fallas que
inevitablemente lo requieran, lo que a su vez lleva a una reducción sustancial en la carga
laboral de rutina. Menos trabajo de rutina trae aparejado, que el resto de las tareas pueden ser
realizadas con mayor precisión. Esto, junto a la eliminación de tareas contraproducentes, lleva
a un mantenimiento más efectivo.
Comparen esto con el método tradicional del desarrollo de políticas de mantenimiento.
Tradicionalmente, los requerimientos de matenimiento de cada bien, se evalúan en relación a
sus características técnicas reales, sin considerar las consecuencias de las fallas. Los
programas resultantes son aplicables para todos los bienes que poseen características
similares, nuevamente sin considerar que las consecuencias serán diferentes de acuerdo al
contexto operativo. Esto trae aparejado el desperdicio de un gran número de programas, no
porque estén equivocados, sino porque no logran sus objetivos.
Se debe tener también en cuenta que el proceso de RCM considera las necesidades de
mantenimiento de cada bien, antes de plantear la posible necesidad de un rediseño. Esto
sucede simplemente por el hecho de que el Ingeniero de mantenimiento que esta de turno hoy,
18
tiene que procurar el mantenimiento del equipo existente en su estado actual, no como podría
o debería encontrarse en el futuro.
1.4 Aplicación del proceso de RCM
Antes de establecer y analizar los requisitos de mantenimiento de cualquier organización,
necesitamos conocer sus bienes, y decidir cuales de ellos serán los sometidos al proceso de
revisión de RCM. Esto significa que se debe preparar un registro de la planta si es que no
hubiere uno. En realidad la gran mayoría de las organizaciones industriales hoy en día poseen
registros de plantas, que se adecuan a este propósito, este manual solo abarca uno de los
atributos mas deseados de este registro en el apéndice 1.
Planificación
Si se aplica correctamente, el RCM brinda mejoras remarcables en la efectividad del
mantenimiento, y generalmente lo logra a una velocidad sorprendente. Sin embargo la
aplicación exitosa de RCM depende de una preparación y planificación meticulosas. Los
elementos claves para este proceso de planificación son:
* Decidir que bienes son lo que obtendrán un mayor beneficio del proceso de RCM, y como
exactamente se verán beneficiados.
* Evaluar los recursos necesarios para aplicar el proceso a los bienes seleccionados.
*En los casos donde los posibles beneficios justifican la inversión, decidir detalladamente
quién llevara a cabo el proceso y quién auditara cada análisis, dónde y cómo, y hacer todos
los arreglos para que reciban el entrenamiento necesario.
* Asegurar que el contexto operativo del bien, se entiende con claridad.
Grupos de revisión
Vimos anteriormente como el proceso de RCM da forma a 7 preguntas básicas. En la práctica,
el personal de mantenimiento, simplemente no puede responder todas esas preguntas por si
solos. Esto es porque muchas de las respuestas solo pueden ser provistas por personal de
operación o producción. Esto se aplica especialmente a preguntas con respecto a funciones,
desempeño deseado, efectos y consecuencias de las fallas.
Por esta razón se debe realizar una revisión de los requisitos de mantenimiento, esto debe ser
realizado por grupos pequeños, que incluyan al menos una persona responsable de
mantenimiento y una persona de la función operativa. La categoría de los miembros del grupo
es menos importante que el real conocimiento que posean de cómo funciona el equipo. Cada
miembro debe además haber sido capacitado en RCM. En el Grafico 1.6 se puede observar la
organización de un grupo típico de revisión:
El trabajo en equipo no solamente permite a los gerentes conocer y absorber la experiencia de
cada miembro en una base sistemática, sino que aporta a cada uno un entendimiento mucho
mas completo del funcionamiento del bien en su contexto operativo.
19
Facilitador
Supervisor de
Operaciones
Supervisor de Ingeniería
Responsable de Trabajado
Manual
Operador
Especialista Externo ( si fuera necesario)
(Tecnico o de Proceso)
Grafico 1.6 Un grupo Tipo de revisión de RCM.
Facilitadores:
Los grupos de revisión de RCM trabajan bajo la guía de especialistas altamente capacitados,
conocidos como facilitadotes. Los facilitadotes son las personas más importantes en el
proceso de RCM, su rol es garantizar que:
* El análisis de RCM se lleva a cabo al nivel correcto, que los límites del sistema están
claramente definidos, que los ítems de importancia no son pasados por alto, y que los
resultados del análisis son registrados apropiadamente.
* Que todos los miembros del grupo comprenden y aplican correctamente el proceso de RCM.
* El grupo concuerda en general de un modo convincente, mientras se retiene el entusiasmo y
compromiso individual de los miembros.
*El análisis progresa con una rapidez razonable, y termina a tiempo.
Los Facilitadotes trabajan a menudo con los jefes de proyecto de RCM o con los sponsors,
para asegurar que cada análisis es planeado correctamente y goza del manejo y apoyo
logístico necesario.
Tanto los facilitadores como los grupos de revisión de RCM se discuten mas detalladamente
en el capitulo 13.
Resultados del análisis de RCM
Si es aplicado del modo sugerido anteriormente, el análisis de RCM aporta tres resultados
tangibles:
* Rutinas de mantenimiento a seguir por el sector competente.
* Procedimientos operativos seguros para los operadores del bien.
*Una lista de áreas donde deban realizarse cambios, ya sean de diseño o del modo operativo,
para revertir las situaciones en las que no se están logrando los niveles productivos deseados
con la configuración actual.
20
Dos resultados menos tangibles son los conocimientos que los participantes adquieren y el
hecho en mejoran sus técnicas de trabajo en equipo.
Auditorías e implementación.
Inmediatamente después de haber concluido la revisión de cada bien, los managers senior, con
responsabilidad superior en el área deben estar satisfechos de que las decisiones tomadas por
el grupo son sensibles y defendibles.
Después de que se aprueba cada revisión, las recomendaciones se implementan incorporando
rutinas de mantenimiento en las planificaciones y sistemas de control, cambios en los
procedimientos operativos del bien, y proveyendo recomendaciones de modificaciones de
diseño a las autoridades del sector correspondiente. En el capitulo 11 discutiremos aspectos
claves para auditoria e implementación.
1.5 Que logra el RCM.
Los resultados descriptos anteriormente, deberían ser solo considerados como los medios para
un fin. Específicamente, estos deberían permitir que las funciones de mantenimiento
completen todas las expectativas detalladas en el grafico 1.1 al comienzo de este capitulo.
Cómo lo realizan se resume en los siguientes párrafos, y se discuten nuevamente, en mayor
detalle en el capitulo 14.
* Mayor seguridad e integridad medioambiental.: el RCM considera las implicaciones
medioambientales y de seguridad de cada falla, antes de considerar sus efectos en las
operaciones. Esto significa que se siguen determinados pasos para minimizar los riesgos
ambientales, y la seguridad relativa a los equipos, de no lograrse eliminarlos por completo. Al
integrar el aspecto seguridad en la corriente de toma de decisiones de mantenimiento, RCM
también logra mejorar las actitudes en este punto.
* Desempeño operativo optimizado: (rendimientos, calidad y servicio al cliente): RCM
reconoce que todo tipo de mantenimiento es valedero, y proporciona reglas para decidir cual
es el más aplicable en cada situación. De este modo, asegura que se escogen los métodos mas
apropiados de mantenimiento para cada bien en particular, y que se llevan a cabo las acciones
necesarias en los casos en los que el mantenimiento no pueda ser de ayuda. Este esfuerzo de
mantenimiento que presenta un enfoque mas centrado conduce a una mejora productiva de los
bienes existentes donde se la requiere.
RCM fue desarrollado para ayudar a las aerolíneas a diseñar un programa de mantenimiento
para nuevas aeronaves antes de que entren en servicio. Como resultado, demostró ser un
sistema ideal para desarrollar programas para nuevos bienes, especialmente equipos
complejos de los cuales no se posee información histórica. Esto ahorra gran parte del sistema
de prueba y error, tan utilizado en los programas de mantenimiento; - la prueba, que implica
frustración y consumo de tiempo, y error, que puede ser sumamente costoso.
* Mejor relación costo-efectividad: RCM enfoca la atención continuamente en las actividades
de mantenimiento que producen en mayor efecto en el desempeño de la planta. De este modo
se asegura que lo invertido en mantenimiento, se utilizo de la manera prioritaria.
Lo que es mas, si RCM se aplica correctamente a los sistemas de mantenimiento existentes,
disminuye la cantidad de trabajo de rutina (en otras palabras, las tareas de mantenimiento se
llevaran a cabo en una base cíclica) destinando en cada periodo, generalmente entre el 40% y
21
el 70%. Si RCM es utilizado para desarrollar un nuevo programa de mantenimiento, la carga
de trabajo es sumamente menor que si dicho programa se basa en cualquier otro método.
* Mayor vida útil en equipos de costos elevados: debido al énfasis centrado el uso de
técnicas de manutención en condición.
* Un banco de datos comprensible: Todo reporte de RCM termina con un registro completo
y totalmente documentado de los requisitos de mantenimiento de todos los bienes
significativos utilizados por la organización.
Esto hace posible adaptarse a circunstancias cambiantes (como ser rotaciones o nueva
tecnología) sin tener que reconsiderar todas las políticas de mantenimiento desde la base. Esto
también permite a los operadores, demostrar que sus programas de mantenimiento están
basados en fundamentos racionales (las auditorias son requeridas por cada vez mas entes
reguladores). Finalmente la información almacenada en las planillas de RCM reducen los
efectos de la rotación de personal, que trae aparejada una pérdida de experiencia.
También provee una visión mucho mas clara de las herramientas requeridas para el
mantenimiento de cada bien, y para decidir sobre los repuestos que deben conservarse en
stock. Un producto derivado de gran valor son también los gráficos y manuales mejorados.
* Mejoras en la motivación individual: especialmente de las personas involucradas en las
revisiones. Esto lleva un entendimiento mucho mas claro del equipo en su contexto operativo,
conjuntamente con una mayor propiedad de los problemas de mantenimiento y sus
soluciones. También significa que estas soluciones tenderán a una mayor duración.
* Mejora en el trabajo en equipo: RCM provee un lenguaje perfectamente entendible para
toda persona involucrada con mantenimiento. Esto da a los operadores y personal de
mantenimiento un claro entendimiento de que se puede o no realizar para mejorar el
desempeño.
Todas estas características, forman parte de la corriente principal de la administración de
mantenimiento, y muchas son actualmente el objetivo de programas mejorados. Una de las
ventajas principales de RCM es que provee una estructura efectiva de seguimiento paso a
paso, para abarcar a todas al mismo tiempo, y para hacer participes a toda aquella persona que
tenga que ver con el equipo durante el proceso.
RCM otorga resultados inmediatamente. En realidad si son enfocados y aplicados
correctamente, RCM cubre sus propios gastos en cuestión de unos meses o hasta de unas
semanas, como se discute en el capitulo 14. La revisión transforma tanto la percepción que la
organización tiene de los requisitos de mantenimiento de un determinado equipo, como
también la percepción general que se tiene de los programas de mantenimiento. Los
resultados son una mejor relación costo- efectividad, mayor armonía, y un mantenimiento
mucho mas exitoso.
22
2- Funciones
La mayoría de los ingenieros se inclinan a esta profesión porque sienten cierta afinidad con
sistemas, ya sean mecánicos, eléctricos o estructurales. Esta afinidad los lleva a sentir placer
cuando los bienes están en buen estado, y a sentirse ofendidos en el caso de que se encuentren
en situaciones desfavorables.
Estos reflejos siempre estuvieron en el corazón del mantenimiento preventivo. Dieron
nacimiento a conceptos como el de “cuidado de equipos”, que como el nombre implica, busca
el cuidado de lo bienes por si mismos. También llevaron a algunos estrategas de
mantenimiento a creer que solo se trata de preservar la confiabilidad o capacidad inherente de
todo bien.
En realidad, esto no es así.
A medida que tenemos un entendimiento mas profundo del rol de los bienes en las empresas,
empezamos a apreciar el hecho de que todo bien es puesto en funcionamiento porque hay
alguien que requiere que este cumpla una función. De esto surge que cuando mantenemos un
bien, este debe conservar un estado tal que siga cumpliendo sus funciones del modo en que lo
requiere el usuario. Mas adelante en este capitulo, veremos que este estado- que los usuarios
desean- difiere totalmente de la capacidad inherente del bien.
Este énfasis, puesto más en lo que el bien hace que en lo que el bien es, provee un modo
totalmente nuevo de definir los objetivos de mantenimiento de cualquier bien; uno que se
enfoca en lo que el usuario quiere. Este es el punto mas destacable de RCM, y es el porque
muchas personas se refieren a RCM como “TQM aplicado a bienes físicos.”
Para definir los objetivos de mantenimiento en términos de requerimientos del usuario,
debemos tener un entendimiento sumamente claro de las funciones de cada bien, junto con los
estándares de desempeño. Es por eso que el proceso de RCM comienza preguntando:
* ¿Cuales son las funciones y los estándares de desempeño del bien en su contexto
operativo actual?
Este capitulo analiza esta pregunta en mayor detalle. Describe como se deben definir las
funciones, explora los dos tipos principales de normas desempeño, revisa diversas categorías
de funciones y muestra como deben alistarse.
2.1 Descripción de funciones.
Está claramente establecido en los principios de ingeniería, que la descripción de una función
debe consistir de un verbo y un objeto. Es también muy útil, comenzar esa descripción con la
palabra “para” (“para bombear agua” “para transportar personas”, etc.).
Sin embargo, como explicamos mas extensamente en la parte siguiente de este capitulo, los
usuarios, no solo esperan que el bien cumpla una función. También esperan que lo haga a un
nivel de desempeño aceptable. De modo que la definición de una función, y por lo tanto, la
definición de los objetivos de mantenimiento de un bien, no es completa, a menos que
especifique con la mayor precisión posible, el nivel de desempeño deseado por el usuario
(diferenciándolo de la capacidad inherente del bien).
* Por ejemplo, la función primaria de la bomba en el grafico 2.1 se detallaría como: “impulsar
agua desde el tanque X al tanque Y a no menos de 800 litros por minuto”.
23
Este ejemplo muestra que la descripción completa de una función, consiste de un verbo, un
objeto, y el nivel de desempeño deseado por el usuario.
La enunciación de una función debe consistir de un verbo, un objeto, y el nivel de
desempeño deseado.
2.2 Criterios de Desempeño
El objetivo de mantenimiento es que los bienes continúen cumpliendo sus funciones del modo
en que lo requieren sus usuarios. El grado en que cualquier usuario pretende que un bien
funcione, puede ser definido por un criterio mínimo de desempeño. Si pudiéramos fabricar un
bien que lograra ese mínimo nivel de desempeño sin deteriorarse para nada, ese seria el fin del
problema. El equipo podría trabajar continuamente sin necesidad de mantenimiento.
Sin embargo en el mundo real, las cosas no son tan simples.
Las leyes físicas nos dicen que cualquier sistema organizado, que se expone al mundo real,
sufrirá deterioro. El resultado final de este deterioro es una desorganización total (también
conocida como caos o entropía), a menos que se tomen los recaudos necesarios para detener
la causa del deterioro del sistema.
Por ejemplo, la bomba en la figura 2.1 esta impulsando agua a un tanque desde donde el agua
es extraída a un promedio de 800 litros por minuto. Un proceso que causa el deterioro de la
bomba (modo de falla) es el uso del propulsor. Esto pasa tanto si esta impulsando acido, como
aceite lubricante, y sin importar si el impulsor esta hecho de titanio o de acero suave. La única
pregunta es que tan rápido se desgastara hasta el punto en el que ya no pueda enviar 800 litros
por minuto.
Entonces, si el deterioro es inevitable, este debe ser tenido en cuenta. Esto significa que
cuando cualquier bien se ponga en funcionamiento, debe ser capaz de producir aun más que el
nivel mínimo de desempeño deseado por el usuario. Lo que el bien es capaz de producir, se
conoce como capacidad inicial (o garantía inherente). El grafico 2.2 ilustra la relación exacta
entre esta capacidad y el desempeño deseado.
La bomba puede
entregar hasta 1000
litros de agua por
minuto
X
Y
Salida del tanque:
800 litros por minuto
Grafico 2.1
Capacidad inicial vs. Desempeño deseado.
24
Capacidad inicial (lo que
puede hacer)
R
E
N
D
I
M
I
E
N
T
O
Margen para
deteriorizacion
Rendimiento deseado (lo
que sus usuarios quieren
que haga)
Grafico 2.2
Teniendo en cuenta el deterioro.
Por ejemplo, para poder asegurar que la bomba del grafico cumple con el nivel de desempeño
deseado, y tener en cuenta el deterioro, los diseñadores del sistema deben especificar una
bomba que posea una capacidad inherente mayor a 800 litros por minuto, en el ejemplo, la
capacidad inicial es de 100 litros por minuto.
Esto significa que el desempeño puede ser definido de dos maneras distintas:
* Desempeño deseado (el funcionamiento que el usuario requiere)
* Capacidad inherente (lo que puede hacer).
Los capítulos siguientes, contemplan como el mantenimiento ayuda a garantizar que los
bienes cumplan con las funciones esperadas, ya sea asegurando que su capacidad permanece
por encima del los requerimientos mínimos del usuario, o restaurándolo hasta alcanzar la
capacidad inicial, si esta ha disminuido. Cuando consideramos la reparación, tengan en cuenta
que:
* La capacidad inicial de cualquier bien esta establecida por el diseño y la fabricación inicial.
* El mantenimiento puede solamente restaurar el bien, recuperando su capacidad inicial, pero
no superarla.
En la práctica, la mayoría de los bienes, son diseñados y fabricados adecuadamente, de modo
que es posible desarrollar programas de mantenimiento que aseguren que estos bienes
continúen cumpliendo con las funciones requeridas.
Capacidad inicial (lo que puede hacer)
R
e
n
d
i
m
i
e
n
t
o
Mantenimiento no
puede elevar la
capacidad de este
bien, por encima de este nivel
El objetivo de
Mantenimiento es
garantizar que la
capacidad se
mantenga por
encima de este
nivel
Por lo tanto
Mantenimiento
alcanza sus objetivos al mantener
la capacidad de
sus bienes
Rendimiento deseado (lo que los usuarios quieren que
haga)
25
Grafico 2.3 Un bien conservable.
En resumen, tales bienes son conservables., como se muestra en el grafico 2.3.
Por otro lado, si el desempeño deseado excede la capacidad inicial, no habrá mantenimiento
capaz de lograr que se cumplan las expectativas. Es decir, esos bienes son no conservables.
Como lo muestra la figura 2.4
Por ejemplo, si la bomba que se muestra en la figura 2.1 tiene una capacidad inicial de 250
litros/ min., no podrá mantener el tanque lleno. Al no existir un programa de mantenimiento
que fabrique bombas mayores, no se podrá proveer el funcionamiento deseado en este
contexto. De igual manera, si hacemos un habito de extraer 15 Kw. (que seria el desempeño
deseado) de un motor eléctrico de 10KW (capacidad inicial), el motor fallara constantemente,
y eventualmente se fundirá en forma prematura. No existe trabajo de mantenimiento que
pueda aumentar la capacidad de este motor. Puede estar diseñado correctamente, y
perfectamente fabricado, solo que no puede ejecutar al nivel deseado en el contexto en el que
se lo esta usando.
El objetivo de mantenimiento
es asegurar que la capacidad se
mantenga por encima de este
nivel
R
e
n
d
i
m
i
e
n
t
o
Rendimiento deseado
Capacidad inicial
Mantenimiento no puede
elevar la capacidad de este
bien por encima de este nivel,
por lo tanto no es reparable.
Grafico 2.4 Una situación fuera del alcance de mantenimiento.
De los ejemplos anteriores podemos sacar dos conclusiones:
* Para que cualquier bien sea susceptible de mantenimiento, el funcionamiento deseado, debe
estar cubierto por su capacidad inicial.
* Para determinar esto, no solo debemos conocer la capacidad inicial del bien, sino que
necesitamos conocer cual es el nivel de desempeño mínimo que el usuario puede aceptar en el
contexto en el que se este utilizando el equipo.
Esto resalta la importancia de identificar precisamente las pretensiones del usuario, antes de
desarrollar el programa de mantenimiento. Los párrafos siguientes exploran detalladamente
aspectos claves de estándares de desempeño:
Normas de desempeño cuantitativas:
Las normas de desempeño deben ser cuantificadas en la medida de lo posible, por que son
naturalmente más precisas que las reglas de calidad. Se debe tener especial cuidado para
evitar enunciados de calidad como ser “fabricar tantas piezas como lo requiera la
26
producción”, o “ir tan rápido como sea posible”. Los enunciados de este tipo no tienen sentido
alguno, solo hacen imposible determinar cuando el ítem esta fallando.
En realidad, puede ser extremadamente difícil determinar exactamente lo que se requiere,
pero el hecho de que sea difícil, no significa que no pueda o no deba realizarse. Un importante
usuario de RCM resumió este punto diciendo:
“Si los usuarios de un bien no pueden especificar precisamente que nivel de desempeño
necesitan, no pueden tampoco hacer responsable al sector de mantenimiento si ese
supuesto nivel no se sostiene”.
Estándares de calidad:
Mas allá de la necesidad de precisión, a veces es imposible determinar estándares de cantidad,
por lo que nos tenemos que remitir a los cualitativos.
Por ejemplo, la función primaria de la pintura es “que se vea estéticamente aceptable” (no
atractivo). Lo que se considera “aceptable” varia enormemente de persona a persona, por lo
tanto es imposible de cuantificar. Por lo tanto, el usuario y el personal de mantenimiento,
deben tener un entendimiento común de lo que significa “aceptable”, antes de establecer un
sistema para conservar esa “aceptabilidad”.
Estándares de desempeño absolutos.
Los enunciados que no mencionan para nada un estándar de desempeño generalmente
implican un absoluto.
Por ejemplo, el concepto de contención se asocia con prácticamente todos los sistemas
cerrados. Los enunciados referidos a contención, se redactan de la siguiente manera:
* Para contener X liquido.
La ausencia de un nivel de desempeño sugiere que el sistema debe contener todo el líquido. Y
que ningún derrame o goteo significara una falla. En los casos en que un sistema encerrado
pueda tolerar alguna perdida, la cantidad que puede ser tolerada debe estar detallada en el
enunciado como norma de desempeño.
Estándares de desempeño variables.
Las expectativas de desempeño (o esfuerzo aplicado) a veces varían entre dos extremos.
Consideren por ejemplo un camión utilizado para entregar mercadería surtidas a minoristas
urbanos. Asumimos que la carga real varia entre (digamos) 0 (vacío) y 5 toneladas; con un
promedio de 2,5 toneladas, y la distribución de cargas es como se muestra en el grafico 2.5.
Para tener en cuenta el deterioro, la capacidad inicial del camión debe ser mayor que la mayor
carga posible, que en este ejemplo seria 5 toneladas .El programa de mantenimiento en este
caso debe asegurar que la capacidad no baja de ese nivel, de ser así, las expectativas de
desempeño serán cumplidas en su totalidad.
27
6
5
Mantenimiento
debe asegurar que
la capacidad se
mantenga por
encima de este nivel
4
Capacidad
Inicial
Caso perdido
3
2
Carga
(toneladas) 1
Rendimiento
deseado
Malo
Minimo
0
Grafico 2.5 Estándares de desempeño variables.
Limites superior e inferior
En contraste con las expectativas variables de desempeño, algunos sistemas presentan
capacidad variable. Estos son sistemas que no pueden ser programados para funcionar a
exactamente el mismo nivel cada vez que operan.
Por ejemplo, una maquina amoladora que se utiliza para un cigüeñal, no producirá
exactamente el mismo diámetro terminado en cada chumacera. Los diámetros variaran,
aunque sea por un poco milésimo de milímetros. Del mismo modo, Una maquina llenadora,
en una fabrica de alimentos no llenara dos envases sucesivos con exactamente el mismo peso
de alimento. El peso variara, aunque sea por unos pocos miligramos.
El grafico 2.6 indica que las variaciones de capacidad de esta naturaleza, generalmente varían
en un medio. Para acomodar esta variabilidad, los niveles de desempeño deseados incorporan
un límite superior y un límite inferior.
Rendimiento deseado
----------
Limite de especificaciom supeior
Limite de control superior
CAPACIDAD ---
Rendimiento
deseado
Rendimiento deseado
Limite de especificación inferior
Por ejemplo, la función principal de una empacadora de caramelos podría ser:
* Empacar 250+1 g. de caramelos en sus bolsas a una velocidad mínima de 75 bolsas por
minuto.
28
(En la practica este tipo de variabilidad no es bien recibida por un numero de razones.
Idealmente, este proceso debería ser tan estable, que no provoque ningún tipo de variaciones,
y por lo tanto no haya necesidad de dos límites. En la persecución de este ideal, muchas
industrias están invirtiendo una gran cantidad de tiempo y energía en diseñar procesos que
varíen tan poco como sea posible. Sin embargo este aspecto de diseño y producción esta mas
allá del alcance de este libro. En este momento, estamos preocupados únicamente por la
variabilidad, desde el punto de vista del mantenimiento.
Que porcentaje de variabilidad puede ser tolerada específicamente en cada producto depende
generalmente de factores externos.
Por ejemplo, el límite inferior mínimo que puede ser tolerado en el diámetro de la caja de un
cigüeñal, depende de factores como ruido, vibración y durezas, y el límite superior por los
espacios necesarios para asegurar una buena lubricación. El límite inferior en el peso de una
bolsa de caramelos (relativo al peso publicado) depende generalmente de regulaciones
comerciales establecidas, mientras que el límite superior dependerá de la cantidad extra de
caramelos que la compañía este dispuesta a suministrar.
En casos como este, los límites de desempeño deseados se conocen como limites de
especificaciones superior e inferior. Los límites de capacidad, (generalmente definidos como
tres desviaciones estándar a cada lado de un medio) se conocen como los limites de control
superior e inferior. Las teorías de manejo de calidad sugieren que en procesos bien
administrados, la diferencia entre los límites de control debería representar la mitad de la
diferencia entre los límites de las especificaciones. Esta operación debería dejar un mas que
adecuado margen de deterioro, desde el punto de vista de mantenimiento.
Los limites inferior y superior, no solo conciernen a la calidad del producto. También se
aplican a otras especificaciones de funcionamiento tales como precisión de los manómetros
y la programación de sistemas de control y dispositivos de protección. Este tema se discute
extensamente en el capitulo 3.
2.3 EL CONTEXTO OPERATIVO.
En el capitulo 1, RCM fue definido como “un proceso utilizado para determinar los requisitos
de mantenimiento de cualquier bien físico en su contexto operativo. Este contexto invade todo
el proceso de formulación de estrategias de mantenimiento, comenzando con la definición de
funciones:
Por ejemplo, consideren una situación en la que se esta diseñando un programa de
mantenimiento para un camión utilizado para transportar materiales desde Startsville a
Endburg. Antes de que se puedan definir las funciones y niveles de desempeño asociados a
este vehiculo, las personas diseñando el programa tienen que asegurarse que realmente
entienden el contexto operativo.
Por ejemplo, ¿Cual es la distancia entre Startsville y Endburg? Sobre que tipos de rutas y que
tipos de terrenos? ¿Cuales son los típicos peores casos de mal tiempo o trafico de esta ruta?
Que tipo de carga lleva el camión? ( Frágil? Abrasivos? Corrosivos? Explosivos?) Que limites
de velocidad u otras regulaciones se aplican a esta ruta? Que estaciones de servicio existen
sobre este camino?
29
Las respuestas a estas preguntas nos llevaran a definir la función primaria de este vehiculo del
siguiente modo: “Para transportar hasta 40 toneladas de planchas de acero a una velocidad de
hasta 60 mph/ (promedio 45 mph) desde Startsville a Endburg con un tanque de combustible.”
El contexto operativo también influencia en profundidad los requisitos para funciones
secundarias. En el caso del camión, El clima puede demandar aire acondicionado, las
regulaciones pueden exigir iluminación especial, el aislamiento de Endburg puede significar
que deban llevarse a bordo todos los repuestos especiales, y así sucesivamente. El contexto no
solo afecta drásticamente el funcionamiento y las expectativas de desempeño, sino que
también afecta la naturaleza de los tipos de fallas que pueden ocurrir, sus efectos y
consecuencias, la frecuencia con la que suceden y que debe hacerse para manejarlas.
Por ejemplo, si consideramos nuevamente la bomba del grafico 2.1, Si se la moviera en una
ubicación donde bombea una emulsión medianamente abrasiva, a un tanque B, desde donde la
emulsión es extraída a proporción de 900 litros por minuto, la función primaria debería ser:
* Para bombear emulsión a 900 litros por minuto.
Este es un nivel de desempeño mayor que en el ejemplo anterior, de modo que el nivel de
mantenimiento necesario aumenta acordemente. Por que ahora esta bombeando emulsión en
lugar de agua, la naturaleza, frecuencia y severidad de las fallas también cambian. Como
consecuencia, a pesar de que la bomba no sufre ningún cambio, es muy probable que se
utilice un programa de mantenimiento totalmente distinto en el nuevo contexto.
Todo esto significa que cualquier empresa con intenciones de aplicar RCM a cualquier bien o
proceso, debe asegurarse de tener un claro entendimiento del contexto operativo antes de
comenzar. Algunos de los factores mas importantes que deben considerarse se discuten en los
capítulos siguientes.
Procesos por lotes y de flujo.
En las plantas de manufactura, la característica principal del contexto operativo es el tipo de
proceso. Varían desde operaciones de procesos de flujo, donde todas las maquinas están
interconectadas, a operaciones por lotes de donde la mayoría de las maquinas trabajan de
modo independiente.
En los procesos de flujo, la falla de un solo equipo, puede parar toda la planta o reducir el
rendimiento, a menos que haya una planta de emergencia. Por otro lado en plantas que
trabajan por lotes, las mayorías de las fallas solo reducen el rendimiento de una sola línea o
maquina. Las consecuencias de tales fallas, son determinadas principalmente por la duración
de la interrupción y la cantidad de trabajo en proceso esperando para seguir en operaciones
subsecuentes.
Estas diferencias implican que la estrategia de mantenimiento aplicadas a cualquier bien que
es parte del proceso de flujo podría ser radicalmente diferente de la estrategia aplicada a un
bien en un medio por lotes.
Redundancia
La presencia de redundancia- o medios de producción alternativos- es una característica del
contexto operativo que debe ser considerado en detalle al describir las funciones de cualquier
bien.
La importancia de la redundancia es ilustrada en tres bombas idénticas, que se muestran en el
grafico 2.7. La bomba B tiene un equipo de emergencia, mientras que la bomba A no.
30
Por si misma
Deber
A
B
Emergencia
C
Grafico 2.7 Diferentes contextos operativos.
Esto significa que la función primaria de la bomba A es transferir liquido de punto a otro, por
si mismo, y la de la bomba B es hacerlo en presencia de una bomba de emergencia. Esta
diferencia significa que los requisitos de mantenimiento de estas bombas serán diferentes, aun
cuando las bombas son diferentes.
Niveles de Calidad
Las normas de calidad y niveles de servicio al cliente son otros dos aspectos mas del contexto
operativo que pueden producir diferencias en las descripciones de las funciones de maquinas,
que de otra forma serian idénticas.
Por ejemplo, dos estaciones de fresado idénticas, en dos maquinas de trasbordo, pueden tener
la misma función básica- fresar una pieza. Sin embargo, la profundidad de corte, tiempo de
ciclo, tolerancia de chatura, y las especificaciones de la terminación de la superficie pueden
todas variar. Esto puede llevar a conclusiones bastantes diferentes sobre los requisitos de
mantenimiento.
Normas Medioambientales.
Un aspecto cada vez mas importante del contexto operativo de cualquier bien es el impacto
que tiene (o podría tener) en el medioambiente.
Este interés creciente a nivel mundial por todo lo relacionado al medioambiente significa que
cuando mantenemos cualquier bien, tenemos que satisfacer a dos “grupos” de usuarios. El
primero es el grupo de personas que opera el bien. El segundo es la sociedad como un grupo,
que quiere que tanto el bien, como el proceso del cual éste forma parte, no causen ningún tipo
de daño al medioambiente.
Lo que la sociedad espera, esta expresado en normas y regulaciones cada vez mas severas y
exigentes. Estas son normas internacionales, nacionales, regionales y hasta inclusive
regulaciones corporativas. Estas cubren un rango extraordinariamente amplio de asuntos,
desde la biodegrabililidad de detergentes, hasta el contenido de gases de escape. En el caso de
procesos, tienden a concentrarse en productos derivados indeseados líquidos, sólidos y
gaseosos.
La mayoría de las industrias están respondiendo a las expectativas medioambientales de la
sociedad asegurando que los equipos son diseñados en cumplimiento con las normas
asociadas. Sin embargo no es suficiente la simple afirmación de que una planta o proceso es
segura para el medioambiente al momento de ser comisionada. Se deben tomar recaudos para
asegurar que no es perjudicial a lo largo de toda su vida útil.
31
Seguir los procedimientos correctos se esta convirtiendo en una cuestión de urgencia, ya que
alrededor de todo el mundo, ocurren cada vez mas incidentes provocados porque un equipo no
estaba funcionando como corresponde, en otras palabras, porque algo fallo. Las penalidades
por esto son cada vez mayores, tanto así que preservar la integridad del medioambiente a tan
largo plazo es ahora un tema particularmente importante para los encargados de
mantenimiento.
Riesgos de Seguridad
Un numero creciente de organizaciones han desarrollado independiente un programa, o se han
subscripto a regulaciones formales sobre los niveles aceptables de riesgo. En algunos casos,
estos se aplican a nivel corporativo, en otros a determinados sectores y en los menos a
procesos y bienes en particular. Claramente, donde estas normas existen, forman una parte
importante del contexto operativo.
Turnos de trabajo.
La organización de turnos afectan claramente al contexto operativo, algunas plantas operan 8
horas al día, 5 días a la semana (y hasta menos en malas temporadas). Otras operan
continuamente durante 7 días a la semana, y algunas en un término medio entre estos dos
extremos.
En plantas que trabajan un solo turno, las perdidas de producción causadas por fallas, se
pueden recuperar generalmente con trabajo después de hora. Este trabajo a deshora, lleva a
un aumenta en los costos de producción, de modo que las estrategias de mantenimiento deben
ser evaluadas a la luz de esos costos.
Por otro lado, si un equipo esta trabajando 24 horas al día, siete días a la semana, es muy poco
probable recuperar el tiempo perdido, entonces el tiempo improductivo causa perdidas en las
ventas. Esto cuesta mucho más que las horas extras, de modo que vale la pena tratar con
mayor intensidad de prevenir las fallas bajo estas circunstancias. Sin embargo es también mas
difícil hacer que los equipos estén disponibles para mantenimiento en una planta totalmente
cargada, o sea que las estrategias de mantenimiento deben ser formuladas con especial
cuidado.
A medida que los productos se mueven dentro de su ciclo vital, o de que las condiciones
económicas cambian, las organizaciones pueden moverse desde un extremo de este espectro
hasta el otro con una rapidez sorprendente. Por esta razón, es sabio revisar las políticas de
mantenimiento cada vez que cambia este aspecto del sistema operativo.
Trabajo en proceso.
El trabajo en proceso hace referencia a cualquier material que todavía no ha seguido todos los
pasos del proceso de manufactura. Puede estar almacenado en tanques, en bins, tanques
alimentadores, en pallets, correas transportadoras o en almacenes especiales. Las
consecuencias de las fallas de cualquier maquina se ve totalmente influenciada por la cantidad
de este material acumulado en estas y las máquinas siguientes del proceso.
Consideren un ejemplo en el que el volumen de trabajo en espera es suficiente para mantener
a la siguiente maquina trabajando por seis horas, y que solo tomara 4 horas reparar la falla
existente. En este caso, la falla no afectara realmente el rendimiento final de la planta. Pero, si
lleva ocho horas repararla, podría afectar el rendimiento final, porque la siguiente operación
deberá ser interrumpida.
32
La severidad de estas consecuencias dependerán de:
* La cantidad de trabajo en proceso entre esa operación y la siguiente y así sucesivamente,
* El grado en que la operación en proceso es un cuello de botella, e otras palabras una
operación que dirige el rendimiento de la línea completa.
A pesar de que las interrupciones en planta significan dinero, también es un costo mantener
cantidades de trabajo en proceso. Hoy en día, los costos de retener stock son tan altos, que
reducirlos al mínimo posible, se convierte en una prioridad básica. Este el objetivo mayor de
los sistemas “a tiempo” y sus derivados.
Estos sistemas reducen el stock de trabajo en proceso, de modo que la amortiguación que los
stocks proveían contra esta falla está desapareciendo. Este es un circulo vicioso, porque
también se esta incrementando la presión en los departamentos de mantenimiento para reducir
fallas así evitar la necesidad de stocks.
De modo que desde el punto de vista del mantenimiento, debe hacerse un balance entre las
implicancias económicas de las fallas operativas, y:
* El costo de retener stocks de trabajo en proceso para así mitigar los efectos d esas fallas, o
* El costo de realizar tareas de mantenimiento proactivo con la visión de anticipar o prevenir
las fallas.
Para que este balance sea exitoso, este aspecto del contexto operativo debe ser entendido
claramente en las operaciones de manufactura.
Tiempo de reparación
Los tiempos de reparación son influenciados por la velocidad de respuesta hacia la falla, que
es una función de los sistemas de reporte de fallas y a nivel del personal, y la velocidad de
reparación en si misma, que depende en la disponibilidad de repuestos y herramientas
apropiadas y de la capacidad de la persona llevando a cabo la reparación.
Estos factores influencian notablemente los efectos y consecuencias de las fallas, y varían
ampliamente de una organización a otra. Como resultado, este aspecto del contexto operativo
también necesita ser entendido con claridad.
Repuestos
Es posible utilizar un derivado del proceso RCM para mejorar los stocks de repuestos, y las
políticas de manejo de fallas relacionadas. Este derivado se basa en el hecho de que la única
razón para tener un stock de repuestos, es evitar o reducir las consecuencias de las fallas. La
relación entre repuestos y las consecuencias de la fallas radica en el tiempo que se necesita
para conseguir dichos repuestos de los proveedores. Si esto fuera instantáneo, no habría
necesidad de tener stock de repuestos. Pero en el mundo real, es un proceso que demanda
tiempo. Esto se conoce como tiempo de reparación, y va desde unos pocos minutos, hasta
varios meses o años. Si el repuesto no esta en stock, este tiempo es el que dicta cuanto llevara
reparar la falla, y por lo tanto la severidad de sus consecuencias. Por otro lado mantener
repuestos en stock tiene un costo, de modo que debe hacerse un balance en cada caso, entre el
costo de tener un repuesto en stock, y el costo total de no tenerlo. En algunos casos también
debe tenerse en cuenta el peso y/o dimensiones de los repuestos, por la carga y restricciones
de espacio, especialmente en sitios como plataformas de petróleo y en barcos.
33
Este proceso de mejora del sistema de repuestos va más allá del alcance de este libro. Sin
embargo al aplicar RCM a una planta existente, tenemos que empezar en algún punto. En la
mayoría de los casos, la mejor manera de administrar los repuestos es la siguiente:
* Utilice RCM para desarrollar una estrategia de mantenimiento basada el la política existente
de tenencia de repuestos.
* Revise las fallas relacionadas con repuestos claves, basándose en las excepciones,
estableciendo que impacto, (si lo hubiere) tendría un cambio en la política actual de stock de
repuestos en la estrategia de mantenimiento inicial, y luego escogiendo la estrategia de
mantenimiento y stock de repuestos que tenga una mejor relación costo- efectividad.
Si se adopta esta modalidad, la política de administración de repuestos existente, puede ser
considerada parte del contexto operativo inicial.
Demanda del mercado.
El contexto operativo a veces presenta variaciones cíclicas en demanda por los productos o
servicios provistos por la organización.
Por ejemplo, las compañías de venta de refrescos tienen mas demanda de sus productos en
verano que en invierno, mientras que las compañías de transporte urbano, experimentan la
máxima demanda en las horas pico.
En casos como estos, las consecuencias operativas de las fallas son mucho mas serias en las
épocas de gran demanda, de modo que en este tipo de industrias, este aspecto del contexto
operativo necesita ser entendido especialmente, cuando se definan las funciones y se evalúen
las consecuencias de las fallas.
Provisión de materia prima
A veces el contexto operativo se ve influenciado por fluctuaciones cíclicas en la provisión de
materia prima. Los fabricantes de alimentos experimentan a menudo periodos de actividad
intensa durante la cosecha y prácticamente están inactivos en otras épocas. Esto se aplica
especialmente a procesadores de fruta y molinos de azúcar. Durante los periodos pico, las
fallas operativas no afectan solo el rendimiento, sino que también pueden llevar a la perdida
de grandes cantidades de materia prima, si estas no pueden ser procesadas antes de que se
deterioren.
Documentar el contexto operativo.
Por todas las razones antes mencionadas, es esencial asegurar que toda persona involucrada
en el desarrollo de un programa de mantenimiento para cualquier bien, entienda totalmente el
contexto operativo de ese bien. El mejor modo de hacerlo es documentando el contexto
operativo, si fuera necesario incluyendo el enunciado general de la misión de la organización,
como parte del proceso de RCM.
El grafico 2.8 en la pagina siguiente muestra un enunciado operativo hipotético para la
maquina amoladora mencionada anteriormente. El cigüeñal es usado en un tipo de motor
utilizado para el auto X.
Grafico 2.8 Reporte del contexto operativo.
34
Fabricar Auto Modelo X: (Activo correspondiente: División de autos modelo X)
La división Modelo X emplea 4.000 personas para producir 220.000 autos este año. Los
pronósticos de venta indican que esto podría aumentar a 320.000 por año en tres años.
Ocupamos ahora el puesto 19 en los ranking de satisfacción al cliente, con intenciones de
ocupar el puesto 15 el año entrante y el 10 para el siguiente. El objetivo de daños por perdida
de tiempo es una cada 500.000 horas pagadas. La probabilidad de una fatalidad en cualquier
sector de la división debe ser menor a 1 cada 50 años. Este departamento procura cumplir con
todas las reglas medioambientales.
Fabricar Motores: (Activo correspondiente: Planta de motores Motown.)
La Planta Motown produce todos los motores para el modelo X de autos. 140.000 motores
tipo 1 y 80.000 motores tipo 2 se producen cada año. Para poder alcanzar los objetivos de
satisfacción de calidad para el vehiculo completo, los reclamos de garantía de motores
deberían reducirse del actual promedio de 20 cada 1.000, a 5 cada 1.000.La planta sufrió tres
consecuencias medioambientales que se informaron durante el año pasado, el objetivo es no
mas de 1 en los próximos 3 años. La planta cierra dos semanas al año, para permitir a los
empleados de producción tomar sus vacaciones correspondientes.
Fabricar motores tipo 2 (Activo correspondiente: Línea de Motores Tipo 2)
La línea de motores tipo 2 trabaja actualmente 110 hors por semana. (2 turno de 10 horas 5
días a la semana, y un turno de 0 horas los sábados). La línea de montaje podría producir
140.000 motores por año en esas horas, si trabajara continuamente sin presentar fallas, pero la
salida general de motores esta limitada por la velocidad de la línea de fabricación de cigüeñal.
La compañía quisiera que se realicen todas las tareas de mantenimiento posibles durante las
horas normales sin interferir con la producción.
Cigüeñales de la maquina (Activo correspondiente: fresado de cigüeñales tipo2)
La línea de cigüeñal consiste en 25 operaciones, y es numeralmente capaz de producir 20
cigüeñales por hora (2200 a la semana, 110.000 en 50 semanas al año. Actualmente tiene
algunas fallas para producir los 16.000 requeridos por semana normalmente. Cuando esto
sucede la línea tiene que trabajar horas extras a un costo adicional de $ 800 por hora.
(Teniendo en cuenta que gran parte del crecimiento esta pronosticado para los motores tipo 2,
las interrupciones en esta línea podrían provocar la perdida de ventas de autos modelo X, a
menos que se mejore el desempeño.) No debería haber cigüeñales almacenados entre el final
de la línea de producción y la línea de montaje del motor, pero las operaciones reservan un
pallet con cerca de 60 cigüeñales, para proveer algún “seguro” contra las interrupciones. Esto
permite a la línea de producción de cigüeñales, detenerse hasta 3 horas, sin suspender los
montajes. Los defectos de fresado de cigüeñal no ha generado ningún reclamo de garantía,
pero el promedio de desecho es del 4%, el objetivo inicial es que sea de 1,5%.
Terminar de amolar el cigüeñal, muñonera y caja de engrase:( Activo correspondiente:
maquina amoladora Ajax Mark 5)
La maquina amoladora esmerila 5 muñones principales y 4 de cabezas de la biela. Esta es la
operación cuello de botella en la línea del cigüeñal, el tiempo de ciclo es 3.0 min. El diámetro
terminado de los muñones principales es 75mm+0.1mm, y de las cabeza de biela
53mm+0.1mm. Ambos muñones tienen una superficie de Ra0.2. La rueda rectificadora se
reacondiciona en cada ciclo, un proceso que lleva 0.3 min., en u ciclo de 3.0 minutos. Las
ruedas deben ser reemplazadas luego de 3.500 cigüeñales, y el reemplazo implica 1.8 horas.
Hay generalmente mas de 10 cigüeñales en la cinta transportadora entre esta maquina y la
siguiente operación, de modo que una interrupción de 25 minutos puede ser tolerada sin
35
afectar la continuidad del proceso. El total de stock en esta línea, significa que esta maquina
puede detenerse por 45 minutos antes de que la línea pare en totalidad. La terminación de
esmerilado contribuye al 0.4% del promedio total de desecho.
La jerarquía comienza con la división de la corporación que produce este modelo, pero podría
moverse a un nivel mayor hasta incluir a toda la corporación. Tenga en cuenta también que un
enunciado de contexto debería incluir a todos los bienes debajo de esa jerarquía, no solo al
que esta bajo revisión.
Las descripciones de contexto a un nivel mayor de esta jerarquía, son simplemente
enunciados amplios de funciones. Los niveles de desempeño en mayor grado, cuantifican las
expectativas desde el punto de vista del negocio en general. A niveles más bajos, los niveles
de producción se van haciendo más específicos hasta que se alcanza el bien revisado en
particular. Las funciones primaria y secundaria del bien, son definidas y descriptas en el resto
de este capitulo.
2.4 Diferentes tipos de funciones.
Todo bien físico tiene más de una, a veces varias, funciones. Si el objetivo de mantenimiento
es asegurar que el bien puede continuar cumpliendo con estas funciones, entonces todas ellas
deben ser identificadas en forma conjunta con los respectivos niveles de desempeño deseados.
A primera vista, este puede parecer un ejercicio bastante fácil de seguir. Sin embargo en la
práctica, generalmente tiende a ser el aspecto más desafiante y el que más tiempo consume en
el proceso de formulación de estrategias de mantenimiento.
Esto es especialmente cierto en plantas de mayor antigüedad. El producto cambia, La
configuración de la planta cambia, las personas cambian, la tecnología se modifica y también
lo hacen las expectativas de producción- pero aun encontramos bienes en servicio que están
allí desde que la planta se construyo. Definir precisamente que función se supone que estos
bienes cumplan ahora, requiere el trabajo conjunto de usuarios y personal de mantenimiento.
Es también una experiencia de aprendizaje intensa para todos los involucrados.
Las funciones se dividen en dos categorías principales (función primaria y secundaria) y luego
subdivididas en varias subcategorías. Estas categorías se detallan en las páginas siguientes
comenzando por Funciones Primarias.
Funciones primarias:
Las organizaciones adquieren bienes físicos por una, a veces dos, y raramente más de tres
razones principales. Estas “razones” son definidas por enunciados apropiados. Al ser las
razones principales por las cuales el bien fue adquirido, se las conoce como funciones
primarias. Son el único motivo por el que el bien existe, por lo tanto se debe tener especial
cuidado para definirlas con precisión.
Las funciones primarias son generalmente fáciles de reconocer. En realidad el nombre de la
mayoría de los bienes industriales esta basado en sus funciones primarias. Por ejemplo, la
función primaria de una maquina empacadora, es empacar, De una aplanadora, aplanar algo y
así sucesivamente.
Como se menciona anteriormente, el desafío real yace en definir las expectativas actuales de
desempeño asociadas con estas funciones. Para la mayoría de los equipos, estos niveles de
desempeño involucran velocidad, volumen y capacidad de almacenamiento. La calidad del
producto también debe ser considerada en esta etapa.
36
El capitulo 1 menciona que nuestra capacidad para alcanzar y mantener niveles de calidad
satisfactorios depende en forma creciente de la capacidad y condición de los bienes que
elaboran el producto. Estos niveles se asocian generalmente con las funciones primarias.
Como consecuencia, se debe tener cuidado en incorporar los criterios de calidad en la
redacción de funciones primarias en todos los casos donde esto sea relevante. Esto incluye
dimensiones para operaciones de ajuste, formación o montaje, normativa de pureza en
alimentos, productos químicos y farmacéuticos; dureza en el caso de tratamiento con calor,
niveles de llenado o peso para los empaques, y así sucesivamente.
Diagramas de conjuntos funcionales:
Si un bien es muy complejo, o si no se entiende en profundidad la interacción entre diferentes
sistemas, es a veces útil clarificar el contexto operativo organizando diagramas de conjuntos
funcionales. Estos son diagramas simples, mostrando todas las funciones primarias de una
empresa a un nivel dado. Se discuten con mayor detalle en el apéndice 1.
Funciones primarias independientes múltiples:
Un bien puede tener más de una función primaria. Por ejemplo, el mismo nombre de un cazabombardero militar sugiere que tiene dos funciones primarias. En este caso ambas deben ser
mencionadas en la especificación de funciones.
Una situación similar se encentra a menuda en manufacturas, donde el mismo bien puede ser
utilizado para cumplir diferentes funciones en distintas etapas. Por ejemplo un vaso reactor en
una planta química puede ser utilizado en diferentes momentos para reflujo (hervir
constantemente) tres productos diferentes, bajo tres condiciones distintas:
Producto
Presión
Temperatura
Tamaño de dosis
1
2 baras
180 C
500 litros
2
10 baras
120 C
600 litros
3
6 baras
140 C
750 litros
(Se podría decir que este vaso no esta desempeñando tres funciones distinta, sino la misma a
tres distintos niveles. En realidad esta distinción carece de importancia por arribamos a la
misma conclusión de todas maneras.)
En casos como este, podríamos realizar un enunciado de función diferente para cada producto.
Esto llevaría lógicamente a tres programas de mantenimiento separados para el mismo equipo.
Esto es realizable, y hasta deseable, si cada equipo trabaja en forma continúa por periodos
extensos.
Sin embargo, si el intervalo entre las tareas de mantenimiento a largo plazo, es mayor que los
intervalos de cambio de tarea, entonces seria impractico cambiar de tarea cada vez que el
equipo es preparado para un producto diferente.
Un modo de solucionarlo es combinar los niveles de la peor situación posible asociados a
cada producto en enunciados de una sola función.
En el ejemplo de arriba, un enunciado combinado podría ser: “para reflujo de hasta 750 litros
de producto a temperaturas de hasta 180C a una presión de hasta 10 baras.”
Esto llevara a un programa de mantenimiento que puede resultar en un sobremantenimiento
en algunas ocasiones, pero que asegurara que el bien responderá efectivamente hasta las
situaciones de máxima exigencia.
37
Funciones primarias seriales o dependientes:
A menudo encontramos equipos que deben realizar dos o más funciones primarias en series.
Estas se conocen como funciones seriales.
Por ejemplo: Las funciones primarias de una maquina en una fábrica de alimentos puede ser
“llenar 300 latas por minuto”, y luego “sellar 300 latas por minuto”
La diferencia entre funciones primarias múltiples, y funciones primarias seriales, es que en el
primer caso, cada función puede ser desarrollada independientemente de la otra, mientras que
el ultimo, una debe ser realizada antes que la otra. En otras palabras, en la maquina
enlatadora, las latas deben ser llenadas primero, y luego selladas.
Funciones secundarias:
Se espera que la mayoría de los bienes sean útiles para una o mas funciones adicionales,
además de su función primaria. Estas son conocidas como funciones secundarias.
Por ejemplo, la función primaria de un automotor pude ser descripta de la siguiente manera:
* Para transportar hasta 5 personas a una velocidad de 90 m/h a través de rutas construidas.
Si esta fuera la única función del vehiculo, entonces el único objetivo del programa de
mantenimiento seria preservar su habilidad para transportar 5 personas a una velocidad de 90
m/h. Pero, esto es solo una parte de la historia, porque la mayoría de los propietarios de autos
esperan mucho más de sus vehículos, desde la capacidad para transportar equipaje, hasta que
posea un indicador de cuanto combustible tiene en el tanque.
Para ayudarnos a asegurar que ninguna de estas funciones son pasadas por alto, se dividen en
las siguientes 7 categorías:
* Integridad medioambiental.
* Integridad estructura/seguridad
* Control/ contención/ confort
* Estética
* Protección
*economía/ eficiencia
* Funciones superfluas.
A pesar de ser generalmente menos obvias que las funciones primarias, la pérdida de
funciones secundarias puede también traer serias consecuencias- a veces mas serias que la
pérdida de una función primaria. Como resultado, las funciones secundarias necesitan tanto o
mas mantenimiento que las primarias, de modo que también deben ser claramente
identificadas. Las páginas siguientes exploran las características principales de estas funciones
en mayor detalle.
Integridad medioambiental.
La parte 2 de este capitulo explico como las expectativas medioambientales de la sociedad se
han convertido en un punto critico del contexto operativo de cualquier bien. RCM comienza
el proceso de cumplimiento de las normas relacionadas, incorporándolas en los enunciados de
funcionamiento.
Por ejemplo, la función de un escape automotor, o de una chimenea fabril puede ser “contener
no mas que X microgramos de un químico especifico por metro cúbico.”El sistema de escape
de un auto puede también estar sujeto a normativas medioambientales referidas al ruido, y la
38
especificación correcta debería ser “para emitir no mas de X dB medidos a una distancia Y
por debajo de la salida del escape.”
Seguridad
La mayoría de los usuarios quieren estar razonablemente seguros de que sus bienes no les
ocasionaran daños o muerte. En la práctica, la mayoría de los riesgos de seguridad emergen en
el proceso de RCM como fallas. Sin embargo en algunos casos es necesario redactar en
enunciados funcionales las amenazas a la seguridad.
Por ejemplo, dos funciones relacionadas a seguridad de una tostadora pueden se “impedir que
los usuarios toquen elementos eléctricamente activos” y “no quemar al usuario”
Muchos procesos son incapaces de satisfacer las expectativas de seguridad de los mismos
dueños. Esto dio cabida a funciones adicionales con la forma de dispositivos de protección.
Estos representan uno de los mayores desafíos que enfrenta el departamento de
mantenimiento en plantas industriales modernas. Es por eso que los analizamos por separado:
Un subgrupo de las funciones relacionadas a Seguridad son las que se tratan la contaminación
e higiene del producto. Estas se encuentran con mayor frecuencia en las industrias
farmacéuticas y alimenticias. Los niveles de producción son generalmente especificados con
precisión y llevan a rigurosas rutinas de mantenimiento. (Limpieza y evaluación/validación).
Integridad estructural
Muchos bienes tienen una función estructural secundaria. Esta generalmente implica respaldar
algún otro bien, subsistema o componente.
Por ejemplo, la función primaria del paredón de un edificio, puede ser proteger personas y
equipos de las inclemencias del tiempo, pero también se espera que sostenga el techo, (y
balancee el peso de estanterías y cuadros)
Las estructuras grandes y complejas, con varios soportes de carga y altos niveles de
redundancia necesitan ser analizadas utilizando una versión especial de RCM. Ejemplos
típicos de tales estructuras son armazones de aeronaves o casco de un barco o elementos
estructurales de plataformas petrolíferas mar adentro.
Las estructuras de este tipo no son comunes en la industria en general, de modo que las
técnicas analíticas relevantes no están cubiertas en este libro. Sin embargo, los elementos
estructurales son de célula simple del mismo modo que cualquier otra función.
Control:
En muchos casos los usuarios no solo quieren que los bienes cumplan las funciones a un
determinado nivel de desempeño, sino que también quieren tener a posibilidad de regular ese
nivel. Esta expectativa se resume en enunciados funcionales separados.
Por ejemplo, la función primaria de un vehiculo como sugería anteriormente era “transportar
hasta 5 personas a una velocidad de hasta 90 m/h a lo largo de calles construidas” Una
función de control asociada a esto podría ser “permitir al conductor regular la velocidad entre
-10 m/h (reversa) y + 90 m/h. “
Las indicaciones o feedback conforman una parte importante de la categoría de control de las
funciones. Esto incluye funciones que otorgan a los operadores información temporal real
sobre los procesos (medidas, indicadores, relojes registradores, VDUs y paneles de control.) o
que registran tal información para un análisis posterior (dispositivos registradores digitales o
39
analógicos, grabadores de sonidos en aeronaves, etc.) Los niveles de desempeño asociados
con estas funciones, no solo se refieren a la facilidad con la que debería ser posible leer y
asimilar, o reproducir la información, sino con la precisión que esto otorga.
Por ejemplo, la función del velocímetro de un auto, puede ser descripta como” indicar al
conductor la velocidad dentro de +5 – 0% de la velocidad actual.”
Contención:
En el caso de bienes utilizados para almacenar cosas, la función primaria seria contener lo que
fuera que esta siendo almacenado. Sin embargo, esta debería ser considerada una función
secundaria de todos los dispositivos utilizados para transferir material de cualquier tipoespecialmente líquidos. Esto abarca cañerías, bombas, cintas transportadoras, sumideros,
tanques alimentadores y sistemas neumáticos e hidráulicos.
La función de contención es también importante en ítems como ser en cajas de cambios o
engranajes y transformadores. (En este contexto tenga nuevamente en cuenta, lo remarcado en
pagina 26 sobre contención y niveles de desempeño)
Confort
La mayoría de las personas esperan que sus bienes no les causen ansiedad, pena o dolor. Estas
expectativas se alistan bajo el titulo de “confort”, porque los principales diccionarios lo
definen como estar libre de ansiedad, dolor, pena, y así sucesivamente. (Estas también se
pueden entrar en la categoría de ergonomía.)
La excesiva carencia de confort afecta la moral, de modo que es rechazada desde el punto de
visto humano. Es también un negocio perjudicial ya que las personas que están ansiosas o en
dolor, son más propensas a tomar decisiones incorrectas. La ansiedad es causada por sistemas
de control ininteligibles, que generen poca confianza o que son explicados remotamente, este
afecta tanto en electrodomésticos como en refinerías de petróleo. El dolor es causado por
ítems, como ser muebles o ropa, que son incompatibles con las personas que los usan.
El mejor momento para hacerse cargo e este problema, es por supuesto, la etapa de diseño.
Sin embargo, el deterioro, o las nuevas expectativas, pueden llevar a que esta categoría de
funciones tenga fallas como cualquier otra. El mejor modo de garantizar que esto no suceda es
definir las funciones específicamente.
Por ejemplo, una función de un panel de control podría ser, “indicar claramente a un operador
daltónico a cinco pies de distancia si es que la bomba A esta operando o apagada”. Una silla
en una sala de control debería “permitir a los operadores sentarse cómodamente por mas de
una hora por vez, sin producir somnolencia. “
Estética/ Apariencia
La apariencia de muchos de los bienes constituye una función secundaria específica. Por
ejemplo la función primaria del trabajo de pintura en la mayoría de los equipos industriales es
protegerlos de la corrosión, pero un color brillante puede ser usado para mejorar la visibilidad
por razones de seguridad. De la misma manera, la función primaria de un cartel afuera de una
fabrica, es mostrar el nombre de la compañía que ocupa ese predio, pero la función secundaria
es proyectar una imagen.
40
Dispositivos de protección
A medida que los bienes físicos se vuelven más complejos, el número de posibles fallas es
más exponencial. Esto trae aparejado un crecimiento también en la severidad de la fallas y en
sus consecuencias. En el intento de eliminar (o al menos reducir) estas consecuencias, se
incremento el uso de dispositivos de protección. Estos trabajan de las cinco siguientes
maneras:
* Llamando la atención de los operadores en condiciones anormales (luces de advertencia y
alarmas sonoras que responden a los efectos de las fallas. Estos son monitoreados por un
numero de sensores incluyendo interruptores de nivel, células de carga, dispositivos de
sobrecarga o exceso de velocidad, sensores de vibración o proximidad, medidores de presión
o temperatura, etc.)
* Apagando el equipo en caso de falla, (estos dispositivos también responden a los efectos de
las fallas, utilizando el mismo tipo de sensores, y a menudo el mismo circuito que las alarmas,
pero con programaciones diferentes.)
* Eliminando o aminorando las condiciones anormales que causa una falla, y que de otro
modo podría producir un daño mayor (equipos de matafuegos, válvulas de seguridad, discos
de ruptura, discos de estallado, equipo medico de emergencia.)
* Compensando una función que falla (Planta de reserva de cualquier tipo, componentes
estructurales redundantes.)
* Previniendo que surjan las situaciones de peligro (guardias)
El propósito de estos dispositivos es proteger al personal, a las maquinarias o al producto, en
algunos casos a todos ellos juntos.
Los dispositivos de protección aseguran que la falla de la función bajo protección, será mucho
menos seria que si no estuviera protegida. En estos casos los requerimientos d mantenimiento
son menos estrictos que si no hubiera dispositivos de protección.
Consideren una fresadora, cuyo cortador rotatorio es dirigido por una correa dentada. Si esta
correa se fuera a cortar sin protección alguna, el mecanismo de alimentación provocaría que la
cortadora fija dañe la pieza trabajada (o viceversa) y cause serios daños secundarios. Esto
puede evitarse de dos maneras.
* Implementando una rutina de mantenimiento proactiva diseñada para prevenir la falla de la
correa
* O proveyendo protección como ser un detector de rompimiento de correa, que apague la
maquina apenas la correa se corte. En este caso la única consecuencia de una correa rota, es
una interrupción breve mientras se la reemplaza, de modo que la política de mantenimiento de
mejor relación costo/efectividad podría simplemente ser dejar que la correa falle. Pero será
solo valido si el detector de rompimiento de correa esta trabajando, y se deben seguir los
pasos correspondientes para asegurar que así sea.
41
El mantenimiento de los dispositivos de protección – especialmente de los que no están
excepto de fallas- se discuten en mayor detalle en los capítulos 5 y 8, sin embargo este
ejemplo demuestra dos puntos fundamentales.
* Que los dispositivos de protección necesitan en general de una mayor rutina de
mantenimiento que el equipo que estos protegen.
* Que no podemos desarrollar un programa de mantenimiento sensible para una función
protegida, sin considerar los requisitos de mantenimiento del dispositivo de protección.
Solo podemos considerar los requisitos de mantenimiento de los dispositivos de protección, si
primero entendemos su función. De modo que al enunciar las funciones de cualquier bien,
debemos alistar las funciones de todos los dispositivos de protección.
Un último punto sobre estos dispositivos implica el modo en el que se debe describir sus
funciones. Estos reaccionan a excepciones (en otras palabras, cuando algo no esta bien) de
modo que es importante describirlos correctamente. En particular, los enunciados de las
funciones de protección deberían incluir las palabras “si es que” o “en el caso de”, seguidas
por un resumen de las circunstancias o eventos que activarían la protección.
Por ejemplo, si estuviéramos por describir la función de un cable como “parar la maquina”
cualquiera que la lea, tendrá que ser escusado por entender que este el dispositivo de
encendido/ apagado normal. Para descartar toda ambigüedad, la función debe ser enunciada
de la siguiente manera:
* “ser capaz de detener la maquina en caso de una emergencia en cualquier unto de su
recorrido”
La función de una válvula de seguridad debe ser descripta como
* ser capaz de aliviar la presión en la caldera si es que esta excede los 250 psi.
Economía/ eficiencia
Cualquier persona que utilice bienes de algún tipo posee recursos financieros limitados. Esto
los lleva a medir lo que están dispuestos a gastar en operar y mantener esos bienes. Cuanto
están preparados para gastar depende de la combinación de tres factores:
* Monto real de sus recursos financieros,
* Que tanto necesitan o quieren lo que ese bien otorga,
* La disponibilidad y costos de otros modos competitivos de alcanzar el mismo fin.
A nivel del contexto operativo, las expectativas de funcionamiento en lo que respecta a costos
se clasifican generalmente como presupuestos de gastos.
A nivel del bien, todo lo relacionado a la economía puede ser mencionado directamente en
enunciados que describan lo que los usuarios esperan en áreas como ser economía de
combustibles o perdidas en materiales de proceso.
Por ejemplo, se puede esperar que un auto “recorra al menos 35 millas por galón de
combustible, a una constante de 65 m/h, y al menos 50millas por galón a 35 m/h. De una
Estación eléctrica de combustible resinado, se puede esperar que “exporte al menos 45% de
42
energía activa en el combustible como corriente eléctrica” Una planta utilizando un solvente
caro puede querer “perder no mas del 0.5% de solvente por mes.”
Funciones superfluas:
De vez en cuando se encuentran ítems o componentes que son completamente superfluos.
Esto sucede generalmente cuando los equipos han sido modificados frecuentemente durante
un periodo de años. O cuando se especifico en exceso equipos nuevos. (Estos comentarios no
se refieren a componentes redundantes agregados por razones de seguridad, sino a ítems que
no tienen propósito alguno en contexto que se esta considerando.)
Por ejemplo, se construyo una válvula de reducción de presión en la línea se provisión entre
un tubo conductor de gas y una turbina de gas. La función original de la válvula era reducir la
presión de gas de 120 psi a 80 psi. El sistema se modifico posteriormente para reducir la
presión del tubo conector a 80 psi, luego de esto la válvula dejo de tener un propósito útil.
En casos se sostiene que ítems como este no producen ningún daño, y que extraerlos tiene un
costo, entonces la solución mas simple pareciera ser dejarlos hasta que la planta es puesta
fuera de servicio. Desafortunadamente esto es casi nunca cierto en la practica. A pesar de que
estos ítems no tienen una función positiva, pueden causar una falla y así reducir la
confiabilidad general del equipo. Para evitar esto, necesitan mantenimiento. Lo que significa
que seguirán consumiendo recursos.
No es inusual descubrir que entre un 5% y un 20% de los componentes de sistemas complejos
son superfluos en el sentido anteriormente descrito. Si se los elimina, se razona que se
eliminara también el mismo porcentaje de problemas y costos de mantenimiento. Sin
embargo, antes de que esto se pueda hacer con seguridad, la función de estos componentes
debe ser identificadas y entendidas con claridad.
Una nota sobre confiabilidad.
Hay con frecuencia una tentación por escribir enunciados de funcionamiento “confiables”
como ser “operar 7 días a la semana, 24 horas al día” En realidad, la confiabilidad no es una
función propiamente dicha. En una expectativa de desempeño que abarca a todas las demás
funciones. Se la manejara apropiadamente si se trabaja con cada posible falla que afecte la
pérdida del nivel funcionamiento. Este tema se discute en profundidad en el capitulo13.
Utilizando las categorías ESCAPES,
Con frecuencia aparecerán dudas sobre a cual de las categoría ESCAPES pertenecen algunas
funciones. Por ejemplo, la función del mecanismo de reclinación de una silla debe ser
clasificado bajo la función de “control” o de Confort”?
En la práctica la especificación precisa no importa. Lo importante es que identificamos y
definimos las funciones que el usuario espera. La lista de categorías sirve meramente como un
memorando para asegurarnos que no se pase por alto ninguna de estas expectativas.
2.5 Como se deben alistar las funciones
Una especificación funcional escrita apropiadamente, especialmente si esta cuantificada en su
totalidad, define precisamente los objetivos de una empresa. Esto asegura que todos los
involucrados conocen a la perfección lo que se desea, lo que a su vez garantiza que las
actividades de mantenimiento permanecen enfocadas en las necesidades reales del usuario. (O
43
“clientes”). También esto permite absorber más fácilmente los cambios desatados por nuevas
expectativas sin descarrilar la empresa en su totalidad.
Las funciones están alistadas en las planillas de trabajo de RCM en la columna de la
izquierda, las funciones primarias están enunciadas primero, y están ordenadas
numéricamente, como se muestra en el grafico 2.9 (estas funciones se aplican al sistema de
escape de una turbina de 5 megawatts.) Al final del Capitulo 4 se muestra una planilla
informativa completa.
PLANILLA INFORMATIVA RCM II
SISTEMA
SUBSISTEMA
1
FUNCION
Canalizar todos los gases de escape de la turbina de aire
caliente sin restricción a un punto fijo de 10 metros sobre el
techo de la antecámara de la turbina
2
Reducir los niveles de ruido de escape a Nivel de Ruido ISO
de 30 a 50 metros.
3
Asegurar que la temperatura de la superficie del conducto
interno del hall de la turbina no excede los 60° C.
4
Transmitir una señal de alarma al sistema de control de la
turbina si la temperatura del gas de escape excede los 475
°C, y una señal de apagado si excede los 500° C a un punto
de cuatro metros de la turbina.
Permitir el movimiento libre del conducto en respuesta a los
cambios de temperatura.
5
Grafico 2.9: Descripción de Funciones.
44
3. Fallas funcionales
El capitulo 1 explica que el proceso de RCM implica realizar 7 preguntas sobre los bienes
seleccionados.
* ¿Cuales son las funciones del bien, y los niveles de desempeño asociados en su contexto
operativo actual?
* En que sentido falla en el cumplimiento de sus funciones?
* ¿Cual es la causa de cada falla funcional?
* ¿Que ocurre al presentarse la falla?
* ¿De que modo afecta cada falla?
* ¿Que puede hacerse para prevenir o predecir cada falla?
* ¿Que debe hacerse si no se encuentra una tarea proactiva adecuada?
El capitulo 2 se encargo en profundidad de la primera pregunta. Después de una breve
introducción al concepto general de falla, este capitulo considera la segunda pregunta, que se
concentra en las fallas funcionales.
3.1 Fallas
En el capitulo anterior, vimos que las personas u organizaciones adquieren bienes porque
pretenden que cumplan con una determinada función. No solo eso, sino que esperan que estas
funciones se realicen a un determinado nivel de desempeño.
El capitulo 2 pasa a explicar que para que cada bien, cumpla con su función y se evite el
deterioro, la capacidad inicial debe exceder el nivel de desempeño esperado. Por lo tanto,
siempre que esto suceda, el usuario estará satisfecho.
Por otro lado, si por alguna razón el bien es incapaz de cumplir con su función, el usuario
considerara que este fallo.
Esto lleva a una definición básica de falla
“Se define “falla” como la incapacidad de un bien de cumplir con las funciones que el
usuario espera realice”.
Esto se ilustra en el grafico 3.1
Por ejemplo si la bomba que se muestra en el grafico 2.1 de la pagina 22, no fuera capaz de
bombear 800 litros por minuto, no podrá mantener el tanque lleno, por lo que sus usuarios la
consideraran “fallada”.
R
e
n
d
i
m
i
e
n
t
o
Lo que el usuario
queiere que haga
Lo que el bien puede
hacer
45
Grafico 3.1: Estado general de falla.
3.2 Fallas funcionales.
La definición anterior hace referencia al concepto de falla aplicándolo aun bien como un todo.
En la práctica esta definición es vaga, porque no hace una distinción clara entre el estado de
falla (falla funcional) y los eventos que causan ese estado (modos de falla). Es también
simplista, porque no tiene en cuenta el hecho de que cada bien tiene más de una función, cada
función tiene con frecuencia más de un nivel de desempeño deseado. Estas implicancias se
exploran en los párrafos siguientes.
Funciones y Fallas.
Hemos visto que un bien esta fallado i no cumple con las funciones esperadas por el usuario.
También vimos que lo que cualquier bien debe hacer se define como función, y que todo bien
tiene más de una, con frecuencia varias funciones diferentes. Teniendo en cuenta que cada
una de esas funciones puede fallar, deducimos que todo bien puede sufrir una variedad de
distintos estados de falla.
Por ejemplo, la bomba en el grafico 2.1 tiene al menos dos funciones. Una es bombear agua a
no menos de 800 litros por minuto, y la otra es contener el agua. Es perfectamente posible
para una bomba de esa especie el bombear la cantidad requerida (sin fallas en lo que respecta
a su función primaria), pero con perdidas excesivas (falla en lo que respecta a la función
secundaria.)
Contrariamente es posible que la bomba sufra un deterioro tal que no le permita impulsar la
cantidad necesaria (falla relacionada a su función primaria) mientras que todavía pueda
contener el líquido, (sin falla en su función secundaria).
Esto muestra porque es más apropiado definir falla como pérdida de funciones especificas,
falla del bien en general. También muestra porque el proceso de RCM utiliza el termino “falla
funcional” para describir estados fallidos, mas que falla en si misma. Sin embargo para
completar la definición de falla, necesitamos analizar en mayor detalle la pregunta sobre
niveles de desempeño.
Niveles de desempeño y falla.
Como se discute en la primera parte d este capitulo, el limite entre desempeño satisfactorio y
falla, esta determinado por un nivel de desempeño deseado. Dado que estos niveles de
desempeño se aplican a funciones individuales, “falla” se puede definir con precisión, si se
define una falla funcional de l siguiente manera:
“Una falla funcional se define como la incapacidad de todo bien de cumplir una función
a un nivel de desempeño aceptable por el usuario.”
Los capítulos siguientes discuten diferentes aspectos de las fallas funcionales, bajo los
siguientes encabezamientos.
* Falla parcial y total
* Limites superior e inferior
46
* Marcadores e indicadores
* El contexto operativo
Rendimiento deseado
Capacidad
Grafico 3.2 Falla funcional.
Falla total y parcial
La definición anterior de falla funcional cubre una perdida total de funcionamiento. También
considera situaciones en la que el bien continúa funcionando, pero se desempeña fuera de los
límites deseados.
Por ejemplo, la función primaria de la bomba detallada anteriormente es “impulsar agua desde
el tanque X al tanque Y a no menos de 800 litros por minuto” esta función podrid padecer dos
fallas funcionales:
* No puede impulsar agua directamente.
* puede hacerlo pero a menos de 800 litros por minuto.
Las fallas parciales son generalmente causadas por motivos diferentes que las fallas totales, y
las consecuencias son también diferentes. Es por esto que todas las fallas funcionales que
pudieran afectar cada función deberían ser registradas.
Registrar todas las fallas funcionales asociadas con cada función.
Debe tenerse en cuenta que una falla parcial no tiene que ser confundida con una situación en
que el bien se deteriora levemente, pero su capacidad permanece por arriba del nivel de
desempeño requerido por el usuario.
Por ejemplo, la capacidad inicial de la bomba del grafico 2.1 es de 1000 litros por minuto. El
desgaste del propulsor es inevitable, por lo que esta capacidad decaerá. Siempre que no
merme hasta un punto donde la bomba no sea capaz de impulsar 800 litros por minuto, tendrá
la capacidad de llenar el tanque y por lo tanto los usuarios se sentirán satisfechos con este
contexto.
Sin embargo, si la capacidad del bien diminuye tanto que cae por debajo del desempeño
deseado, sus usuarios consideraran que ha fallado.
47
Capacidad inicial (lo que
puede hacer)
R
e
n
d
i
m
i
e
n
t
o
Deterioración real
---------------------------------------
Margen para deteriorizacion
Rendimiento
deseado (lo que los
usuarios quieren
que haga)
Grafico 3.3 Bien en buen funcionamiento a pesar de cierto nivel de deterioro.
Limites Superior e Inferior.
El titulo anterior explica que los niveles de desempeño asociados a algunas funciones
incorporan límites superior e inferior. Tales límites implican que el bien falla si genera
productos que están por arriba del límite superior o por debajo del límite inferior. En estos
casos, la brecha del límite superior necesita ser identificada en forma separada de la brecha
del límite inferior. Esto se debe a que los modos de fallas y/o las consecuencias de ir por
arriba del límite superior son generalmente diferentes a las causadas al mantenerse por debajo
del límite inferior.
Por ejemplo, la función primaria de una empacadora de golosinas, se enuncio en el capitulo 2
como “empacar 250+ 1g. De caramelos en bolsas a una velocidad mínima de 75 bolsas por
minuto”. Esta maquina falla si:
* Se detiene en general.
* Si empaca más de 251g. De caramelos en cualquier bolsa.
* Si empaca menos de 249g. En cualquier bolsa.
* Si lo realiza a una velocidad menor a 70 bolsas por minuto.
La función de una maquina amoladora de cigüeñal se describió como “para terminar de pulir
las cajas de apoyo principales en un tiempo cíclico de 3.0 +0.03 minutos aun diámetro de
75+01mm con una terminación de superficie de Ra 0.2”
* Completamente incapaz de pulir la pieza.
* Pule la pieza en un tiempo clínico mayor a 3.03 min.
* Pule la pieza en un ciclo menor a 2.97 min.
* El diámetro excede los 75.1 mm
* El diámetro esta por debajo de los 74.9mm
* La terminación de la superficie es demasiado áspera.
Por supuesto, si se aplica solo un límite aun parámetro particular, solo un estado de falla es
posible. Por ejemplo, la ausencia de un límite inferior en la especificación de aspereza en el
ejemplo anterior, sugiere que no es posible que el ítem quede demasiado pulido. En algunas
circunstancias, esto puede no ser cierto, de modo que se debe tener cuidado en verificar este
punto cuando se analiza una función de este tipo.
48
En la práctica, los estados de falla asociados a los límites superior e inferior pueden
manifestarse de dos maneras. Primero, la capacidad podría violar los límites de
especificaciones en una sola dirección. Esto esta ilustrado en el grafico 3.4 que muestra que
este tipo de estado de falla puede ser vinculado a un numero de tiros en un grupo parejo pero
alejado del centro.
----------
Capacidad
Limite de especificaciones superior
Dentro de las esp.
Fuera de las esp.
Rendimiento
deseado
Limite de especificaciones inferior
Grafico 3.4 La capacidad viola solamente el límite superior.
El segundo estado de falla ocurre cuando la capacidad se extiende a tal extremo que viola
ambos límites el superior, y el inferior. El grafico 3.5 muestra. que esto puede vincularse con
tiros desparramados por todo lo que seria el blanco.
Se debe tener en cuenta que en cualquiera de los casos descriptos anteriormente, no todos los
productos de los procesos bajo consideración estarán fallados. Si la brecha es menor, solo se
producirá un porcentaje mínimo de productos fuera de especificación. Sin embargo cuanto
mas alejados del centro se encuentren los productos en el primer caso, o mas desparramado en
el segundo, el porcentaje de fallas será también mayor.
Limite de especificaciones superior
---------Capacidad
Rendimiento
deseado
Dentro de las esp.
Limite de especificaciones inferior
Fuera de las esp.
Grafico 3.5 La capacidad viola lo limites superior e inferior.
49
El grafico 2.6 ilustraba un bajo control y dentro de los limites especificados. Los gráficos 3.4
y 3.5 muestran que los procesos que están fuera de control, y de especificación presentan en
un estado de falla. Los modos de falla que pueden causar este estado se discuten en el
próximo capitulo. (El capitulo 7 trata los procesos fuera de control, pero dentro de los límites
especificados.)
Marcadores e indicadores
La discusión anterior tiende a enfocarse en la calidad del producto. El capitulo menciona que
los limites superior e inferior también se aplican a normas de desempeño asociadas con
marcadores, indicadores, y sistemas de control y protección. Dependiendo de los tipos de
fallas y sus consecuencias, también puede llegar a ser necesario enlistar la brecha de estos
límites en forma separada cuando enunciamos las fallas funcionales:
Por ejemplo, la función de un indicador de temperatura podría detallarse como: “indicar la
temperatura en el proceso X dentro de (digamos) un 2% de la temperatura actual del proceso.
“
Este marcador puede sufrir de tres fallas funcionales:
* Fallar en general en indicar la temperatura del proceso.
* Mostrar una temperatura a más de un 2% por arriba de la temperatura actual
* Indicar una temperatura a más de un 2% por debajo de la temperatura actual.
Las fallas funcionales y el contexto operativo.
La definición exacta de falla en cualquier bien, depende en gran medida de su contexto
operativo. Esto significa que del mismo modo que no debemos generalizar las funciones de
bienes idénticos, tenemos que ser cuidadosos de no generalizar las fallas funcionales.
Por ejemplo, vimos como l bomba en el grafico 2.1 falla si es totalmente incapaz de impulsar
el agua, o si lo hace, pero a una capacidad menos de 800 litros/ min. Si la misma bomba es
utilizada para llenar un tanque del cual el agua es extraída a 900 litros/min., l segundo estado
de falla ocurre si el rendimiento cae a menos de 900 litros/min.
¿Quien debería establecer el nivel?
En tema que necesita consideración especial cuando se definen las fallas funcionales es el
“usuario”. En estos días, la mayoría de los programas de mantenimiento utilizados alrededor
del mundo son recopilados por personal de mantenimiento trabajando por si mismos. Estas
personas usualmente tienen su propia definición de lo que se considera “falla”.
En la practica, su visión de la fallas tiende a ser con frecuencia diferente a la de los usuarios,
con consecuencias desastrosas en muchos casos para la efectividad del programa.
Por ejemplo, la función de un sistema hidráulico es contener aceite. Que tan bien puede
cumplir su función, puede estar sujeto a puntos de vista que varíen enormemente. Hay jefes de
producción que sostienen que una pérdida hidráulica solo representa una falla funcional, si
tiene una perdida de provoca la interrupción total del equipo. Por otro lado, un jefe de
mantenimiento sugerirá que se esta en presencia de una falla funcional si la perdida causa un
consumo excesivo d aceite hidráulico durante un tiempo prolongado. E insistiendo, un jefe de
seguridad puede considerar que una falla funcional solo ocurre si esa perdida deja un charco
de aceite en el piso, en el cual el personal se puede resbalar y caer, o puede implicar riego de
incendio. Esto se ilustra en el grafico 3.6
50
Inicio de
la perdida
C
o
n
d
i
c
i
o
n
CHARCO DE ACEITE
“Falla” según un jefe de seguridad
ALTA CONSUMICION
Deterioración por
perdidas
“Falla” según un jefe de
mantenimiento
Tiempo
EL EQUIPO DEJA DE TRABAJAR
“Falla” según un jefe de
produccion
Grafico 3.6 Diferentes visiones sobre una falla.
El Jefe de mantenimiento (que controla el presupuesto de aceite hidráulico) puede indicar a
los operadores acceder al sistema hidráulico para reparar perdidas porque “el consumo de
aceite es excesivo” Sin embargo ese acceso puede ser denegado porque los operadores
consideran que la maquina esta “funcionando bien”. Cuando esto sucede, el personal de
mantenimiento (1) registra que “la maquina no fue liberada para mantenimiento preventivo”
y (2) se forman la idea de que sus colegas de producción no creen en MP (mantenimiento
preventivo). Por razones similares, el jefe de mantenimiento puede no enviar una persona a
reparar una perdida cuando lo requiera un oficial de seguridad.
En realidad, los tres sectores creen en la prevención. El problema real es que no están de
acuerdo en lo que se considera “falla” y por lo tanto no tienen en claro que es lo que trata de
prevenir.
Este ejemplo ilustra tres puntos clave
* El nivel de desempeño utilizado para definir falla funcional- en otras palabras el punto
donde decimos “hasta acá llegamos” – define el nivel necesario de mantenimiento proactivo
para evitar esa falla (es decir, para sostener el nivel de desempeño requerido.)
* Se puede ahorrar mucho tiempo y energía si estos niveles desempeño están claramente
establecidos antes de que las fallas ocurran.
* Los niveles de desempeño utilizados en la definición de falla, deben ser establecidos por los
operadores y el personal de mantenimiento trabajando en forma conjunta con toda aquella
persona que pueda aportar razones legitimas sobre como el bien debe funcionar.
Como se deben detallar las fallas funcionales:
Las fallas funcionales se listan en la segunda columna d la planilla informativa de RCM.
Están codificadas alfabéticamente, como se muestra en el grafico 3.7
51
PLANILLA INFORMATIVA RCM II
SISTEMA
SUBSISTEMA
1
2
FUNCION
Canalizar todos los gases de escape de la turbina de
aire caliente sin restricción a un punto fijo de 10
metros sobre el techo de la antecámara de la turbina
Reducir los niveles de ruido de escape a Nivel de
Ruido ISO de 30 a 50 metros.
TURBINA 5
Mw.
SISTEMA DE
ESCAPE
FALLA FUNCIONAL
A Incapaz de canalizar el gas
B
Flujo de Gas restringido
C
Falla la contención de Gas.
Falla en transportar el gas a un
punto de 10 metros sobre el techo
3
Asegurar que la temperatura de la superficie del
conducto interno del hall de la turbina no excede los
60° C.
D
4
Transmitir una señal de alarma al sistema de control
de la turbina si la temperatura del gas de escape
excede los 475 °C, y una señal de apagado si excede
los 500° C a un punto de cuatro metros de la turbina.
A
El nivel de Ruido excede el Nivel de
Ruido ISO de 30 a 150 metros.
La temperatura de la superficie del
conducto excede los 60°
A
5
Permitir el movimiento libre del conducto en
respuesta a los cambios de temperatura.
A
Incapaz de enviar una señal de
Alarma si la temperatura de escape
excede los 500 ° C
No permite el movimiento libre del
conducto.
A
Grafico 3.7 Descripcion de fallas funcionales.
52
4. ANÁLISIS DE EFECTOS Y TIPOS DE FALLAS
Modes and Effects Análisis.)
(FMEA) (Failure
Hemos visto que al definir las funciones y niveles de desempeño de cualquier bien, estamos
también definiendo los objetivos de mantenimiento referidos a ese bien. También vimos que
la definición de fallas funcionales, nos permite referirnos con exactitud lo que se considera
“fallido”. Estos temas fueron abordados por las dos primeras preguntas del proceso de RCM.
Las siguientes preguntas buscan identificar los modos de fallas, que son más propensos a
causar cada falla funcional, y a cerciorarse de los efectos que estas tienen. Esto se logra por
medio de un análisis de tipos de fallas y efectos. (FMEA), para cada falla funcional.
Este capitulo describe los elementos principales de un FMEA, comenzando con la definición
de “modo de falla”.
4.1 Que es un modo de falla?
Un modo de falla puede ser definido como cualquier evento que causa que un bien (sistema o,
proceso) puedan fallar. Sin embargo, en el capitulo 3 vimos que es muy vago y simplista
aplicar el termino “falla” a un bien como un todo. Es mucho mas preciso distinguir entre
“falla funcional” (estado fallido) y “modo de falla” un evento que podría causar un estado de
falla). Esto lleva una definición de falla mas precisa:
“Un modo de falla es cualquier suceso que cause una falla funcional”
La mejor manera de mostrar la conexión y distinción entre estados de fallas y los eventos que
pueden causarlos, es alistar primero las fallas funcionales, luego registrar los modos de fallas
que pueden causar cada falla funcional, como se muestra en el grafico 4.1.
El grafico 4.1 indica también, que la descripción de una falla debe consistir como mínimo de
un sustantivo y un verbo. La descripción debería contener detalles suficientes para que sea
posible seleccionar una estrategia apropiada para el manejo de fallas, pero no una cantidad tal
que se pierda una enormidad de tiempo en el proceso de análisis.
En particular, se deben elegir con cuidado los verbos para describir los modos de fallas,
porque estos tienen una gran influencia en el proceso de selección de una adecuada política de
manejo de fallas. Por ejemplo verbos como “fallar” “quebrar” o “funcionar mal” deben ser
utilizados en minoría, ya que no dan prácticamente ninguna indicación de cual podría ser el
método apropiado para manejar esa falla. El uso de verbos más específicos hace posible
seleccionar una opción de las muchas disponibles.
Por ejemplo, un término como ser “el acoplamiento falla”, no aporta absolutamente ninguna
idea de que puede hacerse para prevenir o anticipar la falla. Sin embargo, si se especifica “los
pernos del acoplamiento se aflojan”, o “los ejes del acoplamiento fallan por fatiga”, entonces
se hace mucho más fácil identificar la tarea proactiva posible.
En el caso de válvulas o interruptores, también se debería indicar si la perdida de una función
es causada cuando estos se encuentran en posición abierta o cerrada. La “válvula se atasca
cuando esta cerrada” es mucho mas especifico que “la válvula falla”. Si el objetivo es la
claridad total, entonces se deberá ir inclusive mas allá en este aspecto.
53
Por ejemplo, “La válvula se atasca cuando esta cerrada, debido a oxido en el tornillo superior”
es mucho mas especifico que “la válvula se atasca cuando es cerrada”. Del mismo modo es
imprescindible distinguir entre “ejes tascados por desgasta normal” y “ejes atascados por
falta de lubricación”.
Estos temas se discuten mas tarde en este capitulo, pero primero veamos por que es necesario
analizar los modos de fallas.
PLANILLA INFORMATIVA RCM II
SISTEMA
1
SUBSISTEMA
FUNCION
Transferir Agua del Tanque X
Al tanque Y a no menos de 800 litros
por minuto.
SISTEMA DE
ENFRIAMIENTO DE
AGUA
Falla Funcional
A Incapaz
transferir Agua
B
de
Transfiere menos
de 800 litro
Por minuto.
MODOS DE FALLA
Rodamiento falla
El propulsor se suelta
Propulsor atascado
por un objeto extraño
de
4 Campana
enganche falla por
5 fatiga.
Se quema el motor
6
Válvula de entrada
tapada
7
Propulsor desgastado
8
Línea de succión
Parcialmente
bloqueada.
1
2
3
Grafico 4.1: Modos de falla de una bomba.
4.2 ¿Porque analizar los modos de fallas?
Una sola maquina pude fallar por docenas de razones. Un grupo de maquinas o sistema, como
una línea de producción, puede fallar por cientos de razones. Para una planta completa el
número puede escalar a miles o inclusive ciento de miles. La mayoría de los gerentes,
tiemblan al pensar en el tiempo y esfuerzo que puede significar descubrir las posibles causas
de falla. Muchos deciden que este tipo de análisis implica demasiado trabajo, y abandonan la
idea en su totalidad. Al hacerlo, estos gerentes pasan por alto el hecho de que en una base
diaria – el mantenimiento se maneja verdaderamente a novel de los modos de falla”. Por
ejemplo,
* Las ordenes o pedidos de trabajo son elevados para cubrir modos de falla específicos.
54
* Los planes diarios de mantenimiento se tratan pura y exclusivamente de cubrir modos de
falla específicos.
* En la mayoría de las plantas industriales, los operadores y el personal de mantenimiento
tienen reuniones a diario. Estas reuniones consisten prácticamente en su totalidad en
discusiones sobre fallas, sus causas (quien es culpable), que se esta haciendo para repararlas, y
en muchas ocasiones, que puede hacerse para evitar que se repitan. En resumen, la reunión
tiene como tema principal discutir los modos de fallas.
* También se registran cada modo de falla en los sistemas técnicos de historial de fallas ( o al
menos que es lo que se hizo para solucionarlo”.
Lamentablemente, en muchos casos, se discute, registra y se hace algo después de que la falla
ocurre. Esta es la esencia del mantenimiento reactivo.
El mantenimiento proactivo, por otro lado, implica encargarse antes de que las fallas ocurrano al menos tener decidido como se procederá en caso de que ocurran. Para que esto sea
posible, necesitamos saber de antemano que eventos pueden ocurrir. Los “eventos”, en este
contexto, serian los modos de fallas. De manera que si queremos aplicar el mantenimiento
proactivo a cualquier bien físico, debemos tratar de identificar todos los modos de falla que
pueden llegar a afectar a dicho bien. Lo ideal seria identificarlos aun antes de que sucedan, o
si esto no fuera posible, antes de que vuelvan a suceder.
Una vez que cada modo de falla fue identificado, se hace posible considerar que sucede
cuando se presenta, para así evaluar sus consecuencias y decidir ( de ser posible) que se debe
hacer para anticiparlo, prevenirlo, detectarlo o corregirlo- o hasta para rediseñarlo.
De modo que el proceso de selección de tareas de matenimiento- y gran parte del manejo
subsiguiente de estas- es llevado a cabo al nivel de modos de fallas. Esto se ilustra brevemente
en el ejemplo siguiente, y luego discutido en profundidad en los siguientes capítulos de este
libro.
Consideren de nuevo la planilla de trabajo de RCM que mostramos en el grafico 4.1. Esto se
aplica a la funcion primaria de la bomba que vimos primero en el grafico 2.1. El grafico 4.2 es
una bomba centrifuga de acoplamiento directo de un grado de succión al extremo, sellada con
un cierre mecánico. En este ejemplo miramos mas de cerca de lo tres tipos de falla que se
considera son los propensos a afectar solo al propulsor. Esto se discute en los párrafos
siguientes, y se resume en el grafico 4.2
55
* El desgaste de un propulsor suele estar relacionado con la edad. Como se muestra en la
figura 4.1, esto significa que se identifica con el segundo de los seis patrones de fallas,
presentados en el grafico 1.5 de la página 12 (Patrón de falla B). De manera que si sabemos
aproximadamente cual es la vida útil del propulsor, y si las consecuencias de la falla son lo
suficientemente serias, podemos decidir prevenir esta falla cambiando el propulsor antes del
final de su vida útil.
* Propulsor atorado por un objeto exterior: La posibilidad de que un objeto exterior aparezca
en la línea de succión no tendrá seguramente nada que ver con el tiempo que el propulsor
lleva e servicio. De esto se puede deducir que esta falla aparecerá ocasiones casuales, (patrón
E en el grafico 1.5) Tampoco habrá advertencia alguna de que la falla esta por ocurrir. De
modo que si las consecuencias fueran lo suficientemente serias, y esta falla se diera en una
frecuencia considerable, deberíamos considerar modificar el sistema, quizás instalando algún
tipo de filtro o pantalla en la línea de succión.
Propulsor a la deriva: Si el mecanismo de fijación del propulsor esta diseñado adecuadamente
y aun así se desencaja, es prácticamente seguro que no fue colocado apropiadamente desde el
principio.( Si supiéramos que esto es un hecho, entonces el modo de falla debería ser descrito
como “ propulsor colocado incorrectamente”). Esto a su vez implica que el modo de falla
tiene mas posibilidades de ocurrir poco después de la puesta en marcha, como se muestra en
el grafico 4.2 (patrón F, en grafico 1.5) Y probablemente se solucionara l mejorar las
capacitaciones y procedimientos relevantes.
Este ejemplo refuerza el punto de que el mantenimiento no se maneja a nivel del bien como
un todo (en este caso la bomba), ni siquiera al nivel de un componente (en este caso el
propulsor), sino al nivel de cada modo de falla. De modo que antes de que nos sea posible
diseñar una estrategia de mantenimiento sistemática y coactiva para cualquier bien, debemos
identificar cuales son (o podrían ser) estos modos de falla.
El ejemplo también sugiere que uno de los modos de falla podría ser eliminado mediante un
cambio de diseño, y otro mediante la mejora de la capacitación y los procedimientos. De
manera que no todos los modos de falla son tratados con mantenimiento programado. Los
capítulos 5 a 9 describen un acercamiento ordenado para decidir cual seria la metodología
más apropiada para remediar cada falla.
Se debe tener en cuenta también que las soluciones propuestas por la figura 4.2 representan
solo una de las muchas posibilidades existentes para cada caso.
Por ejemplo, podemos monitorear el desgaste del propulsor, al monitorear el desempeño de la
bomba, y solo cambiar el propulsor cuando esta lo necesite. También debemos tener en cuanta
que al agregar una pantalla en la línea de succión, esto trae aparejadas tres posibilidades de
falla mas, que deben ser analizadas a su vez, ( Puede bloquear, podría romperse y por lo tanto
no cumplir su funcion, y se podría desintegrar dañando al propulsor.)
Los capítulos 6 a 9 analizan estas alternativas en mayor detalle.
Estos puntos indican que la identificación de los modos de fallas, es uno de los pasos más
importantes de todo programa que tenga por objetivo asegurar que un bien continuara
cumpliendo sus funciones de un modo deseado. En la práctica, dependiendo de la
complejidad, el contexto operativo y el nivel al que se analiza un ítem, se pueden encontrar
entre uno y treinta modos de falla por cada falla funcional.
Las siguientes dos secciones e este capitulo consideran dos de los temas claves en esta área:
56
* Categorías de modos de fallas.
*Nivel de detalle
4.3 Categorías de modos de fallas.
Algunas personas consideran el mantenimiento se trata únicamente de solucionar el deterioro.
Algunas inclusive llegan a especificar que el FMEA solo debería ser aplicado a sus bienes en
el caso deterioro, y deberían ignorar otras categorías de fallas (tales como errores humanos y
defectos de diseño). Desafortunadamente para ellos, el deterioro causa un porcentaje
sorprendentemente pequeño de las fallas. En estos casos, restringir el análisis al deterioro
únicamente, puede llevar a una estrategia de mantenimiento extremadamente incompleta.
Por otro lado, si uno acepta que mantenimiento significa asegurar que un bien físico continué
realizando las funciones que sus usuarios esperan, entonces un programa de mantenimiento
comprensivo debe abarcar todas las posibles causas que pueden significar una amenaza para
ese funcionamiento. Los modos de falla pueden ser clasificados en uno de tres grupos:
* Cuando la capacidad cae por debajo del desempeño deseado.
* Cuando el desempeño deseado supera la capacidad inicial.
* Cuando el bien no es capaz de cumplir la funcion esperada desde un comienzo.
Cada una de esas categoría e discuten en los siguientes párrafos.
Capacidad en descenso
La primera categoría de modos de falla cubre situaciones donde la capacidad esta por encima
del desempeño deseado, pero luego disminuye por debajo de este una vez que el bien es
puesto en servicio, como se ilustra en el grafico 4.3
Las 5 causas principales de una capacidad reducida son:
* Deterioro
* Fallas de lubricación
* Suciedad
* Desmontaje
* Errores Humanos
Capacidad inicial (lo que puede
hacer)
Rendimiento deseado
R
E
N
D
I
M
I
E
N
T
O
La capacidad disminuye por
debajo del rendimiento deseado
después de que el bien es puesto en
servicio
Grafico 4.3 Categoria I de modos de fallas
57
Deterioro
Cualquier bien físico que cumple una función que lo pone en contacto con el mundo real, esta
sujeto a una gran variedad de presiones. Estas presiones o esfuerzos provocan el deterioro del
bien disminuyendo su capacidad, o mas precisamente, su resistencia a esas presiones.
Eventualmente esa resistencia disminuye tanto que el bien no puede desempeñarse como se
espera- en otras palabras falla.
El deterioro cubre todas las formas de uso y desgaste (fatiga, corrosión, abrasión, erosión,
evaporación, degradación del aislamiento, etc.) Estos modos de falla deberían ser incluidos en
una lista donde quiera se piense que puedan ocurrir. El nivel de detalle en que se necesita
registrarlos se discute en la siguiente parte de este capitulo.
Fallas de lubricación
La lubricación esta asociada con dos tipos de modos de fallas. El primero se refiere a falta de
lubricante, la falla del lubricante en si mismo.
Con respecto a falta de lubricación, las cosas cambiaron considerablemente en las ultimas dos
décadas. Veinte años atrás, la mayoría de los puntos de lubricación eran rellenados
manualmente. El costo de lubricar cada punto era ínfimo comparado con el costo de no
hacerlo. Era ínfimo inclusive compara con el costo de analizar los requerimientos de
lubricación de cada punto detalle. Esto significaba que simplemente no valía la pena llevar a
cabo un ejercicio de análisis profundo para establecer un programa de lubricación. En
cambio, estos programas se realizaban sobre las bases de una encuesta breve realizada por un
especialista en lubricación.
Hoy en día, sin embargo, los componentes sellados de por vida y los sistemas centralizados de
lubricación se convirtieron en norma para la mayoría de las industrias. Esto llevo a una
reducción masiva en el número de puntos donde un humano tiene que aplicar aceite o grasa a
una maquina, y a un incremento masivo en las consecuencias de fallas (especialmente fallas
en los sistemas centralizados de lubricación). Desde el punto de vista analítico, lo que tiene
una buena relación costo-efectividad es:
* Utilizar RCM para analizar los sistemas centralizados de lubricación en su propio
derecho.
* Considerar como modos de falla individuales la pérdida de lubricante en los pocos
puntos remanentes lubricados en forma manual.
La segunda categoría d fallas asociadas con la lubricación contempla el deterioro del
lubricante en si mismo. Esto sucede debido a fenómenos como división de moléculas de
aceite, oxidación del aceite base y agotamiento del aditivo. En algunos casos, el deterioro del
aceite puede agravarse por acumulación de sedimentos, o la presencia de agua u otros
contaminantes. Un lubricante puede también fallar simplemente porque se utilizo uno
incorrecto. Si cualquiera o todas estas fallas fueran susceptibles de suceder en el contexto bajo
consideración, deberían ser registradas y sujetas a un análisis mas extenso. (Esto también se
aplica a aceite para transformadores y aceite hidráulico.)
Suciedad
La suciedad o el polvo son causas muy comunes de fallas. Interfieren directamente en las
maquinas causando bloqueos, atascamientos o adhesiones. Es también una causa principal de
la falla de funciones relacionadas con la apariencia de los bienes (cosas que debieran verse
58
limpias, están sucias.) La suciedad también puede causar problemas en la calidad del producto
ya sea introduciéndose en el mecanismo de abrazaderas de herramientas y causando
desalineamientos, o afectando directamente productos como ser alimentos, farmacéuticos o
tubos de engrase de motores. Como consecuencia, las fallas causadas por suciedad deberían
ser enumeradas en el FMEA, cuando sean propensas a afectar la funcion del bien.
Desmontaje
Si los componentes de una maquina se desprenden, el montaje se desarma y todas las
maquinas quedan a la deriva. Las consecuencias son generalmente muy serias, de modo que
todos los tipos de falla relevantes deben ser enumerados. Estas son generalmente fallas en
soladuras de uniones o remaches, debidas a fatiga o corrosión, o que simplemente no están
terminadas.
También se debe tener cuidado en registrar las fallas en mecanismos de cierre como ser
pasadores de aletas o tuercas de seguridad cuando considere la integridad del montaje
Errores Humanos que reducen la capacidad
El último de los grupos causantes de una “capacidad reducida” son las fallas causadas por
errores humanos. Como el nombre implica, estos son errores que reducen la capacidad del
proceso hasta un punto en que es incapaz de funcionar al nivel requerido.
Los ejemplos incluyen válvulas operadas manualmente que no se abrieron, impidiendo que el
proceso comience, partes colocadas incorrectamente por los ensambladores de
mantenimiento, o sensores programados de modo tal que se disparan aun cuando nada esta
funcionando mal.
Si se sabe que ocurren fallas de este tipo deberían ser registradas en la FMEA, de modo que se
puedan tomar decisiones sobre este aspecto. Sin embargo, al enunciar los modos de falla, debe
tenerse cuidado en detallar que error hubo, pero no quien lo cometió. Si se pone demasiado
énfasis en quien lo cometió en esta etapa, las personas tienden a perder objetividad en el
hecho de que este es un ejercicio de solución y evasión de problemas, no de atacar al culpable.
Por ejemplo seria suficiente decir “válvula de control colocada muy arriba” no, “válvula de
control colocada incorrectamente por el técnico instrumentista.
Aumento en el Desempeño Deseado (o Aumento en el Esfuerzo Aplicado)
La segunda categoría d modos de falla ocurre cuando el desempeño deseado es cubierto por la
capacidad inicial del bien, pero posteriormente las expectativas crecen de tal manera que
superan esa capacidad inicial. Esto provoca que el bien falle ya sea:
* El desempeño deseado aumenta hasta que el bien no puede cumplirlo,
* El incremento de esfuerzo causa deterioro, hasta el punto en que el bien pasa a ser tan poco
confiable que se vuelve inútil.
Un ejemplo del primer caso ocurre si los usuarios de la bomba que se muestra en la figura 2.1
quisieran incrementar la toma desde el tanque a 1050 litros/min. Bajo estas circunstancias, la
bomba es incapaz de mantener el tanque lleno. (Tenga en cuenta de que en este caso, los
usuarios no han forzando la bomba a trabajar con mayor rapidez, ellos simplemente hicieron
una mayor abertura en una válvula e algún lugar del sistema.)
59
El segundo caso se presenta por ejemplo si el dueño de un vehiculo, cuyo motor esta al limite
a 6000 rpm, persiste en exigirlo hasta 7000 rpm, esto causa que el motor se deteriore mas
rápidamente que si el usuario se mantuviera dentro de los limites prescriptos.
Este fenómeno se ilustra n el grafico 4.4. Ocurre por dos razones, las primeras tres implican
algún tipo de error humano.
* Sobrecarga sostenida deliberada
* Sobrecarga sostenida inintencionada
* Sobrecarga repentina inintencional.
* Material de proceso incorrecto.
Rendimiento deseado
Capacidad Inicial
R
E
N
D
I
M
I
E
N
T
O
El rendimiento deseado se eleva
por encima de la capacidad
después de que el bien es puesto en
servicio
Grafico 4.4 Categoria II de modos de fallas
Sobrecarga sostenida deliberada
En muchas industrias, los usuarios ceden rápidamente a la tentación de dar más velocidad a
los equipos en respuesta a una creciente demanda de los productos. En otros casos, hay
personas que utilizan equipos adquiridos con un fin, para procesar productos de distintas
características (como ser mas unidades de mayor tamaño y peso, o d estándares de calidad
también mayores.
Las personas hacen esto por que creen que de ese modo obtendrán mayores beneficios de sus
equipos, sin incrementar l inversión. Pueden hasta tener razón a corto plazo, Sin embargo esta
solución trae aparejadas penalidades a largo plazo, en términos de confiabilidad y/o
disponibilidad, especialmente cuando el esfuerzo requerido excede la capacidad del bien para
soportarlas.
(Este fenómeno provoca las disputas más feroces entre el personal de mantenimiento y los
operadores. Cuando esto sucede, los operadores afirman que “algo debe estar mal con la
gente de mantenimiento”, mientras que el sector mantenimiento acusa a los operadores por
“exigir a la maquina hasta matarla”. Esto sucede porque los operarios generalmente se
enfocan el lo que quieren que los equipos hagan, mientras que el personal de mantenimiento
se centra en “lo que el equipo puede hacer”. Ninguno de los dos esta equivocado,
simplemente están considerando el problema desde dos diferentes puntos de vista.)
60
En estos casos, la implementación de “mejores” procedimientos de mantenimiento hará poco
y nada para resolver el problema. En realidad mantener una maquina que no puede lograr el
desempeño deseado, es comparable con reorganizar las sillas en la proa del Titanic. En tales
casos necesitamos mirar más allá del simple mantenimiento. Las dos opciones son modificar
el bien, para mejorar su capacidad inherente, o disminuir nuestras expectativas y operar dentro
de los límites de capacidad del equipo.
Sobrecarga inintencional sostenida.
Muchas industrias responden a una demanda creciente adoptando programas formales para
desarmar los cuellos de botella. Estos programas se centran en aumentar la capacidad de un
equipo de producción- como ser una línea de producción- para acomodar un nuevo nivel de
desempeño deseado. Sin embargo, para el disgusto de sus sponsors, estos programas terminan
causando más problemas de los que resuelven.
Esto pasa generalmente porque unos pocos subsistemas o componentes son dejados de lado
sin sustituir o actualizar, causando resultados desvastadotes. El modo en que esto ocurre se
ilustra en la figura 4.5
La demanda de los productos generados por la fábrica ilustrada en el ejemplo creció de tal
manera que sus usuarios desean incrementar el rendimiento de 400 a 500 toneladas por
semana; las líneas punteadas representan la capacidad de cada operación. Muestran que la
mayoría de las operaciones ya son capaces de cumplir con los nuevos requerimientos. Sin
embargo las operaciones 3, 8 y 10 son capaces de producir menos de 500 toneladas, de modo
que esas son los “cuellos de botella”. Para alcanzar el nuevo objetivo, los usuarios adaptan
estas operaciones instalando nuevas maquinas o componentes que sean capaces de producir
inclusive mas de 500 toneladas por semana. También sustituyen la provisión de energía.
Sin embargo en este ejemplo se omitió la necesidad de actualizar la provisión de aire del
instrumento, de modo que la planta empezara a sufrir problemas instrumentales intermitentes,
cuando la demanda de aire este al máximo. (A pesar de que las operaciones que no fueron
modificadas ya eran capaces de procesar mas de 500 toneladas, su margen de deterioro con el
programa de actualización, de modo que comienzan a fallar con mas frecuencia.)
Claramente, si la planta esta sufriendo de fallas de este tipo, deben ser registradas en el
FMEA, para que se las pueda manejar apropiadamente.
Una linea de producción con 12 operaciones y provista de 4 servicios
1
700
2
3
4
5
6
7
8
9
1
0
1
1
1
2
a
i
r
e
a
g
u
a
600
Nuevo
500
Ahora
400
Rendimiento
deseado
300
v
a
p
o
r
P
o
t
e
n
.
Aumento de
capacidad
Nuevo
rendimiento
deseado
200
100
Grafico 4.5 El impacto desestabilizante de “modificar cuellos de botella”
61
(Algunas organizaciones industriales notaron que a pesar del mejor esfuerzo de sus
ingenieros, este proceso de modificar cuellos de botella causa tanta inestabilidad que esta
prohibido salvo en circunstancias totalmente restringidas y controladas muy de cerca. En
estos casos el crecimiento se maneja teniéndolo en cuanta en el diseño original, o
construyendo nuevas plantas.)
Sobrecarga repentina no intencional
Muchas de las fallas son causadas por aumentos repentinos, muchas veces no intencionales en
el esfuerzo aplicado, generalmente causados a su vez por:
* Operación incorrecta (Por ejemplo si una maquina se pone en reversa en lugar de avanzar.)
* Montaje incorrecto (por ejemplo, sobre ajustar un cerrojo)
* Daño externo (Por ejemplo, si un montacargas choca una bomba, o un rayo afecta una
instalación eléctrica mal protegida.
Estos no son realmente aumentos en el nivel de desempeño deseado, porque nadie quiere
poner la maquina en reversa en el momento equivocado, ni quiere estrellar el montacargas
contra la bomba. Sin embargo pertenecen a esta categoría porque el esfuerzo aplicado supera
la capacidad del bien para soportarlo.
Si se considera que cualquier de estos modos de fallas puede presentarse en el contexto bajo
consideración, entonces deberían ser incluidos en la FMEA.
Materiales de empaque o proceso incorrectos.
Los procesos de manufacturas con frecuencia sufren fallas funcionales causadas por
materiales de proceso que están fuera de especificación (entre esas variables encontramos,
consistencia, dureza o pH). De la misma manera, las plantas de empaque sufren con
frecuencia la presencia de materiales inadecuados o incompatibles.
En ambos casos, las maquinas fallan o trabajan mal, porque no pueden manejar este material.
Esto puede ser visto como un aumento en el esfuerzo aplicado.
En la practica, estos “modos de falla” so raramente el resultado de una falla del bien bajo
revisión, sino casi siempre resultan de una falla en algún otro sector del sistema. Esto significa
que la acción reparadora debe ser aplicada a un bien diferente.
Sin embargo, conocer las fallas en el análisis de un bien afectado, ayuda a asegurar que estas
recibirán total atención cuando se analice el sistema que esta causando el problema. Como
resultado, estos modos de falla deben ser incorporados en el FMEA cuando se advierta que
afectan el bien bajo revisión, con un comentario en la columna de efectos de la falla que
contra su atención en la fuente real del problema.
Capacidad Inicial
El capitulo 2 explico que para que cualquier bien sea susceptible de mantenimiento, su
desempeño deseado debe estar cubierto por la capacidad inicial. También se menciono que la
mayoría de los bienes son fabricados de este modo. Sin embargo surgen situaciones donde
esto no esta previsto desde un comienzo, como se observa en el grafico 4.6.
62
El problema de incapacidad rara vez afecta bienes en su totalidad. Generalmente afecta una o
dos funciones, de uno o dos componentes, pero estos dos vínculos débiles afectan la
operación de toda la cadena. El primer paso para rectificar problemas de diseño de esta
naturaleza es enunciarlos como modos de fallas en un FMEA.
Rendimiento deseado
R
e
n
d
i
m
i
e
n
t
o
Rendimiento deseado por
encima de la capacidad
inicial
Capacidad Inicial
Grafico 4.6 Modos de falla categoría 3.
4.4 ¿Cuantos Detalles?
Anteriormente en este capitulo, se menciono que los modos de falla deberían ser descriptos en
detalle para que sea posible seleccionar una estrategia de manejo de fallas apropiada, pero no
en detalladamente que se desperdicien cantidades excesivas de tiempo en al análisis del
proceso.
Los modos de falla deben ser definidos en suficientes detalles para que sea posible
seleccionar una política de manejo de fallas apropiada.
En la práctica puede ser muy difícil encontrar el nivel de detalle necesario. Pero es importante
hacerlo, ya que esto afecta profundamente la validez del FMEA y la cantidad de tiempo
necesaria para llevarlo a cabo.
La falta de detalles, o la mención de solo unos pocos modos de falla, llevan a análisis
superficiales y a veces peligrosos. Por otro lado, demasiados detalles y modos de falla,
provoca que todo el proceso de RCM demore mucho más de lo necesario. En casos extremos
el proceso puede demorar hasta dos o tres veces más de lo necesario. (Fenómeno conocido
con parálisis del análisis).
Esto significa que es esencial tratar de encontrar el balance exacto. Algunos de los factores
claves se discuten en los párrafos siguientes.
Proceso Causativo
Las causas de toda falla funcional, pueden definirse a cualquier nivel de detalle, y estos
diferentes niveles son apropiados para las distintas situaciones. En un extremo, es suficiente
resumir las causas de las fallas funcionales en un enunciado, como ser “la maquina falla”.
Por otro, debemos considerar que es lo que falla a nivel molecular y/o explorar los rincones
más remotos de la psique de los operadores y mantenedores para definir las llamadas causas
de falla raíz.
63
El grado en el cual los modos de falla pueden ser descriptos se ilustra en la Figura 4.7 en las
tres páginas siguientes.
El grafico 4.7 se basa en la bomba vista en el grafico 4.2, algunos de cuyos modos de fallas se
enunciaron en la figura 4.1. La 4.7, enuncia casos en que la bomba sufra de la falla funcional
“incapacidad total de transferir agua “Esta falla se considera en siete diferentes niveles de
detalle.
El nivel superior (nivel 1) es una falla de la bomba instalada como un todo. El nivel dos
reconoce la falla de los 5 mayores componentes de la bomba- bomba, eje motor, motor,
mecanismo de control y bocas de entrada y salida. De ahí en más las fallas se consideran
progresivamente en más detalle.
Cuando consideramos este ejemplo, por favor tenga en cuenta que :
* Se definieron los niveles y ubicaron los modos de falla para cumplir el propósito de este
ejemplo. No se trata de clasificaciones universales.
* El grafico 4.7 no muestra todas las posibilidades de falla en cada sector, de modo que no
debe usarse este ejemplo como modelo definitivo.
* Es posible analizar algunos de los modos de falla ha inclusive niveles menores que el nivel
7, pero en la practica es raramente necesario hacerlo.
* Los modos de falla enunciados solo se aplican a alas fallas funcionales “totalmente incapaz
de transferir agua “.
La figura 4.7 no muestra modos de fallas que puedan causar otras fallas funcionales, como
ser perdida de contención o perdida de protección.
64
NIVEL 1
Falla el set de bomba
NIVEL 2
Falla la bomba
NIVEL3
Falla el propulsor
NIVEL 4
Se suelta el propulsor
NIVEL 5
Tuerca de montaje no hecha
Tuerca de montaje desgastada
Tuerca
hecha
del
material
equivocado
Tuerca del propulsor partida
Llave del propulsor cortada
Objeto golpea
propulsor
Carcasa rota
el
Pernos de la carcasa
flojos
Fallan las juntas de la
carcasa
Carcasa golpeada
Parte en sistema después del
mantenimiento
Objeto extraño en el sistema
Pernos no ajustados correctamente
Pernos aflojados por vibración
Pernos corridos
Pernos fallan por fatiga
Juntas ubicadas incorrectamente
Juntas fallan por corrosión
Carcasa golpeada por un vehiculo
Golpeada por un objeto volador
Falla el cierre de
bomba
Desgaste normal
Cierre gastado
Bomba se seca
Cierre desalineado
Cierre con suciedad
Cierre equivocado
Ver “falla la provisión de agua”
Error de montaje
Error de montaje
Cierre equivocado provisto
Cierre
instalado
dañado
Cierre mas especificado
Cierre golpeado anteriormente
Cierre de la bomba dañado en
transito
NIVEL 7
Tuerca no ajustada correctamente
Tuerca erosionada o corroída
NIVEL 7
Error de montaje.
Material mal especificado
Material provisto equivocado
Tuerca del prop. sobre ajustada
Tuerca de material incorrecto
Metal
para
la
llave
mal
especificado
Metal provisto equivocado
Error de montaje
Material provisto equivocado
Error de diseño
Error de montaje
Error de procuración
Error de almacén
Error de pedido
Ver Apéndice 2
Colador de succión no instalado
Error de montaje
Error de montaje
Ver apéndice 2
Error de montaje
Ver apéndice 2
Error operativo
Bomba en posición vulnerable
Carcasa golpeada por un meteorito
Carcasa golpeada por parte de una
nave aérea
Ver apéndice 2
Error de Diseño
Ver apéndice 2
Ver apéndice 2
Error de procuración
Error de Almacén
Error de diseño
Error de Almacenamiento
Ver apéndice 2
Ver apéndice 2
Ver apéndice 2
Ver apéndice 2
Error de procuración
65
NIVEL 1
Falla el set
de bomba
NIVEL
2
Falla El
motor
NIVEL3
NIVEL 4
NIVEL 5
El rodamiento falla
Uso y desgaste Normal
Fatiga en la superficie de la capa
externa
Bolas desgastadas
Motor mas pequeño que lo normal
Empuje axial demasiado
grande
Falla de lubricación
NIVEL 7
NIVEL 7
Cierre dañado en la instalación
Cierres mal ubicados en el rodamiento
Aceite base oxidado
Grasa licuada
Aditivos disminuidos.
Error de fabricación
Rodamiento golpeado en el almacén
Error de montaje
Error de Manufactura
Error de Procuración
Error de montaje
Ver apéndice 2
Error de fabrica
Error de Almacenamiento
Error de diseño
Error de procuración
Error de montaje
Rodamiento dañado en transito
Rodamiento golpeado con un martillo.
Error de montaje
Rodamiento defectuoso provisto
Rodamiento corroído en el almacén
Rodamiento mal especificado
Rodamiento erróneo provisto
Ver apéndice 2
Se deteriora la aislacion
Uso y desgaste normal
Motor operado con grandes cargas
Aislacion húmeda
Error operativo
La carcasa del motor falla
Falla el cierre del rodamiento
Falla de engrase
Rodamiento
instalado
mal
Lubricantes equivocados
daño previo a la instalación
Daño durante la instalación
Rodamiento desalineado
Rodamiento defectuoso instalado
Rodamiento erróneo instalado
El Motor esta en reversa
Bobinado
quemado
del
estator
Motor
conectado
incorrectamente
Falla la aislacion del
motor
Motor sobrecalentado
Falla del Ventilador
No encendido
Error operativo
Ventilador Bloqueado por suciedad
Mal colocado
No colocado
Ver apéndice 2
Error de almacenamiento
Carcasa del motor rota
Motor almacenado en una zona húmeda
Agua derramada sobre el motor
Pernos sueltos
Deterioro normal
Carcasa mal colocada
Motor golpeado
Error de montaje
Error operativo
Error de montaje
Error de montaje
Error de montaje
Ver apéndice 2
Ver apéndice 2
66
NIVEL 1
Falla el set
de bomba
NIVEL
2
Falla El
motor
NIVEL3
NIVEL 4
NIVEL 5
El rodamiento falla
Uso y desgaste Normal
Fatiga en la superficie de la capa
externa
Bolas desgastadas
Motor mas pequeño que lo normal
Empuje axial demasiado
grande
Falla de lubricación
NIVEL 7
NIVEL 7
Cierre dañado en la instalación
Cierres mal ubicados en el rodamiento
Aceite base oxidado
Grasa licuada
Aditivos disminuidos.
Error de fabricación
Rodamiento golpeado en el almacén
Error de montaje
Error de Manufactura
Error de Procuración
Error de montaje
Ver apéndice 2
Error de fabrica
Error de Almacenamiento
Error de diseño
Error de procuración
Error de montaje
Rodamiento dañado en transito
Rodamiento golpeado con un martillo.
Error de montaje
Rodamiento defectuoso provisto
Rodamiento corroído en el almacén
Rodamiento mal especificado
Rodamiento erróneo provisto
Ver apéndice 2
Se deteriora la aislacion
Uso y desgaste normal
Motor operado con grandes cargas
Aislacion húmeda
Error operativo
La carcasa del motor falla
Falla el cierre del rodamiento
Falla de engrase
Rodamiento
instalado
mal
Lubricantes equivocados
daño previo a la instalación
Daño durante la instalación
Rodamiento desalineado
Rodamiento defectuoso instalado
Rodamiento erróneo instalado
El Motor esta en reversa
Bobinado
quemado
del
estator
Motor
conectado
incorrectamente
Falla la aislacion del
motor
Motor sobrecalentado
Falla del Ventilador
No encendido
Error operativo
Ventilador Bloqueado por suciedad
Mal colocado
No colocado
Ver apéndice 2
Error de almacenamiento
Carcasa del motor rota
Motor almacenado en una zona húmeda
Agua derramada sobre el motor
Pernos sueltos
Deterioro normal
Carcasa mal colocada
Motor golpeado
Error de montaje
Error operativo
Error de montaje
Error de montaje
Error de montaje
Ver apéndice 2
Ver apéndice 2
67
El primer punto que emerge de este ejemplo es la conexión entre el nivel de detalle y el
número de modos de falla enunciados. El ejemplo muestra hacia abajo en un FMEA, el mayor
numero de de fallas que pueden ser mencionadas.
Por ejemplo, se mencionan 5 modos de fallas al nivel 2 de la bomba en el grafico 4., pero 64
al nivel 6.
Dos problemas principales que surgen del grafico 4.7 están relacionados con “causas raíz” y
errores humanos. Estas se discuten a continuación.
Causas de Raíz
El termino “causa raíz” se utiliza con frecuencia en conexión con el análisis de una falla.
Implica que si uno escarba lo suficiente, es posible llegar a un nivel final y absoluto de
causalidad. Pero este caso no es común.
Por ejemplo, e el grafico 4.7 el modo de falla “ tuerca del propulsor sobre ajustada” se
enuncia en el nivel 6 , que a su vez es causada por un “error de montaje” en el nivel 7, si
bajáramos un nivel mas, el error de montaje puede haber ocurrido porque el “ ensamblador
estaba distraído”( nivel 8). Puede haber estado distraído porque su “hijo estaba enfermo”
(nivel 9) Esta falla puede haber ocurrido porque “el niño comió comida en mal estado en un
restaurante” (nivel 10)
Claramente, este proceso podría ser prácticamente infinito, mucho mas allá del punto en que
la organización realizando el FMEA puede tener control alguno. Es por eso que este capitulo
remarca especialmente que el nivel al que cualquier modo de falla debe ser identificado, es el
nivel en el que es posible identificar una política de manejo de fallas apropiada. (Esto es cierto
ya sea que se lleve a cabo un FMEA o una “análisis de causa raíz” antes de que la falla
ocurra.)
El hecho de que el nivel apropiado varía de acuerdo a los modos de falla, implica que no
tenemos que listar todos los modos de falla al mismo nivel en una planilla de información.
Algunos deben ser identificados l nivel 2, otros al nivel 7, y el esto en algún punto medio.
Por ejemplo en un contexto particular, puede ser apropiado enunciar solo los modos de fallas
sombreados de gris en el grafico 4.7. En otro contexto puede ser necesaria una selección
diferente.
Obviamente, para poder detenernos en algún nivel apropiado, el personal llevando a cabo tal
análisis necesita tener conocimiento de todas las posibles políticas de manejo de fallas. Esto
se discute más extensamente en los capítulos 6 a 9.
Otros factores que influencian el nivel de detalle se considera en este capitulo, y luego en el
capitulo 7.
Errores Humanos.
La parte 3 de este capitulo mencionaba diferentes maneras en que errores humanos pueden
causar fallas en maquinas. También se menciono que si los modos de falla asociados a esto
pueden tener tendencia a ocurrir, entonces deben se mencionados en el FMEA. Esto fue
realizado en el grafico 4.7, donde tolos modos de falla enunciados con la palabra “error” son
referidos a “errores humanos”. El apéndice 2 provee un breve resumen de los temas claves
involucrados con la clasificación y manejo de tales errores.
68
Probabilidad
Distintos modos de falla ocurren con diferentes frecuencias, algunos pueden ocurrir
regularmente, en intervalos promedio medidos en meses, semanas o hasta días. Otros pueden
ser extremadamente improbables, que significa que los tiempos de intervalos se pueden medir
en millones de años. Cuando se prepara un FMEA, se deben tomar decisiones continuamente
sobre los modos d falla que son tan poco probables que se los puede ignorar sin correr riesgos.
Esto significa que no tratamos de anunciar toda posibilidad de falla sin tener cuenta sus
probabilidades de ocurrir.
Cuando enunciamos los modos de falla, no tratamos de mencionar todos ellos sin tener en
cuenta su probabilidad.
Solo de deben alistar los modos de falla que se espera sucedan en el contexto en cuestión. Una
lista de modos de falla “razonablemente probables” debe incluir lo siguiente:
* Fallas que ocurrieron anteriormente en los mismos bienes o similares. Estas son las
candidatas mas obvias de ser incluidas en FMEA, a menos que el bien haya sido modificado
para que la falla no vuelva a ocurrir. Como se discute posteriormente, las fuentes de
información sobre estas fallas incluyen las personal que conocen el bien en profundidad
(empleados, proveedores u otros usuarios de un equipo similar), informes de historia técnica y
bancos de datos. En este contexto, se debe tener en cuanta los comentarios de la parte 6 de
este capitulo sobre las deficiencias en los registros de historia técnica, y en el capitulo 12
sobre el peligro de confiar demasiado en datos históricos.
* Modos de falla que están actualmente sujetos a rutinas de mantenimiento proactivo, y por
lo tanto ocurrirían si dicho mantenimiento no se estuviera realizando. Uno de las formas de
asegurarse que ninguno de estos modos de falla fueron pasados por alto es estudiar los
programas de mantenimiento existentes y preguntar “ Que modo de falla ocurriría si no
hubiésemos llevado a cabo esta tarea?
Sin embargo, la revisión de los programas existentes solo debería hacerse como un chequeo
final, luego de que todo el análisis de RCM ha sido completado, para reducir la posibilidad de
perpetuar status quo. (Algunos usuarios se tientan a asumir que todas las fallas posibles están
ya cubiertas por sus PM existentes, y por lo tanto a creer que son los únicos modos de falla
que deben incluir en un FMEA. Esto lleva a los usuarios a desarrollar la totalidad de FMEA
trabajando en retroceso, desde sus programas de mantenimiento ya existentes, y luego
progresando hacia los tres últimos pasos del proceso de RCM. Esto se realiza usualmente bajo
la creencia d que esto dará velocidad al proceso de flujo. En realidad esto no se recomienda
porque entre otros defectos, lleva a análisis de RCM insuficientes)
* Cualquier otro modo de falla que si bien no ha ocurrido aun, se puede considerar
posibilidad real.
Identificar y definifir el manejo de fallas que todavía no han ocurrido es una característica
esencial del mantenimiento proactivo en cereal, y del manejo de riesgos
en particular. Es también uno de los aspectos más desafiantes del proceso de RCM, porque
requiere un alto nivel de juicio. Por un lado, necesitamos enunciar todos los posibles modos
de falla, mientras que por otro no queremos perder tiempo en falla que nunca sucedieron
antes y que son muy improbables en el contesto en cuestión.
69
Por ejemplo, se colocan soportes “sellados de por vida” en el motor de la bomba en grafico
4.7. Esto significa que las probabilidades de fallas por lubricación serán bajas, tanto axial,
que no serán incluidas en la mayoría de los FMEA. Por otro lado, de las fallas por falta de
lubricación probablemente se incluirán en un FMEA los componentes lubricados
manualmente, los sistemas de lubricación centralizados y los engranajes.
Sin embargo, la decisión de no enunciar un modo de falla debe realizarse bajo la cuidadosa
consideración de las consecuencias d la falla.
Consecuencias
Si las consecuencias pudieran ser realmente severas, entonces si se deberá enunciar y someter
un análisis profundo a toda falla, sin importar sus posibilidades de ocurrir.
Por ejemplo, si la bomba de la figura 4.7 fue instalada en una fabrica de alimentos, o en una
planta de montajes de vehículos, el modo de falla “ser aplastada por un objeto que cae del
cielo”, será descartado por completo y causara gracia su enunciado. Sin embargo, si la bomba
estuviera impulsando algo desagradable en una estación nuclear, esta falla tiene más
posibilidades de ocurrir, aunque continua siendo muy improbable. (Una política apropiada de
manejo de fallas puede ser prohibir que aeronaves sobrevuelen el complejo, o diseñar un
techo que pueda soportar la caída de una de estas).
Otro ejemplo del grafico 4.7 es “motor no encendido” Este modo de falla tendería a ser
descartado por poco probable en la mayoría de los casos. Aunque suceda, las consecuencias
pueden ser tan mínimas que directamente lo excluimos del FMEA. (Por otro lado, si ocurre y
es importante, especialmente en casos donde encenderlo es parte de una secuencia y no
hacerlo puede causar un daño grave, - esta falla debe ser considerada.)
Causa vs., efecto
Se debe tener cuidado en no confundir causas con efectos cuando se enumeran los modos de
fallas. Este es un error sutil cometido generalmente por personas que son nuevas en el proceso
de RCM.
Por ejemplo, una planta tenía 200 engranajes, todos del mismo diseño y todos cumpliendo
más o menos las mismas funciones en el mismo tipo de equipo. Inicialmente, los modos de
falla siguientes se registraron en uno de esos engranajes:
* Los soportes de los engranajes se traban.
* Se desmontan los dientes del engranaje.
Se comenzó con estos modos de fallas porque las personas llevando a cabo la revisión habían
recordado estas fallas del pasado hasta donde ellos sabían (algunos de los engranajes tenían
20 años). Las fallas no afectaron la seguridad, pero si la producción. Entonces se implico que
es valido realizar tareas de prevención como “chequear los dientes de engranaje para uso” o
“chequear la caja de engranajes por falta de rectificación”, y “chequear los soportes por la
vibración”. Sin embargo de los estudios resulto que ambas fallas fueron causadas porque no
se controlo el nivel de aceite en su debido momento, de modo que los engranajes fallaron por
falta de aceite. Lo que es mas, nadie recuerda que los engranajes lubricados apropiadamente
hayan fallado. Como resultado de esto, el modo de falla que se registro fue:
* Engranaje falla por falta de aceite.
70
Esto resalta la importancia de la tarea proactiva obvia. Que era controlar el nivel de aceite
periódicamente. (Esto no pretende sugerir que todas las cajas de engranaje deben ser
analizadas de la misma manera. Algunas son mucho más complejas, o más cargadas, de modo
que son propensas a una mayor variedad de modos de falla. En otros casos las consecuencias
de las fallas pueden ser mucho más severas, lo que generara una visión más defensiva de las
posibilidades de falla.)
Modos de falla y contexto operativo.
Vimos como las funciones, y fallas funcionales de cualquier ítem se ven influenciadas por su
contexto operativo. Esto también es cierto para los modos de fallas n lo que respecta a
causalidades, probabilidades y consecuencias.
Similarmente, un vehiculo que opera en el Ártico, estará expuesto a diferentes modos de falla
que un vehiculo operando en el Desierto del Sahara; o una turbina impulsando una aeronave,
tendrá modos de fallas diferentes que una turbina impulsando una plataforma de petróleo.
Estas diferencias implican que se debe tener cuidado al confirmar que el contexto operativo es
idéntico antes de aplicar un FMEA desarrollado para un bien en particular y bajo
determinadas circunstancias. (Léase el párrafo sobre el uso genérico de FMEA en la parte 6
de este capitulo.)
El contexto operativo afecta los niveles de análisis, tanto como las causas y consecuencias de
la falla. Como se discutió anteriormente, puede ser apropiado identificar modos de fallas
similares para dos bienes idénticos, aun nivel en un contexto y a otro en el siguiente.
4.5 Efectos de la fallas.
Los cuatro pasos en la revisión de RCM implica enunciar que sucede cuando s representa
cada modo de falla. Estos se conocen como efectos de las fallas.
Los efectos de las fallas describen que sucede cuando se presenta un modo de falla.
Tenga en cuanta que los efectos de las fallas no son lo mismo que consecuencias de las fallas.
(Un efecto de falla responde a la pregunta “que sucede?” , mientras que la consecuencia
responde a “ (como) afecta?”
Una descripción de los efectos de falla debe incluir toda la información necesaria para
respaldar la evaluación de las consecuencias de la falla. Específicamente cuando se describen
los efectos de una falla, se debe registrar lo siguiente:
* Que evidencias hay (de ser así) de que la falla sucedió.
* En que medida (si así fuera) representa una amenaza para la seguridad o el medioambiente.
* De que manera (si así fuera) afecta la producción u operaciones.
* Que daño físico (si lo hubiera) es causado por la falla.
* Que debe hacerse para repararla.
Estos temas se detallan e los siguientes párrafos. Tener en cuanta que uno de los objetivos de
este ejercicio es establecer donde es necesario el mantenimiento proactivo. Si lo haremos
correctamente, no podemos asumir que ya se ha realizado ningún tipo de mantenimiento
71
productivo, de manera que los efectos de la falla deben redactarse sosteniendo que nada se
estaba haciendo para prevenirlas.
Evidencia de la falla.
Los efectos de las falla deben ser descriptos de tal manera que permita al equipo haciendo el
análisis de RCM decidir si la falla será evidente para los operadores bajo circunstancias
normales.
Por ejemplo la descripción debería establecer si las fallas provocan que se enciendan luces de
advertencia, o que suenen alarmas, (o ambas), y si la advertencia es dad en un panel local o en
una sala de control central (o en ambas).
Del mismo modo, la descripción debería establecer si la falla es acompañada o precedida por
efectos físicos obvios como ser ruidos fuertes, fuego, humo, vapores, olores inusuales, o
charcos de líquido e el suelo.
Por ejemplo, si estamos considerando que una falla en los apoyos de la bomba que se muestra
en la figura 3.5, los efectos d la falla deberían ser descriptos de la siguiente manera (las
cursivas detallan lo que hace evidente para los operadores que se ha producido un falla.)
* El motor falla y el alarma se dispara suena en la sala de control. La alarma de bajo nivel
del tanque Y suena después de 20 minutos, y el tanque se seca después de 30 minutos. Se
requiere un tiempo de inactividad de 4 horas para reemplazar los soportes.
Este es un modo de falla inusualmente complejo, de modo que la descripción del efecto de la
falla es también más extenso que lo habitual. La cantidad promedio de palabras utilizadas en
una descripción de efecto ronda entre las veinte y sesenta palabras.
Cuando se describen efectos de las fallas, no prejuzgar la evaluación de consecuencias de l
falla, mediante el uso de palabras como ser “ocultas” o “evidentes”. Estas son partes del
proceso de evaluación de consecuencias, y usarlas prematuramente podría guiar
incorrectamente la evaluación.
Finalmente, cuando se trabaja con dispositivos de protección, la descripción de los efectos de
falla debería establecer brevemente que podría suceder si el bien protegido fallara, estando
inactivo el dispositivo de protección.
Riesgos medioambientales y de Seguridad.
Las plantas industriales modernas han evolucionado al punto de que solo una pequeña
proporción de modos de falla presentan una amenaza directa a la seguridad del
medioambiente. Sin embargo, d existir la posibilidad de que alguien salga lastimado, o
fallezca como resultado directo de la falla, o se viole una norma o regulación medioambiental,
los efectos de la falla deberían describir como puede suceder esto. Por ejemplo:
* Alto riesgo de incendio o explosiones.
* El escape de químicos perjudiciales (gases, líquidos, sólidos.)
* Electrocución
*Objetos que caen
72
* Golpes de presión (especialmente en vasos de presión y sistemas hidráulicos.)
* Exposición a materiales muy calientes o fundidos.
* La desintegración de componentes rotativos de gran tamaño
* Accidentes o descarrilamientos de vehículos.
* Exposición a extremos filosos, o maquinarias en movimiento.
* Niveles de ruido crecientes.
* Colapso de estructuras
* El aumento de bacterias.
El ingreso de suciedad en alimentos o productos farmacéuticos.
Cuando enumeramos estos efectos, n hacer enunciados cualitativos como ser: “esta falla tiene
consecuencias en la seguridad”, o “esta falla afecta el medioambiente”. Simplemente se debe
mencionar lo sucedido, y deje la evaluación de las consecuencias para el siguiente paso del
proceso de RCM.
Note también que no solo estamos preocupados por las posibles amenazas a nuestro personal,
(operadores y de mantenimiento) sino también por la seguridad de nuestro clientes y de la
comunidad como un todo. Esto requerirá investigación por parte del equipo haciendo el
análisis, obre las regulaciones es medioambientales y de seguridad de las cuales depende l
proceso bajo revisión.
Daños secundarios, y efectos de producción:
La descripción de los efectos de falla, debería también ayudar con decisiones sobre las
consecuencias operacionales y no operacionales. Para lograr esto, deberían indicar como se ve
afectada la producción (si es así) y por cuanto tiempo. Esto se calcula generalmente por la
cantidad de tiempo de inactividad asociado a cada falla.
En este contexto, tiempo inactivo significa el monto total de tiempo que este bien estará fuera
de servicio, debido a una falla, desde el primer momento en que esta se presenta, hasta que el
equipo esta operando nuevamente a su máxima capacidad.
Como se indica n el grafico 4.8, este es por lo general más extenso que el tiempo de
reparación.
Tiempo de Inactividad
La maquina
se detiene
Encuentre a
alguien que
pueda
repararla
Diagnostiqu
e la falla
Consiga los
repuestos
Repare la
falla
Revalide o
prueba la
maquina
Ponga la
maquina
nuevamente
en servicio
Tiempo de
reparacion
73
Grafico 4.8 Tiempo de inactividad versus tiempo de reparación.
El tiempo de inactividad, como se lo define anteriormente puede sufrir grandes variaciones,
por diferentes presentaciones de la misma falla, y las consecuencias mas serias son causadas
generalmente por las mayores interrupciones. Teniendo en cuenta que lo que más nos interesa
son las consecuencias, el tiempo de inactividad registrado en la planilla informativa debería
estar basado en la típica peor situación posible.
Por ejemplo, si la interrupción de actividad causada por una falla que se presenta tarde en un
turno nocturno de fin de semana, es por lo general más extensa que cuando esa falla se
presenta en un turno diurno normal, y si esos horarios nocturnos son frecuentes, mencionamos
el primer caso.
Por supuesto es posible reducir las consecuencias operacionales de una falla, tomando pasos
para acortar los periodos inactivos, mas frecuentemente reduciendo el tiempo que lleva
conseguir los repuestos. Sin embargo, como se discute en el capitulo 2, todavía estamos en el
proceso de definir el problema en esta etapa, de manera que el análisis debe estar basado – al
menos inicialmente – en las políticas actuales de posesión de repuestos.
S debe tener en cuenta que si la falla afecta las operaciones, es más importante registrar el
tiempo de inactividad, que el tiempo medio para reparar la falla (MTTR) por dos razones:
* En la mente de muchas personas, la palabra “tiempo de reparación” tiene el significado que
se muestra en el grafico 4.8. Si este se usa en lugar de tiempo de inactividad podría perjudicar
la posterior evaluación sobre las consecuencias de las falla.
* deberíamos basar la evaluación de consecuencias, n el “peor caso típico” y no el medio,
como discutimos anteriormente.
Si la falla no causa una interrupción en el proceso, entonces se debe registrar el tiempo
promedio que lleva a la reparación, ya que puede ser utilizado para establecer los
requerimientos de mano de obra.
En suma al tiempo de inactividad, se debe nombrar cualquier otra circunstancia en que la falla
puede haber tenido un efecto significante en la capacidad operativa del bien. Las posibilidades
incluyen:
* Como se ve afectada la calidad del producto y el servicio al cliente, y de ser así, si hay
penalidades financieras involucradas.
* Si es que algún otro equipo o actividad tiene que ser interrumpida también (o disminuir su
velocidad)
* Si es que la falla a un incremento en los costos operativos generales, además del costo
directo de reparación (tales como ser mayores costos de electricidad).
* Que daño secundario, si lo hubiere, fue causado por la falla.
Acción Correctiva
Los efectos de las fallas deberían también establecer que debe hacerse para repararla. Esto
puede ser incluido en los enunciados sobre tiempo de inactividad, y mostrados en cursivas.
* Interrupción para reemplazar soportes alrededor de cuatro horas.
74
* Interrupción para despejar la obstrucción y resetear el interruptor de disparos alrededor de
30 minutos.
* Interrupción para desmantelar la turbina y reemplazar el disco alrededor de 2 semanas.
4.6 Fuentes e Información sobre Modos y Efectos.
Cuando se considere donde conseguir la información necesaria para desarrollar un FMEA
comprensivo, recuerden la necesidad de ser proactivos. Esto significa que se debe poner tanto
énfasis en lo que pudo suceder, como en lo que sucedió. Las fuentes más comunes de
información, se discuten en los siguientes párrafos, conjuntamente con una breve revisión de
sus ventajas y desventajas.
El fabricante o vendedor del equipo.
Al llevar a cabo un FMEA, la primera fuente de información que se nos viene a la cabeza es
el fabricante, especialmente en el caso de equipos nuevos. En algunas industrias esto alcanzo
el punto donde los fabricantes o vendedores deben proveer rutinariamente un FMEA
comprensivo, como parte del contrato de provisión del equipo. Aparte de todo, esto implica
que los fabricantes saben absolutamente todo lo que se necesita saber sobre fallas en el equipo
y como actuar cuando ocurren.
Este es un caso muy raro en la realidad.
En la práctica, pocos fabricantes conocen la operación día a día del equipo. Una vez que
expira el periodo de garantía, casi ninguno recibe un feedback regular de parte los usuarios
sobre qué falla y por qué. Lo mejor que muchos de ellos pueden hacer, es tratar de sacar
conclusiones sobre como sus equipos se desempeñan, besándose en una combinación de
evidencia anecdótica y un análisis de la venta de repuestos (salvo cuando ocurre una falla
realmente extraordinaria, en cuyo caso abogados toman el lugar de los ingenieros. En este
punto, la discusión racional técnica sobre las causas raíces pasa a segundo plano.)
Los fabricantes además tienen muy poco acceso a información sobre el contexto operativo del
equipo, niveles desempeño deseado, causas de las fallas, y los conocimientos de los
operadores y personal de mantenimiento. En la mayoría de los casos, los fabricantes no saben
nada de todo esto. Como resultado, los FMEA recopilados por ellos son generalmente
genéricos, y sumamente especulativos, lo que limita enormemente su valor.
La pequeña menoría de fabricantes capaces de producir un FMEA satisfactorio cae en una de
dos categorías:
* Están involucrados con el mantenimiento del equipo a través de su vida útil, ya sea
directamente o a través de vendedores cercanos. Por ejemplo, la mayoría de los vehículos de
propietarios particulares, son mantenidos por la consecionaria que vendió el vehiculo. Esto
permite a las confeccionarías proveer a los fabricantes de muchísima información relevante.
* Se les paga para realizar estudios formales de garantía en prototipos como parte del proceso
inicial de adquisición. Esto es muy común en procuración militar, pero mucho menos común
en la industria.
En la mayoría de los casos, el autor descubrió que el mejor modo de acceder al conocimiento
que el fabricante posee sobre el comportamiento del equipo en un determinado campo, es
75
solicitarles provean técnicos experimentados en dicho campo, para que trabajen en forma
conjunta con los encargados de operar y mantener el equipo, para desarrollar un FMEA que
sea satisfactorio para ambas partes. Si se adopta esta sugerencia, los técnicos de campo debes
por supuesto tener acceso irrestricto al apoyo de especialista para que los ayuden a responder
las consultas más complicadas.
Al adoptar este método, asuntos tales como garantía, derechos de autor, idiomas que los
participantes deberían ser capaces de hablar con fluidez, confidencialidad, etc., deberían ser
manejados a nivel contrato, de manera que cada uno sabe que puede o no esperar del otro.
Tenga en cuenta la sugerencia de trabajar con técnicos en el área, más que con diseñadores.
Los diseñadores tienden a ser reluctantes para admitir que sus diseños pueden fallar. Lo que
reduce su habilidad para ayudar en el diseño de un FMEA sensible.
Lista genérica de modos de falla
Listas genéricas son enumeraciones de modos de fallas- o a veces hasta FMEA completos
preparados por terceros. Pueden cubrir sistemas enteros, pero abarcan con mayor frecuencia
bienes individuales, o hasta componentes simples. Estas listas genéricas son solicitadas como
un método más de acelerar o hacer más dinámicas esta parte del desarrollo del programa de
mantenimiento. Esto debe ser abordado con gran cuidado, por las siguientes razones:
* El nivel de análisis puede ser inapropiado: Una lista genérica puede llegar a identificar
modos de falla a un nivel equivalente a (digamos) nivel 5 en la figura 4.7, cuando todo lo que
puede necesitarse es un nivel 1. Esto significa que lejos de acelerar el proceso, la lista
genérica puede condenar al usuario a analizar muchos mas modos de falla que los necesarios.
Contrariamente, la lista genérica se puede enfocar en los niveles 3º 4 e una situación en que
algunos modos de falla realmente deban ser analizados a un nivel 5 o 6.
* El contexto operativo puede ser diferente: El contexto operativo de su equipo puede tener
características que lo hacen susceptible de modos de falla que no figuran en la lista genérica.
De la misma manera en que muchos de los modos de falla incluidos en la lista genérica, puede
ser muy poco probable (si no imposible) en su contexto.
* Pueden diferir los niveles de desempeño: Su equipo puede operar a niveles de desempeño
que implican que la completa definición de falla, puede ser absolutamente diferente que la
utilizada para desarrollar la FMEA genérica.
Estos tres puntos significan que si se utiliza una lista genérica de modos de falla, solo debe
ser usada para complementar un FMEA en un contexto específico, y jamás ser utilizada en
forma particular como una lista definitiva.
Otros Usuarios del mismo Equipo
Otros usuarios son una fuente de información obvia y muy valedera sobre que puede
funcionar mal en bienes utilizados en común, siempre por supuesto que las presiones
competitivas permitan el intercambio de datos. Esto se realiza con frecuencia a través
asociaciones industriales (como en la industria mar adentro), a través de cuerpos regulatorios
(como en la aviación civil), o entre diferentes ramas de una misma organización. Sin
embargo, se deben tener en cuanta los peligros de tomar datos genéricos como fuente de
información.
76
Registros Técnicos históricos.
Los registros técnicos históricos pueden ser también una fuente de información de gran valor.
Sin embargo, deberían ser tratados con cuidado por las siguientes razones:
* Son frecuentemente incompletos.
* Describen con mayor frecuencia que se hizo para reparar la falla, en lugar de que la causó.
* Generalmente describen modos de falla que son en realidad el efecto de alguna otra falla.
Estos inconvenientes de los registros técnicos históricos implican que estos solo deben usarse
como fuente complementaria al preparar un FMEA, y jamás como única fuente,
Las personas que operan y mantienen el equipo.
En prácticamente todos los casos, las personas que mantienen y operan los equipos en una
base diaria, son la mejor fuente de información para preparar en FMEA. Tienden a saber en
profundidad como trabaja el equipo, que es lo que no funciona, cuanto afecta cada falla, y que
debe hacerse para repararla- y si no lo saben son ellos los que tienen el razonamiento para
descubrirlo.
La mejor manera de captar e incrementar su conocimiento es comprometerlos a participar
formalmente en la preparación de un FMEA, como parte del proceso general de RCM. El
modo más eficiente de hacerlo es bajo la conducción de un facilitador acordemente entrenado
en una serie de reuniones. (La fuente más valedera de información adicional en estas
reuniones es un conjunto de diseños de proceso e instrumentación, conjuntamente con el
acceso a especialistas técnicos o de proceso a medida de que vaya surgiendo la necesidad.)
Esto fue mencionado en el capitulo 1, y es explicado mas extensamente en el capitulo 13.
4.7 Niveles de Análisis y planilla de información:
La parte 4 de este capitulo muestra como los modos de falla pueden ser descriptos a casi
cualquier nivel de detalle. El nivel de detalle seleccionado debería permitir la identificación
de una política de manejo de fallas apropiada. En general, los niveles mas altos (menos
detalles) deberían ser seleccionados si el componente o subsistema presenta la probabilidad de
ir hacia la falla, o es sometido a la búsqueda de fallas. Mientras que los niveles menores (mas
detalles) debe ser seleccionado si el modo de falla puede ser sujeto a algún tipo de
mantenimiento proactivo.
El detalle utilizado para describir modos de falla en las planillas informativas, también esta
influenciado por el nivel al cual el FMEA es llevado a cabo. Esto a su vez depende del nivel
al cual se desempeña el análisis de RCM. Por esta razón, analizamos los factores principales
que influencian el nivel de análisis general (que también se conoce como “nivel de
inventario”) antes de considerar como afecta los detalles que deben incluirse en la
descripción de los modos de falla.
Nivel de Análisis
RCM se define como un proceso utilizado para determinar que debe hacerse para asegurar
que todo bien físico continúa cumpliendo con las funciones que sus usuarios esperan, en el
contexto operativo presente. A la luz de esta definición, hemos visto que es necesario definir
el contexto en detalle, antes de que podamos aplicar el proceso. Sin embargo, también
necesitamos definir exactamente cual es el “bien físico” al que se aplicara el proceso.
77
Por ejemplo, si aplicamos RCM a un camión, es todo el camión el “bien”.? O subdividimos el
camión y analizamos el tren de arranque, separadamente del sistema de frenos, la dirección, el
chasis y así sucesivamente? O deberíamos ir aun mas allá, y subdividir el tren de arranque y
analizar el motor separado de los engranajes, diferenciales, soportes, semiejes, y ruedas? O
debería ser el motor dividido en bloque de motor, sistema de manejo de motor, sistema de
enfriamiento, sistema de combustible, y así sucesivamente antes de comenzar el análisis? Y
que si subdividimos el sistema de combustible en tanque, bomba, cañerías, y filtros?
Se debe tener precaución en este asunto, porque un análisis llevado acabo en un nivel muy
alto, puede ser demasiado superficial. Mientras que uno realizado a un nivel muy bajo, puede
volverse inmanejable e in entendible. Los siguientes párrafos exploran l implicancia de llevar
a cabo un análisis a diferentes niveles.
Comenzar a un nivel bajo
Uno de los errores mas comunes del proceso de RCM, es llevar a cabo el análisis a un nivel
muy bajo en la jerarquía del equipo/
Por ejemplo, cuando se piensan en los modos de falla que podrían afectar a un vehiculo
automotor, una de las posibilidades que vienen a la mente es una línea de combustible
bloqueada.
La línea de combustible es parte del sistema de abastecimiento de combustible, entonces
parece acertado elevar una planilla de trabajo para el sistema de combustible. La figura 4.9
indica que si el análisis se lleva a cabo a ese nivel, la línea de combustible bloqueada será el
séptimo modo de falla identificado de un total de quizás doce, que pueden causar la falla
funcional “incapaz de transfererir combustible”
PLANILLA INFORMATIVA RCM II
SISTEMA MOTOR
SUBSISTEMA SISTEMA DE
COMBUSTIBLE
FUNCION
1
Trasferir combustible de un tanque
de combustible al motor a un
promedio de 1 litro por minuto
FALLA FUNCIONAL
(Perdida de Funcion)
A Incapaz de transferir
combustible
MODOS DE FALLA
( Causa de la Falla)
1 No hay combustible
en el tanque.
3 El filtro esta
bloqueado
7 Línea de
Combustible
bloqueada.
1
2 Línea de combustible
puesta a prueba, etc.
Grafico 4.9: Modos de falla de un sistema de combustible.
Cuando la planilla de decisión ha sido completada para este subsistema, el grupo de revisión
de RCM procede al sistema siguiente, y así sucesivamente hasta que los requisitos de
mantenimiento de todo el vehiculo hayan sido revisados. Esto parece un trabajo bastante
78
directo, hasta que consideramos que el vehiculo puede ser subdivido en literalmente docenas
– sino cientos- de subsistemas a este nivel. Si se realiza un análisis por separado para cada
nivel, comienza a surgir el siguiente problema.
* Cuanto más abajo se progresa en la jerarquía, mas difícil es conceptualizar y definir niveles
de desempeño. (Uno podría también preguntar a quien realmente le importa la cantidad
precisa de combustible que pasa a través del sistema, siempre y cuando el gasto de
combustible del vehiculo este dentro de los limites razonables, y el automóvil tenga la
potencia suficiente.)
* A un nivel bajo, se vuelve equitativamente difícil visualizar, y por lo tanto analizar las
consecuencias de las fallas.
* Cuanto mas bajo es el nivel de análisis, mas difícil se vuelve decidir que componentes
pertenecen a cada sistema (por ej. Es el acelerador parte del sistema de combustible, o del
sistema de control del motor?)
* Algunos modos de falla pueden causar que muchos subsistemas dejen de funcionar
simultáneamente (como ser una falla en la provisión d energía a una planta industrial). Si cada
subsistema se analiza por separado, el tipo de falla se repetirá una y otra vez.
* Los circuitos cerrados de control y protección son muy difíciles de tratar a un nivel bajo,
especialmente cuando un sensor en un subsistema lleva un actuador en otro a través d en un
procesador en un tercero)
Por ejemplo, un limitador de revoluciones que lee una señal en un volante en el “bloque del
motor”, puede enviar una señal a través de un procesador en el subsistema de “control del
motor”, a una válvula de combustible cerrada en el subsistema de “combustible”.
Si no se presta especial atención ese asunto, la misma funcion termina siendo analizada en
tres maneras minimamente diferentes. Y se prescribirán las mismas tareas de busque de fallas
mas de una vez, para el mismo circuito cerrado.
* Se debe elevar una nueva planilla por cada subsistema. Esto lleva a la generación de grandes
cantidades de papeleo para el análisis del vehiculo completo, o al consumo de cantidades
similares de memoria electrónica. Los manuales relacionados, o sistemas de llenado
electrónicos, deben ser estructurados con sumo cuidado si la información pretende seguir
siendo manipulada. En resumen, el proceso comienza a ser mucho más extenso e intimidante
de lo que realmente necesita.
FMEA, son llevados a cabo frecuentemente a un nivel muy bajo en la jerarquía del equipo,
por una creencia de que existe una correlación entre el nivel al que identificamos los modos
de fallas, y el nivel al cual debe llevarse a cabo el FMEA (o el análisis d RCM como un
todo). En otras palabras, se dice a menudo que si queremos identificar los modos de falla en
detalle, debemos llevar a cabo un FMEA separado para cada componente reemplázale o
subsistema.
En realidad esto no es así. El nivel al que pueden ser identificados los modos de falla, es
independiente del nivel al que se realiza el análisis. Como se muestra en la sección siguiente
de este capitulo.
79
Comenzando desde arriba.
En lugar de comenzar el análisis desde abajo de la jerarquía del equipo, podemos comenzar
desde arriba.
Por ejemplo, la funcion primaria de un camión fue enunciada en la pagina 28 de la siguiente
manera: “Para transportar hasta 40 toneladas de material, a una velocidad de hasta 75 mph,
(promedio 60mph) desde Starsville hasta Endburg con un tanque de combustible”.
La primera falla funcional con esta funcion es “incapaz de moverse” Los cuatro modos de
falla que se muestran en la figura 4.9 pueden causar esta falla funcional, de modo que en lugar
de ser enumeradas en una planilla de información para el sistema de combustible, podrían
haber sido enunciadas en una planilla que cubra el camión en general, como se muestra en la
figura 4.10.
PLANILLA INFORMATIVA RCM II
SISTEMA CAMION DE 40
TON.
SUBSISTEMA
FUNCION
1
Trasferir 40 toneladas de material
desde Startsville a Endburg a
velocidades de hasta 75 mph
(promedio de 60 mph) con un
tanque de combustible.
FALLA FUNCIONAL
(Perdida de Funcion)
A Incapaz de
moverse.
MODOS DE FALLA
( Causa de la Falla)
No hay combustible
en el tanque.
El filtro esta
bloqueado
Línea de
Combustible
bloqueada por un
objeto extraño.
Línea de combustible
puesta a prueba, etc.
Grafico 4.10 Modos de falla para un camión.
Las principales ventajas de comenzar un análisis a este nivel son las siguientes:
* Las funciones y expectativas de desempeño son mucho más fáciles de definir.
* Las consecuencias de las fallas son más fáciles de evaluar.
* Es más fácil identificar y analizar circuitos cerrados y de control como un todo.
* hay menos repetición de funciones y modos de fallas.
* No es necesario elevar una nueva planilla de información para cada nuevo subsistema, de
modo que el consumo de papel disminuye notablemente.
Sin embargo, la principal desventaja de llevar a cabo el análisis a este nivel, es que hay
cientos de modos de fallas que pudieran provocar que el camión no pueda moverse. Estas van
desde una rueda delantera desinflada a un cigüeñal partido. De manera que si trataron de
enumerar todos los modos de falla a este nivel, es muy probable que muchos sean pasados por
alto.
80
Por ejemplo, vimos como el sistema de combustible bloqueado fue el séptimo de doce modos
de falla, en ser identificado al nivel de “el sistema de combustible”. Sin embargo a nivel
"camión”, l figura 4.10 muestra que podía haber sido la numero 73, de cientos de posibles
modos de fallas.
Niveles Intermedios.
Los problemas asociados con niveles altos y bajos de análisis, sugieren que debe ser sensato
llevar a cabo el análisis a un nivel intermedio. En realidad, estamos perjudicados por la
opción, porque la mayoría de los bienes pueden ser subdivididos en mucho niveles, y el
proceso de RCM puede aplicarse a cualquiera de esos niveles.
Por ejemplo, la figura 4.11 muestra que un camión de 40 toneladas puede ser dividido en al
menos 5 niveles. . Esto traza la jerarquía desde el nivel del camión como un todo, al nivel de
las líneas de combustible. Y muestra como la funcion principal del bien, puede ser definid a
cada nivel de la planilla d información de una planilla de RCM, y como la línea de
combustible bloqueada puede aparecer en cada nivel.
Dada la opción de 5, (o a veces mas posibilidades), ¿como seleccionamos a que nivel llevar a
cabo el análisis?
Hemos observado que el nivel superior generalmente abarca demasiados modos de falla por
funcion, para permitir un análisis sensible. A pesar de eso, sin embargo, aun así necesitamos
identificar las principales funciones de un bien o sistema al nivel más alto, para proveer una
estructura estratégica para el resto del análisis.
Por ejemplo, un operador adquiere un camión para transportar mercaderías desde A B, no
para bombear combustible a través de una línea. Aunque la ultima funcion contribuye a la
primera, el desempeño general del bien- y por lo tanto de su mantenimiento- tiende a ser
juzgada a su nivel superior. Por ejemplo, el jefe responsable de una flota de camiones
probablemente preguntara “Cual es el desempeño del camión X”, mas que “ Que tal el
funcionamiento de la línea de combustible del camión X?” (A menos que se sepa que el
sistema de combustible esta causando un problema.)
El capitulo 2 explica que en la practica, un enunciado del contexto operativo provee un
registro de las principales funciones, y niveles de desempeño asociados con cualquier bien o
sistema a niveles superiores al nivel al que se lleva a cabo el proceso de RCM.
Por otro lado, hemos visto que la inclinación inicial es la de comenzar desde muy abajo en la
jerarquía del bien. Por esta razón, una buena regla general (especialmente para personas
nuevas en RCM) es llevar a cabo el análisis a un _ o inclusive dos_ niveles mas arriba de que
parezca sensato.
Esto es porque siempre es más sencillo descomponer subsistemas complejos desde un nivel
superior, que tratan de elevarse, cuando ya se ha comenzado muy abajo. Esto se discute en
mas detalle en la sección siguiente de este capitulo.
Con un poco de practica, (especialmente en lo que respecta a que se entiende por “un nivel
que permita identificar políticas apropiadas de manejo de fallas “) el nivel mas acertado
comienza a ser intuitivamente obvio. En este contexto, se debe tener en cuenta que no es
necesario analizar cada sistema al mismo nivel a lo largo de la jerarquía del bien.
81
Por ejemplo, el sistemas de frenos completo puede ser analizado al nivel 2, como se muestra
en la figura 4.11, pro puede ser necesario analizar el motor al nivel 3 o nivel 4.
Camion de 4 ton.
Funcion
1
Transferir 40 ton. de material de
Startville a Endburg a velocidades
de hasta 75 mph (promedio 60
mph) en un tanque de combustible
1
Falla Funcional
A
Sistema de freno
Inhabilidad para transferir
alguna cantidad de metal
Modo de falla
18
42
73
114
Sistema de direccion
No hay comb. en el tanque
Filtro de comb. Bloqueado
Conducto de comb. Bloqueado
Conducto de comb. cortado
Cabina
Tren de mando
Funcion
2
Propulsar el vehiculo con una
carga de hasta 40 ton. de Startville
a Edinburg a velocidades de 75
mhp (promedio 60 mhp)
1
Falla Funcional
A
Engranaje
Inhabilidad para propulsar el
vehiculo
Modo de falla
9
16
33
71
Eje
No hay fallas en el tanque
Filtro de comb. Bloqueado
Conducto de comb. Bloqueado
Conducto de comb. cortado
Diferenciales
Motor
Funcion
3
1
Transferir 400 kW de potencia en
hasta 2500 rpm al eje de entrada
del engranaje.
Block del motor
Falla Funcional
A
Inhabilidad para transferir
potencia
Modo de falla
4
9
18
38
No hay comb. en el tanque
Filtro de comb. Bloqueado
Conducto de comb. Bloqueado
Conducto de comb. cortado
Sistema de escape
Sistema de enfriamiento
Sistema de
Combustible
Funcion
4
1
Transferir combustible desde el
tanque de combustible a una
relacion de 1 litro por minuto.
Falla Funcional
A
Tanque de combustible
Inhabilidad para transferir
potencia
Modo de falla
1
3
7
12
No hay comb. en el tanque
Filtro de comb. Bloqueado
Conducto de comb. Bloqueado
Conducto de comb. cortado
Filtro de combustible
Bomba de combustible
Conductos de
combustible
5
Etc…
Funcion
1
Transportar combustible del
tanque de combustible a una
relacion de un litro de cerveza por
minuto.
Falla Funcional
A
Inhabilidad para transferir
combustible
Modo de falla
1
3
Conducto de comb. Bloqueado
Conducto de comb. cortado
82
Grafico 4.11: Funciones y Fallas a diferentes niveles.
Como Se deben registrar los modos de falla y efectos.
Una vez que se estableció el nivel para todo el análisis de RCM, luego tenemos que decidir
que grado de detalle es necesario para definir cada modo de falla, dentro del marco de ese
análisis. No existe una razón técnica de porque los modos de falla no pueden ser enunciados
(junto con sus efectos) aun nivel que permita seleccionar una estrategia apropiada de modos
de falla.
Sin embargo, aun los niveles intermedios de análisis, a veces generan demasiados modos de
falla, por falla funcional; especialmente para funciones primarias.
Esto sucede generalmente cuando el bien incorpora subgrupos complejos, que pueden
también sufrir de un gran número de modos de falla.
Ejemplos de dichos subgrupos pueden ser, pequeños motores eléctricos, pequeños sistemas
hidráulicos, pequeñas cajas de engranajes, circuitos cerrados de control, y acoplamientos
complejos.
Dependiendo como siempre del uso y las consecuencias, estos subgrupos pueden ser
manejados en una de las siguientes formas descriptas abajo.
Opción 1
Enumerar todos los posibles modos de falla de los subgrupos en forma individual como parte
del análisis principal- en otras palabras, a niveles equivalentes al nivel 3, 4,5 o 6 del grafico
4.7.
Por ejemplo, consideren un bien que puede detenerse por completo como resultado de una
falla en una caja de engranajes pequeña.
En la planilla informativa para este bien, esta falla podría detallarse como se muestra a
continuación.
1
MODO DE FALLA
Falla en los rodamientos de la
caja de engranaje.
EFECTOS DE LAS FALLAS
El motor se dispara y suena la alarma en la sala
de control. 3 horas de inactividad para
reemplazar la caja de engranajes. Nuevos
rodamientos colocados en el taller.
2
Dentadura del engranaje rota
El motor no se dispara, pero la maquina se
detiene. 3 horas de inactividad para reemplazar
el engranaje. Nuevo engranaje colocado en el
taller.
3
Engranaje falla por falta de
aceite
El motor se dispara y la alarma suena en la sala
de control. 3 horas de inactividad para
reemplazar el engranaje.
En general, los modos de fallas que pueden afectar a un subgrupo deben ser incorporados en
un nivel de análisis más alto, si este subgrupo no fuera propenso a
83
sufrir más de unos 6 modos de falla que valga la pena identificar y que causaran alguna de las
fallas funcionales del sistema de nivel más alto.
Opción 2
Para comenzar, enumere la falla del subgrupo como un modo de falla simple en la planilla
informativa, luego eleve una nueva planilla para analizar las funciones, fallas funcionales,
modos de falla y efectos del subgrupo en un ejercicio separado.
Por ejemplo, la falla en la caja de engranaje discutida anteriormente podría haber sido
detallada de la siguiente manera:
1
MODO DE FALLA
Falla
la
caja
engranajes
de
EFECTO DE LAS FALLAS
Caja de engranajes analizada
por separado.
Vale la pena tratar de esta manera a un subgrupo si mas de diez modos de falla del mismo,
pudieran causar la perdida de alguna funcion del montaje principal.
(Si hubiera entre 7 y 9 modos de falla por falla funcional, utilice la opción 1 u opción 2,
teniendo en cuenta que los análisis separados implican mayor numero de análisis, pero menos
modos de falla en cada uno de ellos.)
Opción 3
Enumere las fallas del subgrupo en la planilla de información, como un modo de falla simple
– en otras palabras a un nivel 1 o 2 del grafico 4.7_ registre sus efectos y déjelos de ese modo.
Por ejemplo, si se considerara apropiado tratar la falla en la caja de engranaje discutida
anteriormente en este ejemplo se enunciaría del siguiente modo: (Tabla 3)
1
MODO DE FALLA
Falla la caja de
engranajes … etc.
EFECTO DE LAS FALLAS
Falla el motor y suena la alarma. Tiempo de
inactividad para reemplazar la caja de engranajes
3 horas
Este método solo será adoptado por un componente o subgrupo que presente las siguientes
características:
* No es sometido a un diagnostico detallado y rutinas de reparación cuando falla, pero es fácil
de reemplazar y hasta descartado o sujeto a un reemplazo posterior.
* Es bastante pequeño, pero complejo.
* No tiene modos de falla dominantes.
* No tiende a ser susceptible a ninguna forma de mantenimiento proactivo.
84
Opción 4
En algunos casos, un subgrupo complejo puede sufrir de uno o dos modos de falla
dominantes, que son prevenibles, y un número de fallas menos comunes, que no vale la pena
prevenir, porque la frecuencia, o las consecuencias de las fallas no lo garantizan.
Por ejemplo, un motor eléctrico pequeño, que opera en un medioambiente con polvo, puede
fallar debido a un recalentamiento si la rejilla que cubre el sistema de enfriamiento se
bloquea, pero pueden ser muy pocas las fallas por otras razones, muy esporádicas y no muy
serias si es que ocurren. En este caso el modo de falla de este motor debe enunciarse como:
* Ventilador del motor bloqueado por polvo.
* El motor falla (por otras razones.)
Esta opción es realmente una combinación de las opciones 1 y 3.
Servicios
Esta falla de servicios (energía, agua, vapor, aire. gases. vacío, etc.) se consideran como un
modo de falla simple, desde el punto de vista del bien que recibe la provisión de determinado
servicio, porque un análisis mas detallado de esto va generalmente mas allá del alcance del
bien en cuestión.
Dichas fallas se remarcan con propósitos informativos
(Falla la provisión de energía), se
registra sus efectos, y son analizadas en detalle cuando el servicio es analizado como un todo.
Una Planilla Informativa Completa
Los efectos de la falla están detallados en la última columna de la planilla informativa al
costado del modo de falla relevante, como se muestra en la figura 4.13.
85
PLANILLA INFORMATIVA RCM II
SISTEMA Turbina de Gas 5 MW
Sistema
216-05
SUBSISTEMA Sistema de Escape
Subsistema Nº
216-05-011
FUNCION
1
FALLA FUNCIONAL
(Perdida de Funcion)
Canalizar todo el as de la turbina de
calefacción sin restricción a un punto fijo de
10 m. por encima del techo del hall de la
turbina.
Nº
Facilitador:
N. Smith
Auditor:
Jones
MODOS DE FALLA
( Causa de la Falla)
Monturas
silenciadoras
1
corroídas
1
Parte del silenciador falla por
fatiga.
P
Fecha:
7-07-1996
Hoja Nº 1
Fecha
De 3
07-08-1996
EFECTO DE LA FALLA
(Que sucede cuando falla)
Montaje del silenciador colapsa y cae al fundo de la torre. La presión trasera
causa que la turbina surja violentamente y se apague a altas temperaturas de
gas de escape. El tiempo de inactividad para reemplazar el silenciador.
Dependiendo de la naturaleza del bloqueo, la temperatura de escape puede
aumentar hasta apagar la turbina. El despojos podría afectar partes de la
turbina. El tiempo de inactividad para reparar el silenciador es de 4 semanas.
.
Grafico 4.13. Planilla Informativa de RC
86
5. Consecuencias de las fallas.
Los capítulos anteriores explicaron como en proceso de RCM, realiza las siguientes 7
preguntas sobre cada bien:
* Cuales son las funciones y niveles desempeño asociados en el contexto operativo
presente?
* De que manera falla en cumplir con esas funciones?
* Que sucede cuando se presenta cada falla?
* De que modo importa cada falla?
* Que puede hacerse para predecir o prevenir cada falla?
* Que sucede si no se encuentra una tarea proactiva apropiada?
Las respuestas a las primeras 4 preguntas, se discutieron extensivamente en los capítulos 2 a
4. Esto muestra como las planillas de RCM se utilizan para registrar las funciones de los
equipos bajo revisión, y a enumerar las fallas funcionales relacionadas, modos de falla, y
efectos de las fallas.
Las ultimas tres preguntas hacen referencia a cada modo de falla individual.
Este capitulo considera la 5ta. Pregunta:
* ¿De que modo importa cada falla?
5.1 Es Técnicamente Posible y vale la pena hacerlo.
Cada vez que se presenta una falla, la organización que utiliza el bien se ve afectada en algún
grado. Algunas fallas afectan el rendimiento, la calidad del producto, o el servicio al cliente.
Otras amenazan la seguridad del medioambiente. Algunas incrementan los costos operativos,
por ejemplo mediante un aumento en el consumo de energía, mientras que unas pocas tienen
un impacto en cuatro, cinco, o hasta seis de estas áreas. Hay inclusive fallas que aparentan no
afectar en nada en si misma, pero exponen a la organización al riesgo de fallas mucho mas
serias.
Si no se previene alguna de estas fallas. El tiempo y esfuerzo que se necesita para corregirlas
también afecta a la organización, ya que reparar fallas consume recursos que podrían ser
mejor utilizados.
La naturaleza y severidad d éstos efectos son responsable por las consecuencias de las fallas.
En otras palabras, de ellas depende el grado en el que los propietarios o usuarios de un bien
creerán que la falla es importante. (Se debe tener en cuanta que los efectos de una falla
describen que sucede cuando se presenta una falla, mientras que las consecuencias describen
como – y cuanta- es la importancia. Claramente, si logramos reducir los efectos de cualquier
falla, en lo que respecta a frecuencia y/ o severidad, de ahí surge que también reduciremos las
consecuencias aparejadas. Esto especialmente cierto si la falla pudiera dañar o terminar con la
vida de una persona, o si pudiera tener un efecto serio en el medioambiente. También esto es
87
cierto en las fallas que interfieren con la producción u operaciones, o que causan un daño
secundario significante.
Por otro lado, si la falla presenta solo consecuencias menores, es posible que no se adopte
ninguna acción proactiva, sino que la falla simplemente se corrija cada vez que se presenta.
Este enfoque en las consecuencias implica que RCM comienza el proceso de selección de
tareas, evaluando los efectos de cada modo de falla, y calificando las consecuencias en una de
cuatro amplias categorías. El segundo paso es investigar si es físicamente posible realizar una
tarea proactiva que reduzca, o permita acciones tendientes a reducir las consecuencias de las
fallas a un grado que pueda ser aceptable para el propietario o usuario del bien. Si se
encuentra tal tarea, se la considera Técnicamente Posible. El criterio del cual esto depende se
discute en más detalle en los capítulos 6 y 7.
Si una acción es técnicamente posible, se pasa al tercer paso, que es preguntarse si realmente
reduce las consecuencias de la falla a un grado tal que justifique los costos directos e
indirectos de llevarla a cabo.( Los costos directos son los de mano de obra o material
necesarios para realizar esta tarea y cualquier trabajo de rectificación relacionado.)
Tiene sentido realizar una tarea proactiva si esta reduce las consecuencias del modo de
falla a un grado tal que justifique los costos directos e indirectos de llevarla a cabo.
Si no es posible encontrar una tarea proactiva apropiada, la naturaleza de las consecuencias de
la falla también indicara que acción de default debe realizarse. Las acciones de default
(omisión) se explican en los capítulos 8 y 9.
Este capitulo considera el criterio utilizado para evaluar las consecuencias de una falla, y así
decidir si vale la pena llevar a cabo una tarea proactiva. Las consecuencias se dividen en dos
etapas, dentro de cuatro categorías. La primera etapa separa las funciones ocultas de las
funciones evidentes.
5.2 Funciones ocultas y evidentes.
Vimos que cada bien tiene más de una, a veces docenas de funciones. Cuando la mayoría de
estas funciones fallan, es inevitablemente evidente que la falla ocurrió.
Por ejemplo algunas fallas provocan que se enciendan las luces de advertencia o se disparen
alarmas, o ambas. Algunas hacen que las maquinas se apaguen, o se interrumpa parte del
proceso. Otras llevan a problemas en la calidad del producto, o aun consumo de energía
incrementado, e inclusive otras están acompañadas por efectos físicos, como ruidos fuertes,
perdida de vapor, olores inusuales, o charcos de líquido en el piso.
Por ejemplo, la figura 2.7 en el capitulo 2 mostraba tres bombas que vemos nuevamente en el
grafico 5.1. Si se desencaja el soporte de la bomba A, se pierde la capacidad de bombeo. Esta
falla ser inevitablemente evidente para los operadores, ya sea apenas sucede, o en el momento
en que alguna parte del proceso se interrumpe. (Los operadores pueden no darse cuanta de
que el problema viene de los soportes, pero notaran que algo inusual esta sucediendo.)
88
Por si misma
A
Deber
B
Emergencia
C
Figura 5.1 Tres bombas.
Las fallas de este tipo se clasifican como evidentes, por que alguien la notara cuando ocurre
por si misma. Esto lleva a la siguiente definición de función evidente:
Una función evidente es aquella cuya falla es inevitablemente evidente por si misma para
los operarios bajo circunstancias normales.
Sin embargo, algunas fallas se presentan de tal manera que nadie advierte que el ítem esta en
un estado de falla, a menos que ocurra otra falla.
Por ejemplo, si la bomba C en el grafico 5.1 falla, nadie notaria esto, porque bajo
circunstancias normales la bomba B estaría aun trabajando. En otras palabras, la falla de la
bomba C por si misma no tiene impacto directo a menos que, o hasta que la bomba B también
falle (situación anormal).
La bomba C exhibe una de las características mas importantes de una funcion oculta. Que es
que la falla de esta bomba por si misma, no será evidente para los operarios bajo
circunstancias normales. En otras palabras, no será evidente a menos que la bomba B también
falle. Esto lleva a la siguiente definición de Funciones ocultas.
Una función oculta es aquella cuya falla no será evidente a los operarios bajo
circunstancias normales si esta se presenta por si misma.
El tercer paso en el proceso de evaluación de consecuencias de RCM es separar las funciones
ocultas de las funciones evidentes, ya que las funciones ocultas necesitan un manejo especial.
Como se explico n la parte 6 de este capitulo, estas funciones están asociadas con dispositivos
de protección que no son libres de falla. Desde que estas representan hasta la mitad de los
modos de falla que pueden afectar a los equipos modernos complejos, las funciones ocultas
podrían bien convertirse en El problema dominante que deberá enfrentar el mantenimiento
durante los próximos diez años. Sin embargo, para poner estas funciones en perspectiva,
consideramos primero las funciones evidentes.
Categorías de Funciones Evidentes.
Las funciones evidentes se clasifican en tres categorías en orden descendente de importancia:
* Consecuencias medioambientales y de seguridad: Una falla tiene consecuencias de
seguridad si puede dañar o terminar con una vida. Tiene consecuencias medioambientales si
pudiera llevar a una violación de cualquier norma medioambiental corporativa, regional o
nacional.
89
* Consecuencias Operativas: Una falla tiene consecuencias operativas, si afecta la
producción o las operaciones (rendimiento, calidad del producto, servicio al cliente, o costos
operativos, además de el costo directo de reparación).
* Consecuencias no operativas: Las fallas evidentes en esta categoría no afectan ni la
seguridad, ni la producción, de modo que solo implican el coto directo de reparación.
Al colocar las fallas evidentes en este orden, RCM asegura que están consideradas la
seguridad e implicancias medioambientales de cada modo de falla evidente. Esto pone
irrevocablemente a las personas en frente de la producción.
Este enfoque también significa que las consecuencias medioambientales, económicas y de
seguridad de cada falla, se evalúan en un ejercicio, lo que tiene una mejor relación costoefectividad que si e los considera por separado.
Las siguientes cuatro secciones de este capitulo consideran cada una de esas categorías en
detalle, comenzando con las categorías evidentes, y luego dirigiéndose a situaciones mas
complejas relacionadas con fallas ocultas.
5.3 Consecuencias medioambientales y de Seguridad.
La seguridad primero
Como hemos visto, el primer paso en el proceso de evaluación de consecuencias es identificar
las funciones ocultas, de manera que las podamos manejar apropiadamente. Todos los modos
de falla restantes, en otras palabras fallas que no se clasifican como ocultas, deben por
definición ser evidentes. Los párrafos anteriores explicaron que el proceso de RCM considera
primero las implicancias medioambientales y de seguridad de cada falla. Lo hace por dos
razones:
* Una creencia cada vez mas firme entre los empleados, empleadores, clientes y sociedad en
general, de que simplemente no es tolerable dañar o terminar con vidas en el curso de una
actividad económica, y por lo tanto debe hacerse todo lo posible para minimizar el riesgo de
cualquier incidente relacionado a la seguridad o excursión medioambiental.
* La convicción pragmática de l tolerancia a incidentes relacionados con la seguridad, están
muy por debajo de la tolerancia que se tiene a incidentes causados por fallas operativas. Como
resultado, en la mayoría de los casos donde una tarea proactiva vale la pena desde el punto de
vista de la seguridad, también suelen ser muy productivas desde el punto de vista operacional.
A un nivel la seguridad se refiere a la seguridad de individuos en su lugar de trabajo,
específicamente, RCM analiza si alguien puede resultar herido ya sea como resultado directo
del modo de falla en si mismo, o por daño causado por la falla.
Un modo de falla tiene consecuencias de seguridad si causa una perdida de funcion u otro
daño que puede ocasionar herida o muerte a una persona.
A otro nivel “seguridad” se refiere a la seguridad o bienestar de la sociedad en general. Hoy
en día, las fallas que afectan a la sociedad se catalogan como problemas “medioambientales”.
En realidad, en muchos lugares del mundo se esta llegando al punto donde las organizaciones
90
respetan todas las expectativas medioambientales de la sociedad, o dejan de operar. De modo
que aparte de cualquier sentimiento personal que genere este tema, la integridad
medioambiental se esta convirtiendo en un prerrequisito fundamental para la supervivencia de
las organizaciones.
El capitulo 2 explicaba como las expectativas de la sociedad se reflejan en normas
municipales, regionales, nacionales o internacionales. Algunas organizaciones tienen sus
propias regulaciones corporativas que pueden llegar a ser aun más exigentes.
Un modo de falla tiene consecuencias medioambientales si lleva al incumplimiento de alguna
de estas regulaciones.
Un modo de falla tiene consecuencias medioambientales si causa una pérdida de función u
otro daño que podría llevar a la violación de cualquier norma medioambiental conocida.
Se debe tener en cuenta que cuando consideramos si modo de falla tiene consecuencias
medioambientales, consideramos si un modo de falla por si mismo puede tener esas
consecuencias. Esto es diferente a la parte 6 de este capitulo, donde consideramos la falla de
ambos elementos de un sistema protegido.
La Cuestión del Riesgo.
La mayoría de las personas preferirían vivir en un medioambiente donde no existiera en
absoluto la posibilidad de herida o muerte. Es generalmente aceptable que hay un nivel de
riesgo en cada cosa que hacemos. En otras palabras un cero absoluto es inalcanzable, a pesar
de que es un objetivo por el que vale la pena luchar. Esto nos lleva a la pregunta de qué es
alcanzable.
Para responder a esta pregunta debemos considerar la gestión del riesgo en más detalle.
La evaluación de riesgo consiste en tres elementos. El primero pregunta que podría suceder si
se presenta el hecho bajo consideración. La segunda que tan probable es que esto hecho
suceda. La combinación de estos dos elementos provee una medida del grado de riesgo. La
tercera- y generalmente el elemento mas disputable- pregunta si el riesgo es tolerable.
Por ejemplo, consideren un modo de falla que podría resultar en la muerte o heridas de 10
personas. (Que puede suceder), la probabilidad de que esto ocurra es una en mil a lo largo de
un año. (Cuales son las probabilidades de que ocurra). Basándonos en estos números, el riesgo
asociado a la falla es:
10 x (1 en 1000)= Una víctima cada 10 años.
Ahora consideremos un segundo modo de falla, que podría haber causado 1000 victimas, pero
que la probabilidad es 1 en 100.000 a lo largo d un año.
El riesgo asociado a esta falla es:
1000 x (1 en 100.000)= Una victima cada 100 años.
En estos ejemplos, el riesgo es el mismo, a pesar de que los números en que se basa son muy
diferentes. Se debe tener en cuanta que estos ejemplos no indican si l riesgo es tolerablesolamente lo cuantifican.
91
Si el riesgo es tolerable, o no, es un asunto aparte y mucho más complejo que se debe analizar
a posterior.
Tenga en cuenta que a lo largo de este libro, los términos “probabilidad” (1 en diez
posibilidades de falla en un periodo dado) y “promedio de falla” (Una vez en diez periodos
promedio, correspondientes a un tiempo medio entre fallas de 10 periodos) se utilizan como
si fueran intercambiables cuando se los aplica a fallas en general. Estrictamente hablando,
esto no es cierto. Sin embargo, si el MTBF es mayor que aproximadamente 10 periodos, la
diferencia es tan pequeña que generalmente puede ser ignorada.
Los párrafos siguientes consideran cada uno de estos tres elementos de riesgo en mayor
detalle.
¿Que podría suceder si se presenta la falla?
Cuando nos hacemos esta pregunta, se deben tener en cuenta dos asuntos. Estos son: Que
sucede realmente y cuales son las probabilidades de que alguien resulte herido o pierda la vida
como consecuencia de ello.
Lo que realmente sucede si se presenta un modo de falla debe ser registrado en l planilla de
RCM como efecto de la falla, como se explica extensamente en el capitulo 4. En la parte 5 de
este último, también se enumera un número de efectos típicos que representan una amenaza a
la seguridad del medioambiente.
El hecho de que estos efectos pueden herir o quitar la vida a alguien, no necesariamente
significa que de hecho esto sucederá cada vez que el efecto se produzca. Muchos pueden
presentarse con frecuencia sin consecuencias de este tipo. Sin embargo el tema no es si es que
estas consecuencias son o no inevitables, sino, si son posibles.
Por ejemplo, si se desprendiera el gancho de una grúa en movimiento utilizada para
transportar rollos de acero, la carga que se desprende solo puede lastimar a alguien que este
justo parado debajo de esta o muy cerca en ese momento. Si no había nadie cerca, nadie sale
lastimado. In embargo la sola posibilidad de que esto ocurra, implica tratar esta falla como un
riesgo a la seguridad y analizarla acordemente.
Este ejemplo pone en evidencia el hecho de que el proceso de RCM evalúa las consecuencias
de seguridad al nivel muy conservador. Si es razonable asumir que todo modo de falla podría
afectar la seguridad del medioambiente, asumimos que puede hacerlo. En cuyo caso debe ser
sujeto a un análisis mas profundo. (Veremos mas adelante que la probabilidad e que alguien
resulte herido, es tomada en cuenta cuando se evalúa la tolerabilidad del riesgo.)
Una situación mas compleja surge cuando las amenazas a la seguridad están ya cubiertas por
algún tipo de protección inherente. Ya vimos como uno de los objetivos principales de RCM
es manejar cada falla en el contexto de sus consecuencias. Esto solo puede realizarse en un
principio, si esas consecuencias son evaluadas como si no s estuviera haciendo nada para
manejar la falla. (En otras palabras para predecir, o prevenir, o mitigar las consecuencias.)
Los dispositivos de seguridad diseñados para manejar la falla o estado de falla, (alarmas,
dispositivos de interrupción automática o sistemas de alivio) no son más que sistemas de
manejo de fallas ya incluidos. Como resultado que el resto del análisis es llevado a cabo desde
una base cero apropiada, las consecuencias de las fallas de funciones protegidas deberían ser
evaluadas como si no hubiera dispositivos de protección de este tipo.
92
Por ejemplo, por ejemplo una falla que puede provocar un incendio es siempre considerada un
riesgo a la seguridad, por que la presencia de un sistema de extinción de incendios no
garantiza necesariamente que el fuego será controlado y extinguido.
El proceso de RCM, puede ser utilizado para validar, o revalidar la adaptabilidades
dispositivo de protección en si mismo desde tres puntos de vista.
* Su capacidad para proveer la protección requerida. Esto se logra definiendo la funcion del
dispositivo de protección, como se explica en el capitulo 2.
* Si es que el dispositivo de protección responde con la suficiente velocidad para evitar las
consecuentes, como se discute en el capitulo 7.
* Que debe hacerse para asegurar que el dispositivo de protección continua funcionando,
como se discute en la parte 6 de este capitulo y en el capitulo 8.
¿Cuales son las probabilidades de que la falla ocurra?
Parte 4 del capitulo 4 menciona que los únicos modos de falla que tienen probabilidades de
ocurrir en el contexto en cuestión, deberían ser enumerados en la planilla informativa de
RCM. Como resultado de esto, si la planilla de información ha sido preparada con una base
realista, el solo hecho de que el modo de falla este mencionado en ella, implica que hay una
probabilidad de que ocurra, y por lo tanto, que deberíamos someterlo a un análisis mas
profundo.
(A veces puede ser prudente mencionar un modo de falla muy improbable, aunque aun
peligroso, e un FMEA, solamente para tener el registro de que fue considerado y mas tarde
rechazado. En estos casos, debería redactarse un comentario como ser “Este modo de falla es
considerado muy poco probable, para justificar un análisis mayor”).
¿Es el riego tolerable?
Uno de los aspectos más difíciles del manejo de la seguridad, es el grado en el que lo que se
considera tolerable, varia de individuo a individuo y de grupo en grupo. Una gran variedad de
factores influencian estas creencias, de los cuales el más dominante es definitivamente “cual
es el grado de control que un individuo piensa que tiene sobre una determinada situación.”Las
personas están prácticamente siempre preparadas para tolerar un nivel de riesgo mas alto,
cuando ellas mismas tienen el control de la situación, que si sintieran que esta mas allá de su
control.
Por ejemplo, las personas toleran niveles de riesgo mucho más altos, cuando van conduciendo
sus propios autos, que cuando son pasajeros de un avión. ( El grado en el que este tema
gobierna la percepción del riesgo se ve claramente en la estadística de que 1 persona en
11.000.000 que viajan en avión entre Nueva Cork , y Los Ángeles, tiene probabilidades de
morir en ese tramo, mientras que un apersona en 14.000 que hace este viaje en auto tiene
probabilidades de morir. Y sin embargo, las personas siguen prefiriendo hacer este tramo por
tierra porque sienten que están mas seguros!)
Este ejemplo ilustra la relación entre las probabilidades de morir que cualquier persona esta
preparada para tolerar, el grado en el cual esa persona cree estar en control. En términos
generales, esto puede variar para un particular, como lo vemos en la figura 5.2.
93
10-4
Probabilidad
que tolero de
ser asesinado
en cualquier
año
10-5
10-6
10-7
Creo que
tengo un
control
completo
(manejando
mi auto o en
el taller de
mi casa.
Creo que tengo
cierto control y la
eleccion de
exponerme a mi
mismo (en el
lugar donde
trabajo
Creo que no
tengo control,
pero no tengo que
exponerme a mi
mismo (en un
avion de
pasajeros)
Creo que tengo
cierto control y la
eleccion de
exponerme a mi
mismo (en el
lugar donde
trabajo
Grafico 5.2 Tolerancia al Riesgo fatal.
Los números dados en este ejemplo, no intentan ser prescriptitas, y no reflejan
necesariamente la visión del autor – ellos implementan ilustran lo que un individuo pude
decidir esta o no preparado para tolerar. Tenga en cuenta que esta basado en la perspectiva de
un individuo dirigiéndose a su trabajo diario. Esto entonces debe ser traducido en el grado de
riesgo para toda la población (todos los trabajadores en una planta, los ciudadanos en un
pueblo, o la población de un país.)
En otras palabras, Si yo tolero una probabilidad de 1en 100. 000 de morir en el trabajo en un
año, y tengo 1000 compañeros que comparten mi misma visión, entonces todos toleramos que
i persona al año morirá en nuestra planta, cada 100 años- y que eso puede sucederme a mi, y
quizás este año.
Tengan en cuenta, que cualquier cuantificación de riesgo es solo una aproximación. En otras
palabras, si yo afirmo que tolero una probabilidad de 1 en 100.000, esto no es más que una
cifra aproximada. Esto indica que estoy preparado para tolerar la probabilidad de morir en el
trabajo, que es 10 veces menor que lo que puedo tolerar al conducir en autopistas (cerca de 1
en 10.000).
Siempre recordando que estamos trabajando con aproximaciones, el próximo paso es traducir
las probabilidades de que yo mismo, y mis compañeros estamos preparados para tolerar, que
ninguno de nosotros puede morir, por cualquier situaron bajo una probabilidad tolerable n
cada evento individual (modo de falla o falla múltiple) Que podría matar a alguien.
Por ejemplo, continuando con la lógica del ejemplo previo, la probabilidad de que alguno de
mis compañeros morirá en cualquier año es 1 en 100 (asumiendo que todos en la planta se
enfrentan al mismo riesgo).Si las actividades llevadas a cabo implican, 10.000 eventos que
pudieran causar la muerte a alguien, entones la probabilidad promedio de que un evento pueda
causar la muerte de una persona, debe reducirse a 1 en 1.000.000 en cualquier año. Esto
significa que la probabilidad de mueran 10 personas debe reducirse 1 en 10.000.000, mientras
que la probabilidad de un evento que tiene una chance en 10 de matar una persona, debe
reducirse a 1 en 100.000.
94
Estas técnicas en las que se pueden elevar y reducir esta jerarquía de probabilidades, se
conocen como Evaluaciones de riesgo cuantitativas o probables. Esto se explora con mayor
profundidad en el apéndice 3. Los puntos clave a tener en cuanta en esta etapa son:
* La decisión de que es tolerable debe comenzar con la posible victima. Como se debe
involucrar a la posible victima en el contexto industrial se discutirá mas adelante en este
capitulo.
* Es posible vincular lo que una persona tolera directamente o cuantitativamente a una
probabilidad tolerable de modos de falla individuales.
A pesar de que el grado de control percibido generalmente domina las decisiones sobre la
tolerabilidad del riesgo, esta no es en absoluto en único planteo. Otros factores que nos
ayudan a decidir que es tolerable incluyen factores como ser:
* Valores individuales: Explorar este tema va más allá del alcance de este libro. Es suficiente
poner en contraste la tolerancia al riesgo que tiene un montanista, comparada con la que tiene
una persona que sufre de vértigo, o la de trabajadores de una mina subterránea, con la de los
que sufren claustrofobia.
* Valores industriales: Mientras que toda industria hoy en día reconoce la necesidad de
trabajar con la mayor seguridad posible, no se puede obviar el hecho de que algunas son
intrínsicamente más peligrosas que otras. Algunas incluso compensan los niveles de riesgo
mayor, con pagas mayores. La visión de cualquier individuo que trabaje en esa industria,
analizan y deciden si “vale la pena” – en otras palabras, si los beneficios justifican el riesgo.
El efecto en “generaciones futuras”: la seguridad en los niños _ especialmente de lo que aun
no han nacido_ tiene in gran efecto n la visión de las personas sobre lo que es “tolerable”. Los
adultos frecuentemente muestran una despreocupación sorprendente por su propia seguridad.
(Es testigo el tiempo que debe perderse, tratando de persuadir a las personas de usar
indumentaria de protección), sin embargo, amenace a sus niños, y su actitud cambia
completamente.
Por ejemplo, el autor trabajo con grupo que tuvo la oportunidad de discutir las propiedades de
un químico, Palabras como, “acido”, o “cancerigeno”, eran tratadas con indiferencia, aun
cuando la mayoría de las personas en este grupo eran las mas expuestas al riesgo. Sin
embargo cuando surgió que el químico era también mutagénico y teratogenicos, y se explico
al grupo el significado de estas palabras, comenzaron a tomar este químico con mucho mas
respeto.
Conocimiento: las percepciones del riesgo son influenciadas en gran medida por cuanto saben
las personas sobre el bien, el proceso del que este forma parte y el mecanismo de falla
asociado a cada modo de falla. Cuanto mas saben, tienen un mejor juicio. (La ignorancia es
generalmente una espada de doble filo. En algunas situaciones las personas tomas riesgos
extremos por pura ignorancia, mientras que en otros, exageran el riesgo enormemente,
también por ignorancia. (Por otro lado, necesitamos recordar constantemente el grado en que
la familiaridad puede engendrar el desencanto.)
Un gran número de otros factores también influencian la percepción de riesgo, tales como el
valor que se da a la vida humana por diferentes grupos culturales, valores religiosos, y
factores tales como la edad, y el estado civil de los individuos.
95
Todos estos factores implican que es imposible especificar un nivel de tolerancia para
cualquier riesgo absoluto y objetivo. Esto sugiere que la tolerancia a cualquier riesgo puede
solo ser evaluada en una base tanto subjetiva como relativa_ “relativa” en el sentido de que el
riesgo se compara con otro riesgo sobre el cual hay un consenso claro, y subjetiva, en el
asunto es también un tema de juicio. Pero del juicio de quien?
¿Quien debería evaluar los riesgos?
La diversidad de los actores descriptos anteriormente implica que no es posible para ningún
ser humano- ni siquiera para una organización- evaluar los riesgos de manera tal que sean
universalmente aceptables. Si el evaluador es demasiado conservador, las personas lo
ignoraran y hasta pueden ridiculizar la evaluación. Si en cambio es demasiado relajado, se lo
puede llegar a acusar de jugar con la vida de las personas. (Por no decir de matar personas).
Esto sugiere que una evaluación de riesgos satisfactoria solo puede ser llevada a cabo por un
grupo. En la medida de lo posible, este grupo debería representar personas con un claro
entendimiento del mecanismo de fallas, los efectos de las fallas, (especialmente la naturaleza
de los riesgos), la probabilidad de que ocurran esas fallas, y que medidas se puede tomas para
anticiparlas o prevenirlas. El grupo también debe incluir personas con un entendimiento claro
de la tolerabilidad o no de un riesgo. Esto significa representantes de las posibles victimas
(por lo general operadores o personal de mantenimiento en el caso de los riesgos de seguridad
directos) y de la gerencia (que generalmente toman responsabilidad si alguien sale lastimado,
o si se viola una norma medioambiental.
Si esto se aplica desde un enfoque apropiado y estructurado, la sabiduría colectiva de un
grupo tal, hará mucho para asegurar que la organización hace lo mejor para identificar y
manejar todos los modos de falla que pudieran afectar la seguridad o el medioambiente. El
uso de tales grupos permite ponerse al nivel de la tendencia mundial respecto a leyes que
implican que la seguridad es responsabilidad de todos los empleados, no solo de los
directivos).
Los grupos de esta naturaleza pueden alcanzar consenso con rapidez, cuando tratan con
riesgos directos a la seguridad, ya que incluyen las personas en riesgo. Los riesgos
medioambientales no son tan simples, porque la sociedad en su totalidad, es la “victima
probable” y no se tiene familiaridad con muchos de los temas implicados. De modo que un
grupo que se espera considere si una falla viola o no una regla medioambiental, deben
conocer de antemano cuales son las normas y reglas que cubren el proceso bajo revisión.
Mantenimiento Proactivo y de Seguridad
Si una falla pudiera afectar la seguridad del medioambiente, el proceso de RCM estipula que
debemos tratar de prevenirla. Esta discusión sugiere que:
Para modos de falla que tienen consecuencias de seguridad o medioambientales, solo es
valido llevar a cabo una tarea proactiva si reduce la tolerabilidad de la falla a un nivel
tolerable.
Si no se encuentra una tarea proactiva que logre este objetivo satisfaciendo al grupo que
realiza el análisis, esto significa que estamos en presencia de riesgos de seguridad o
medioambientales, que no pueden ser prevenidos o anticipados adecuadamente. Esto implica
que se debe modificar algo para lograr que el sistema sea seguro. Este “algo” puede ser el
bien en si mismo, un proceso o un procedimiento operativo. A veces los cambios son
clasificados como “rediseño”, y se los leva cabo con uno de dos objetivos:
96
* Reducir la probabilidad de la falla a un nivel tolerable,
* Cambiar aspectos, de modo que la falla no tenga más consecuencias medioambientales o de
seguridad.
El tema de rediseño se discute con mayor profundidad en el capitulo 9.
Tenga en cuanta que cuando tratamos con asuntos medioambientales y de seguridad, RCM no
considera los costos de las fallas en términos financieros. Si no es seguro tenemos la
obligación, ya sea de evitar que falle, o de hacerlo seguro. Esto sugiere que el proceso de
decisión para modos de falla que tienen consecuencias medioambientales, puede resumirse
como se expone en el grafico 5.3
Causa el modo de falla una
perdida de funcion u otro
daño que podría lastimar a
alguien?
NO
SI
Causa el modo de falla una perdida
de funcion u otro daño
Que podría violar cualquier norma
de o regulación medioambiental?
SI
El mantenimiento proactivo es
conveniente si reduce el riesgo de
falla a un nivel bajo tolerable.
NO
Ver Partes 4 y 5
de Este capitulo.
Si no se logra encontrar una tarea productiva que reduzca el riesgo de la falla a
un nivel bajo tolerable, el rediseño es obligatorio.
Grafico 5.3 Identificación y desarrolloyo de una estrategia de mantenimiento para una falla
que afecta la seguridad o el medioambiente.
La base sobre la cual determinamos la posibilidad técnica y la frecuencia de los diferentes
tipos de tareas proactivas se discute en los capítulos 6 y 7.
RCM y la Legislación sobre Seguridad
Siempre surge una pregunta sobre la relación de RCM, y la legislación obre seguridad (con la
legislación medioambiental se trabaja directamente.)
Hoy en día, la mayoría de las leyes relacionadas a la seguridad exigen solo que los usuarios
sean capaces de demostrar que sus bienes son seguros. Esto llevo a un gran énfasis en el
concepto de auditorias, que básicamente requieren a los usuarios proveer evidencia
documentada de que sus programas de mantenimiento poseen una base racional y defendible.
En la gran mayoría de los casos RCM satisface plenamente estos requerimientos.
Sin embargo, algunas regulaciones exigen que deban realizarse determinadas tareas en
equipos específicos, a intervalos también determinados. Si es proceso de RCM sugiere una
tarea diferente, o con una frecuencia distinta m es sabio continuar llevando a cabo la tarea
especifica impuesta por la legislación, y discutir cualquier cambio eventual con la autoridad
regulatoria.
97
5.4 Consecuencias Operativas.
Como las fallas afectan a las operaciones:
La función primaria de la mayoría de los equipos en la industria, esta conectada de alguna
manera con la necesidad de generar ingresos, o respaldar las actividades generadoras de
ingresos.
Por ejemplo, la función primaria de la mayoría de los bines utilizados en manufactura es
agregar valor a los materiales, mientras que los clientes pagan directamente para acceder a
telecomunicaciones y equipos de transporte (colectivos, camiones, trenes o aviones.)
Las fallas que afecten la función primaria de estos bienes afectan también la capacidad de
obtener ganancias de la organización. La magnitud de estos efectos depende en cuanta es la
carga que un equipo soporta, y la disponibilidad de alternativas. Sin embargo, en casi todos
los casos los efectos son aun mayores, que el costo de reparar la falla. Esto también es cierto
en equipos de industrias de servicio, tales como entretenimientos, comercio y hasta bancos.
Por ejemplo, si las luces fallan en un partido de football, el publico tiende a querer la
devolución de su dinero. Lo mismo sucede si los proyectores fallan en un cine. Si el aire
acondicionado no funciona en un restaurante, los clientes se retiraran. Los bancos pierden
negocios si fallan sus cajeros automáticos no funcionan.
En general, las fallas afectan las operaciones de cuatro maneras:
* Afectan el rendimiento total: esto ocurre cuando un equipo se detiene totalmente, o cuando
comienza a trabajar con lentitud. Esto resulta ya sea en costos de producción incrementados,
si la planta tiene que trabajar horas extras para recuperar tiempo, o pérdida de ventas si la
planta ya esta cargada a su capacidad máxima.
* Afectan la calidad del producto: Si la maquina no puede superar las tolerancias de
manufactura, o si las fallas causan el deterioro del material, el resultado probable, es
deshecho, o demanda una reelaboración costosa. En un sentido más general, “calidad”
también abarca conceptos como la precisión en sistemas de navegación, la exactitud de los
sistemas de objetivos, y así sucesivamente.
* Afectan el servicio al cliente: Las fallas afectan el servicio al cliente de diversas maneras,
yendo desde la entrega tardía de órdenes, hasta la partida demorada de vuelos. Las demoras
frecuentes o de seriedad, traen aparejadas multas importantes, pero en la mayoría de los casos
no resultan en una inmediata perdida de ingresos. Sin embargo los problemas de servicio
crónicos eventualmente provocan la perdida de confianza del cliente, lo que hace que se
retiren y busquen otro negocio.
* Costos operativos mayores, sumados a los costos directos de reparación: Por ejemplo la
falla puede llevar a un consumo mayor de energía, o puede traer aparejado el cambio a un
proceso alternativo más costoso.
En las compañías sin fines de lucro, tales como las organizaciones militares, ciertas fallas
pueden afectar la capacidad de la empresa para cumplir sus funciones principales, algunas
veces con resultados desvastantes.
98
“Por falta de un clavo, se perdió la herradura. Por falta de una herradura se perdió el caballo.
Por falta del caballo, se perdió el mensaje. Por falta del mensaje, se perdió una batalla. Por
falta de esa batalla, se perdió la guerra. Todo por falta del clavo de una herradura de caballo.”
Si bien es muy difícil poner precio a una guerra, las fallas de este tipo tienen consecuencias
económicas reales a un nivel más mundano. Si suceden con demasiada frecuencia, será
necesario conservar dos caballos, para así asegurarse que el trabajo se realizara- o sesenta
tanques de batalla en vez de de cincuenta. O seis aviones en lugar de cinco- las redundancias
en esta escala pueden reducir muy costosas.
La severidad de estas consecuencias, implican que si una falla evidente no implica una
amenaza a la seguridad o el medioambiente, el proceso de RCM se centra en las consecuecias
operativas de la falla.
“Una falla tiene consecuencias operativas si tiene un efecto adverso directo en la capacidad
operativa”.
Como vimos, estas consecuencias tienden a ser evaluadas en términos económicos. Sin
embargo que ciertos casos mas extremos, (tales como perder una guerra), el “costo” puede
tener que ser evaluado en una base mas “cualitativa”.
Evitar las Consecuencias Operativas.
El efecto económico general de cualquier modo de falla que trae consecuencias operativas
depende de dos factores:
* Cual es el costo de la falla cada vez que ocurre, en término de consecuencias operativas,
más costos de reparación.
* Con que frecuencia sucede.
En la sección previa de este capitulo, no prestamos demasiada atención a la frecuencia con
que tienden a presentarse las fallas. (Los costos de una falla no están basados en fallas
relacionadas a seguridad, porque el objetivo en estos casos es evitar toda falla que pueda
servir de base.) Sin embargo, si las consecuencias de la falla son económicas, el costo total se
ve afectado por la frecuencia de las consecuencias. En otras palabras, para evaluar el impacto
económico de estas fallas, necesitamos evaluar cuanto pueden llegar a costar en un periodo
determinado de tiempo.
La bomba puede
entregar hasta 1000
litros de agua por
minuto
X
Y
Salida del tanque:
800 litros por minuto
Considere por ejemplo la bomba que se mostro en el grafico 2.1. La bomba es controlada por
un interruptor de flota que la activa cuando el nivel en el tanque Y disminuye a 120.000 litros,
y por otro que la desactiva cuando el nivel en el tanque Y alcanza los 240.000 litros. Una
99
alarma de bajo nivel se encuentra ubicada justo debajo del nivel de 120.000 litros. Si el tanque
se seca, el proceso de corriente hacia abajo debe ser cancelado. Esto tiene un costo para la
empresa que utiliza la bomba de $5 por minuto.
MODO DE FALLA
Desgaste del cojinete
debido al desgaste
normal
EFECTO DE LAS FALLAS
El motor falla pero no suena la alarma en el cuarto de
control. El nivel en el tanque disminuye hasta que suena
la alarma de bajo nivel a 120.000 litros. Tiempo de
inactividad para reemplazar el cojinete: 4 horas. (el
transcurrido entre cada ocurrencia de esta falla es de 3
años)
Grafico 5.5 FMEA para fallas del cojinete de la bomba única.
Asumamos que ya ha sido acordado que uno de los modos de falla que pueden afectar esta
bomba es “soportes se atascan debido al desgaste natural”. Por pura simplicidad, asumamos
que el motor de esta bomba esta equipado con un interruptor de sobrecarga, pero no hay una
alarma de falla conectada con la sala de control.
Este modo de falla debe ser descrito como se muestra en la figura 5.5.
El agua es extraída del tanque a una velocidad de 800 litros por minuto, de modo que el
tanque se seca 2,5 horas después e que suena la alarma de bajo nivel. Lleva cuatro horas
reemplazar los soportes, de modo que proceso de paso de agua se suspende por 1.5 hs. De
modo que la falla cuesta:
1.5 x $5.000 = $7.500
En perdida de producción cada tres años, mas el costo de reemplazar los soportes.
Supongamos que es técnicamente posible controlar los soportes por ruidos audibles una vez a
la semana, (la base en la que hacemos este juicio se discute en el capitulo siguiente.) Si se
encuentra que el soporte hace ruido, se puede evitar las consecuencias operativas de la falla
asegurando que el tanque esta lleno antes de comenzar a trabajar en el soporte. Esto provee 5
horas de almacenamiento, de modo que ahora el soporte puede ser reemplazado en cuatro
horas sin interferir el proceso de flujo.
Supongamos también que la bomba esta ubicada en una estación de bombas sin operadores.
Se acordó, que el chequeo debe ser llevado a cabo por un operario de mantenimiento, y que el
tiempo tita necesario para hacer cada control es 20 minutos, asumamos que el costo de
contratar a este operario es $24 dólares la hora, en cuyo caso costaría $8 llevar a cabo cada
control. Si el MTBF del soporte es tres años, se llevaran cabo cerca de 150 chequeos por falla.
En otras palabras el costo del control es:
150 x $8 = $1200
Mas el costo de reemplazar el soporte.
En este ejemplo, la tarea programada tiene claramente una mejor relación costo-efectividad,
en relación con las consecuencias operativas de la falla más el costo de reparación.
100
Esto sugiere que si una falla tiene consecuencias operativas, la base para decidir si una tarea
proactiva es conveniente es la parte económica:
Para modos de falla con consecuencias operativas, es conveniente llevar a cabo una tarea
proactiva si, después de un periodo de un determinado tiempo, es menos costosa que las
consecuencias operativas mas el costo de reparación de la falla que pretende prevenir.
Contrariamente, si no se puede encontrar una tarea proactiva conveniente y efectiva, entonces
no vale llevar a cabo el mantenimiento programado para tratar de anticipar o prevenir el modo
de falla bajo consideración. En algunos casos lo más conveniente será decidir vivir con la
falla.
Sin embargo, si no se encuentra una tarea proactiva, y las consecuencias de la falla son
intolerables, puede ser necesario cambiar el diseño del bien (o cambiar el proceso) para así
reducir el costo final mediante:
* La reduccion de la frecuencia (y por lo tanto costo total) de la falla.
* La reduccion o eliminando las consecuencias de la falla
* La obtención de una buena relación costo- efectividad de una tarea proactiva.
El rediseño se discute en mayor detalle en el capitulo 9.
Tener en cuenta que en el caso de un modo de falla con consecuencias medioambientales y de
seguridad, el objetivo es reducir la probabilidad de la falla a un nivel muy bajo. En el caso de
consecuencias operativas, el objetivo será reducir la probabilidad (o frecuencia), a un nivel
económicamente tolerable. Como se menciona al comienzo de la parte tres de este capitulo,
esta frecuencia tiende a tener una magnitud mucho mayor a lo que estamos dispuestos a
tolerar en relación a riesgos de seguridad. Entonces el proceso de RCM asume que una tarea
proactiva que reduce la probabilidad de las fallas relacionada a seguridad a un nivel tolerable,
también manejara las consecuencias operativas de la falla.
En un principio, solo consideramos la posibilidad de realizar cambios después de haber
analizado si es posible lograr el desempeño deseado como el bien bajo la configuración
actual. Sin embargo, en este caso las modificaciones también deben tener un costo justificado,
donde sea la acción de default obligada para modos de falla con consecuencia
medioambientales o de seguridad.
A la luz de estos comentarios, el proceso de decisión para fallas con consecuencias operativas,
se puede resumir como mostramos en el grafico 5.6
101
¿Tiene el modo de falla un
efecto adverso directo
sobre la capacidad
operativa?
NO
El mantenimiento proactivo es conveniente si
después de un periodo de tiempo su costo es
menor al de las consecuencias operativas
más el costo de las fallas que pretende
reparar.
NO
Ver Parte 5 de
este capitulo
Si no puede encontrarse una tarea de buena
relación costo efectividad, la decisión de
default es mantenimiento no programado.
… pero puede ser conveniente rediseñar el bien o cambiar el
proceso para reducir los costos totales.
Grafico 5.6 - Identificacion y desarrollo de una estrategia de mantenimiento para una falla
que posee consecuencias operativas.
Este análisis se realiza a cada modo de falla individual, y no al equipo como un todo. Esto es
porque cada tarea proactiva es diseñada para prevenir un modo de falla específico. De modo
que la viabilidad económica de cada tarea solo puede ser comparada a los costos de lo modos
de falla que pretende prevenir. En cada caso es una simple decisión de hacerlo o no.
En la practica, cuando evaluamos los modos de falla individuales e este sentido, no es siempre
necesario llevar a cabo un estudio detallado de costo-beneficio basado en los costos de de
inactividad real y MTBF’s como se muestra en el ejemplo de la pagina 106. Esto es porque el
atractivo económico de las tareas proactivas es con frecuencia intuitivamente obvio cuando
evaluamos modos de falla con consecuencias operativas.
Sin embargo, si las consecuencias económicas son evaluadas formal o intuitivamente, este
aspecto del proceso de RCM debe ser aplicado ampliamente. (En realidad este paso es en
realidad sorprendentemente pasado por alto por la gente nueva en el proceso.
El personal de mantenimiento en particular, tiene una tendencia a implementar tareas en base
a la viabilidad técnica solamente, lo que resulta en programas de mantenimiento elegantes,
pero muy costosos.
Finalmente, se debe tener en cuanta que las consecuencias operativas de toda falla están
fuertemente influenciadas por el contexto en el que esta operando el bien. Esta es otra razón
mas por la que se debe tener cuidado para asegurar que el contexto es idéntico, antes de
aplicar un programa de mantenimiento que fue diseñado para otro bien. Los temas claves son
discutidos en la parte 3 del Capitulo 2.
102
5.5 Consecuencias No- Operativas.
Las consecuencias de una falla directa que no tienen efectos directos adversos sobre la
seguridad, el medioambiente o la capacidad operativa, se clasifican como no- operativas. Las
únicas consecuencias asociadas con estas fallas son los costos directos de reparación, de modo
que las consecuencias son económicas.
Considere por ejemplo las bombas que se observan en la figura 5.7. Esto es similar ala figura
que vimos en el grafico 5.4, excepto que ahora hay dos bombas (ambas idénticas a la del
grafico 5.4)
Bomba
principal
“B”
La bomba puede
entregar hasta
1000 litros de
agua por minuto
X
Y
Stand by
“C”
Salida del tanque:
800 litros por minuto
Grafico 5.7 Bomba con stand- by.
La bomba principal se enciende por un interruptor flotante cuando el nivel del tanque Y baja a
120.000 litros, y se apaga por otro cuando el nivel alcanza los 240.000 litros. Un tercer
interruptor se coloca justo abajo del de bajo nivel de la bomba principal, y este es diseñado
tanto para disparar la alarma en la sala de control si el nivel de agua lo alcanza, y para
encender la bomba de emergencia. Si el tanque se seca, el proceso de extracción de agua debe
detenerse. Esto también cuesta a la organización que utiliza la bomba un promedio $ 5.000
por hora.
Como antes, supongamos que un modo de falla afectando la bomba es “estancamiento de los
soportes” y que esto s causado por el desgaste normal. Supongamos que el motor de la bomba
principal también esta equipado con un interruptor de sobrecarga, pero no hay una alarma
conectada a la sala de control. Este modo de falla y sus efectos deben ser descriptos en la
planilla informativa de RCM como vemos en el grafico 5.8.
MODO DE FALLA
Desgaste del cojinete
debido al desgaste
normal
EFECTO DE LAS FALLAS
El motor falla pero no suena la alarma en el cuarto de
control. El nivel en el tanque disminuye hasta que suena
la alarma de bajo nivel a 120.000 litros, y la bomba
stand- by es activasa automaticamente. Tiempo de
inactividad para reemplazar el cojinete: 4 horas. (el
transcurrido entre cada ocurrencia de esta falla es de 3
años)
103
Grafico 5.8 FMEA para una falla en los soportes de una bomba principal con una de
emergencia.
En este ejemplo, la bomba de reemplazo, se enciende cuando la bomba principal falla, de
modo que el tanque no se seca. El único costo asociado a esta falla es reemplazar el soporte.
Supongamos sin embargo que es técnicamente viable chequear los soportes por algún ruido
extraño una vez a la semana. Si se notara que es ruidoso, los operadores cambiaran
manualmente a la bomba de emergencia, y se reemplazara ese soporte.
Supongamos que estas bombas también están situadas en una estación donde no hay
operarios, y que se acordó que el chequeo – que también lleva 20 minutos- deber ser llevado a
cabo por un operador de mantenimiento a un costo de $8 por chequeo, y de nuevo, haremos
alrededor de 150 chequeos por falla. En otras palabras, el costo del programa de
mantenimiento proactivo por falla es de:
150 x $8 = $1200 mas el costo de reemplazar el cojinete.
En este ejemplo el costo de realizar a tarea programada, es mucho mayor que el costo de no
llevarla a cabo. Como resultado, no es conveniente realizar la tarea proactiva aun cuando la
bomba es técnicamente idéntica a la que describimos en el grafico 5.3. Esto sugiere que
únicamente es conveniente prevenir una falla que no tiene consecuencias operativas, si, en un
periodo de tiempo, el costo de la tarea preventiva es menor que el costo de corregir una falla.
Si no lo es, entonces el mantenimiento programado no tiene razón de ser.
Para los modos d falla con consecuencias no operativas, es conveniente realizar una tarea
proactiva si, en un periodo de tiempo el costo de esta es menor, que el de reparar las alas
que pretende prevenir.
Si una tarea proactiva no es conveniente, entonces las modificaciones serán raramente
justificadas, por las mismas razones que las relacionadas a fallas con consecuencias
operativas.
Más Puntos Concernientes a Consecuencias No operativas.
Se necesita tener en cuenta dos puntos más cuando revisamos fallas con consecuencias nooperativas:
* Daños secundarios: algunos modos de falla causan daños secundarios considerables, si non
anticipados o prevenidos, lo que suma al costo de repararlos. Una tarea proactiva apropiada
puede prevenir o anticipar la falla, y así evitar el daño. Sin embargo, tal tarea solo se justifica
si el costo de hacerlo es menor al costo d reparar la falla y al daño secundario.
Por ejemplo, en el grafico 5.7, la descripción de los efectos de falla sugiere que el
atascamiento de los soportes no causa daños secundarios. Si esto es así, el análisis es valido.
Sin embargo, si la falla inanticipada del soporte también causa (digamos) que el eje se parta,
entonces una parea proactiva que detecte la falla inminente en los soportes, permitiendo a los
operadores apagar la bomba antes de que se dañe el eje. En este caso el costo de la falla
inanticipada del soporte es:
104
El costo de reemplazar el soporte y el eje.
Por otro lado el costo de la tarea proactiva (por falla de soportes) es: $1200 mas el costo de
reemplazar el soporte.
Claramente la tarea es conveniente si reemplazar el eje tiene un costo mayor a $1200. Si
cuesta menos que esto, entonces no es conveniente.
* Funciones protegidas: Solo es valido decir que una falla no tiene consecuencias operativas
al tener un componente de reemplazo o emergencia, si es que podemos asegurar que el
dispositivo de protección funcionara, cuando la falla se presente. Esto significa que se debe
aplicar a tal dispositivo un programa de mantenimiento adecuado (la bomba de emergencia es
el ejemplo dado) Esto se discute extensamente en la parte siguiente de este capitulo.
Si las consecuencias de fallas múltiples de un sistema protegido son particularmente serias,
puede ser conveniente prevenir la falla de la función protegida, así como el dispositivo de
protección para reducir la probabilidad de fallas múltiples a un nivel tolerable. (Como se
explica en la página 97, si las fallas múltiples poseen consecuencias de seguridad, seria sabio
evaluar las consecuencias, como si no existiera la protección, y luego revalidar la protección
como parte del proceso de selección de tareas.)
5.6 Consecuencias de Fallas Ocultas.
Fallas ocultas y dispositivos de protección.
El capitulo 2 mencionaba que el crecimiento en el numero de posibilidades en las que un
equipo puede fallar, llevo a un crecimiento aparejado en la variedad y severidad de las
consecuencias de las fallas que caen en las categorías evidentes. También mencionaba que los
dispositivos de protección se usan cada vez mas en un intento por eliminar (o al menos
reducir) estas consecuencias.
Y explicaba como trabajan estos dispositivos en una de las siguientes formas:
* Para alertar a los operarios por condiciones anormales.
* Para apagar el equipo en caso de falla.
* Eliminar o aliviar las condiciones anormales que siguen a una falla y que podrían causar
daños más serios.
* Reemplazar una función que fallo.
* Prevenir la aparición de situaciones de peligro.
En esencia, la función de estos dispositivos es asegurar que las consecuencias de la falla de la
función protegida son mucho menos serias de lo que seria si no hubiera protección. De modo
que todo dispositivo de protección es en realidad parte de un sistema, con al menos dos
componentes:
* El dispositivo de protección
* La función protegida.
105
Por ejemplo, la bomba C en la figura 5.7 puede ser considerada como un dispositivo d
protección, porque “protege” la función de bombeo si la bomba “B” fallara. La bomba B es
por supuesto la función protegida.
La existencia de este sistema crea dos grupos de posibilidades de falla, dependiendo si el
dispositivo de protección es a prueba de fallas o no.
Sistemas de protección a prueba de falla:
En este contexto, a prueba de falla significa que la falla del dispositivo en si mismo será
evidente para los operarios bajo circunstancias normales.
En el contexto de este libro, un dispositivo “a prueba de fallas” es uno, cuya falla se volverá
evidente para los operadores bajo circunstancias normales.
Esto significa que en un sistema que incluye un dispositivo de protección a prueba de falla,
hay tres posibilidades de falla en cualquier periodo:
La primera posibilidad es que el dispositivo nunca falle. En este caso todo sigue su curso
normal.
La segunda posibilidad es que la función protegida falle antes que el dispositivo de
protección, En este caso este dispositivo lleva cabo la función esperada, y dependiendo de la
naturaleza de la protección, se eliminan o reducen las consecuencias de las fallas de la
función protegida.
La tercera posibilidad es que el dispositivo de protección falle antes que la función protegida.
Esto será evidente, porque si no lo fuera, el dispositivo no seria “a prueba de fallas” en el
sentido descrito anteriormente. Si se sigue una practica normal, las chances de que el
dispositivo protegido, falle al mismo tiempo que el de protección pueden ser eliminadas, ya
sea interrumpiendo la función protegida, o proveyendo protecciones alternativas mientras se
rectifica el dispositivo de protección fallado.
Por ejemplo, se puede solicitar a un operador que te nga en cuenta una válvula de presión – y
mantener su dedo en el botón de stop, mientras se reemplaza un interruptor de presión.
Esto significa que las consecuencias de las fallas de un dispositivo de protección a prueba de
fallas entran generalemnete en las categorías, “operativas" o “no operativas”.
La secuencia de eventos se resume en el grafico 5.9
2. La funcion de proteccion es desactivada o se proporciona otra proteccion
mientras que el dispositivo esta en reparacion. Esto reduce la probabilidad de
fallas multiples casi hasta 0.
Tiempo
Funcion de
proteccion
Dispositivo de
proteccion
La funcion de
proteccion
Es resguardada
mientras que se
repara el dispositivo
x
1. La falla del dispositivo
de proteccion a prueba de
fallas es evidente
inmediatamente.
x
4. Si la funcion de proteccion falla, el
dispositivo de proteccion actua para
reducir o eliminar las consecuencias
3. Dispositivo de
proteccion activado. La
situación es nuevamente
normal
106
Grafico 5.9 Fallas de un dispositivo de protección a prueba de fallas.
Dispositivos de protección que no son “a prueba de falla”\
En un sistema que contiene u dispositivo de protección que no es “a prueba de falla”, el hecho
de que el dispositivo no sea capaz de cumplir con su funcion esperada no es evidente bajo
circunstancias normales. Esto crea cuatro posibilidades de falla en cualquier periodo dado,
dos de las cuales son las mismas que se aplican a un dispositivo a prueba de fallas. La primera
es ningún dispositivo falla, el cuyo caso todo sigue un curso normal como antes.
La segunda posibilidad es que la función protegida falle en el momento en que el dispositivo
de protección esta funcionando. En este caso este, lleva a cabo la funcion esperada, y de
nuevo las consecuencias de la falla se eliminan o reducen.
Por ejemplo, consideren una válvula de alivio de presión (dispositivo de protección) ubicada
en un vaso de presión, (funcion protegida), Si la presión supera los limites tolerables, la
válvula libera presión, reduciendo o eliminando las consecuencias del exceso de la sobre
presurización Similarmente, si la bomba B en el grafico 5.7 falla. La bomba C se encarga de
continuar.
La tercera posibilidad es que la válvula de despresurización estuviera tapada, nadie se daría
cuenta de este hecho mientras, la presión se mantenga en los límites normales. Similarmente,
si la bomba C estuviera por fallar de algún modo mientras la bomba B esta aun trabajando,
nadie advertiría esto, a menos que la bomba B también fallara.
La discusión anterior sugiere que las funciones ocultas pueden ser identificadas formulando la
siguiente pegunta:
¿Será la perdida de una función causada por este modo de falla por si mismo, evidente
para los operadores bajo circunstancias normales?
Si la respuesta a esta pegunta es no, el modo de falla es oculto. Si la respuesta es si, es
evidente. Tenga en cuenta que en este contexto, “por si mismo” significa que nada mas fallo.
También asumimos que a este punto del análisis no se llevo a cabo ningún intento por
controlar si la funcion oculta esta aun trabajando. Esto porque tales controles son una forma
de mantenimiento programado. Y el propósito del análisis es justamente definir si tal
mantenimiento es necesario. Estos dos temas se discuten en mayor detalle mas adelante en
este capitulo.
La cuarta posibilidad durante cualquier ciclo es que l dispositivo de protección falle, y la
funcion protegida también falle mientras este está en estado de falla. Esta situación se conoce
como falla múltiple. (Esta es una posibilidad real simplemente porque la falla del dispositivo
de protección no es evidente, y así nadie advertiría la necesidad de tomar acciones correctivas
o alternativas para evitar la falla múltiple.
Una falla múltiple solo ocurre si una funcion protegida falla mientras un dispositivo de
protección esta en estado de falla también.
107
2. No se toma ninguna accion para desactivar la funcion de proteccion ni
para proporcionar otro tipo de proteccion.
Tiempo
Funcion de
proteccion
Dispositivo de
proteccion
La funcion de
proteccion opera sin
proteccion porque
nadie adviertio la
falla en el
x
1. La falla del dispositivo
de proteccion a prueba de dispositivo de
fallas no es evidente para proteccion
* 3. Si la funcion de proteccion
falla en este caso, el resultado
es una falla multiple
el operador.
Grafico 5.10 Falla de un dispositivo de protección cuya funcion es oculta.
La secuencia de eventos que lleva a las fallas múltiples se resume en el grafico 5.10. En el
caso de la válvula de alivio, si la presión del vaso aumenta excesivamente, mientras la
válvula esta tapada, este puede explotar, (a menos que alguien actúe rápidamente, o que halla
otra protección en el sistema). Si la bomba B falla, mientras la bomba C esta también en
estado de falla, el resultado será la interrupción total del bombeo.
Dado que la prevención de fallas es principalmente evitar las consecuencias de esas fallas,
este ejemplo también sugiere que cuando desarrollamos programas de mantenimiento para
funciones ocultas, nuestro objetivo es realmente prevenir, o al menos reducir la probabilidad
de las fallas múltiples asociadas a esto.
El objetivo de un programa de mantenimiento para una funcion oculta es prevenir - o al
menos reducir la probabilidad de – las fallas múltiples relacionadas.
Que tan intenso será el trabajo de prevención de una falla, depende de las consecuencias de
las fallas múltiples.
Por ejemplo, las bombas B y C pueden estar impulsando agua de enfriamiento a un reactor
nuclear. En este caso, si el reactor no pudiera apagarse lo suficientemente rápido, las
consecuencias de la falla múltiple podría ser un derretimiento, con consecuencias
medioambientales, operativas y de seguridad catastrófico.
Por otro lado, las dos bombas pueden estar conectadas a un tanque con capacidad suficiente
para proveer en proceso de flujo por dos horas. En este caso la consecuencia de la falla
múltiple será que se detiene la producción, después de unas dos horas, y luego solamente si
ninguna de las bombas puede ser reparada antes de que el tanque se seque. Un análisis
profundo sugiere que en el peor de los casos, esta falla múltiple le costara a la organización
(aprox.) $ 2000 en perdida de producción.
En el primero de estos ejemplos, las consecuencias de la falla múltiple son muy serias, de
modo que se deberá hacer todo lo posible para prevenir la falla de la funcion oculta. En el
segundo caso, las consecuencias son puramente económicas: y el costos de estas determinara
que tanto esfuerzo ponemos en prevenir la falla oculta.
108
Otros ejemplos de fallas ocultas, y sus consecuentes fallas múltiples si las primeras no fueran
detectadas:
* Interruptores de vibración: Un interruptor de vibración diseñado para apagar un ventilador
puede ser configurado de un modo tal que su falla esta oculta. Sin embargo, esto solo importa
si la vibración supera los limites tolerables, (una segunda falla), causando que los soportes del
ventilador y tal vez el ventilador en si mismo se desintegren (consecuencias de la falla
múltiple).
* Interruptor final de nivel: Los interruptores finales de nivel están diseñados para activar una
alarma, o apagar un equipo si un interruptor primario de nivel falla. En otras palabras, si se
atasca el interruptor final de bajo nivel, no habrá consecuencias a menos que el interruptor
principal también falle (segunda falla), en cuyo caso el receptáculo o tanque se secara
(consecuencias de la falla múltiple.)
* Mangueras de Incendio: La falla de una anguera para incendio no tiene consecuencias
directas. Solo importa si hay un incendio (segunda falla), cuando la manguera falla, lo que
puede resultar en la destrucción del lugar, y la pérdida de vidas. (Consecuencias de la falla
múltiple.
Otras funciones ocultas típicas incluyen, equipo medico de emergencia, detectores de
incendio, advertencias de incendio y equipos de extinción, botones de apagado de emergencia,
y cables de falla, estructuras secundarias de contención, interruptores de presión y
temperatura, dispositivos de protección de sobrecarga o exceso de velocidad, planta de
emergencia, componentes estructurales redundantes , interruptores de sobre corriente,
fusibles, y sistemas de emergencia de provisión de electricidad.
La disponibilidad requerida de Funciones Ocultas.
Hasta ahora, esta parte de este capitulo definió las fallas ocultas, y la relación entre
dispositivos de protección y funciones ocultas. La cuestión siguiente, involucra una mirada
mas detallada del desempeño requerido de las funciones ocultas.
Una de las más importantes conclusiones obtenidas asta ahora es que la única consecuencia
directa de una falla oculta, es la exposición creciente al riesgo de falla múltiple. Desde que lo
que queremos evitar es esto ultimo, la clave del desempeño requerido de una funcion oculta
debe estar conectada con la relativa falla múltiple.
Hemos visto que donde un sistema esta protegido por un dispositivo que no es “a prueba de
falla””, solo se presenta una allá múltiple mientras este dispositivo esta también en estado
fallado, como se ilustra en el grafico 5.10.
De modo que la probabilidad de una falla múltiple en cualquier periodo, debe ser determinada
por la probabilidad de que la funcion protegida falle, en el mismo periodo en que el
dispositivo de protección también se encuentre en estado de falla. El grafico 5.11 muestra que
esto se puede calcular de la siguiente manera:
Probabilidad de una
Múltiple falla
=
probabilidad de falla de x
una funcion protegida
indisponibilidad promedio
de un dispositivo de
protección.
109
La probabilidad tolerable de una falla múltiple es determinada por los usuarios del sistema,
como se discute en la parte siguiente de este capitulo, y nuevamente en el apéndice 3. La
probabilidad de falla de la función protegida es generalmente dada. De modo que si estas dos
variables son conocidas, la indisponibilidad permitida de un dispositivo de protección puede
ser expresada del siguiente modo:
Indisponibilidad permitida
Del dispositivo de protección
=
___Probabilidad de una falla múltiple_____
Probabilidad de falla de la función protegida
De modo que el elemento crucial del desempeño requerido de cualquier función oculta es la
disponibilidad requerida para reducir la probabilidad de las fallas múltiples asociadas a un
nivel tolerable. La discusión anterior sugiere que esta disponibilidad es determinada por las
siguientes tres etapas:
* Primero establecer que probabilidad puede tolerar la organización para la falla múltiple
* Luego determinar la probabilidad de que la funcion protegida pueda fallar en el periodo bajo
consideración (esto también se conoce como grado de demanda)
* Finalmente, determinar que disponibilidad debe alcanzar la funcion oculta para reducir la
probabilidad de la falla múltiple al nivel requerido.
Cuando calculamos los riesgos asociados a sistemas protegidos, hay a veces una tendencia a
considerar fija la posibilidad de falla del dispositivo de protección. Esto lleva a la creencia de
que el único modo de modificar la probabilidad de una falla múltiple es cambiar el equipo (es
decir modificar el sistema), quizás agregando mas protección, o reemplazando los
componentes existentes por otros que se consideren mas confiables.
En realidad, esta creencia es incorrecta, porque generalmente posible variar tanto la
posibilidad de falla de la funcion protegida como (especialmente) la indisponibilidad del
dispositivo de protección adoptando un mantenimiento y políticas operativas apropiados.
Como resultado, también es posible reducir la probabilidad de falla a prácticamente cualquier
nivel razonable al adoptar tales políticas. (Por supuesto cero es un ideal inalcanzable.)
Grafico 5.11:
Calculo sobre la probabilidad de una falla multiple
La “probabilidad” de que una funcion protegida falle en cualquier periodo es lo opuesto al
tiempo transcurrido entre fallas, como se ilustra en el grafico 5.11a a continuación:
Funcion de
Si el tiempo transcurrido entre fallas inesperadas de la funcion protegida es
de 4 años y el periodo de medicion es de un año, entonces la probabilidad de
Falla
que la funcion protegida falle en este periodo es 1 en 4.
*
proteccion
Dispositivo de
x
proteccion
Falla
Periodo de medicion
110
Grafico 5.11a Probabilidad de funciones protegidas
La probabilidad de que el dispositivo de proteccion se encuentre en un estado de falla en
cualquier momento se calcula por medio del porcentaje de tiempo que dura el estado de falla,
Esto por supuesto se mide en base a su falta de disponibilidad (lo cual tambien se conoce
como tiempo de inactividad “downtime”), como se muestra en el grafico a continuación:
Funcion de
Periodo de medicion
*
proteccion
Dispositivo de
proteccion
x
Fallo
Fallo
Si la falta de disponibilidad promedio del dispositivo de proteccion es
33%, entonces la probabilidad de que se encuentre en un estado de
falla en cualquier momento es de 1 en 3.
Grafico 5.11b Probabilidad y dispositivos de proteccion
La probabilidad de una falla multiple es calculada al multiplicar la probabilidad de falla de la
funcion protegida por la falta de disponibilidad promedio del dispositivo de proteccion. Para
el caso descripto en el grafico 5.11 (a) y (b), la probabilidad de una falla multiple seria la
indicada en el grafico 5.11c a continuación:
1 Año
Funcion de
Probabilidad de falla en un año = 1 en 4
*
proteccion
Dispositivo de
Disponibilidad 67%
proteccion
Falla
33%
Falta de disponibilidad
x
Fallo
La probabilidad de una falla
multiple en cualquier
momento:
1 en 4 x 1 en 3 = 1 en 12
Grafico 5.11c Probabilidad de una falla multiple
Por ejemplo, las consecuencias de que ambas bombas en el grafico 5.7 estén en estado de falla
pueden ser tales que los usuarios estén preparados para tolerar la probabilidad de una falla
múltiple de menos de 1 en 1000 en un año dado. Asumamos que también se estimo, que si la
bomba principal es mantenida apropiadamente, el tiempo medio entre fallas in anticipadas de
esta puede incrementarse a 10 años, lo que implicaría que la posibilidad de falla es 1 en por
año, cada 10 años.
De modo que para reducir la probabilidad de fallas múltiples a menos de 1 en 1000 en un año
dado, la bomba de emergencia no puede estar no disponible por más de un 1%. En otras
palabras, debe ser mantenida de manera tal que su disponibilidad exceda un 99%. Esto se
ilustra en el grafico 5.2.
111
1 Año
Funcion de
Probabilidad de falla en un año reducida a 1 en 10
*
proteccion
Dispositivo de
Falla
Falta de disponibilidad
Disponibilidad 99%
33 %
proteccion
La probabilidad de una falla
multiple en cualquier
momento:
1 en 10 x 1 en 100 = 1 en 1000
Grafico 5.2 Disponibilidad deseada de un dispositivo protegido.
En la práctica, la probabilidad considerada tolerable para cualquier falla múltiple depende de
sus consecuencias. En la gran mayoría de los casos las evaluaciones deben ser realizadas por
los usuarios del bien. Estas consecuencias varían enormemente entre sistema y sistema, de
modo que lo que se considera tolerable también es muy variable. Para ilustrar este punto, el
grafico 5.13 sugiere cuatro evaluaciones para cuatro sistemas diferentes.
Falla de la funcion
protegida
Error de ortigrafia en
memo o e-mail
Motor 10kW
sobrecargado de la
bomba B
Falla de la bomba
principal B
Caldera sobre presurizada
Estado de falla del
dispositivo de
proteccion
Corrector de ortografia
del procesador de texto
inhabilitado para detectar
los errores
Interruptor trabado en la
posición de cerrado
Falla de la bomba Stand
By C
Válvulas de alivio
cerradas
Fallas multiples
Relacion tolerable de
falles multiples
Errores de ortografis sin
detectar
¿10 por mes?
El motor de desgasta
$ 500 para reparar
¿1 en 50 años?
Perdida total de la
capacidad de la bomba:
$10.000 en perdidas de
produccion
La caldera explota:
Mueren 10 personas
¿1 en 1000 años?
¿1 en 10 000 000 años?
Grafico 5.13 Relacion de fallas múltiples.
Como anteriormente, estos niveles de tolerancia no tienen como fin ser prescriptivos, y no
reflejan necesariamente los puntos de vista del autor. Tienen como objetivo demostrar que en
cualquier sistema protegido, alguien debe decidir que es tolerable, antes de que se pueda
decidir sobre el nivel de protección necesario, y que este bien diferirá de sistemas distintos.
La parte 3 de este capitulo sugiere que si las fallas múltiples pueden afectar la seguridad,
“alguien” debe se un grupo que incluya a las posibles victimas y a sus superiores. Esto
también es cierto para las fallas múltiples que tienen consecuencias económicas.
Por ejemplo, en el caso del error de ortografía, la posible victima es el autor de la
correspondencia. En la mayoría de las organizaciones, las consecuencias no tienden a ser más
que pequeñas situaciones embarazosas (si alguien nota el error). En el caso de un motor
eléctrico, la persona con mas posibilidades de ser considerada responsable, (en otras palabras
la posible victima) será el jefe responsable del presupuesto de mantenimiento, o el jefe de
112
mantenimiento en persona. En el caso de perdida de bombeo, las sumas mayores
involucradas, implican que los niveles altos de gerenciamiento deben participar en el
establecimiento de los criterios de tolerancia.
El grafico 5.13 también sugiere que las probabilidades que toda organización debe estar
preparada para tolerar por fallas con consecuencias económicas tienden a decaer a medida
que la magnitud de las consecuencias se incrementa. Esto además sugiere que debería ser
posible para cualquier organización desarrollar un programa de riesgos económicos
estándares que podría a su vez ser utilizado para ayudar a desarrollar programas de
mantenimiento diseñados para liberar esos riesgos. Esto puede tomar la forma que se muestra
en el grafico 5.14
1
10-1
Probabilidad
que toleramos
de cualquier
evento en
cualquier
momento
10-2
Intolerable
10-3
10-4
Tolerable
10-5
10-6
Trivial
(sin costo)
Hasta $100
$ 1000
$ 10 000
$ 100 000
$ 1 millon
$ 10 millones y
más
Grafico 5.14: Tolerancia del riesgo económico.
Nuevamente, estos niveles de tolerabilidad no tienen intención de ser prescriptivos, y no
pretenden ser ningún tipo de Estándar Universal. Los riesgos económicos que toda
organización esta preparada para tolerar son literalmente asuntos de esa empresa.
Los grafico 5.2 y 5.14 sugieren que puede llegar a ser posible generar un programa de riesgo
que combine riesgos de seguridad y riesgos económicos en un continuo. En el apéndice 3 se
discute como sebe hacerse esto.
En algunos casos puede ser innecesario – en realidad a veces es imposible- llevar a cabo un
análisis cuantitativo de rigor, de la probabilidad de fallas múltiples en la forma descriptas
anteriormente. En tales casos puede ser suficiente hacer un juicio de la disponibilidad que se
requiere del dispositivo de protección, basado en una evaluación de calidad de la
confiabilidad de la funcion protegida, y las posibles consecuencias de la falla múltiple. Esto se
discute mas extensamente en el capitulo 8. Sin embargo, si la falla múltiple es particularmente
seria, entonces deberá realizarse un análisis de rigor.
Los siguientes pasos consideran en detalle como puede influenciar esto:
* El grado de fallas de las funciones protegidas.
* La disponibilidad de dispositivos protegidos.
113
Mantenimiento de Rutina y Funciones Ocultas
En un sistema que incorpora un dispositivo de protección que no es “a prueba de fallas”; la
probabilidad de una falla múltiple puede reducirse de la siguiente manera:
* Reduciendo el grado de falla de la funcion protegida:
_Llevando a cabo algún tipo de mantenimiento proactivo.
_ Cambiando el modo de operar la funcion protegida
_ Cambiando el diseño de la funcion protegida.
* Incrementar la disponibilidad del dispositivo de protección mediante:
_ Llevando a cabo algún tipo de mantenimiento proactivo.
_ Controlando periódicamente si el dispositivo de protección fallo.
_ Modificando el dispositivo de protección.
Prevenir la falla de la funcion protegida.
Hemos visto que la posibilidad de una falla múltiple esta basada en parte en el grado de falla
de la función protegida. Casi con certeza esto puede ser reducido mejorando el mantenimiento
u operación del dispositivo protegido, o hasta (como último recurso) cambiando su diseño.
Específicamente, si las fallas de una funcion protegida pueden ser anticipadas o previstas, el
tiempo entre medio de fallas (inanticipadas) de esta funcion aumentaría. Esto a su vez
reduciría la probabilidad de fallas múltiples.
Por ejemplo, un modo de prevenir la falla simultanea de las bombas B y C es tratando de
prevenir fallas inanticipadas de la bomba B. Al reducir los números de estas fallas, los
intervalos entre fallas de la bomba B aumentaran, y de ese modo las probabilidades de fallas
múltiples, se reducirán correspondientemente, como se muestra en el grafico 5.12.
Sin embargo, se debe tener en cuenta, que la razón para instalar un dispositivo de protección
es que las funcion protegida es vulnerable a fallas inanticipadas con serias consecuencias.
En segundo lugar, si no se realiza ninguna acción para proteger la falla del dispositivo de
protección, fallara inevitablemente en alguna medida, y por lo tanto dejara de proveer
protección alguna. Después de este punto, la probabilidad de una falla múltiple, es igual a la
probabilidad de la funcion protegida fallando por si misma.
La situación puede ser intolerable, o no se hubiera instalado en principio un dispositivo de
protección. Esto sugiere que al menos deberíamos intentar encontrar un modo práctico para
prevenir las fallas de los dispositivos de protección que no son a prueba de falla.
Prevenir la falla oculta
Para poder prevenir una falla oculta, debemos asegura que la funcion oculta no esta en estado
de falla, si es que, y cuando falle la funcion protegida. Si se encuentra una tarea proactiva los
suficientemente buena como para asegurar un 100% de disponibilidad del dispositivo
protegido, entonces la probabilidad de una falla múltiple se vuelve teóricamente imposible.
Por ejemplo, si se encontrara una tarea proactiva que asegure el 100 % de disponibilidad de la
bomba C cuando esta en estado de Stand by, entonces podríamos estar seguros de que C se
hará cargo cuando B falle.
114
(En este caso solo es posible una falla múltiple si los usuarios operan C mientras B esta bajo
reparación o siendo reemplazada. Sin embargo, inclusive el riesgo de falla múltiple es bajo,
porque B debería ser reparada a la brevedad, de modo que el periodo de tiempo en que la
organización esta en riesgo es básicamente corto. Si la organización esta o no preparada para
utilizar la bomba C, mientras la bomba B esta inactiva, depende de las consecuencias de la
falla múltiple, y del grado en que es posible acordar otras formas de protección, como se
discutió anteriormente).
En la práctica es menos posible que una tarea proactiva provoque que una funcion, oculta o
no, alcance una disponibilidad del 100% indefinidamente. Lo que se debe hacer, sin embargo,
es producir la disponibilidad necesaria para reducir la probabilidad de falla múltiple a un nivel
tolerable.
Por ejemplo, supongamos que encontramos una tarea proactiva que permitirá a la bomba C
tener una disponibilidad de 99%. Si el intervalo entre las fallas inanticipadas de la bomba B es
10 años, la probablididad de falla múltiple seria 1 en 1000, en un año dado, como se discutió
anteriormente.
Si la disponibilidad de la bomba C aumentara a 99%, entonces la probabilidad de allá múltiple
se reduciría a 1 en 10.000 y así sucesivamente.
De modo que para una falla oculta, solo es conveniente realizar una tarea proactiva, si esta
asegura la disponibilidad necesaria para reducir la probabilidad de una falla múltiple a un
nivel tolerable.
Para las fallas ocultas, solo es conveniente llevar a cabo una tarea proactiva, si esta
asegura la disponibilidad necesaria para reducir a un nivel tolerable la posibilidad de una
falla múltiple.
Las formas de prevención de fallas se discuten en el capitulo 6 y 7. Sin embargo estos
capítulos también explican que frecuentemente es imposible encontrar una tarea proactiva que
asegure la disponibilidad requerida.
Esto se aplica especialmente a equipos que sufren de fallas ocultas. De modo que si no
encontramos la manera de prevenir una falla oculta, debemos encontrar algún otro modo de
mejorar la disponibilidad de la funcion oculta.
Detectar la falla oculta
Si no es posible encontrar un modo apropiado de prevenir una función oculta, aun se puede
reducir el riesgo de falla múltiple controlando la funcion oculta periódicamente para saber si
esta aun funcionando.
Si este control (que se denomina búsqueda de fallas) se lleva a cabo en intervalos apropiados,
y si la funcion es rectificada tan pronto se descubre que esta en falta, es posible asegurar
niveles altos de disponibilidad. La búsqueda de fallas programada se discute en el capitulo 8.
Modificar el equipo.
En un pequeño número de casos, es imposible encontrar tareas de rutina que aseguren el nivel
deseado de disponibilidad, o es poco práctico hacerlo con la frecuencia solicitada. Sin
embargo, algo debe hacerse para reducir el riesgo de fallas múltiples a un nivel tolerable, de
modo que en estos casos, es generalote necesario “volver al tablero de dibujo” y reconsiderar
el diseño.
115
Si la falla múltiple pudiera afectar la seguridad del medioambiente, el rediseño es obligatorio.
Si la falla múltiple tiene consecuencias económicas, la necesidad de rediseño se evalúa sobre
bases de costos.
Las maneras en que el rediseño puede ser útil para reducir el riesgo o para cambiar las
consecuencias de una falla múltiple se discuten en el capitulo 9.
Fallas Ocultas: El proceso de decisión.
Todos los puntos hasta ahora sobre el desarrollo de una estrategia de mantenimiento para
funciones ocultas pueden resumirse como vemos en el grafico 5.15:
¿Será evidente para el equipo de operadores bajo
circunstancias normales la pérdida de funcion
causada por este modo de falla?
NO
El mantenimiento Proactivo es
beneficioso si asegura la
disponibilidad necesaria para
reducir la probabilidad de falla
múltiple a un nivel tolerable.
NO
La falla es
evidente. Ver
partes 3 a 5 de
este Capitulo
Si no se logra encontrar una tarea proactiva adecuada, controlar
periódicamente si la funcion oculta es funcionando (realizar una tarea de
búsqueda de fallas programada.)
Si no se logra encontrar una tarea de búsqueda de fallas adecuada:
* El rediseño es Obligatorio dado el caso de que la falla múltiple pudiera
afectar la seguridad o el medioambiente.
* Si la falla no afecta la seguridad o el medioambiente, el rediseño solo puede
ser justificado por bases económicas.
Grafico 5.15 Identificar y desarrollar estrategias de mantenimiento para fallas ocultas.
Otros puntos y funciones ocultas
Al realizar la primera pregunta del grafico 5.15, debemos tener especial cuidado en los
siguientes seis aspectos:
* La distinción entre fallas funcionales y modos de fallas.
* La cuestión de tiempo.
* Las funciones primarias y secundarias de los dispositivos de protección.
* Que significa exactamente el “grupo de operadores”
* Cuales son las “circunstancias normales”
116
* Dispositivos a “prueba de falla”
Estas se discuten en mayor detalle en los siguientes párrafos.
Falla funcional y Modo falla
En esta etapa del proceso de RCM, cada modo de falla que sea razonablemente capaz de
provocar cada falla funcional, habrá sido ya identificado en la planilla informativa de RCM:
* Primero, no nos preguntamos que modos de falla podrían ocurrir. Todo lo que tratamos de
establecer es si cada modo de falla que ya ha sido identificado como una posibilidad, seria
oculto o evidente si ocurriera.
* En segundo lugar, no estamos preguntando si el equipo de operarios puede diagnosticar el
modo de falla en si mismo. Estamos preguntando si la perdida de funcion causada por el
modo de falla puede ser evidente bajo circunstancias normales. ( En otras palabras, estamos
preguntando si los modos de falla presentan algún efecto o síntoma, que bajo circunstancias
normales , llevarían al observador a creer que el ítem es actualmente incapaz de llevar a cabo
la funcion deseada_ o al menos que ocurrió algo fuera de lo común.)
Por ejemplo, consideren el motor de un vehiculo que sufre de una línea de combustible
bloqueada. Un conductor promedio (en otras palabras, un operador promedio) no podría
diagnosticar este modo de falla sin la ayuda de un experto, de modo que habría una tendencia
a considerar esta es una falla oculta. Sin embargo la pérdida de funcion en este caso es
evidente, porque el auto deja de funcionar.
La cuestión del tiempo
Hay frecuentemente una tendencia a describir una falla como “oculta” si pasa un periodo
prolongado de tiempo entre que la falla ocurre y el momento en se la descubre. En realidad
este no es el caso. Si la perdida de funcion eventualmente se vuelve evidente para los
operadores, y lo hace como efecto directo e inevitable de esta falla en si misma, entonces la
falla se considera evidente, no importa cuanto tiempo pase entre esta y su descubrimiento.
Por ejemplo, el tanque alimentado por la bomba B en el grafico 5.4, puede tardar semanas en
vaciarse, de manera que la falla de esta bomba puede n se r aparente apenas ocurre. Esto
puede llevar a querer describir la falla como oculta. Sin embargo esto no es así, porque el
tanque se seca como resultado directo e inevitable de la falla de la bomba A por si misma. Por
lo tanto el hecho de que la bomba A será evidente para el equipo de operarios.
Contrariamente, la falla de la bomba C en el grafico 5.7 solo será evidente si la bomba B
también falla (a menos que alguien sugiera el control de la bomba C de vez en cuando). Si la
bomba B se operar de tal manera que nunca fuera necesario cambiar a la bomba C, es posible
que las fallas de esta en si misma no fueran jamás descubiertas.
Este ejemplo demuestra que el tiempo no es un problema al considerar las fallas ocultas.
Estamos simplemente preguntando si alguien advertirá el hecho de que la falla ocurrió por si
misma, y no si se advertirá cuando ocurrió.
Funciones primarias y secundarias
Hasta ahora nos hemos concentrado en la función primaria de los dispositivos de protección,
que es ser capaz de cumplir con la función para la que están diseñados cuando se lo requiera.
Como hemos visto, esto sucede usualmente después de que la función protegida ha fallado.
Sin embargo una funcion importante de muchos de estos dispositivos, es que ellos no deberían
trabajar si todo esta en orden.
117
Por ejemplo, la funcion primaria de un interruptor de presión puede ser enunciada de la
siguiente manera:
* ser capaz de transmitir una señal cuando la presión cae por debajo de los 250psi, la funcion
secundaria implícita de este interruptor es:
* ser incapaz de transmitir una señal cundo la presión esta por encima de los 250psi.
La falla de la primera funcion es oculta, pero la falla de la segunda es evidente porque si
ocurre, el interruptor transmite la señal falsa y la maquina se detiene. Si esto sucede en la
practica, debería enunciarse como un modo de falla de la funcion interrumpida (generalmente
la funcion primaria de la maquina) Como resultado, no hay necesidad de mencionar la
segunda funcion en forma separada, pero el modo de falla será mencionado bajo la funcion
relevante si tiene una probabilidad razonable de ocurrir.
El equipo de Operarios
Cuando preguntamos si una falla es evidente, el termino equipo de operarios, se refiere a
cualquier persona que tenga la oportunidad de observar el equipo o que esta haciendo este en
cualquier momento de sus actividades diarias normales, y que pueda reportar si este falla.
Las fallas pueden ser observadas por personas con diferentes puntos de vista. Incluidos
operarios, conductores, inspectores de calidad, constructores, supervisores y hasta los
inquilinos de edificios.
* El observador, debe estar en una posición de detectar la falla causada por el modo de falla.
Esto puede ser una ubicación física, o acceso a equipos o información (Incluyendo
información de jefatura) que llamara la atención al hecho de que algo no esta bien.
* El observador debe ser capaz de reconocer la condición como falla.
* Debe entender y aceptar que realizar los reportes de fallas es parte de su trabajo.
* Debe tener acceso al procedimiento para reportar las fallas.
Circunstancias normales
Un análisis cuidadoso revela con frecuencia que muchas de las actividades llevadas a cabo
por los operadores, son realmente tareas de mantenimiento, porque se puede observar que ya
sea la tarea o su frecuencia necesitan ser revisadas radicalmente. En otras palabras cuando se
pregunta si una falla se volverá evidente para los operarios bajo circunstancias “normales”, la
palabra normal tiene los siguientes significados:
* Que no se esta haciendo nada para prevenir la falla. Si actualmente la falla esta siendo
prevenida por una tarea proactiva exitosa, se puede argumentar que la falla es oculta, porque
no llega a ocurrir. Sin embargo en el capitulo 4 se resalto que los modos de falla y efectos y el
resto del proceso de RCM, deberían mencionarse y llevarse a cabo como si no se estuvieran
realizando tareas proactivas; porque uno de los principales propósitos del ejercicio es revisar
si deberíamos llevar a cabo tales tareas en primer lugar.
* Que no se esta llevando a cabo ninguna tarea especifica para detectar la falla, un numero
sorprende de tareas ya firman parte de las actividades normales de un operador, son en
realidad rutinas diseñadas para controlar que las funciones ocultas estén funcionando.
Por ejemplo, presionar un botón en una panel de control todos los días para controlar si todas
las luces de alarma del panel están trabajando, es en realidad un tarea de búsqueda de falla.
Veremos mas adelante como esta búsqueda de fallas es cubierta el proceso de selección de
tareas de RCM, de modo que una vez mas debería estar asumida en esta etapa del análisis que
118
esta tarea no esta siendo realizada (aun cuando es actualmente parte genuina del programa de
trabajo de un operador.) Esto es porque el proceso de RCM puede revelar una tarea más
efectiva, o la necesidad de realizar la misma tarea con una frecuencia mayor o menor.
(Bastante separado de la pregunta de tarea de mantenimiento, hay seguido una duda
considerable a cerca de cuales son las actividades normales del equipo de operarios, esto
ocurre con frecuencia en lugares donde los procedimientos no estas documentados o no
existen. En estos casos, el proceso de revisión de RCM es muy útil para clarificar cuales son
los deberes de cada uno, y puede hacer mucho por la fundaron de un procedimiento operativo
organizado. Esto se aplica especialmente a plantas de alta tecnología).
Dispositivos “a prueba de fallas”
Pasa a menudo que en sistema de protección es considerado ‘ aprueba de fallas” cuando no lo
es. Esto ocurre frecuentemente cuando solo parte del circuito esta bajo consideración, en lugar
del circuito como un todo.
El ejemplo es nuevamente provisto por el interruptor de presión, esta vez adjunto a un soporte
hidrostático. El interruptor tenia como fin apagar la maquina si la presión de aceite en el
apoyo bajaba de un cierto nivel. Surgió de la discusión que si se interrumpía la señal eléctrica
desde el interruptor hasta el panel de control, la maquina se apagaría, de modo que la falla del
interruptor se consideraba evidente.
Sin embargo, un análisis mas profundo revelo que el diafragma interno del interruptor podría
deteriorarse con los años, de modo que el interruptor podía volverse incapaz de sentir los
cambios de presión. La falla era oculta, y acorde a esto se desarrollo del programa e
mantenimiento para este interruptor.
Para evitar este problema, tener en cuenta incluir los sensores y actuadores en el análisis de
cualquier sistema de control cerrado, tanto como en el mismo circuito eléctrico.
5.7 Conclusión
Bajo circunstancias
normales, se volverá evidente
la pérdida de funcion para
los operadores bajo
circunstancias normales?
S
Podría este modo de falla causar
una perdida de funcion o daño
secundario que puede llegar a
lastimar o terminar con una vida,
o violar una norma
medioambiental conocida?
Tiene este modo de falla un
efecto directo adverso en la
capacidad operativa?
N
N
Y
S
El mantenimiento proactivo
es conveniente si reduce la
probabilidad de falla
múltiple a un nivel tolerable.
Si No…
Realizar una búsqueda de
fallas programada
El rediseño es
obligatorio.
El mantenimiento proactivo es
conveniente si reduce la
probabilidad de fallas a un nivel
tolerable.
El mantenimiento
proactivo es conveniente
si luego S
de un periodo de
tiempo el costo es menor
que el costo de la
consecuencia operativa
mas el costo de
reparación de la falla.
El mantenimiento Proactivo es
comneveniente si en un periodo
de tiempo su costo es menor que
el costo de reparar la falla.
Si No…
Si No…
El rediseño es
obligatorio.
Mantenimiento
No programado
Si No…
Mantenimiento no
Programado
El rediseño puede ser
deseable
Rediseño puede
ser deseable
119
Grafico 5.16 Evaluación de las consecuencias de la falla.
Este capitulo ha demostrado como el proceso de RCM provee un marco estratégico
comprensivo para el manejo de fallas, como se resume en el grafico 5.16, este marco:
* Clasifica todas las fallas en base a sus consecuencias. Separa fallas ocultas de fallas
evidentes, y luego ordena las consecuencias de las fallas evidentes en orden descendente de
importancia.
* Provee la base para decidir si el mantenimiento proactivo es conveniente en cada caso.
* Sugiere que debe hacerse si no se encuentra una tarea proactiva apropiada.
Los diferentes tipos de tareas proactivas y acciones de default, se discuten en los próximos
cuatro capítulos, conjuntamente con un acercamiento integrado a la evaluación de
consecuencias y selección de tareas.
120
6- Mantenimiento Proactivo 1: Tareas de Prevención.
6-1 Viabilidad Técnica y Tareas Proactivas.
Como se menciono en el capitulo 1, las acciones que se pueden tomar para manejar las fallas,
pueden ser divididas en las siguientes dos categorías:
* Tareas proactivas: estas tareas se realizan antes de que ocurra una falla, para prevenir que el
ítem entre en estado fallido. Abarcan lo que se conoce tradicionalmente como mantenimiento
“preventivo” y “predictivo”. A pesar de que RCM utiliza los términos restauración
programada”, descarte programado y mantenimiento en condición.
* Acciones de Default: Estas tratan el estado de falla, y se escogen cuando no es posible
identificar una tarea proactiva efectiva. Las acciones de default incluyen búsqueda de fallas,
rediseño e ir a la falla.
Estas dos categorías corresponden a la sexta y séptima de las siete preguntas que conforman el
proceso básico de decisión de RCM, y que son:
* Que puede hacerse para predecir o prevenir cada falla?
* Que sucede si no puede encontrarse una tarea proactiva apropiada?
Los capítulos 6 y 7 se enfocan en la sexta pregunta. Esta se encarga del criterio utilizado para
decidir si una tarea proactiva es Técnicamente posible. También observa en detalle como en
base a que toamos la decisión de si una tarea proactiva es conveniente, o no. (Los capítulos 8
y 9 revisan las acciones de default.)
Los capítulos previos explicaron, que es conveniente realizar una tarea proactiva, si esta
reduce las consecuencias de la falla a un grado que justifique los costos directos e indirectos
de llevarla a cabo. La viabilidad técnica se resume del siguiente modo:
Una tarea es técnicamente viable, si tiene la posibilidad física de reducir, o permitir que la
acción seleccionada disminuya, las consecuencias del modo de falla asociado a un grado
que sea aceptable para el propietario o usuario del bien.
Dos aspectos dominan la selección de tareas proactivas, desde el punto de vista técnico. Estos
son:
* La relación entre la edad del ítem bajo consideración y cuales son sus posibilidades de
fallar,
* Que sucede una vez que la falla comenzó a manifestarse.
El resto de este capitulo considera tareas que podrían aplicarse cuando hay una relación entre
la edad (exposición a presiones) y fallas. El capitulo 7 considera casos mas complejos en que
no existe tal relación.
121
6.2 Edad y Deterioro
Todo bien físico que tiene como objetivo cumplir una funcion que lo pone en contacto con el
mundo real esta sujeto a una variedad de esfuerzos. Estos esfuerzos causan el deterioro del
bien, disminuyendo su resistencia a las sobrecargas. Eventualmente esta resistencia disminuye
a un punto en el que el bien no puede lograr mas el desempeño deseado- en otras palabras,
falla. Este proceso se ilustro primeramente en el grafico 4.3, y lo podemos ver nuevamente,
con un pequeño cambio, en el grafico 6.1.
La exposición a este esfuerzo se mide de diversos modos, incluyendo el rendimiento,
distancias recorridas, ciclos operativos, tiempo calendarios y corrientes. Estas unidades están
relacionadas a tiempo, de modo que es común referirse a la total exposición como Edad del
bien. Esta conexión entre esfuerzo y tiempo sugiere que debe haber una relación directa entre
el grado de deterioro, y la edad del ítem. Si esto es así, concluimos que el punto en que la falla
ocurre también debería depender de la edad del ítem, como se observa en el grafico 6.2.
Capacidad inicial (lo que puede
hacer)
Rendimiento deseado
R
E
N
D
I
M
I
E
N
T
O
El equipo falla cuando la
capacidad disminuye por debajo
del rendimiento deseado (cuando la
habilidad para resitir la tension es
inferior a la tension aplicada)
Grafico 6.1- Deterioro a Falla.
Sin embargo, el grafico 6.2 esta basado en dos asumpciones clave:
* El deterioro es directamente proporcional al esfuerzo aplicado.
* El es esfuerzo es aplicado consistentemente.
Si esto fuera cierto para todos los bienes, podríamos predecir la vida de los equipos con gran
precisión. La visión clásica del mantenimiento preventivo sugiere que esto es posible, todo lo
que necesitamos es suficiente información acerca de las fallas. En calidad, sin embargo, la
situación no es tan clara. Este capitulo comienza observando el mundo real al considerar una
situación donde exista una relación clara entre edad y falla. El capitulo 7 abarca una visión
más general de la realidad.
122
Lo que puede hacer
Edad en la que
ocurre la falla
(Resistencia a la tension)
R
E
N
D
I
M
I
E
N
T
O
Lo que queremos que haga
Tension aplicada
Vida
EDAD
Grafico 6.2: Predictibilidad absoluta.
Fallas relacionadas con la edad.
Aun partes que aparentan ser idénticas varían minimamente en su resistencia inicial a las
fallas. El grado en el que resistencia disminuye con la edad también varia. Lo que es mas, no
hay dos partes expuestas a los mismos esfuerzos durante su vida útil. Aun esas variaciones
sean muy pequeñas, pueden tener un efecto desproporcional en la edad en que las partes
fallan. Esto se ilustra en el grafico 6.3 que muestra que sucede a dos componentes puestos en
servicio con resistencia similar a la falla.
Grafico 6.3 - Una visión realista de las fallas relacionadas a la edad.
La parte B esta expuesta a un nivel de stress superior, que la parte A, de modo que se
deteriora más rápidamente. El deterioro también se acelera en respuesta a dos picos de stress a
las 8.000 millas y a las 30.000 millas. Por otro lado, por alguna razón la parte A parece
deteriorarse aun ritmo fijo, a pesar de dos picos de stress a las 23.000 millas y a las 37.000
millas. De modo que uno de los componentes falla a las 53.000 millas y el otro a las 80.000
millas.
Este ejemplo muestra que la edad de las fallas de partes idénticas, trabajando bajo condiciones
aparentemente también idénticas varía enormemente. En la práctica sin embargo, algunas
partes duran mucho mas que otras, las fallas de un gran número de partes que se deterioran en
este contexto, tenderán a congregarse alrededor de una vida promedio, como se muestra en el
grafico 6.4
123
Grafico 6.4 Frecuencia de la falla y “vida promedio”
De modo que aun cuando la resistencia a la falla decline con la edad, el punto en el que la
falla ocurre es frecuentemente mucho menos predecible que lo sugiere el sentido común. El
capitulo 12 explora las implicancias cuantitativas de esta situación con mayor profundidad.
También explica que la curva de frecuencias de falla que se observa en el grafico 6.4, puede
ser considerada como una curva de probabilidad condicional de falla, como se muestra abajo
en el grafico 6.5 .( El termino vida útil define la edad en la que se produce un rápido
incremento en la probabilidad condicional de falla. Se utiliza para distinguir esta edad de la
vida promedio que observamos en el grafico 6.4.)
Grafico 6.5 Probabilidad condicional de falla y “vida útil”
Si se analiza un gran numero de modos de falla relacionados a la edad, aparentemente
idénticos, no es usual encontrar que ocurren prematuramente. El porque se esto también se
discute en el capitulo 12. El resultados de estas fallas prematuras, es una curva de
probabilidad condicional como se observa en el grafico 6.6. Este es el mismo patrón B de
falla de la figura 1.5.
Grafico 6.6 El efecto de fallas prematuras.
124
Inclusive esta es una visión simplista de las fallas relacionadas, porque hay en realidad tres
diferentes formas en las que las probabilidades de falla pueden aumentar a medida que un
ítem envejece. Esto puede verse en el grafico 6.7
Grafico 6.7 Fallas relacionadas a la edad.
Esto patrones fueron introducidos en el capitulo 1 y se discuten en mayor proporción en el
capitulo 12. La característica compartida por los patrones A y B es que ambos muestran un
punto donde se presenta un rápido aumento en la probabilidad condicional de falla. El patrón
C muestra un crecimiento fijo en la probabilidad de falla, pero no distingue una zona de
desgaste. Las próximas tres partes de este capitulo consideran las implicancias de estos
patrones de fallas desde el punto de vista del mantenimiento preventivo.
6.3 Fallas Relacionadas con la Edad y Mantenimiento Preventivo.
Por siglos, exactamente desde que el uso de maquinarias se propago, la humanidad tendió a
creer que la mayoría de los equipos se comportan como se observa en los gráficos 6.4 a 6.6.
En otras palabras, la mayoría de las personas tienden a asumir que ítems similares, llevando a
cabo actividades también similares, serán confiables por un periodo, quizás con un pequeño
numero de fallas tempranas, y que desgastaran aun tiempo similar.
En general, los patrones relacionados a la edad se aplican a ítems que son muy simples, o a
ítems complejos que sufren de un modo de falla dominante. En la practica, se los encuentra
comúnmente bajo condiciones de uso directo (generalmente donde los equipos tienen contacto
directo con el producto). También se los asocia con fatiga, corrosión, oxidación y
evaporación.
Las características de desgaste, aparecen generalmente cuando los equipos entran en
contacto directo con el producto. Las fallas relacionadas con la edad, también tienden a
estar asociadas con fatiga, corrosión, oxidación y evaporación.
Ejemplos de casos donde el equipo entra en contacto directo con el producto incluyen
refractarios de hornos, propulsores de bombas, asientos de válvulas, herramientas mecánicas,
conductores espirales, revestimiento de embudos y trituradores, la superficie interna de
cañerías, y así sucesivamente.
La fatiga afecta a ítems- especialmente a los metálicos- que están sujetos a cargas razonables
de alta frecuencia. El grado al que la oxidación y corrosión afecta un ítem depende
125
seguramente de su composición química, el grado de protección que posee y el medio en que
opera. La Evaporación afecta los solventes y las funciones más livianas de los productos
petroquímicos.
Bajo ciertas circunstancias, para reducir la incidencia de los modos de falla hay dos acciones
preventivas que son, la restauración programada y las tareas de descarte programadas. Estas
dos categorías de tareas se consideran en mayor detalle en la parte dos de este capitulo.
6.4 Restauración Programada y Descarte Programado.
Los modos de falla que conforman los patrones A y B en el grafico 6.7 tienen más
probabilidades de ocurrir después del final de su vida útil, como se puede ver en el grafico
6.5. Si un ítem o componente es uno de esos que sobreviven al final de esta vida, es posible
que se los saque de servicio antes de que entre en la zona de desgaste, y que se tome algún
tipo de acción, ya sea para prevenir que falle, o para reducir las consecuencias de la falla. A
veces, esto implica hacer algo para recuperar la capacidad inicial del ítem o componente que
fue removido. Si esto se hace a intervalos fijos, sin intentar evaluar la condición del ítem o del
componente antes de someterlo al proceso de restauración, esta acción se conoce como
restauración programada.
La restauración programada implica restaurar la capacidad inicial de un ítem o
componente existente a o antes una edad limite especificada, sin tener en cuenta su
condición aparente en ese momento.
Las tareas de restauración programada solían ser conocidas como tareas programadas de
recuperación. Ellas incluyen reparaciones o cambrones completos que se llevan a cabo en
intervalos preestablecidos para prevenir los modos de falla relacionados con la edad.
En el caso de algunos modos de falla de este tipo, es simplemente imposible restaurar la
capacidad inicial una vez que alcanzo el final de su vida útil. En estos casos, solo se puede
restaurar la capacidad inicial si el ítem es descartado y reemplazado por uno nuevo. En otros
casos la restauración programada puede llegar a ser técnicamente posible, pero tiene una
mejor relación costo efectividad el reemplazo por un nuevo componente. En ambos casos, si
el ítem o componente es reemplazado por uno nuevo en intervalos fijos sin intentar evaluar la
condición del viejo de antemano, esta tarea es conocida como descarte programado.
El descarte programado implica descartar un ítem o componente a, o antes del límite de
edad especificado, sin tener en cuenta su condición en ese momento.
Tener en cuenta que los términos restauración y descarte programados pueden ser aplicados a
exactamente la misma tarea, y que termino es el apropiado es una funcion del nivel al que se
esta llevando a cabo el análisis.
Por ejemplo, si un propulsor de bomba se desgasta a un grado predecible, y es reemplazado
por uno nuevo en intervalos fijos la tarea de reemplazo puede ser descripta como descarte
programado del propulsor, o como restauración programada de la bomba.
Es por esto que tendemos a considerar la restauración y el descarte programado en forma
conjunta. Sin embargo, la distinción se vuelve importante cuando consideramos un modo de
126
falla, que podría ser prevenido, por cualquiera de las dos tareas cuando consideramos el
mismo nivel de análisis.
Por ejemplo, un cierto tipo de motor eléctrico, puede sufrir por fallas en el bobinado luego de
periodo de tiempo predecible en servicio. En este caso puede ser posible recuperar la
capacidad inicial al realumbrar el motor (restauración programada) o reemplazándolo por uno
nuevo (descarte programado).
Por esta razón, el reto de este capitulo considera las características comunes de la restauración
programada y descarte programados, pero también tiene cuidado en resaltar las diferencias.
Frecuencia de Tareas de Restauración Programada y Descarte Programado.
La frecuencia con la cual se realizan las tareas de restauración o descarte programadas
dependen de la visa util del item como se muestra en la figura 6.5. En otras palabras:
La frecuencia de Tareas de Restauración o Descarte programados dependen de la edad a la
cual el ítem o componente muestra un rápido incremento en la probabilidad condicional de
falla.
En el caso del patrón C, se necesitan analizar al menos 4 niveles de restauración diferentes,
para determinar el intervalo óptimo (si existiese uno).
En general, hay una creencia particular muy sostenida de que “todos los ítems tienen una
vida”, y que repararlo, o instalar nuevas partes antes de que se alcance esa “vida” es “seguro”.
Esto no es siempre cierto, de modo que RCM tiene especial cuidado en enfocarse en la
seguridad al tomar tareas de descarte o restauración programadas.
En realidad, RCM reconoce dos tipos diferentes de límites de edad al tratar con estas tareas.
El primero se aplica a tareas para evitar fallas que tienen consecuencias de seguridad, y se
denominan “limite de edad segura”. Aquellas que tienen como fin prevenir las fallas que no
tienen consecuencias de seguridad, se denominan “limite de economía segura”.
Limites de vida segura.
Los límites de seguridad solo se aplican a fallas con consecuencias medioambientales o de
seguridad, de modo que las tareas asociadas deben reducir a un nivel tolerable la probabilidad
de una falla que se presenta antes del final del límite de vida. (Un método para decidir que es
tolerable se discute en el capitulo 5 parte 3, y en el apéndice 3 de este libro. Probabilidades
que son tan bajas como 1 en 1.000.000, y hasta 1 en 1.000.000.000, se utilizan en ese
contexto).
Esto significa que los límites de edad segura, no se pueden aplicar a ítems que conformen el
patrón A, porque la mortalidad infantil implica que un número significante de ítems deben
fallar en forma prematura. En realidad no se pueden aplicar a ningún modo de falla donde
halla una probabilidad significante de que la falla ocurra cuando el ítem entre en servicio.
Idealmente, los límites de edad segura deberían ser determinados antes de que el ítem sea
puesto en servicio. Debería ser probado en un medioambiente de simulación para determinar
que vida se alcanza realmente, y una fracción conservadora de esta vida debería ser utilizada
como el límite de edad segura.
127
Grafico 6.8 Limites de vida segura.
No hay jamás una correlación perfecta entre un medioambiente de prueba y el medio
operativo. Probar por fallas una parte que esta siendo utilizada desde hace tiempo, es también
costoso y obviamente requiere de mucho tiempo, de modo que no hay suficientes datos de
prueba que permitan trazar con confianza una curva de supervivencia. En estos casos los
limites de edad segura, se establecen dividiendo el promedio por un factor arbitrario de tres o
cuatro. Esto implica que la probabilidad condicional de falla al límite de edad, debería ser
esencialmente cero.
Limites de vida económica
La experiencia operativa sugiere a veces, que la restauración programada o el descarte
programado debe analizarse sobre bases económicas. El límite de edad asociado se conoce
como limite de vida económica. Es generalmente equitativa la vida útil, más que a una
fracción de esa vida. La economía de la restauración programada y el descarte programado se
discute mas adelante en este capitulo.
Viabilidad Técnica de la Restauración Programada.
Los comentarios anteriores indican que para que la restauración programada sea posible, los
primeros criterios que deben satisfacerse son:
* Debe haber un punto en el cual haya un incremento en la probabilidad de falla condicional
(en otras palabras el ítem debe tener “vida útil”).
* Tenemos que estar racionalmente seguros de cual es esa vida útil.
En segundo lugar, la mayoría de los ítems deben sobrevivir a esta edad, si demasiados ítems
fallan antes de alcanzarla, el resultado neto es un aumento en fallas no anticipadas. Esto no
solo puede traer consecuencias inaceptables, pero significa que no se esta respetando la
secuencia de tareas de restauración. Esto a su vez desorganiza todo el proceso de programa y
planificación. ( Si el modo de falla tiene consecuencias de seguridad o medioambientales, la
probabilidad de que una falla ocurra antes del limite de vida segura, debe reducirse a un nivel
extremadamente bajo- efectivamente cero- como discutimos anteriormente.
Finalmente, la restauración programada debe recuperar la capacidad iniciadle bien, o al menos
algo cercano a la capacidad inicial, para asegurar que el equipo sigue siendo capaz de cumplir
con su funcion por un periodo tal, que debería ser igual al limite de vida original.
Por ejemplo, nadie en su justo juicio trataría de recuperar un foco común, simplemente porque
es imposible devolverle su capacidad inicial (sin tener en cuenta la parte económica). Por otro
128
lado, se podría argumentar que al recauchetar las ruedas de un camión se logran alcanzar algo
similar a su condición original.
Estos puntos llevan a las siguientes conclusiones generales sobre la viabilidad técnica de la
restauración programada:
La restauración programada es técnicamente posible si:
* Hay una edad identificable en la cual el ítem muestra un rápido crecimiento en la
probabilidad condicional de falla.
* La mayoría de los ítems sobreviven a esa edad (todos los ítems, si la falla tiene
consecuencias que afecten la seguridad o el medioambiente)
* Reestablecen la resistencia original del ítem.
Viabilidad Técnica de las Tareas de Descarte Programadas.
Los comentarios anteriores indican que el descarte programado, es técnicamente viable bajo
las siguientes circunstancias:
El descarte programado es técnicamente posible si:
* hay una edad identificable en la que el ítem muestra un rápido crecimiento en la
probabilidad condicional de falla.
* La mayoría de los ítems sobreviven a esa edad (todos los ítems si la falla tiene
consecuencias que afecten la seguridad o el medioambiente).
La Efectividad de la Restauración Programada o el Descarte Programado.
Aun cuando sea técnicamente posible, la restauración programada y el descarte programado
pueden no ser convenientes, por que puede haber otras tareas que sean aun mas efectivas,
como se explica en el capitulo 7.
Si no se pudiera encontrar una tarea as efectiva, hay una tentación para seleccionar la
restauración programada o el descarte programado, basándose únicamente en la viabilidad
técnica. Si se aplica un limite edad a un ítem que actúa como en el grafico 6.6, esto significa
que algunos ítems recibirán atención antes de lo necesario, mientras que otros pueden
presentar fallas tempranas, pero el efecto neto puede ser una reducción en el numero
inanticipado de fallas. Sin embargo, aun la restauración programada o el descarte programado
pueden no ser convenientes, porque como mencionamos anteriormente, no es suficiente la
mera reducción en el número de fallas, si la falla tiene consecuencias medioambientales, o de
seguridad. Esto es así porque para que algo sea conveniente, la tarea debe reducir la
probabilidad de fallas que traen estas consecuencias a un nivel muy bajo (efectivamente cero.)
Por otro lado, si las consecuencias son económicas, necesitamos estar seguros que por un
periodo de tiempo, el costo de realizar la restauración programada, el la tarea de descarte
programado, será menor que el costo de permitir que la falla ocurra. En otras palabras, la
única justificación para un límite de vida económica es la relación costo-efectividad. Esto es
así porque la restauración programada incrementa el trabajo en los talleres, mientras que el
descarte programado incremente el consumo de ítems o componentes que pueden ser sujetos
del descarte. Esto se ilustra en el grafico 6.9.
129
Cuando consideramos fallas que tienen consecuencias operativas, se debe tener en cuenta
también que la restauración programada y el descarte programado también pueden afectar las
operaciones, Sin embargo, en la mayoría de los casos, este efecto tiene menos probabilidades
de ocurrir que las consecuencias de la falla porque:
* La tarea se realizaría normalmente cuando tiene al menos probabilidades de tener efecto
sobre las operaciones. (Usualmente se lo llama ventana de operaciones)
* La tarea tiene probabilidades de consumir menos tiempo que el que llevaría reparar la falla
por que es posible planificar más extensamente para la tarea programada.
El grafico 6.9 muestra un modo de falla relacionado a la edad, donde la vida útil era de 12
meses, mientras que la vida promedio es 18 meses. En un periodo de tres años, la falla ocurre
dos veces, si no se realiza mantenimiento preventivo, mientras que la tarea de prevención se
realizaría tres veces. En otras palabras, el mantenimiento preventivo debe llevarse a cabo con
un 50 % de mayor frecuencia que la acción correctiva, que debería ser llevada a cabo si se
permitiese que la falla ocurra.
Si cada falla costara, digamos, $2.000 en pérdida de producción más reparación, significarían
más de $4.000 en un periodo de 3 años. Si el costo total de cada tarea preventiva es, digamos,
$1.100, estas tareas significarían $ 3.300 durante el mismo periodo. En este caso la tarea es
efectiva y conveniente.
Por otro lado, si la vida promedio era de 24 meses, y todos los demás números permanecerían
iguales, las fallas solo ocurrirían 1.5 veces, cada tres años, y costarían $3.000 durante ese
periodo. La tarea programada costaría $3000 durante el mismo periodo, de modo que no seria
conveniente.
Grafico 6.9 “Vida útil” y “Vida promedio”
Si no hay consecuencias operativas, la restauración y el descarte programados, se justifican
solamente si cuestan sustancialmente menos que el coto de reparación (que puede ser el caso
si falla cuesta un daño secundario extensivo).
Todo esto significa que en general, un limite de vida económica es conveniente si evita o
reduce las consecuencias operativas de una falla no anticipada, y, o si la falla que previene
causa un daño secundario significativo. Claramente, debemos conocer el patrón de falla antes
de que podamos evaluar la efectividad de las tareas de descarte programado.
Para bienes nuevos, esto implica que un modo de falla con consecuencias económicas
mayores, debería también ser puesto bajo un programa de exploración de edad, para
determinar si se puede aplicar un límite de vida. Sin embargo, raramente se encuentran
130
evidencias suficientes para incluir restauración o descarte programado en un programa de
mantenimiento inicial. En la practica, la frecuencia de estas tareas solo puede ser determinada
satisfactoriamente en la base de datos históricos confiables. Estos raramente están a
disposición cuando el bien recién entra en servicio, de modo que es imposible especificar la
restauración programada o el descarte programado en programas de mantenimiento previos al
servicio. (Por ejemplo, solo a siete componentes en el programa desarrollado para el Douglas
DC10, se le habían asignado restauración programada.) Sin embargo, los ítems que traen
consecuencias de altos costos, deberían ser sometidos a programas de exploración de edad,
tan pronto como sea posible, para saber si se beneficiarían con estas tareas.
6.5 Fallas que no tienen relación con la edad.
Uno de los proyectos mas desafiantes del mantenimiento moderno es el descubrimiento de
que muy pocos modos de falla realmente se adaptan a los patrones de falla del grafico 6.7.
Como discutimos en el párrafo siguiente, esto se debe principalmente a la combinación de
esfuerzo aplicado y complejidad en aumento.
Tension variable
Contrariamente a las afirmaciones enumeradas en la parte 2 de este capitulo, el deterioro no es
siempre proporcional al esfuerzo aplicado, y el esfuerzo no siempre se aplica
consistentemente. Por ejemplo en la parte 3 de capitulo 4 mencionaba que muchas fallas son
causadas por aumentos en el esfuerzo aplicado, lo que a su vez es causado por operaciones
incorrectas, montaje incorrecto o daño externo.
Ejemplos en tales aumentos de esfuerzo mencionados en el capitulo 4 incluían errores
operativos, (poner en marcha una maquina demasiado rápido, poner reversa accidentalmente
cuando la intención era avanzar, incorporar el material a un proceso demasiado rápido)
errores de montaje, (sobre ajustar tuercas, partes mal colocadas) y daño externo (rayos, la
“creciente de los mil años”, y así sucesivamente.)
En todos estos casos, hay una pequeña (o ninguna) relación entre el tiempo que el bien ha
estado en servicio, y la probabilidad de que la falla ocurra. Esto se muestra en el grafico 6.10,
que es básicamente el mismo que el grafico 4.4, con la dimensión temporal agregada.
(Idealmente, “prevenir” fallas de este tipo debería ser cuestión de prevenir lo que sea cause un
aumento en los niveles de esfuerzo, mas que una cuestión modificar en algo el bien).
Grafico 6.10
En el grafico 6.11, los picos de esfuerzo reducen permanentemente la resistencia a la falla,
pero no provoca que el ítem falle (un terremoto quiebra una estructura, pero no la hace caer.)
la resistencia a la falla reducida, deja la parte vulnerable al próximo pico, que puede o suceder
antes de que la parte sea reemplazada por otra razón.
131
Grafico 6.11
En el grafico 6.12 el pico de esfuerzo reduce la resistencia a la falla temporariamente (Un
material termoplástico que se ablanda cuando sube la temperatura y se endurece cuando esta
baja.)
Grafico 6.12
Finalmente, en el grafico 6.13 el pico de esfuerzo acelera la declinación de la resistencia a la
falla y eventualmente acorta la vida del componente en gran medida. Cuando esto sucede,
puede ser difícil establecer la relación causa y efecto, porque la falla podría ocurrir meses, o
inclusive años después del pico de esfuerzo.
Grafico 6.13
Esto sucede generalmente si una parte es dañada durante la instalación (que puede suceder si
esta desalineado un soporte), si se daña previamente a la instalación (se deja caer el soporte en
el piso del deposito), o recibe un maltrato en el servicio (se llena de suciedad). En estos casos
la prevención de fallas es una cuestión de asegurar que el trabajo de mantenimiento e
instalación se realizo correctamente, y que el deposito as partes son muy bien cuidadas en el
deposito.
En estos cuatro ejemplos, cuando los ítems entran en servicio no es posible predecir cuando
van a ocurrir las fallas. Por esta razón, tales fallas se describen como “Casuales”.
132
Complejidad
Los procesos de falla descriptos en el grafico 6.7, se aplican a procesos de mecanismos
simples. En el caso de ítems complejos, la situación se vuelve menos predecible. Los equipos
son fabricados mas complejamente para mejorar se desempeño (incorporando nuevas
tecnologías o automatización) o haciéndolos mas seguros (utilizando dispositivos de
protección.)
Por ejemplo, Nowlan y Heap (1978) citan desarrollos en la aviación civil. En 1930, un viaje
aéreo era algo lento, riesgoso, tomado en condiciones climáticas razonablemente buenas, en
naves que contaban con unos cientos de millas, y espacio para unos veinte pasajeros.
Contaban con uno o dos motores recíprocos, equipo de aterrizaje fijo, dos hélices, con dos
alas.
Hoy en día un viaje en avión es mucho más rápido, y mucho más seguro. Se lo lleva a cabo en
casi cualquier condición climática, con un promedio de miles de millas y espacio para cientos
de pasajeros. La aeronave tiene varios motores jet, equipo anta hielo, equipo de aterrizaje
retractable, dispositivos de alto vuelo, sistemas de control de presión y temperatura para la
cabina, equipo extensivo de navegación y comunicaciones, instrumentación compleja y
sistemas de soporte complejos.
En otras palabras, con los costos de una mayor complejidad se alcanza un mejor desempeño y
mayor seguridad. Esto es así para casi todas las ramas de la industria.
Una mayor complejidad significa un balance entre lo liviano y compacto que se necesita para
el alto desempeño, con el tamaño y masa necesaria para asegurar la durabilidad. Esta
combinación de complejidad y compromiso:
* Incrementa el número de componentes que pueden fallar, e incrementa el número de
interfaces o conexión entre esos componentes. Esto a su vez aumenta el número de fallas que
se pueden presentar.
Por ejemplo, muchas de las fallas mecánicas incluyen soldaduras y tuercas, mientras que una
proporción importante de fallas eléctricas y electrónicas implican la conexión de varios
componentes. A cuantas más conexiones de este tipo halla, mas fallas habrá.
* Reduce el margen entre la capacidad inicial de cada componente y el desempeño deseado.
(En otras palabras, el “poder” esta mas ceca del “querer”), lo que reduce el alcance del
deterioro antes de que las falla ocurra.
Estos dos desarrollos a su vez sugieren que los ítems complejos tienen una mayor tendencia a
sufrir de fallas casuales que los ítems más simples.
133
Grafico 6.14 Fallas no relacionadas con la edad.
Patrones D, E y F
La combinación del esfuerzo variable y la respuesta errática a este, en forma conjunta con la
complejidad creciente implican que en la práctica, la cantidad en aumento de los modos de
falla responden a los patrones de falla que se observan en el grafico 6.14. La característica
mas importante de los patrones D, E, y F es que después del periodo inicial, hay una relación
mínima o no hay relación entre confiabilidad y edad operativa. En el caso de tales modos de
falla, los límites de edad hacen poco o nada para reducir la probabilidad de falla.
(En realidad, las reparaciones programadas, pueden incrementar los porcentajes de fallas
generales, al introducir la mortalidad infantil en sistemas que de otra forma serian estables.
Esto es confirmado por en creciente numero de accidentes desagradables alrededor del
mundo, que ocurrieron ya sea, mientras el mantenimiento se estaba realizando o
inmediatamente después de una intervención de matenimiento. Esto también es corroborado
por el operario de la maquina que dice “cada vez que se le realiza mantenimiento durante un
fin de semana, nos leva hasta el miércoles para que vuelva a funcionar bien.”)
Desde el punto de vista de la gerencia de mantenimiento, la conclusión principal que se puede
sacar de estos patrones de falla es que la idea del desgaste por edad, simplemente no se aplica
a fallas casuales, de manera que la idea de intervalos fijos de reemplazos o reparación antes de
llegar a esa edad, no se pueden aplicar.
Como mencionamos en el capitulo 1, una advertencia intuitiva de estos hechos lleva a algunas
personas a abandonar la idea del mantenimiento preventivo en su conjunto. A pesar de que
esto puede ser lo correcto para fallas con consecuencias menores, cuando las consecuencias
de las fallas son serias, “algo” debe hacerse, para prevenir las fallas, o al menos evitar las
consecuencias.
La necesidad continua de prevenir ciertos tipos de falla, y la incapacidad creciente de las
técnicas clásicas para hacerlo, están por debajo del crecimiento de nuevos tipos de manejos de
fallas. Entre estos las técnicas conocidas como mantenimiento preventivo o en-condición,
están en primer lugar. Estas técnicas se discuten extensamente en el siguiente capitulo.
134
7- Mantenimiento Proactivo 2: Tareas Predictivas
7.1 Fallas Potenciales y Mantenimiento En-condición.
El capitulo anterior explicaba que hay una relación mínima, o ninguna, entre el tiempo en que
un bien ha estado en servicio y cuales son sus probabilidades de falla. Sin embargo, a pesar de
que muchas fallas no están relacionadas con la edad, la mayoría de ellas dan algún tipo de
advertencia de que están por o en proceso de ocurrir. Si se puede encontrar evidencia de que
algo esta en las etapas finales de fallas, puede ser posible tomas acción para prevenir que falle
completamente o para evitar sus consecuencias. El grafico 7.1 ilustra que sucede en las etapas
finales de una falla. Se lo llama la curva P-F, porque muestra como comienza una falla, como
se deteriora al punto de que se la puede detectar (punto “P”), y luego si no se la detecta y
corrige se continua deteriorando-generalmente en proporción acelerada- hasta que alcanza el
punto de falla funcional (punto “F”).
Grafico 7.1 La curva P-F
El punto del proceso de falla en el que es posible detectar si la falla esta ocurriendo o por
ocurrir se conoce como falla potencial.
Una falla potencial es una condición identificable que indica que una falla funcional esta
por ocurrir o en proceso de ocurrir.
En la practica, hay miles de formas de descubrir si una falla esta en proceso de ocurrir.
Ejemplos de fallas potenciales incluyen puntos de temperatura alta mostrando el deterioro
hornos refractarios, o aislaciones eléctricas, vibraciones que indican la falla inminente de los
soportes, grietas indicando la fatiga del metal, partículas en el aceite de un engranaje,
indicando fallas, execivo desgaste en neumáticos, etc.
Si una falla potencial se detecta entre el punto P y el punto F del grafico 7.1, puede ser posible
tomar una acción para prevenir o evitar las consecuencias de la falla funcional. (Si es posible
o no tomar llevar a cabo una acción significativa, depende en l rapidez con que ocurre la falla,
como se discute e la parte 2 d este capitulo) Las tareas diseñadas para detectar las fallas
potenciales se conocen como Tareas en –condición.
Las tareas en –condición implican el control de fallas potenciales, para que pueda tomarse
precauciones para prevenir la falla funcional o para evitar las consecuencias de esta.
Las tareas en-condición se llaman de este modo, porque los ítems inspeccionados siguen en
servicio en la condición de que continúen alcanzando los niveles de desempeño específicos.
135
Esto también se conoce como mantenimiento predictivo (porque estamos tratando de predecir
si es que – y si fuera posible cuando- el ítem va a fallar, basándonos en su comportamiento
actual), o mantenimiento basado en la condición (porque la necesidad de acciones correctivas
o de evasión de consecuencias se basa en una evaluación de la condición del ítem.)
7.2 El intervalo P-F
En adición a la falla potencial en si misma, necesitamos considerar el monto de tiempo (o el
número de ciclos de stress) que transcurre entre el punto en que ocurre una falla potencial- en
otras palabras el punto en que esta se vuelve detectable- y el punto en que se deteriora en falla
funcional. Como se muestra en la figura 7.2, el intervalo se conoce como intervalo P-F.
El intervalo P-F es el intervalo entre la aparición de una falla potencial y su degeneración
en falla funcional
Grafico 7.2: Intervalo P-F.
El intervalo P-F nos muestra la frecuencia con que se deben realizar las tareas en-condición.
Si queremos detectar la falla potencial antes de que se convierta en falla funcional, el
intervalo entre controles debe ser menor al intervalo P-F.
Las tareas en-condición deben ser llevadas a cabo a intervalos menores
Que los intervalos P-F.
El intervalo P-F también es conocido como periodo de advertencia, el tiempo previo a la falla,
o periodo de gestación de falla. Puede ser medido en cualquier unidad que provea una
indicación de la exposición al stress (tiempo corriente, unidades de rendimiento, ciclos de
inicio e interrupción, etc.) pero por razones prácticas, se lo mide mas frecuentemente en
términos de tiempo transcurrido. Para diferentes modos de falla, de fracciones de fracciones
de segundos a varias décadas.
Tenga en cuenta que si una tarea en-condición se realiza en intervalos que no son mayores a
los intervalos P-F, hay una chance de que perderemos la falla totalmente. Por otro lado, si
realizamos la tarea a un porcentaje muy pequeño de intervalo P-F, gastaremos recursos en
controlar el proceso.
Por ejemplo, si el intervalo P-F para un modo de falla dado es dos semanas, la falla se
detectara si el ítem se controla una vez a la semana. Contrariamente, si se lo controla una vez
al mes, es posible perderse el proceso de falla completo. Por otro lado, si el intervalo P-F es
tres meses, será un desperdicio de esfuerzo controlarlo todos los días.
136
En la práctica es genialmente suficiente seleccionar una frecuencia de tarea equivalente a la
mitad del intervalo P-F. Esto asegura que la inspección detectara la falla potencial, mientras
(en la mayoría de los casos) otorga un monto de tiempo razonable para hacer algo al respecto.
Esto lleva al concepto de intervalo P-F neto.
El intervalo P-F neto.
El intervalo P-F neto es el intervalo mínimo con probabilidades de ocurrir entre el
descubrimiento de la falla potencial y la manifestación de la falla funcional. Esto se ilustra en
el grafico 7.3 y 7.4, ambos muestran una falla con un intervalo P-F de 9 meses.
Grafico 7.3 Intervalo P-F neto.
El grafico 7.3 muestra que si el ítem es inspeccionado mensualmente, el intervalo P-F neto es
de 8 meses. Por otro lado, si se inspecciona con intervalos de 6 meses como se muestra en el
grafico 7.4, el intervalo P-F es tres meses. De manera que en el primer caso, el monto mínimo
de tiempo disponible para hacer algo con respecto a la falla es 5 meses más que en el segundo,
pero la tarea de infección debe hacerse 6 veces mas seguido.
Grafico 7.4 Intervalo P-F neto.
El intervalo P-F establece la cantidad de tiempo disponible para llevar a cabo la acción que
necesaria para reducir o eliminar las consecuencias de la falla. Dependiendo del contexto
operativo del bien, la advertencia de fallas incipientes permite al usuario reducir o evitar las
consecuencias de las siguientes maneras:
* Tiempo de inactividad: Las acciones correctivas pueden ser planeadas para momentos
donde no interrumpan las operaciones. La oportunidad de planificar las acciones correctivas
apropiadamente, también significa que se las puede realizar más rápidamente.
Por ejemplo, si se descubre que un componente eléctrico esta levantando temperatura antes de
que se incendie, puede ser posible reemplazarlo cuando la maquina esta totalmente inactiva.
137
En este caso, la falla del componente no se “previene”, pero si se evitan las consecuencias
operativas.
* Costo de reparación: Los usuarios pueden llevar a cabo acciones para eliminar los danos
secundarios que pueden causar las fallas no anticipadas. Esto reduciría el tiempo de
inactividad y los costos de reparación asociados a la falla.
Por ejemplo, una advertencia a tiempo, permitiría a los usuarios apagar una maquina antes
que un soporte en colapso, permita que un rotor toque un estator.
* Seguridad: la advertencia de fallas permite ya sea apagar la planta la planta antes de que la
situación se vuelva peligrosa, o evacuar a las personas que podrían resultar lastimadas.
Por ejemplo, si una grieta en una pared se descubre a tiempo, es posible reforzar los cimientos
y de esa manera prevenir que la pared se deteriore tanto que llegue a caerse. Es muy probable
que tengamos que evacuar las premisas mientras se realiza el trabajo, pero al menos evitamos
las consecuencias de seguridad que provocaría el hecho de que el muro llegara a caerse.
Para que una tarea en-condición sea posible técnicamente, el intervalo P-F debe ser mas largo
que el tiempo necesario para llevar a cabo las acciones que van a evitar o reducir las
consecuencias de la falla. Si el intervalo P-F neto es demasiado corto para tomar cualquier
acción sensible, entonces la tarea en-condición claramente no es técnicamente viable.
En la practica, el tiempo requerido varia ampliamente, en algunos casos puede ser cuestión de
horas, (digamos hasta el final de un ciclo operativo, o el final de un turno) o inclusive minutos
(para apagar una maquina o evacuar un edificio). En otros casos puede llevar semanas o
meses (hasta un cierre mayor).
En general, los intervalos P-F extensos son preferidos porque:
* Es posible realizar lo que fuera necesario para evitar las consecuencias de la falla (inclusive
planificar acciones correctivas) de un modo mas considerado, y por lo tanto con mayor
control.
* Se requieren menos inspecciones en-condición.
Esto explica por que se dedica tanta energía en encontrar condiciones de fallas potenciales, y
técnicas en-condición que generen intervalos P-F más largos posibles. Sin embargo es
posible que en algunos casos se utilicen intervalos P-F muy cortos.
Por ejemplo, las fallas que afectan el equilibrio de ventiladores de gran tamaño pueden causar
serios problemas de una forma rápida, de modo que los sensores de vibración se utilizan para
apagar esos ventiladores cuando se presenta la falla mencionada. En este caso, el intervalo PF es muy corto, de modo que el monitoreo es continuo. Una vez más, el dispositivo de control
se utiliza para evitar las consecuencias de la falla.
138
Consistencia de intervalo P-F
Las curvas P-F ilustraron hasta ahora en este capitulo, que el intervalo P-F es constante para
cualquier falla dada. En realidad este no es el caso, algunas varían dependiendo de un grado
de valores considerable. Como se muestra en el grafico 7.5.
Por ejemplo, cuando discutimos el intervalo P-F asociado con un cambio en el nivel de ruidos,
alguien podría decir: “esto se sacude y hace ruido por cualquier cosa entre dos semanas y tres
meses antes de que colapsa”. En otro caso, podemos decir que pueden transcurrir de 6 meses a
5 años desde el momento en que una grieta aparece, hasta que la estructura se desmorona.
Grafico 7.5 Intervalos P-F inconsistentes.
Claramente en estos casos, se debería seleccionar un intervalo de tarea sustancialmente menor
que el mas corto de los posibles intervalos P-F. De este modo podemos siempre estar
razonablemente seguros de detectar la falla potencial antes de que se convierta en una falla
funcional. El inervado P-F neto asociado al intervalo mínimo, es lo suficientemente largo para
tratar las consecuencias de la falla, de modo que la tarea en condición es técnicamente
posible.
Por otro lado, si el intervalo P-F es muy inconsistente- como algunos pueden serlo- entonces
no es posible establecer un intervalo de tarea significativo, y la tarea en cuestión debería ser
dejada de lado para buscar otra forma de solucionar la falla.
7.3 Posibilidad técnica de las Tareas en-condición.
A la luz de la discusión anterior, se puede resumir del siguiente modo el criterio que toda
tarea en-condición debe satisfacer para ser técnicamente viable:
Una tarea en-condición es técnicamente viable si:
* Es posible definir una condición potencial de falla.
* El intervalo P-F es razonablemente consistente.
* Si es practico monitorear el ítem a intervalos menores que el intervalo P-F.
139
* El intervalo P-F neto es lo suficientemente largo para ser de utilidad. (En otras
palabras, lo suficientemente largo para que se lleve a cabo una acción para reducir o
eliminar las consecuencias de la falla funcional.)
7.4 Categorías de las técnicas en-condición.
Las cuatro principales categorías de las técnicas en condición son:
* Técnicas de monitoreo de condición: que incluyen el uso de equipos especializados para
monitorear la condición de otros equipos.
* Técnicas basadas en variaciones en calidad del producto.
* Técnicas de monitoreo de efectos primarios, que implican el uso inteligente de escalas
existentes y equipos de monitoreo de procesos.
* Técnicas de infección basadas en los sentidos humanos.
Cada una de ellas es revisada en los siguientes párrafos:
Monitoreo de condición
Las técnicas de mantenimiento en-condición más sensibles, generalmente implican el uso de
algún tipo de equipo para detectar fallas potenciales. En otras palabras, un equipo se utiliza
para monitorear las condiciones del otro.
Estas técnicas se conocen como monitoreo de condición, para diferenciarlas de otros tipos de
mantenimiento en-condición.
El monitoreo de condición abarca cientos de técnicas diferentes de modo que un estudio
detallado de este asunto esta mucho mas allá del alcance de este capitulo.
Sin embargo, el apéndice 4 provee un breve resumen de las 100 técnicas mas conocidas.
Todas estas técnicas fueron diseñadas para detectar los efectos de la falla, (o más
precisamente efectos potenciales, como los cambios en las características de las vibraciones,
cambios de temperatura, partículas en aceite lubricante, pérdidas y si sucesivamente) Están
clasificadas respectivamente en el apéndice 4 bajo los siguientes títulos:
* Efectos dinámicos
* Efectos de partículas.
*efectos químicos.
* Efectos físicos.
* Efectos de temperatura.
* Efectos eléctricos.
Estas técnicas pueden ser vistas como versiones altamente sensibles de los sentidos humanos.
Algunas son realmente muy sensibles, y otras dan varios meses (o varios años) de aviso de
falla. Sin embargo, una limitación mayor, de casi todo dispositivo de monitoreo de condición,
es que solo controla una condición. Por ejemplo, el analizador de vibraciones, solo controla la
vibración y no puede detectar cambios químicos y de temperatura. De modo que una mayor
sensibilidad tiene el precio de perder la versatilidad inherente de los sentidos humanos.
140
Los intervalos P-F asociados con diferentes técnicas de monitoreo varían desde minutos a
varios meses. Las distintas técnicas también apuntan a las fallas con diferentes grados de
precisión. Se debe considerar estos dos factores al evaluar la viabilidad de cada técnica.
En general, las técnicas de monitoreo de condición, pueden ser tan espectacularmente
efectivas, cuando son apropiadas, pero si son inapropiadas pueden ser muy costosas y algunas
veces frustrantes perdidas de tiempo. Como resultado, el criterio para evaluar si una tarea encondición es técnicamente posible y conveniente, debe ser aplicado con especial rigor a las
técnicas de monitoreo de condición.
Variaciones en la calidad del producto.
En algunas industrias, una fuente importante de datos sobre fallas potenciales es la funcion del
control de calidad. Con frecuencia un defecto en un articulo producido por una maquina esta
directamente relacionado con un modo de falla en esa maquina. Muchos de estos defectos
emergen gradualmente, y proveen de este modo evidencia temporal de fallas potenciales. Si la
recolección de datos y el proceso de evaluación ya existen, utilizarlos como provisión de
advertencias de fallas tiene un costo muy bajo.
Una técnica popular que puede ser utilizada con frecuencia es el Control de Proceso
Estadístico (Statistical Process Control, SPC). SPC implica medir algún atributo del producto,
tales como la dimensión, nivel de llenado, o peso del paquete, y utilizar esas medidas para
sacar conclusiones sobre la estabilidad del proceso.
El grafico 2.6 en el capitulo 2, como tales medidas aparecerían para un procesó que esta bajo
control y dentro de especificación. Los grafico 3.4 y 3.5 en el capitulo 3, mostraban dos casos
en los que un proceso puede estar fuera de control y fuera de especificación (en otras palabras,
fallando). En la gran mayoría de los casos, la transición de estar bajo control a estar fallado,
sucede en forma gradual.
Por ejemplo, el grafico 7.6 muestra una tabla típica de SPC en la cual las lecturas están bajo
control en un principio. Se presenta un modo de falla que hace a las medidas comenzar una
tendencia determinada.
Por ejemplo, a medida que se gasta una rueda de amolar, el diámetro de las piezas sucesivas
aumenta hasta que la rueda se ajusta o reemplaza.
En la zona 2 del grafico 7.6 el proceso esta fuera de control pero aun dentro de las
especificaciones. (Oakland 1991 describe como es posible identificar turnos muy graduales de
este tipo utilizando “un diagrama “cusum”) Este caso del centro es una
Situación claramente identificable de que la falla esta por ocurrir. En otras palabras, es una
falla potencial. Si no se hace nada para rectificar la situación, eventualmente el proceso
comienza a producir artículos fuera de especificación, como se muestra en la zona 3 del
grafico 7.6.
Este ejemplo describe solamente una de las muchas maneras e las que SPC puede ser utilizado
para medir y manejar la variabilidad del proceso. Una descripción completa de estas técnicas
va mucho más del alcance de este libro. Sin embargo el punto clave para identificar en esta
etapa si las desviaciones de un cuadro como este pueden estar relacionadas directamente a
141
modos de falla específicos, de modo que los cuadros son fuentes de datos valoradles que
pueden hacer una gran contribución al mantenimiento en general.
Grafico 7.6 Mantenimiento en condición y SPC.
Monitoreo de Efectos Primarios
Los efectos primarios, (velocidad, nivel de flujo, presión, temperatura, potencia, corriente,
etc.) son otra fuente información sobre la condición del equipo. Los efectos pueden ser
monitoreados por una persona leyendo un indicador, y quizás registrando los datos
manualmente, o por una computadora como parte del proceso de sistema de control, o hasta
por un registrador de gráficos tradicional.
Los registros, y de estos efectos y sus derivados son comparados con la información de
referencia y de esta manera proveen evidencia de fallas potenciales. Sin embargo, en el caso
de la primera opción en particular, procuren asegurar que:
* La persona leyendo los datos sabe que esto debe hacerse cuando todo esta en orden, que
lecturas corresponden a una falla potencial, y que corresponde a una falla funcional.
* Las lecturas se realizan con una frecuencia que es menor que el intervalo P-F (en otras
palabras, la frecuencia debe ser menor que el tiempo que lleve al puntero moverse desde el
nivel de falla potencial, al nivel de falla funcional cuando se presenta el modo de falla en
cuestión.)
* Que un indicador debe ser mantenido de forma tal en que sea lo suficientemente preciso
para esta funcion.
142
Grafico 7.7 Utilizando indicadores para el mantenimiento en-condición.
El proceso de lectura de datos puede simplificarse enormemente si los indicadores están
marcados (o hasta coloreados) como se muestra en el grafico 7.7. En este caso todo lo que los
operadores, o cualquier otra persona, necesita hacer, es observar el indicador y reportar si el
puntero esta sobre la zona de falla potencial ( amarillo?) , o tomar una acción mas drástica si
esta en la zona de falla funcional ( red?). Sin embargo el indicador debe seguir siendo
monitoreado en intervalos menores al intervalo P-F.
(Por razones obvias, estas sugerencias solo se aplican a indicadores que estén midiendo un
estado fijo. También se debe asegurar que los indicadores que tienen esas marcas, no son
retirados y utilizados en el lugar erróneo.)
Los sentidos humanos.
Quizás las técnicas de inspección en-condición mas conocidas son las basadas en los sentidos
humanos (vista, oído, tacto y olfato). Las dos principales desventajas de usar estos sentidos
para detectar falla potenciales son:
* El proceso de deterioro esta generalmente muy avanzado, para el momento en que es
posible detectar las fallas utilizando los sentidos humanos. Esto significa que el intervalo P-F
es generalmente corto, lo que implica que los controles deben hacerse con mayor frecuencia y
que la respuesta debe ser rápida.
* El proceso es subjetivo, de modo que es difícil de desarrollar un criterio de inspección
preciso, y las observaciones dependerán mucho de la experiencia y hasta del estado mental del
observador.
Sin embargo, las ventajas de utilizar estos sentidos son:
* El ser humanos promedio tiene una gran versatilidad, y puede detectar una gran variedad de
condiciones de falla, mientras que cualquier técnica de monitoreo de condición, puede ser útil
solo para el control de un tipo de falla funcional.
* Puede ser muy conveniente y efectivo si el monitoreo es realizado por personas que
desempeñan sus tareas normales cerca de este equipo.
* Un humano tiene la capacidad de emitir un juicio sobre la severidad de la falla potencial, y
por lo tanto sobre la acción que debería tomarse, mientras que un dispositivo de monitoreo de
condición puede solamente hacer lectura y enviar una señal.
143
Selección de la categoría apropiada:
Muchos modos de falla son precedidos por mas de una (a veces muchas) fallas potenciales
diversas, de modo que mas de una categoría de tareas en-condición puede ser apropiada. Cada
una de estas tendrá un intervalo P-F diferente, y cada uno requerirá diferentes tipos y noveles
de habilidad.
Por ejemplo, consideren un rodamiento cuya falla se describe como “se atasca por desgaste
normal”. El grafico 7.8 muestra como esta falla puede ser precedida por una variedad de fallas
potenciales, cada una de las cuales puede ser detectada por una tarea en condición diferente.
Grafico 7.8: Distintas fallas potenciales que pueden preceder un modo de falla.
Esto no significa que todos los rodamientos exhibirán estas fallas potenciales, ni tampoco
tendrán necesariamente los mismos intervalos P-F. El grado en que toda técnica es viable y
conveniente, depende en gran medida del contexto operativo del rodamiento. Por ejemplo,
* Este puede estar ubicado tan adentro de la maquina, que puede ser imposible medir las
características de vibración.
* Solo se pueden detectar partículas en el aceite, si éste esta operando en un sistema de
lubricación totalmente cerrado.
* Los niveles de ruido del sector pueden ser tan altos, que el ruido de una falla puede ser
imposible de detectar.
Esto significa que ninguna categoría de tareas individual será siempre más conveniente que
otra. Es importante tener esto en cuenta porque hay cierta tendencia a presentar el monitoreo
de condición en particular, como “la respuesta” a todos los problemas de mantenimiento.
En realidad, si se aplica RCM correctamente a los sistemas industriales modernos típicos, no
es generalmente posible encontrar que el monitoreo de condición, según se lo describe en esta
parte de este capitulo, sea técnicamente posible para mas de un 20% de los modos de falla, y
conveniente en menos de la mitad de estos casos. (Las cuatros categorías de mantenimiento
en-condición juntas, son generalmente apropiadas para cerca de 25-30% de los modos de
falla.) Esto ni pretende implicar que no deba utilizarse el monitoreo de condición, _ donde
144
funciona, funcionan muy, muy bien_ sino que también debemos recordar desarrollar
estrategias apropiadas para manejar el 90 % restante de nuestros modos de falla. En otras
palabras, el monitoreo de condición es solo parte de la respuesta- y una parte relativamente
pequeña.
De modo que para evitar una inclinación innecesaria en la selección de tareas, necesitamos:
* Considerar todas las advertencias que pueden razonablemente preceder a un modo de falla,
en forma conjunta con la totalidad de las tareas en-condición que podrían utilizarse para
detectar esas advertencias.
* Aplicar el criterio de selección de tareas de RCM rigurosamente para determinar cual (si
alguna) de las tareas tiene probabilidades de ser el modo mas efectivo de anticipar el modo de
falla bajo consideración.
Como con muchos otros aspectos en mantenimiento, la “mejor” opción depende del contexto
operativo del bien.
7.5 Tareas en-condición: Algunos peligros ocultos.
Cuando consideramos la viabilidad técnica del mantenimiento en-condición, dos asuntos
necesitan cuidado especial. Ellos involucran la distinción entre fallas potenciales y
funcionales, y la distinción entre fallas potenciales y edad. Estos asuntos se discuten abajo en
mayor detalle.
Fallas potenciales y funcionales.
En la práctica, surge una confusión en la distinción de fallas potenciales y funcionales. Esto
sucede porque algunas condiciones pueden ser consideradas fallas potenciales en un contexto,
y fallas funcionales en otro. Esto es muy común en el caso de pérdidas de líquido.
Por ejemplo, un goteo mínimo en una junta de pestañas remachadas en una cañería puede ser
considerada como falla potencial si la cañería lleva agua. En este caso, la tarea en-condición,
sería “ controlar las juntas por perdidas). La frecuencia de la tarea dependerá del tiempo que
lleve una “perdida menor aceptable” en convertirse en una perdida mayor “inaceptable”. De
modo que la acción correctiva apropiada deberá realizarse cuando se descubre la perdida
menor.
Sin embargo, si la misma cañería estuviera portando una sustancia toxica como ser cianuro,
cualquier pequeña debe ser considerada falla funcional. En este caso, no es posible si no fuera
posible tener a alguien controlando las perdidas, de modo que debe encontrarse otro método
de manejo de falla.
Este ejemplo, re-enfatiza la importancia que tiene en llegar a un acuerdo de lo que se
considera falla funcional, antes de considerar que se debería hacer para prevenirla.
Intervalo P-F y edad operativa.
Cuando se aplican estos principios por primera vez, las personas tienen dificultad en
distinguir, entre la vida de un componente y el intervalo P-F. Esto las lleva a basar la
frecuencia de tareas en-condición, en la vida imaginaria o real del equipo. Si esta existe, seria
muchísimas veces mayor a al intervalo P-F, de modo que la tarea alcanzo muy poco, o nada.
145
En la realidad, medimos la vida de un componente hacia adelante desde el momento en que
entra en servicio. El intervalo P-F se mide desde la falla funcional hacia atrás, implicando que
estos dos conceptos no se relacionan para nada generalmente. La distinción es importante
porque las fallas, que no están relacionadas con la edad, (en otras palabras fallas casualestienen tantas probabilidades de ser precedidas por una advertencia que aquellas que no lo son.
Grafico 7.9 Fallas e Intervalo P-F
Por ejemplo, el grafico 7.9 muestra un componente que conforma un patrón de falla casual
(Patrón E). Uno de los componentes fallo después de 5 años, un segundo después de 5 meses,
y un tercero después de dos años. En cada uno de estos casos, la falla funcional fue precedida
por una falla por una falla potencial con un intervalo P-F de cuatro meses.
El grafico 7.9 muestra que para detectar la falla potencial. Necesitamos hacer una tarea de
inspección cada dos meses. Al ocurrir las fallas en una base casual, no sabemos cuando se va
a presentar la siguiente, de modo que los ciclos de inspección deben comenzar tan pronto
como el ítem es puesto en servicio. En otras palabras, la frecuencia de las inspecciones no
tiene nada que ver con la edad o vida del componente.
Sin embargo esto no significa que las tareas en-condición se aplican solo a ítems que fallan en
una base casual. También pueden aplicarse a ítems que sufren fallas relacionadas a la edad,
como se discute mas adelante en este capitulo.
7.6- Curvas P-F Lineares y No lineares.
La parte uno de este capitulo, explicaba que las etapas finales de deterioro pueden ser
descriptas por la curva P-F. En esta parte de este capitulo, consideramos esta curva en mayor
detalle, comenzando con una mirada a las curvas P-F no lineares, y luego continuando hasta
considerar las curvas P-F lineares.
Las etapas finales del deterioro.
La figura 7.1 de la paina 144 sugiere que el deterioro de acelera generalmente en las etapas
finales. Para ver porque pasa esto, consideremos en mayor detalle que sucede cuando un
rodamiento falla debido al uno y desgaste normal.
El grafico 7.10 ilustra un típico rodamiento de bolas, cargado verticalmente que gira en
sentido horario. La parte cargada con mayor peso y frecuencia será el fondo del anillo
exterior. A medida que el rodamiento gira, la superficie interior del anillo exterior se mueve
hacia arriba y hacia abajo a medida que pasa cada bola. Estos movimientos cíclicos son
146
pequeños, pero son suficientes para causar grietas por fatiga en la superficie, que evolucionan
como se ve en el grafico 7.10.
Este también explica como estas grietas dan cabida a la aparición de síntomas detectables de
deterioro. Estas son por supuesto fallas potenciales, y los intervalos P-F asociados se pueden
ver en la figura 7.8 d la pagina 154. Este ejemplo eleva otros varios puntos sobre las fallas
potenciales:
* En el ejemplo el proceso de deterioro se acelera, esto sugiere que si e utiliza una técnica de
análisis de vibración para detectar fallas potenciales, no podemos predecir cuando va a ocurrir
la falla trazando una línea recta, si estamos basándonos en solo dos observaciones.
Esto lleva a su vez a la noción de que luego de que se observa una desviación inicial, se
deberían tomar lecturas de vibración adicionales a intervalos progresivamente más cortos,
hasta que se alcance algún punto superior, en el que deba tomarse acción. En la practica, esto
solo pude hacerse si el intervalo P-F es lo suficientemente extenso para permitir se realicen las
lecturas adicionales. Esto tampoco escapa al hecho de que las lecturas iniciales deben
realizarse a una frecuencia que se sabe es menor al intervalo P-F.
(En realidad, si la forma de la curva P-F es bien conocida, y el intervalo P-F es
razonablemente consistente, no seria necesario realizar lecturas adicionales una vez que se
descubre el primer sigo de desviación. Esto sugiere que el proceso de deterioro, solo debería
controlarse tomando lecturas adicionales, si la curva P.D. no esta bien entendida, o si el
intervalo P-F es altamente inconsistente.)
147
Grafico 7.10: Como un rodamiento de bolas falla debido al uso y desgaste normal.
* Los distintos modos de falla pueden con frecuencia exhibir síntomas similares.
Por ejemplo, Los síntomas descriptos en el grafico 7.10, están basados en fallas causadas por
uso y desgaste normal. Síntomas muy similares serian exhibidos en las etapas finales de la
falla de un rodamiento donde el proceso de falla se halla iniciado por suciedad, falta de
lubricación o durezas.
En la práctica, la raíz precisa de muchas fallas, solo puede ser identificada utilizando
instrumentos sofisticados. Por ejemplo, se puede determinar la causa raíz de la falla de un
rodamiento, utilizando un ferrografo, para separar las partículas del aceite lubricante, y
examinarlas bajo un microscopio electrónico.
Sin embargo, si dos fallas diferentes tienen los mismos síntomas, y si el intervalo P-F es
similar a cada grupo de síntomas- lo que es probable en el ejemplo de los rodamientos- la
distinción entre causas raíz es irrelevante desde el punto de vista de detección de fallas.
(Ésta distinción se vuelve relevante si estamos buscando eliminar la causa raíz de la falla.)
* La falla solo se vuelve detectable cundo las grietas por fatiga se extienden a la superficie, y
esta comienza a partirse. El punto en el que esto sucede en la vida de cualquier rodamiento
depende en la velocidad de rotación de este, la magnitud de la carga, el grado en el que el
anillo exterior rota por si mismo, si es que la superficie del rodamiento fue dañada durante o
antes de la instalación, que tanto se calienta el rodamiento en servicio, la alineación del eje,
con respecto al bastidor, los materiales que se utilizaron para fabricar el rodamiento, la
calidad de fabricación, etc. Efectivamente esta combinación de variables hace posible predecir
cuantos siclos operativos transcurren hasta que las grietas lleguen a la superficie, y por lo
tanto cuando el rodamiento comenzara a exhibir los síntomas mencionados en el grafico 7.10.
(Para los interesados en analizar esto con mayor profundidad, la teoría del caos – en particular
“el efecto mariposa”- muestra como las pequeñas diferencias entre las condiciones iniciales
que aplican a cualquier sistema dinámico lleva a diferencias dramáticas con el paso del
tiempo. Esto puede explicar porque variaciones de minutos entre las condiciones iniciales de
dos elementos rotatorios pueden llevar a diferencias enormes entre las edades en las cuales
fallan. Ver Gleik 1987).
El deterioro se acelera en las etapas finales de la mayoría de las fallas. Por ejemplo, el
deterioro tiende a acelerarse cuando las tuercas comienzan a aflojarse, cuando se atascan
elementos de filtro, cuando la correa trapezoidal comienza a resbalarse, cuando los contactos
eléctricos se recalientan, cuando los cierres comienzan a fallar, cuando los rotores se
desbalancean, y axial sucesivamente. Pero no se acelera en todos los casos.
Curvas P-F lineares
Si un ítem se deteriora de una manera más o menos linear durante su vida, es razonable que
las etapas finales de deterioro, también serán más o menos lineares. Una mirada detallada a
los grafico 6.2 y 6.3, sugieren que esto tiende a ser cierto en las fallas relacionadas con la
edad.
Por ejemplo, consideremos el desgaste de un neumático, la superficie de un neumático tiende
a desgastarse de un modo medianamente linear, hasta que la llanta llega a un mínimo legal. Si
este mínimo es (digamos) 2mm, es posible especificar una profundidad de llanta mayor a
148
2mm, que provea una advertencia adecuada de que la falla funcional es inminente. Este es por
supuesto el nivel de falla potencial.
Si la falla potencial se establece a (digamos) 3mm, entonces el intervalo P-F es la distancia
que se puede esperar la rueda recorra mientras la profundidad de la llanta se desgasta de 3mm
a 2mm, como se ilustra en el grafico 7.11
Profundidad de la llanta
cuando es nueva
= 12 mm
Profundidad
de la llanta
Maxima relacion
de desgaste
Falla potecial
= 3 mmfuncional
Intervalo P-F al
menos 3000
millas
Falla funcional =
2mm
P
P
Seccion transversal
del neumatico
F
0
10
20
30
40
50
Edad operativa
(x 1 000)
Grafico 7.11 Una curva P-F lineal.
El grafico 7.11 también sugiere que si la rueda entra en servicio con una profundidad de
12mm, debería ser posible predecir el intervalo P-F basándonos en la distancia total cubierta
generalmente antes de que la rueda deba ser re-tratada. Por ejemplo, si las ruedas duran al
menos 30.000 millas, antes de ser tratadas, es razonable concluir que la llanta se gasta a un
porcentaje máximo de 1 mm cada 3000 millas. Esto lleva a un intervalo P-F de 3000 millas.
La tarea en-condición respectiva solicitara al conductor:
“Controlar la profundidad de llanta cada 1500 millas, y reportar las ruedas cuyo grosor sea
menor 3mmm.”
Esto no solo asegura que el desgaste se detecta antes de que exceda el limite legal, sino que da
tiempo suficiente -1500 millas en este caso- para que los operadores del vehiculo, planeen
retirar la rueda antes de que alcance ese limite.
En general, el deterioro linear entre “P” y “F”, solo puede encontrarse donde os mecanismos
de falla están relacionados a la edad intrínsicamente (excepto en el caso de fatiga, que es de
un caso mas complejo. Este proceso de falla se discute en mayor detalle mas adelante.)
Se debe tener en cuenta que el intervalo P-F y la frecuencia de la tarea asociada, solo puede
ser reducida de esta manera si el deterioro es linear. Como vimos, el intervalo P-F no puede
ser determinado en este caso si el deterioro se acelera entre P y F.
149
Otro punto sobre fallas lineares implica el momento en que se deberían empezar a buscar las
fallas potenciales.
Por ejemplo, el grafico 7.11 sugiere que seria una perdida de tiempo medir la profundidad
general de la llanta de la rueda, a las 10 o 20 mil millas, porque sabemos que recién se acerca
al punto de falla potencial a las 30.000. De modo que deberíamos comenzar a medir la llanta
de cada rueda una vez que paso el punto en que sabemos que se estará aproximando a 3mm de
profundidad, en otras palabras, una vez que la rueda ha estado en servicio por más de 25.000
millas.
Sin embargo, si queremos asegurarnos de que este régimen de control se adopta en la práctica,
consideren como se deben planear los controles para un camión de cuatro ruedas si la historia
de un set actual es:
Ítem
Camión
Rueda delantera izq.
Rueda delantera der.
Rueda trasera izq.
Rueda trasera der.
Distancia recorrida por el camión y por cada rueda (millas)
140.000
39.000
21.000
12.000
24.000
141.500
40.500
22.500
500 +
25.500
143.000
42.000
24.000
2.000
27.000
144.500
1.000*
25.000
3.500
28.500
* Grosor de llanta de las ruedas D/I por debajo de los 3mm, rueda reemplazada y enviada a
depósito.
+ Un clavo de 6 pulgadas provoco que la rueda reviente alas 13.000 millas, se reemplazo con
un repuesto.
Si vamos a intentar asegurar con seriedad que el conductor solo controla cada rueda una vez
que supera las 25.000 millas en servicio, debemos trazar un sistema que le requiera:
* Controlar las ruedas D/I solamente cuando se hallan recorrido 126.000 millas.
* Controlar las Ruedas izquierda delantera y derecha trasera cuando se hallan recorrido
141.500 millas.
* Y nuevamente a las 143.000 millas
* Pero controlar la rueda trasera derecha y delantera derecha, a las 144.500 millas, pero no la
delantera izquierda.
Claramente, esto carece de sentido, porque el costo de administrar un sistema semejante, seria
mucho mayor que el costo de pedir al conductor controle las llantas de todas las ruedas cada
1.500 millas. En otras palabras, en este ejemplo, el costo de sincronizar las tareas, seria
mucho mayor que el de llevarlas a cabo. De modo que simplemente solicitaríamos al
conductor chequear las ruedas en intervalos de 1.500 millas, más que dirigir su atención a
ruedas específicas.
Sin embargo, si el proceso de deterioro es linear, y la tarea en si misma es muy costosa,
entonces seria conveniente asegurarnos que solo comenzamos controlando las fallas
potenciales solo cuando sea absolutamente necesario.
Por ejemplo, si una tarea en-condición implica apagar y abrir una turbina para controlar si los
discos tienen grietas , y tenemos la certeza de que el deterioro solo se vuelve detectable una
vez que la turbina ha estado en servicio por un cierto periodo de tiempo
( en otras
palabras, las fallas están relacionadas a la edad) , entonces solo deberíamos comenzar a poner
150
la turbina fuera de servicio y controlar sus discos una vez que se ha excedido la edad en la
cual comienzan las probabilidades de grietas.
Por lo tanto, la frecuencia de los controles se basa en las posibilidades que una grieta
detectada, tiene de degenerar en falla.
Para el registro, la edad en la cual una grieta tiene probabilidades de volverse detectable se
conoce como inicio de vida, mientras el tiempo (numero de ciclos de stress), que transcurre
desde el momento en que la ruptura se vuelve detectable, hasta que llega un punto en que el
ítem falla se conoce como propagación de vida de la grieta.
En casos como este, el costo de llevar a cabo la tarea, será mucho mayor que el costo de los
sistemas de planificación, de modo que debemos asegurarnos de que llevamos a cabo la trae,
cuando es realmente necesario. Sin embrago si se siente que esta sincronización de tareas es
necesaria, se debe tener en cuenta que el proceso de plantación utiliza dos marcos temporales
totalmente distintos.
* El primero se utiliza para decidir cuando deberíamos comenzar a realizar la tarea encondición. Esta es la edad operativa en la que las fallas potenciales comienzan a hacerse
detectables.
* El segundo marco establece la frecuencia con que deberíamos llevar a cabo la tarea una vez
que se alcanzo esa edad. Este marco temporal es por supuesto el intervalo P-F.
Por ejemplo, se puede sentir que el disco de una turbina no tiene probabilidades de presentar
ninguna ruptura detectable hasta que halla estado en servicio por lo menos unas 50.000 horas,
pero que lleva un mínimo d 10.000 horas para que una grieta detectable se deteriore en falla
de disco. Esto sugiere que no necesitamos comenzar a buscar rupturas hasta que el ítem haya
estado en funcionamiento por 50.000 horas, pero de ahí en adelante, se lo debe controlar en
intervalos menores a 10.000 horas.
Planificar con este grado de sofisticación requiere un entendimiento muy detallado del modo
de falla bajo consideración, en forma con n sistema de planificación también sofisticado. En
la práctica, solo unos pocos modos de falla son tan bien entendidos. Cuando lo son, d todas
maneras, muy pocas organizaciones poseen sistemas de planificación que puedan cambiar de
un marco temporal al otro como describimos anteriormente, de modo que esto debe ser
tratado con cuidado.
Cerrando esta discusión, debe resaltarse que todas las curvas – P-F- y relacionadas a la edad
que se destacaron en esta parte de este capitulo, se diseñaron para un modo de falla por vez.
Por ejemplo, en el ejemplo relacionado a las ruedas, el proceso de falla era el uso normal. Los
distintos modos de falla (tales como puntos desgastados en las ruedas debido a golpes o
roturas causadas por rebordes e las calles) pueden llevar a diferentes conclusiones, porque
tanto las características técnicas como las consecuencias de estos modos de falla son
diferentes.
Una cosa es especular sobre la naturaleza de las curvas P-F en si mismas, pero otra muy
distinta determinar la magnitud del intervalo P-F en la práctica. Este tema se considera en
siguiente sección de este capitulo.
151
7.7 Como Determinar el Intervalo P-F
Es generalmente un asunto simple determinar el intervalo P-F para las fallas relacionadas a la
edad, cuyas etapas finales de deterioro son lineares. Esto se realiza aplicando una lógica
similar a la utilizada en el ejemplo de las ruedas.
Por otro lado el intervalo P-F puede ser sorprendentemente difícil de determinar en el caso de
fallas casuales, donde el deterioro se acelera. El problema principal con las fallas casuales, es
que no sabemos cuando se va a presentar la siguiente, de modo que no sabemos cuando el
siguiente modo de falla va a comenzar a recorrer la curva P-F. De modo que si ni siquiera
sabemos donde va a comenzar la curva P-F, como podremos saber que tan larga es? Los
siguientes párrafos revisan cinco posibilidades, de las cuales solo la cuarta y quinta tienen
algún merito.
Observación continúa:
En teoría, es posible determinar el intervalo P-F si se observa continuamente un ítem en
servicio asta que una falla ocurra, prestando atención cundo eso ocurre, y luego seguir
observando el ítem hasta que falla completamente. (Se debe considerar que no podemos trazar
una curva P-F completa, si observamos el ítem en forma intermitente, porque aunque
descubramos que ha fallado, aun no podremos saber con precisión cuando comenzó el
proceso. Lo que es mas, si el intervalo P-F es mas corto que el periodo de observación
intermitente nos perderemos la curva P-F completa, en cuyo caso tendremos que comenzar
todo de nuevo con un ítem nuevo.)
Claramente este método es poco práctico, en primer lugar porque la observación continua es
muy cara, especialmente si tratáramos de establecer todo intervalo P-F de este modo. En
segundo lugar, esperar hasta que ocurra la falla funcional implica que el ítem realmente tiene
que fallar. Esto puede terminar con nosotros diciéndole a nuestro jefe una vez que el
compresor exploto: “OH, sabíamos que estaba fallando, pero solo queríamos saber cuanto
demoraría en estallar, para si poder determinar en intervalo P-F”
Comenzar con un intervalo corto, y extenderlo gradualmente.
La poca practicidad del método anterior llevo a algunas personas a sugerir, que los intervalos
P-F pueden establecerse, comenzando lo controles con intervalos cortos pero arbitrarios
(digamos 10 días), y luego, esperando hasta que “descubrimos cual debería ser el intervalo”,
quizás extendiendo gradualmente el intervalo. Desafortunadamente de nuevo, este es el punto
en que ocurre la falla funcional, de modo que todavía podríamos terminar permitiendo que el
compresor explote.
Este método es potencialmente peligroso, porque tampoco hay garantía de que el intervalo
arbitrario inicial, no importa cuan corto sea, será mas corto que el intervalo P-F (a menos que
se considere seriamente el proceso de falla en si mismo.
Intervalos Arbitrarios
Las dificultades asociadas con los métodos descriptos anteriormente, llevan a la sugerenciabastante seria, de que debería seleccionarse un intervalo arbitrario razonablemente corto, para
todas las tareas en-condición. Este método arbitrario es el menos satisfactorio, (y mas
peligroso) de establecer la frecuencia de tareas en-condición, porque de nuevo no hay
garantías de que los intervalos arbitrarios razonablemente cortos, serán aun mas cortos que el
intervalo P-F. Por otro lado, el intervalo P-F verdadero
152
Puede ser mucho más extenso que el intervalo arbitrario, en cuyo caso la tarea termina siendo
realizada con mucho más frecuencia que la necesaria.
Por ejemplo, si una tarea diaria solo necesita ser realizada, digamos una vez al mes, esta tarea
esta costando treinta veces lo que debería.
Investigación.
El mejor modo de establecer un intervalo P-F preciso es simular una falla de modo tal que no
haya consecuencias serias, cuando esta ocurra eventualmente. Por ejemplo, esto se realiza
cuando se ponen a prueba los componentes de una aeronave para que fallen en tierra, antes
que en el aire. Esto n solo provee datos sobre la vida de los componentes, como se discute e el
capitulo 6, sino que también permite a los observadores estudiar como se desarrollan las fallas
y con la rapidez que sucede. Sin embargo, las pruebas de laboratorio son costosas, y lleva
mucho tiempo obtener resultados, aun cuando son acelerados. De modo que solo es
conveniente realizarles cuando un gran número de componentes están en riesgo- tales como
una flota de aviones- y las fallas tienen consecuencias muy serias.
Un método racional:
El párrafo anterior indica que en la mayoría de los casos, es imposible, impractico o
demasiado costoso determinar el intervalo P-F en una base empírica. Por otro lado, es aun
menos sabio manejarse en la oscuridad. A pesar de estos problemas, los intervalos P-F pueden
calcularse con una precisión sorprendente en las bases del juicio y experiencia.
El primer truco es realizar la pregunta correcta. Es esencial que toda persona tratando de
determinar el intervalo P-F entienda que estamos preguntando Que tan rápido falla el ítem.
En otras palabras, estamos preguntando cuanto tiempo (o
Cuantos ciclos de stress) transcurren desde el momento en que la falla potencial se vuelve
detectable, hasta el momento en que alcanza un estado funcional de falla. No estamos
preguntando con que frecuencia falla, o cuanto dura esta.
El segundo truco es consultar con las personas adecuadas – personas que poseen un
conocimiento íntimo del bien, el modo en que falla y los síntomas de cada falla. Para la
mayoría de los equipos, esto generalmente abarca las personas que lo operan, los operarios
que lo mantienen, y sus supervisores de primera línea. Si el proceso de detección requiere
instrumentos especializados, tales como equipos de monitoreo de condición, entonces
deberían formar parte del análisis especialistas apropiados.
En la práctica, el autor encontró que un modo efectivo de aclarar los pensamientos sobre los
intervalos P-F, consiste en proveer un número de “percheros” donde las personas puedan
colgar sus pensamientos. Por ejemplo, uno podría preguntar: “ Piensan que el intervalo P-F
tendera en medirse en orden de días, semanas o en meses? “ Si la respuesta es semanas, el
paso siguiente será preguntar: o “una, dos, cuatro u ocho semanas?”
Si todo el grupo alcanza un consenso, se establece el intervalo P-F, y los analistas pasan a
considerar otro criterio de selección de tareas, como ser la consistencia del intervalo P-F y si
el intervalo neto será lo suficientemente extenso como para evitar las consecuencias de la
falla.
153
Si el grupo no alcanza un consenso, no es posible proveer una respuesta positiva a la pregunta
“que es el intervalo P-F?”. Cuando esto sucede, la tarea en-condición asociada, debe ser
abandonada, como forma de detectar el modo de falla bajo consideración, y la falla debe ser
tratada de otra manera.
El tercer truco es concentrarse en un modo de falla a la vez, en otras palabras, si el modo de
falla es desgaste, los analistas deberían concentrarse en las características d desgaste, y no
discutir corrosión o fatiga, ( a menos que los síntomas de los otros modos de falla sean
prácticamente idénticos , y el grado de deterioro sea también similar.)
Finalmente, se debe entender claramente, por todos los que formas parte de tal análisis, que el
objetivo es alcanzar a un intervalo de tarea en-condición que sea menor al intervalo P-F , pero
no tanto que los recursos sean malgastados en el proceso de control.
La efectividad de ese grupos se redobla si la gerencia expresa una apreciación sobre el hecho
de que esta realizada por seres humanos, y que estos no son infalibles. Sin embargo, los
analistas también deben estar al tanto de que si la falla tiene consecuencias de seguridad, el
precio de se comentan errores puede literalmente ser fatal para ellos mismos o para sus
colegas, de modo que deben ser especialmente cuidadosos en esta área.
7.8 Cuando las tareas en condición son convenientes.
Las tareas en-condición deben satisfacer el siguiente criterio para que se considere
conveniente llevarlas a cabo:
* Si una falla es oculta, no tiene consecuencias directas. De modo que las tareas en-condición
que tienen por objetivo prevenir una falla oculta deberían reducir el riesgo de falla múltiple a
un nivel aceptablemente bajo. En la práctica, porque la funcion es oculta, muchas de las fallas
potenciales que afectan normalmente a las funciones evidentes, también serán ocultas.
Lo que es mas, gran parte de este tipo de equipos sufren de fallas casuales con intervalos P-F
muy cortos o no existentes, de modo que es inusual encontrar una tarea en-condición, que sea
técnicamente viable y conveniente para una funcion oculta. Pero esto no significa que no deba
buscarse una.
* Si la falla tiene consecuencias de seguridad o medioambientales, solo es conveniente
realizar una tarea en condición si se puede confiar en que esta de la advertencia suficiente
sobre la falla, para asegurar que se puedan tomar las medidas necesarias para evitar las
consecuencias de seguridad o medioambientales.
* Si la falla no afecta la seguridad, la tarea de be tener una relación costo-efectividad, de
modo que en un periodo de tiempo, el costo de llevar a cabo la tarea en-condición, sea menor
que el costo de no realizarla. La pregunta de la relación costo-efectividad se aplica a fallas con
consecuencias operativas y no operativas del siguiente modo:
- Las consecuencias operativas son generalmente más costosas, de modo que una tarea en
condición que logre reducir el número de estas, tendrá una buena relación costo-efectividad.
Esto es así, porque el costo de inspección es generalmente bajo. Esto se ilustraba en los
ejemplos de las páginas 104 y 105
154
- El único costo de una falla funcional que tiene consecuencias no operativas es el costo de
reparación. Algunas veces, este es prácticamente lo mismo que el costo de corregir la falla
potencial que lo precede.
En tal caso, aun cuando una tarea en-condición sea técnicamente posible, no tendrá relación
costo-efectividad, porque después de un periodo de tiempo, el costo de las inspecciones, mas
el costo de corregir las fallas potenciales serán mayores que el costo de reparar la falla
funcional (ver paginas 107 y 108).
Sin embargo, una tarea en-condición puede justificarse si cuesta mucho mas reparar la falla
funcional que la falla potencial, especialmente si la primera causa daños secundarios.
7.9 Seleccionando las Tareas Proactivas.
Es raramente difícil decidir cuando una tarea proactiva es técnicamente posible. Esta decisión
depende de las características de la falla, y estas son generalmente lo suficientemente claras
para que la decisión sea cuestión de un Si o No.
Decidir si es conveniente llevarlas a cabo requiere de mayor juicio. Por ejemplo, el grafico
7.8 indica que puede ser técnicamente posible que dos o más tareas de la misma categoría
sirvan para prevenir el mismo modo de falla. Pueden llegar a tener tanta afinidad en lo que
respecta a costo-efectividad, que el hecho de seleccionar cual utilizar puede llegar a ser una
cuestión de preferencia personal.
Esta situación se complica aun más, cuando tareas de dos categorías diferentes, son ambas
técnicamente viables para el mismo modo de falla.
Por ejemplo, la mayoría de los países en actualidad especifican un grosor de llanta mínimo
legal para las ruedas, (generalmente alrededor de 2mm). Las ruedas que tienen un mayor
desgaste deben ser reemplazadas o re-encauchetadas. En la práctica, las ruedas de camión,
especialmente las de vehículos similares, pertenecientes a una misma flota y recorriendo las
mismas rutas – muestran una relación aproximada entre edad y falla.
El recauchetaje devuelve prácticamente toda la resistencia original, de modo que se debería
programas la restauración de las ruedas una vez que recorrieron una distancia establecida.
Esto significa que todas las ruedas de la flota de camiones serán recauchutadas una vez
recorrida cierta cantidad de millas, ya sea que lo necesiten o no.
El grafico 6.4 en el capitulo 6, repetido en el grafico 7.12, podría haberse diagramado para tal
flota. Este muestra que dentro del desgaste normal, todas las ruedas duran entre 30.000 y
50.000 millas. Si se estuviera por adoptar una política de restauración programada basándonos
en esta información, habrá un incremento rápido en la probabilidad de falla condicional a las
30.000 millas, y ninguna ocurrirá antes de ese lapso, de modo que todas las ruedas podrían ser
recauchutadas a las 30.000 millas de uso.
Sin embargo, si se adoptara esta política muchas ruedas serian recauchutadas mucho antes de
que sea necesario. En algunos casos, ruedas que podrían haber durado unas 50.000 millas,
habrán sido recauchutadas a las 30.000, de modo que habrán perdido 20.000 millas de vida
útil.
155
Por otro lado, como se discute en la parte 6 de este capitulo. Es posible definir una condición
de falla potencial de las ruedas relacionada al grosor de la llanta. Controlar esto es rápido y
fácil, de modos que es solo cuestión de controlar las ruedas cada 1.500 millas, y programas el
recauchetaje solo cuando sea necesario.
De esta forma, las ruedas alcanzaran un promedio de 40.000 millas entre recauchetajes
(debidos a desgaste normal) sin poner en peligro a los conductores, en lugar de 30.000 millas
si la restauración programada se realizara como se describe anteriormente- un aumento en la
vida útil de la rueda de 33%.
De manera que en este caso, las tareas en-condición tienen un mejor relación costoefectividad que la restauración programada.
Grafico 7.12
hipotética.
Fallas de ruedas debido a desgaste normas en una tropa de camiones
Este ejemplo sugiere el siguiente orden básico de preferencia para la selección de tareas
proactivas:
Tareas en-condición:
Las tareas en-condición se consideran primeras en el proceso de selección de tareas por las
siguientes razones:
* Pueden casi siempre ser llevadas a cabo sin mover el bien de la posición en que esta
instalado y generalmente mientras este opera, de modo que rara vez interfieren con el proceso
de producción. Además son fáciles de organizar.
* Ellas identifican condiciones específicas de fallas potenciales, de modo que las acciones
correctivas se pueden definir claramente antes de que comience el trabajo. Esto reduce la
cantidad de trabajo de reparación, y permite realizarlo más rápidamente.
*Al identificar el equipo en el punto de falla potencial, permiten determinar su vida útil
(como se ilustraba en el ejemplo de la rueda).
Tareas de restauración programada y descarte programado.
Si no se logra encontrar una tarea en-condición apropiada para un modo de falla particular, la
siguiente opción es la restauración programada o el descarte programado.
Si satisfacen la viabilidad técnica y el criterio de costo –efectividad descriptos en el capitulo
6 _ pueden reducir significativamente las consecuencias de las fallas a las que va dirigidas.
Sin embargo estas dos categorías de tareas también tienen desventajas significantes:
* Solo puede ser realizadas si el bien no esta funcionando y (generalmente) tiene que ser
enviado al taller, de modo que la tarea casi siempre afecta la operación de algún modo.
* El límite de edad se aplica a todos los ítems, de modo que muchos ítems o componentes que
pueden haber sobrevivido a su límite de edad, serán retirados igualmente.
156
* Las tareas de restauración implican trabajo en taller, de modo que general una carga mucho
mayor que las tareas en-condición.
Estas desventajas implican que cuando ambas categorías son técnicamente posibles, las tareas
en-condición tienen generalmente una mejor relación costo-efectividad que la restauración
programada o el descarte programado, de modo que las primeras se consideran primero.
Como se menciona en el capitulo 6, la restauración programada y el descarte programado
generalmente se consideran en forma conjunta porque tienen mucho en común. Cuando las
encontramos en la práctica, es generalmente obvio si el modo de falla debe recibir
restauración programada o descarte programado.
Sin embargo, en el caso de algunos modos de falla, ambas categorías de tareas pueden
satisfacer el criterio de posibilidad técnica. En estos casos, se debe seleccionar el que mejor
relación costo-efectividad posea.
En general, sin embargo, la restauración programada se considera generalmente antes que el
descarte programado, porque el inherentemente mas conservador restaurar ítems, en lugar de
tirarlos.
¿Es la tarea en condición
técnicamente viable, conveniente
y beneficiosa?
Combinaciónes de tareas.
Para un numero muy pequeño de modos de falla, que tienen consecuencias de seguridad o
medioambientales, no se puede encontrar una
NO
SI
tarea que en si misma, reduzca el modo de falla a
un nivel bajo aceptable, y una modificación
Realizar las tareas en
apropiada que se auto sugiera.
Condición a intervalos
Menores que el intervalo
En estos casos, es a veces posible encontrar una
combinación de tareas, (generalmente de dos
categorías de tareas diferentes, tales como una
tarea en-condición, y una tarea de descarte
programado), que reduzca el riego de una falla a
un nivel aceptable.
Cada tarea se lleva a cabo con una frecuencia
apropiada. Sin embargo, se debe resaltar que esto
es necesario muy raramente, y se debe tener
cuidado de no emplear tales tareas con una base
regular.
El proceso de selección de tareas.
El proceso de selección de tareas se resume en el
grafico 7.13. Este orden básico de preferencia es
valido para la mayoría de los modos de falla, pero
no se aplica en cada caso en particular. Si una
tarea de bajo orden, esta por ser claramente un
método mas efectivo de manejar una falla que una
tarea de mayor orden, entones la primera debe ser
seleccionada.
Grafico 7.13 Proceso de selección de tareas.
P-F
¿Es la tarea de restauración
programada técnicamente viable, y
conveniente?
SI
NO
Realizar las tareas de
restauración programadas a
intervalos menores que la
edad limite.
¿Es una tarea de descarte
programado técnicamente
posible y conveniente?
SI
NO
Realizar las tareas de descarte
programado antes de límite de
edad.
Las acciones de Default
dependerán de Las
consecuencias (ver capitulos
4,8 y9)
157
8. Acciones de Default 1 – Tareas de búsqueda de fallas.
8.1- Acciones de Default.
Los capítulos anteriores mencionaban que si no se puede encontrar una tarea proactiva que
sea técnicamente posible, y a la vez conveniente para un modo de falla dado, entonces la tarea
de default que debe realizarse depende de las consecuencias de la falla:
* Si no se logra encontrar una tarea proactiva que reduzca a un nivel tolerable el riesgo de
falla múltiple asociado a una funcion oculta, entonces se debe llevar a cabo se debe llevar a
cabo una tarea de búsqueda de falla periódica. Si una tarea de búsqueda de falla apropiada
no puede ser determinada, entonces la acción de default secundaria es que el ítem debe ser
rediseñado.
* Si no se logra encontrar una tarea proactiva que reduzca a un nivel tolerable el riesgo de
una falla con potencial de afectar la seguridad e el medioambiente, el ítem debe ser
rediseñado, o se debe cambiar de proceso.
* Si no se logra encontrar una tarea proactiva que implique un costo menor que la falla con
consecuencias operativas, la decisión de default inicial es que no se realice mantenimiento
programado. (Si esto ocurre y las consecuencias operativas siguen siendo inaceptables,
entonces la acción de default secundaria vuelve a ser el rediseño.
* Si no se logra encontrar una tarea proactiva que en determinado periodo de tiempo tenga un
costo menor que una falla con consecuencias no-operativas, la decisión de default inicial es el
mantenimiento no programado, y si los costos de reparación fueran demasiado altos,
entonces la acción de default vuelve a ser el rediseño.
La ubicación de las acciones de default en el marco de decisión de RCM se muestra en el
grafico 8.1. A este punto, estamos respondiendo la séptima de las siete preguntas que
conformas el proceso de toma de decisión de RCM:
- ¿Que debe hacerse si no se encuentra una tarea proactiva apropiada?
Este capitulo considera la búsqueda de fallas. El capitulo 9 trata el rediseño y el ir a la falla;
también considera tareas de rutina que caen fuera del marco de toma de decisiones de RCM
tales como los controles caminando.
158
¿Se volverá evidente una
perdida de funcion para
el equipo de operarios
bajo circunstancias
normales?
S
¿Podría este modo de falla
causar una perdida de
funcion o daño secundario
que podría lastima o
terminar con la vida de
alguien, o violar una norma
medioambiental?
N
El mantenimiento
proactivo es conveniente si
reduce la probabilidad de de
falla a un nivel tolerable.
Si No
Si No
Si No
Realizar una
búsqueda de Falla.
El rediseño
puede ser
obligatorio
Grafico 8.1
El rediseño es
obligatorio
ACCIONES
DE DEFAULT
Acciones de Default.
N
S
El mantenimiento
proactivo es
conveniente si en un
periodo de tiempo su
costo es menor que el
costo de las
consecuencias
operativas menos mas
el costo de reparación
de la falla.
S
El mantenimiento
proactivo es conveniente si
reduce la probabilidad de de
falla múltiple a un nivel
tolerable.
N
Tiene este modo de
falla un efecto directo
adverso en la capacidad
operativa.
El mantenimiento
proactivo es
conveniente si reduce
la probabilidad de
modo de falla a un
i l l bl
Si No
Mantenimiento
No programado
Mantenimiento
No programado
El rediseño
puede
ser deseable
El rediseño
puede ser
deseable.
8-1 Bús
8.2 Busqueda de Fallas.
¿Porque preocuparse?
Mucho de lo que se escribió hasta la fecha sobre estrategias de mantenimiento, hace
referencia a tres, y solo tres tipos de mantenimiento: predictivo, preventivo y correctivo. Las
tareas predictivas, implican controlar si algo esta fallando. Las tareas Preventivas implican
reparar o reemplazar ítems en intervalos fijos. El mantenimiento correctivo implica reparar
ítems ya sea cuando se descubre que están fallando o que fallaron anteriormente.
Sin embargo, hay una familia completa de tareas de mantenimiento que no pertenece a
ninguna de las categorías anteriores. Por ejemplo, cuando activamos periódicamente una
alarma para incendios, no controlamos si esta fallando. No la estamos reparando o
reemplazando, ni la estamos arreglando porque fallo.
Solamente estamos probando si sigue funcionando.
Las tareas diseñadas para controlar si algo todavía funciona se conocen como tareas de
búsqueda de fallas, o controles funcionales. (Para que concuerde con las otras tres categorías
de tareas, el autor y otros colegas las llamas tareas defectivas, porque se utilizan para detectar
si algo ha fallado.)
La búsqueda de fallas se aplica a fallas ocultas o no reveladas. Las fallas ocultas a su vez solo
afectan a los dispositivos de protección.
159
Si se aplica RCM de forma correcta a la mayoría de los sistemas industriales modernos y
complejos, no es usual encontrar que hasta un 40 % de los modos de falla estén considerados
en la categoría de fallas ocultas. Lo que es mas, hasta un 80% de estos modos de falla
requieren de la búsqueda de falla, de modo que hasta un tercio de las tareas generadas por
programas comprensivos de desarrollo de estrategias de mantenimiento aplicados
correctamente son las tareas de búsqueda de fallas.
Un descubrimiento mas problemático es que al momento de escribir, muchos programas de
mantenimiento existentes no proveen atención alguna para menos de un tercio de dispositivos
de protección (e inclusive a intervalos inadecuados). Las personas que operan y mantienen
las planas cubiertas por estos programas, tienen conocimiento de que existe otro tercio de
estos dispositivos pero no les prestan atención, e inclusive no es difícil encontrar que nadie
sabe de su exigencia. Esta falta de conocimiento y atención, implica que la mayoría de los
dispositivos de protección en la industria – nuestra última línea de protección cuando las
cosas salen mal- son mal mantenidos, o no reciben mantenimiento alguno.
Esta situación es totalmente insostenible.
Si la industria es seria en lo que respecta a la integridad medioambiental y de seguridad, todo
el asunto de búsqueda de fallas debe ser abordado como una prioridad con urgencia. A
medida que mas cantidad de profesionales de mantenimiento toman conciencia de la
importancia de esta área de mantenimiento tratada con negligencia, esta
Teniendo una tendencia a convertirse en una estrategia de mantenimiento en la próxima
década aun mayor de lo que fue el mantenimiento predictivo en los últimos diez años. El resto
de este capitulo explora este asunto en mayor detalle.
Fallas Múltiples y búsqueda de fallas
Una falla múltiple ocurre si una funcion protegida falla mientras un dispositivo de protección
esta también en estado de falla. Este fenómeno se ilustra en el grafico 5.10 de la pagina 114.
El grafico 5.11 de la pagina 117 mostraba que la probabilidad de una falla múltiple puede
calcularse del siguiente modo.
Probabilidad de
Falla múltiple
=
Probabilidad de falla de
la funcion protegida
= Indisponibilidad promedio
del dispositivo de PROTECA.
Esto llevaba a la conclusión de que la probabilidad de falla múltiple puede reducirse, al
reducir la indisponibilidad del dispositivo de protección- en otras palabras aumentando su
disponibilidad. El capitulo 5 explicaba que la mejor manera de hacer esto es prevenir que el
dispositivo de protección entre en estado de falla aplicando algún tipo de mantenimiento
proactivo.
Los capítulos 6 y 7 describen como decidir si es que el mantenimiento proactivo es
técnicamente viable y monetariamente conveniente. Sin embargo, cuando los criterios
descriptos en estos dos capítulos se aplican a funciones ocultas, se observa que solo un 10 %
de estas funciones son susceptibles de algún tipo de mantenimiento predictivo y preventivo.
No obstante, aunque el mantenimiento proactivo es a veces inapropiado, es esencial hacer
algo para reducir la probabilidad de falla múltiple en el nivel requerido, esto puede hacerse
controlando periódicamente si la funcion oculta esta aun funcionando.
160
Por ejemplo, no podemos prevenir la falla de un foco roto. De modo que no hay un circuito de
advertencia de que el foco ha fallado. El único modo de reducir la posibilidad de que un foco
quemado cause una falla mayor, es controlar si aun esta funcionando y cambiarlo si no es así.
La búsqueda de fallas programada implica controlar una funcion oculta en intervalos
regulares para determinar si ha fallado.
Este capitulo se concentra en los aspectos técnicos claves de la búsqueda de fallas, describe
como establecer los intervalos para esta, define el criterio de viabilidad técnica formal para la
búsqueda de fallas, y considera que debería hacerse si no se puede encontrar una tarea
apropiada en este caso.
Aspectos Técnicos de la Búsqueda de Fallas.
El objetivo de la búsqueda de fallas es auto satisfacernos de que un dispositivo de protección
proveerá la protección requerida si se requiere que lo haga. En otras palabras, no estamos
controlando si un dispositivo de protección se ve bien- sino que estamos controlando si
todavía funciona como debería. (Esto es por lo que las tareas de búsqueda de fallas también se
conocen como controles funcionales.)
Controlar el sistema de protección en su totalidad.
Una tarea de búsqueda de fallas debe asegurar la detección de todos los modos de falla que
pueden tener una tendencia razonable a causar la falla del dispositivo de protección. Esto es
especialmente cierto en dispositivos complejos como ser los sistemas eléctricos. En estos
casos, la funcion del sistema en su totalidad debe ser controlada desde el sensor hasta el
actuador. Lo optimo seria hacerlo mediante una simulación del circuito al que deba
responder, y controlar si el actuador da la respuesta correcta.
Por ejemplo, un interruptor de presión puede haber sido diseñado para apagar una maquina, si
la presión del aceite lubricante baja de cierto nivel. Cuando sea posible, los interruptores de
este tipo debería ser controlados bajando la presión al nivel requerido y controlando si la
maquina se apaga.
Del mismo modo, un circuito de detección de incendios debería controlarse desde el detector
de humo hasta la alarma, arrojando humo al detector y controlando si suena la alarma.
No perturbar.
Desmantelar algo de que se lo vuelva a ensamblar en forma incorrecta. Si esto sucede a una
funcion oculta, el hecho de que sea oculta implica que nadie sabrá que estuvo en estado de
falla hasta el control siguiente (o hasta que sea necesario). Por esta razón, siempre deberíamos
buscar la forma de controlar las funciones de los dispositivos de protección sin desconectarlos
o perturbarlos.
Habiendo dicho esto, algunos dispositivos tienen que ser simplemente desmantelados o
retirados en su totalidad para controlar si están trabajando apropiadamente. En estos casos, se
debe tener gran cuidado en realizar el trabajo de un modo tal que seguirán funcionando
cuando se los vuelva a poner en servicio. (Mas adelante en este capitulo se considera la
implicancia matemática del hecho de que una tarea de búsqueda de fallas puede inducir a otra
falla.)
161
Debe ser físicamente posible controlar la funcion.
En número pequeño pero significante de casos, es imposible llevar a cabo una tarea de
búsqueda de fallas. Estos son:
* Cuando es imposible tener acceso al dispositivo de protección para controlarlo (es casi
siempre el resultado de diseños poco pensados)
* Cuando la funcion del dispositivo no puede ser controlada sin destruirlo (como en el caso de
dispositivos fusible y discos de ruptura). En la mayoría de estos casos, están disponibles otras
tecnologías (tales como interruptores de circuitos en lugar de fusibles). Sin embargo, en uno o
dos casos nuestra única opción es encontrar algún otro modo de manejar los riesgos asociados
con la protección inestable hasta que aparezca algo mejor, o abandonar lo procesos
considerados.
Minimizar el riesgo mientras se lleva a cabo la tarea.
Debería ser posible llevar a cabo una tarea de búsqueda de fallas sin incrementar
significativamente el riesgo de falla múltiple.
Un ejemplo de una tarea limite, seria aumentar la velocidad de un equipo para controlar si el
mecanismo de protección de exceso de velocidad funciona.
Si se debe inhabilitar un dispositivo de protección para realizar la tarea de búsqueda de fallas,
o si se controla tal dispositivo y se encuentra que esta en estado de falla, se debería proveer
protección alternativa o debería detenerse la funcion protegida hasta que la protección inicial
sea repuesta. Esto se discute en mayor detalle mas adelante.
La búsqueda de fallas no debería realizarse en sistemas donde no se la necesita, pero seria
muy peligroso, (si la sociedad es seria con respecto a la seguridad, es debatible si estos
sistemas deberían existir en un principio).
La frecuencia debe ser práctica.
Debe ser práctico llevar a cabo las tareas de búsqueda de fallas en los intervalos requeridos.
Sin embargo, antes de que podamos decidir si un intervalo requerido es practico, debemos
determinar que intervalo es el realmente “requerido”. Este asunto se considera a continuación.
8.3- Intervalos de Búsqueda de Fallas.
Esta sección de este capitulo, describe como determinar la frecuencia de las taras de búsqueda
de fallas. Comenzara explicando que esta frecuencia depende de dos variables, la
disponibilidad deseada, y la frecuencia de falla del dispositivo de protección. Considera como
establecemos la disponibilidad “deseada”, y luego examina diferentes métodos que pueden
utilizarse para establecer los intervalos de búsqueda de fallas bajo diferentes circunstancias.
Intervalos de búsqueda de fallas, disponibilidad y confiabilidad.
Hemos visto que los intervalos de tareas de mantenimiento predictivo y preventivo están
basados en solo una variable (intervalo P-F y vida útil respectivamente). Los siguientes
párrafos muestran que para establecer estos intervalos se utilizan no una, sino dos variables –
disponibilidad y confiabilidad.
162
El grafico 8.2 muestra una situación en la que 10 motos han estado en servicio por cuatro
años. Esto significa que la vida total del servicio de la flota de motos en este periodo es:
10 motos x 4 años = 40 años.
La luz de freno en cada moto ha sido controlada una vez al año durante cuatro años. (Este
ejemplo asume que no hay intentos de controlar las luces en otras ocasiones, excepto en el
control anual.) Después del periodo de cuatro años, las luces estuvieron en estado de falla en
cuatro ocasiones, como se muestra en el grafico 8.2, de modo que el tiempo medio entre fallas
(MTBF) de la luz de freno es:
40 años en servicio % 4 fallas = 10 años
Grafico 8.2 Fallas en la luz de freno.
En este caso, el intervalo de búsqueda de fallas de un año es igual al 10% de, MFTB de 10
años. Sin embargo, no sabemos exactamente cuando dejo de funcionar cada luz. Una puede
haber fallado un día después del último control, otra el día previo al control actual, y el resto
en algún momento en el medio. Todo lo que sabemos con seguridad es que cada una de las
cuatro luces fallo e algún momento durante ese año previo al chequeo. De modo que al no
tener mejor información, asumimos que en promedio, cada falla ocurrió a mitad de año. En
otras palabras, en promedio, cada luz estuvo fuera de servicio por medio año. Esto significa
que en un periodo de 4 años, las luces falladas estuvieron en estado de falla por un total de:
4 luces falladas x 0.5 años cada estado de falla = 2 años.
Basándonos en esa información, parece que podemos esperar una indisponibilidad promedio
de nuestras luces de freno de:
2 años en estado de falla % 40 años de servicio = 5%.
Esto implica una disponibilidad del 95%.
El ejemplo anterior que hay una correlación linear entre la indisponibilidad (5%), el intervalo
de búsqueda de fallas (1 año) y la confiabilidad del dispositivo de protección como se da en su
MTBF (10 años), de la siguiente manera:
163
Indisponibilidad = 0.5 x intervalo de búsqueda de falla % MFTB del dispositivo de
protección.
Se puede mostrar que esta relación linear es valida para todos los casos donde la no
disponibilidad es menor al 5%, con la condición de que el dispositivo de protección responde
a la distribución de supervivencia exponencial (Ver Cox and Tail 1991, Pág. 283-284, o
Andrews and Moss 1993, Pág. 110 a 112.)
Excluyendo los tiempos de tarea y de reparación.
Se debe tener en cuenta que la “indisponibilidad” del dispositivo de protección, no incluye los
casos en que esa indisposición se presenta mientras se esta llevando a cabo la tarea de
búsqueda de fallas, ni incluye los casos en que al encontrar una falla el dispositivo deba
ponerse fuera de funcionamiento para reparación. Esto sucede por dos razones:
* La interrupción de las funciones del dispositivo ya sea, para efectuar la búsqueda de fallas o
para realizar una reparación, es extremadamente corta si se compara al tiempo de
indisponibilidad desconocido entre tareas, l grado de que este será negligido puramente sobre
bases matemáticas.
* Tanto la tarea de búsqueda de fallas, como las reparaciones necesarias, deben llevarse a
cabo bajo estrictas condiciones de control. Esas condiciones deberían reducir en gran medida
– si no logran eliminar por completo, la posibilidad de una falla múltiple mientras se esta
llevando a cabo la intervención. Esto implica ya sea, interrumpir el sistema de protección, o
organizar una protección alternativa hasta que el sistema halla sido restaurado en su totalidad.
Si esto se realiza apropiadamente, la indisponibilidad resultante de de la intervención
(controlada), puede ser ignorada en cualquier bien en probabilidad de falla múltiple.
En el proceso de decisión de RCM, este último punto es cubierto por el criterio de evaluación
de la conveniencia o no de la búsqueda de fallas. Si hay un incremento significante en la
posibilidad de falla múltiple mientras la tarea se esta realizando, la respuesta a la pregunta “
reduce la tarea la probabilidad de falla múltiple? “ será “no”, y el proceso de decisión de
RCM tomara la segunda acción de default que se discute mas adelante.
Calculando el FFI, mediante el uso de la disponibilidad y la confiabilidad únicamente.
Si utilizamos la abreviación “FFI” para describir los intervalos de búsqueda de fallas. Y
“MTIVE “para describir el MTBF del dispositivo de protección se puede ordenar la siguiente
ecuación de “indisponibilidad” para dar la siguiente formula:
FFI = 2 x indisponibilidad x Mtive
…….2
Esto nos indica que para determinar el intervalo de búsqueda de fallas para un solo dispositivo
de protección, necesitamos conocer el tiempo medio entre fallas, y la disponibilidad deseada
del dispositivo (del cual podemos determinar la indisponibilidad a ser usada en esta formula)
Por ejemplo, asumamos que los conductores de las motocicletas deciden que no los satisface
la disponibilidad de un 95%, y referirían que esta aumente aun 99%. La indisponibilidad
correspondiente seria de un 1%. Si el MTBF de las luces de freno permanecen inmodificadas
a los 4 años, los intervalos de control deben aumentarse de un año a:
FFI = 2 x 1% x 4 años = 2% x 48 meses = 1 mes.
164
En otras palabras, basándonos en las expectativas de disponibilidad, y los datos de falla
existentes, los conductores necesitaran controlar una vez al mes si las luces de freno
funcionan. Si quieren una disponibilidad de 99.9%, necesitaran controlarlas alrededor de dos
veces por semana.
(Estrictamente hablando, los cálculos anteriores son solo validos si las luces de freno en todas
las motocicletas se utilizan durante tiempos similares en toda la semana. Si hay una variación
muy amplia, tanto el MTBF como los intervalos de búsqueda de falla deberían ser calculados
teniendo en cuenta las distancias recorridas, o mas precisamente, el numero de veces que los
frenos_ y por lo tanto las luces de frenos_ son utilizados. Sin embargo un punto clave a tener
en cuenta, en esta etapa es la conexión entre el intervalo de control, la disponibilidad deseada,
y el MTBF.)
Para personas que se sienten incomodas con las formulas matemáticas, la formula 2 puede ser
utilizada para desarrollar una simple tabla:
Habilidad que
requerimos para la
funcion oculta
99.99 %
99.95 %
99.9 %
99.5 %
99 %
98 %
Intervalo de busqueda
de falla (como el % de
MTBF)
0.02 %
0.1 %
0.2 %
1%
2%
4%
95 %
10 %
Grafico 8.3: Intervalos de búsqueda de fallas, disponibilidad y confiabilidad.
Disponibilidad requerida
Habiendo establecido la relación entre disponibilidad, confiabilidad e intervalos de búsqueda
de fallas, el siguiente tema a considerar es como decidimos que disponibilidad requerimos. La
parte 6 del capitulo 5 explicaba que esto puede realizarse en las tres etapas siguientes:
1- Consultar que probabilidad puede tolerar la organización, para la falla múltiple que puede
presentarse si la funcion oculta no responde cuando se lo requiere.
2- Luego determinar la probabilidad de que la funcion protegida falle en el periodo bajo
consideración.
3- Finalmente determinar la disponibilidad que la funcion oculta debe alcanzar, para reducir la
probablididad de falla múltiple al nivel deseado.
Además de llevar a cabo estos tres pasos, necesitamos encontrar el tiempo medio entre fallas
de la funcion oculta. Una vez que esto se levo a cabo, estamos en posición de observar el
grafico 8.3 y seleccionar la frecuencia de tareas que corresponda al nivel de disponibilidad
establecido en el paso 3. Este proceso se ilustra en el siguiente ejemplo:
El grafico 8.4 resume la bomba principal/ de emergencia en el capitulo 5, donde:
* En el paso 1 arriba, los usuarios deseaban que la probabilidad de falla múltiple sea menor
que 1 en 1000 en un año dado.
165
* En el paso 2 establecieron que el grado de fallas no anticipadas de la bomba de emergencia
podría reducirse a un promedio de 1 en 10 años.
1 Año
Funcion de
MTBF = 10 años
*
proteccion
Dispositivo de
Fallo
proteccion
1 en 10
Paso 2 : Determinar con que
frecuencia la funcion de
proteccion tiene probabilidades
de necesitar el disposito de
proteccion
x
1 en 100
=
Falla
Una falla
multiple tiene
lugar cuando
cuando la
funcion de
proteccion falla
mientras que el
dispositivo de
proteccion se
encuentra en un
estado de falla
1 en 1000
Paso 3 : Determinar que
inhabilidad del dispositivo de
proteccion nos permitira
alcanzar 1 en 2
Paso 1 : decidir que
probabilidad es aceptable para
una falla multiple
Paso 4 : coloque la inhabilidad
requerida dentro del grafico 8.3
Grafico 8.4: Disponibilidad deseada de un dispositivo protegido.
* Esto significa que la indisponibilidad de la bomba de emergencia, no deberá exceder un 1%,
de modo que l disponibilidad de esta bomba debe ser del 99% o mas (paso 3).
El grafico 8.3 sugiere que para alcanzar una disponibilidad del 99% para la bomba de
emergencia alguien debería llevar a cabo una tarea de búsqueda de fallas (en otras palabras,
controlar si funciona en su totalidad) a un intervalo del 2% de su tiempo medio entre fallas.
Los registros deben mostrar que la bomba de emergencia tiene un tiempo medio entre fallas
de 8 años ( o 400 semanas) , de modo que la frecuencia de búsqueda de fallas debería ser:
2% de 400 semanas = 8 semanas = 2 meses.
Métodos Rigurosos para Calcular el FFI
El ejemplo anterior sugiere que es posible desarrollar una formula simple para determinar los
intervalos de búsqueda de fallas que incorporen todas las variables consideradas hasta ahora.
En realidad, esto puede hacerse al combinar ecuaciones (1) y (2) arriba, como s explica en los
siguientes párrafos. Comencemos por definir los términos claves:
* Una probabilidad de falla múltiple de 1 en 1.000.000 en un año, implica un tiempo medio
entre fallas de 1.000.000 de años. Llamemos esto MMF. Si esto es axial, entonces la
probabilidad de que la falla múltiple ocurra en un año es 1/ Mmf (ver nuevamente la nota en
la pagina 96)
166
* Hemos visto que si l porcentaje que se demanda de una funcion protegida es de una vez en
200 años, esto corresponde a una probabilidad de falla para la funcion protegida de 200 años.
Llamemos a esto MTED, de modo que la probabilidad de falla de la funcion protegida en un
año cualquiera será de 1/ Mted. Esto también se conoce como el grado de demanda.
* Como antes, Mtive es el tiempo medio entre las falla de los dispositivos de protección y FFI
es el intervalo de las búsquedas de falla.
* UTIVE es la indisponibilidad permitida al dispositivo de protección.
Si sustituimos las expresiones anteriores, la ecuación (1) se convierte en:
1/Mmf = (1/MTED) x Utive.
….2
Esto puede ser arreglado del siguiente modo:
Utive = Mted
Mmf
….3
La ecuación (2) arriba establece que
FFI = 2 x UTIVE x MTIVE
….4
De modo que sustituyendo Utive de la ecuación 4 en la ecuación 2 nos da:
FFI = 2 x MTIVE x MTIVE x MTED
MMF
….5
Esta formula permite que un intervalo de búsqueda de fallas sea determinado de un solo paso:
Si aplicamos esta formula a los gráficos utilizados en la bomba principal/ Stand By, Mmf es
1000 años Mtive es 8 años y Mted es 10 años, de modo que:
FFI = 2 x 8 x 10 = 2 meses.
1000
Fallas múltiples en un dispositivo de proteccion simple.
A través de este capitulo, todas las posibilidades de falla que podrían causar fallas en cada
dispositivo de protección, se agruparon juntas como un modo de falla simple (“falla la bomba
de emergencia”). La gran mayoría de los dispositivos de protección pueden ser tratados de
esta manera, porque todos los modos de falla que podrían provocar la interrupción de un
dispositivo de protección se controlan cuando se chequea el dispositivo como un todo.
Sin embargo es a veces apropiado llevar a cabo un FMEA detallado para identificar los modos
de falla individuales que podrían causar por si mismos que el dispositivo otorgue la
protección deseada. Esto generalmente sucede en dos tipos de circunstancias:
* Cuando se sabe que los modos de falla son susceptibles de recibir mantenimiento proactivo,
pero otros no son ni prevenibles, ni predecibles. En estos casos, debería aplicarse la
restauración en-condición o una tarea de descarte programadas, a los modos de falla que
califiquen, se de deberían aplicar la búsqueda de fallas al resto de los modos de falla.
167
* Cuando un dispositivo de protección es nuevo, y los únicos datos de falla disponibles (de
bancos de datos, proveedores, etc.) se aplican a partes del dispositivo pero no al dispositivo
como un todo.
En estos casos, la ecuación (5) puede ser modificada para acomodar el MTBF de cada
componente del dispositivo.
Cuando la tarea de búsqueda de falla puede causar la falla.
Un problema practico mayor, que afecta a todo el asunto de búsqueda de falla es que esta
misma tarea puede causar la falla, que se supone detecte. Esto generalmente sucede en dos
formas:
* La tarea estresa al sistema de un modo tal que este falla (que puede ser el caso cuando se
prueba un interruptor, cuando el acto de activarlo implica un esfuerzo del mecanismo).
* Si se necesita perturbar el sistema para realizar la tarea, hay posibilidades de que la persona
haciendo esto deje el sistema en estado de falla.
En ambos casos, es dispositivo estará en estado de falla desde el momento en que se completa
la falla. Si p es la probabilidad de que se lo dejara en tal estado después d la prueba, entonces
p (como un decimal) será la indisponibilidad causada por el proceso de prueba. Si MOTHER, es
el tiempo medio entre fallas causadas por fenómenos ajenos a la prueba, se puede mostrar
(para un sistema simple) que:
FFI = 2 x MOTHER x (MTED – p)
___________ ____
(1-p)
MMF
…..6
En esta formula, la expresión (1-p) puede ser ignorada, si p es menor que 0.05.
Si la acción de mover el interruptor es la única causa de falla, (es decir no hay MOTHER) y si la
falla conforma una distribución de supervivencia exponencial, la probabilidad de falla es el
grado de demanda (en años) multiplicado por el numero de ciclos entre fallas de un
dispositivo de protección.
Por ejemplo, si el grado de demanda es de 40 años, y el interruptor dura alrededor de 600.000
ciclos, entonces la probabilidad de falla múltiple es:
1 en (40 x 600.000) = 1 en 24.000.000 de años.
Esto es así, porque si la falla es causada solo por activar el interruptor, entonces el acto de
operar en interruptor para chequear si ha fallado simultáneamente:
* permitirá descubrir si la ultima operación del interruptor s la que causo la falla.
* fatigara al interruptor creando la posibilidad de que este falle como resultado del control.
De modo que bajo este grupo único de circunstancias, (fallas casuales, causadas solo por la
operación del ítem) la tarea de búsqueda de fallas implica controlar el ítem para comprobar si
ha fallado, no tendrá ningún efecto en la probabilidad de falla múltiple, sin importar la
168
frecuencia con que se realiza la tarea. En otras palabras, la respuesta a la pregunta “Es
practico llevar a cabo la tarea en los intervalos requeridos”? es “no”, porque no hay un
intervalo apropiado. Entonces, en este caso, si la organización quiere que la probabilidad de
falla múltiple del interruptor descrito anteriormente sea menos que 1 en 100.000.000, el único
modo de alcanzar esto es reduciendo el grado de demanda en el interruptor, y/o instalando ya
sea un interruptor mas confiable, o mayor cantidad de interruptores.
Todo esto indica si los grados de falla que se dan como un número de operaciones deberían
ser tratados con gran cuidado, por las siguientes razones:
* Rara vez indican si la falla bajo consideración es oculta o evidente.
* No indican si el patrón de falla subrayado esta relacionado a la edad, en cuyo caso puede ser
apropiada alguna forma de restauración programada, o descarte programado, o si es casual.
* A pesar del comentario previo, un modo de falla causado únicamente por la operación de un
interruptor tiene posibilidades de estar relacionado a la edad. Si esto fuera así, entonces es
igualmente probable que se pueda identificar una tarea preventiva que reduzca la probabilidad
de falla múltiple al nivel requerido.
Esto sugiere que como regla, los interruptores importantes – especialmente los de grandes
circuitos – no deberían ser tratados como modos de falla simple. Sino que deberían estar
sujetos a un FMEA detallado, y se debería desarrollar la política de mantenimiento mas
apropiada para cada modo de falla.
Fuentes de Datos para los Cálculos de FFI
La mayoría de las industrias modernas poseen varios miles de sistemas protegidos, la mayoría
de los cuales incorporan funciones ocultas. Las fallas múltiples asociadas con muchos de
estos sistemas serán los suficientemente serios para necesitar utilizar unos de los métodos
rigorosos de búsqueda de fallas.
Si tuviéramos a disposición datos apropiados sobre la probabilidad de falla de una funcion
protegida y del tiempo medio entre fallas, los cálculos podrían realizarse con rapidez. Si esta
información no estuviera disponible – lo que ocurre con frecuencia- entonces es necesario
estimar como pueden ser estas variables en el contexto bajo consideración. En raros casos,
puede ser posible obtener datos de uno de los siguientes:
* Los fabricantes del equipo
* Los bancos de datos comerciales
* Otros usuarios de equipos similares
Con mayor frecuencia, sin embargo, estas estimaciones deben basarse en el conocimiento y
experiencia de las personas que mas saben sobre estos equipos. En muchos de estos casos son
operadores, o personal de mantenimiento. (Cuando utilizamos datos de fuentes externas, se
debe tener especial cuidado en el contexto operativo del bien, para el que se juntaron los
datos, comparándolo con el contexto en que esta operando su equipo en particular.)
Una vez establecida la frecuencia de búsqueda de fallas y las tareas se están realizando en una
base regular, es posible determinar que llevo a determinar esa frecuencia muy rápidamente.
169
Sin embargo, requiere se lleve registros meticulosos de todo esto. No solo de cuando se
realiza cada búsqueda de fallas, sino también:
* Si se encuentra o no que la falla oculta es funcional cada vez que se lleva a cabo la tarea.
* Con que frecuencia falla la funcion protegida (esto puede deducirse por el número de veces
que la funcion protegida hace uso del dispositivo de protección- por ejemplo, del número de
veces que una válvula de presión debe realmente aliviar la presión del sistema.)
Basándonos en esta información, se puede calcular el tiempo medio real entre fallas, y si fuera
necesario se puede revisar la frecuencia de tareas.
Los modos de falla donde el MTBF y/o los patrones de falla asociados son completamente
desconocidos – y no puede hacerse una aseveración satisfactoria- deberían ser puestos en un
programa de exploración de edad de inmediato para establecer la situación verdadera. Si la
situación es tal que la falta de certeza no puede ser tolerada, mientras los datos se están
acumulando, en otras palabras, si las consecuencias de equivocarse son demasiada serias para
que la organización (o en algunos casos, la sociedad en su conjunto), las acepte- entonces
debería hacerse todo esfuerzo para cambiar las consecuencias. Esto casi siempre implicara la
necesidad de algún modo de rediseño.
Un método Informal de Establecer los Intervalos de Búsqueda de fallas:
No todas las funciones ocultas tienen la suficiente importancia para garantizar el tiempo y
esfuerzo para realizar un análisis completo de rigor. Esto se aplica principalmente a las fallas
múltiples que no afectan la seguridad ni el medioambiente. También abarca las fallas
múltiples que podrían afectar la seguridad pero donde la funcion protegida es inherentemente
confiable y el riego a la seguridad es marginal.
En estos casos, puede ser suficiente tener una visión del sistema protegido en su totalidad, en
su contexto operativo, e ir directo a una decisión sobre el nivel de disponibilidad deseado para
la funcion protegida. Esta decisión se usara conjuntamente con el MTBF de la funcion oculta
para establecer un intervalo de tareas, utilizando la tabla del grafico 8.3. (Algunas
organizaciones llegan incluso a utilizar una disponibilidad de 95% de todas las funciones
protegidas en que la falla múltiple asociada no afecta la seguridad o el medioambiente. Sin
embargo, las políticas generales de esta naturaleza pueden ser peligrosas, de modo que solo
deberían ser utilizadas por personas que tiene una gran experiencia con este tipo de análisis.)
Nuevamente, si no hay registros de fallas ocultas disponibles_ raramente los habrá_ será
necesario adivinar a los de MTBF en un principio. Pero estos registros deberán compilarse
tan pronto como sea posible, para validar los números iniciales.
Otros Métodos para Calcular los Intervalos de Búsqueda de Fallas.
El rango de técnicas para establecer los intervalos de búsqueda de fallas descriptos hasta
ahora, no es de ninguna manera exhaustivo. Se desarrollaron muchas variantes adicionales por
la red Aladon de especialistas de RCM. Estas incluyen formulas para:
* Sistemas de votos.
* Sistemas completamente redundantes, independientes y múltiples.
170
* Derivar intervalos optimizados para sistemas en que las fallas múltiples no afectan la
seguridad o el medio ambiente.
Como este libro solo intenta proveer una introducción a este tema, estas formulas no se
incluyen en este capitulo.
La practicidad de los intervalos de tareas.
Los métodos descriptos hasta ahora para calcular los intervalos de búsqueda de fallas a veces
producen intervalos muy cortos o muy largos. En algunos casos, estos intervalos pueden ser
demasiado cortos o demasiado largos:
* Un intervalo muy corto de búsqueda de fallas tiene dos implicancias principales:
- A veces el intervalo es demasiado corto para ser práctico. Por ejemplo tareas de búsqueda de
falla aplicadas a ítems principales que impliquen que la planta deba interrumpir actividades
cada pocos días.
- La tarea puede convertirse en habito (lo que puede suceder si una alarma contra incendios es
controlada con demasiada frecuencia.)
En estos casos, la tarea propuesta es rechazada y nos movemos a la siguiente etapa del
proceso de toma de decisiones de RCM, como discutimos a continuación.
* También podemos encontrar intervalos muy extensos- a veces tanto como intervalos de 100
años o más. Aquí el proceso sugiere claramente que realmente no necesitamos preocuparnos
por llevar a cabo la tarea. En estos casos la “tarea” propuesta debería enunciarse de la
siguiente manera:
“El perfil de riego/ confianza es tal que se considera innecesaria la tarea de búsqueda de
fallas”
* En raros casos, emergen intervalos notablemente mas largos que los requeridos ( MTED). No
tiene sentido llevar a cabo la búsqueda de fallas a Intervalos (FFI) que es sistema se esta
probando a si mismo (MTED), de modo que en estos casos, la respuesta a la pregunta “ Es
practico realizar la tarea al intervalo requerido?” será “no”. Sin embargo, se debe tener en
cuanta que si no se realiza una tarea de búsqueda de fallas no se realiza en un sistema
protegido, (y si Mtive es más que 4 o 5 veces mayor que Mted, que es generalmente el caso),
se puede mostrar que:
Mmf = Mted = Mtive
Si este valor de MMF es demasiado bajo para ser aceptable, entones la protección es
inadecuada y el sistema tendrá que ser rediseñado seguramente, como discutimos en el
próximo capitulo.
8.4 La Viabilidad Técnica de la Búsqueda de Fallas
Los temas discutidos en las partes 2 o 3 de este capitulo implica que para que intervalo de
búsqueda de fallas sea técnicamente posible , debe ser totalmente posible realizar la tarea,
debe ser posible llevarla a cabo sin incrementar el riesgo de falla múltiple, y debería ser
practico llevarla a cabo en el intervalo requerido.
171
La búsqueda de falla es posible técnicamente si
* Es posible realizar la tarea.
* Esta no incrementa el riesgo de falla múltiple.
* Es práctico realizar la tarea en el intervalo requerido.
El objetivo de una tarea de búsqueda de fallas es reducir la probabilidad de multiple falla
asociada con la falla oculta a un nivel tolerable. Esto solo es conveniente si alcanza los
objetivos.
La búsqueda de Fallas es Conveniente si reduce la probabilidad de fallas múltiples a un
nivel tolerable.
La Búsqueda de fallas es una acción de Default!
Se debe tener en cuenta que el mantenimiento proactivo previene que los equipos fallan,
mientras que la búsqueda de fallas que pasaran algún tiempo, si bien no demasiado en estado
de falla. Esto significa que el mantenimiento proactivo es inherentemente más conservativo
(en otras palabras más seguro) que la búsqueda de fallas, de modo que este último solo
deberán ser especificados, si una tarea proactiva más efectiva no puede ser encontrada. Por
esta razón, es sabio evitar los diagramas de decisión de RCM que ponen la búsqueda de fallas
en frente al mantenimiento proactivo, en el proceso de selección de tareas.
¿Que sucede si la Búsqueda de Fallas no es apropiada?
Si es evidente que una tarea de búsqueda de fallas no es técnicamente viable, o conveniente,
habremos agotado todas las posibilidades que nos podrían permitir obtener el desempeño
deseado de un bien existente. Donde esto nos deja, depende una vez más de las consecuencias
de la falla múltiple:
* Si no se logra encontrar una tarea de
búsqueda de fallas apropiada y la falla
múltiple podría afectar la seguridad o el
medioambiente, algo debe cambiarse
para hacer segura la situación. En otras
palabras, el rediseño es obligatorio.
* Si no se logra encontrar la tarea
apropiada de búsqueda de fallas, y la
falla múltiple no afecta la seguridad y el
medioambiente, entonces es aceptable
no llevar a cabo ninguna acción, pero el
rediseño puede ser justificado si la falla
múltiple tiene consecuencias muy
costosas.
¿Es la tarea de búsqueda
de fallas técnicamente
viable y productiva?
Realice una tarea de
búsqueda de fallas
programada
¿Podría la falla
múltiple afectar la
seguridad o el medio
ambiente?
El rediseño es
obligatorio
Mantenimiento
no programado
El rediseño
puede
ser deseable
Este proceso de decisión se resume en el
grafico 8.5. (Este diagrama presenta una
mayor descripción de este aspecto comparado con los cuadros al pie de la columna de la
izquierda en el grafico 8.1)
172
Grafico 8.5 Búsqueda de Fallas: El proceso de decisión.
9- Otras acciones de Default.
Al pie del grafico 8.1 podemos ver tres acciones de default, la primera de estas - la búsqueda
de fallas- se cubrió en el capitulo 8. Este capitulo se enfoca en el mantenimiento noprogramado y el rediseño. También revisa brevemente el rol de las rondas de control.
9.1 Mantenimiento No Programado.
Hemos visto que la búsqueda de fallas es la acción de default inicial si no se logra encontrar
una tarea proactiva apropiada para una funcion oculta. Sin embrago, si a su vez no se logra
encontrar una tarea de búsqueda de fallas apropiada, la acción de default secundaria es el
rediseño, si la falla múltiple tiene consecuencias de seguridad o medioambientales. También
hemos visto que si una falla evidente tiene fallas de seguridad o medioambientales y no se
logra encontrar una tarea preventiva apropiada, algo se debe cambiar para hacer más segura la
situación.
Sin embargo, si la falla es evidente y no afecta la seguridad o el medioambiente, i si es oculta
y la falla múltiple no afecta estos aspectos, entonces la acción de default inicial es realizar
mantenimiento no programado. En estos casos los ítems siguen en servicio hasta que se
presenta una falla funcional, y en este punto se reparan o reemplazan. En otras palabras, el
mantenimiento no programado es únicamente valido si:
* Si no se logra encontrar una tarea programada adecuada para una funcion oculta, y la falla
múltiple asociada no tiene consecuencias de seguridad o medioambientales.
*Si no se logra encontrar una tarea preventiva con buena relación costo-efectividad para fallas
que no tengan consecuencias operativas ni no operativas.
Se debe tener en cuenta si no se logra encontrar una tarea preventiva apropiada para una falla
bajo estas circumstancias, simplemente significa que no llevamos a cabo mantenimiento
programado sobre este componente en su estado actual. No significa que nos olvidamos de
esto. Como vemos en la sección siguiente de este capitulo, puede haber circumstancias donde
vale la pena cambiar el diseño o el componente para reducir los costos generales.
9.2 Rediseño
La pregunta del diseño de equipos surgió una y otra vez a medida que trazamos los pasos que
deben seguirse para desarrollar un programa de mantenimiento exitoso. En esta parte de este
capitulo, consideramos dos temas generales que afectan la relación entre diseño y
mantenimiento, y luego consideramos el rol del rediseño en el proceso de selección de tareas.
El termino “rediseño” se utiliza en su sentido mas amplio en este capitulo. Primero, se refiere
a todo cambio en la especificación de todo ítem o equipo. Esto significa cualquier acción que
pueda resultar en un cambio de un plano, o de una lista de partes. Esto incluye cambiar la
especificación de un componente, agregar un nuevo ítem, reemplazando una maquina
completa por una de diferente marca o tipo reubicando una maquina. Esto también implica
173
cualquier otro cambio a un proceso o procedimiento que afecte la operación de la planta.
También cubre el entrenamiento como método de manejar un modo de falla especifico (que
puede ser visto como rediseñar la capacidad de la persona siendo entrenada.)
Diseño y Mantenimiento
Cambiar cualquier cosa es costoso. Implica el costo de desarrollar la nueva idea (diseñar una
nueva maquina, establecer un nuevo procedimiento de operaciones), el costo de convertir la
idea en realidad (construir una nueva parte, comprar una nueva maquina, compilando un
nuevo programa de entrenamiento) y el costo de implementar el cambio (instalar la pieza,
conducir el nuevo programa de entrenamiento.) Se presentan mayores costos indirectos si
equipos o personas deben ser puestos fuera de servicio mientras se implementa el cambio.
También existe el riesgo de que un cambio fallara en eliminar o aliviar el problema que
pretende resolver. En algunos casos puede llegar a causar aun más problemas.
Como resultado, la pregunta total sobre modificaciones debe abordarse con gran cuidado. Dos
temas necesitan atención especial:
* Que consideramos primero, el diseño o el mantenimiento?
* La relación entre confiabilidad inherente y desempeño deseado.
¿Que viene primero- el rediseño o el mantenimiento?
La confiabilidad, el diseño y el mantenimiento están ligados intricadamente. Esto puede llevar
a la tentación de comenzar a revisar el rediseño de equipos existentes antes de considerar sus
requisitos de mantenimiento. En realidad, el proceso de RCM considera al mantenimiento
primero por dos razones.
La mayoría de las modificaciones lleva de seis meses a tres años desde la concepción hasta el
comisionado, dependiendo del costo y complejidad del nuevo diseño. Por otro lado, la
persona de mantenimiento que esta a cargo hoy debe mantener el equipo en su estado actual,
no lo que debería o podría suceder en el futuro. De modo que las realidades de hoy deben ser
tratadas antes de que cambie el diseño de mañana.
En segundo lugar, la mayoría de las organizaciones enfrentan muchos mas oportunidades
deseables de mejoras del diseño de las que pueden afrontar económica o físicamente. Si nos
centramos en las consecuencias de las fallas, RCM nos ayuda enormemente a desarrollar un
grupo de prioridades racional para estos proyectos, especialmente porque separa aquellos que
son esenciales, de los que son meramente deseables. Claramente, tales prioridades solo
pueden establecerse una vez que se llevo a cabo la revisión.
Confiabilidad inherente vs. Desempeño deseado.
Entre otras cosas, la parte 2 del capitulo 2 remarcaba que la confiabilidad inherente de
cualquier bien esta establecida por el diseño y por como esta realizada, y que el
mantenimiento no puede elevar la confiabilidad mas allá de la inherente al diseño. Esto lleva a
dos conclusiones importantes.
Primero, si la confiabilidad inherente, o capacidad innata de un bien es mayor al desempeño
deseado, el mantenimiento puede ayudar a alcanzar ese objetivo. La mayoría de los equipos
son diseñados y construidos de manera adecuada, de modo que generalmente es posible
desarrollar un programa de mantenimiento satisfactorio, como describimos en los capitulos
174
previos. En otras palabras, en la mayoría de los casos, RCM nos ayuda a extraer el desempeño
deseado del bien, según su configuración actual.
Por otro lado, si el desempeño deseado excede la confiabilidad inherente, entonces no habrá
mantenimiento capaz de otorgar el desempeño deseado. En estos casos un mejor
matenimiento no podría resolver el problema, de modo que tenemos que buscar las soluciones
más allá del mantenimiento. Las opciones incluyen:
* Modificar el equipo.
* Cambiar los procedimientos operativos
* Disminuir las expectativas y decidir vivir con el problema.
Esto nos recuerda, que el mantenimiento no es siempre la respuesta a problemas crónicos de
confiabilidad. También nos recuerda que debemos establecer tan pronto y tan precisamente
como sea posible que queremos que haga cada pieza de equipo en su contexto operativo antes
de que podamos comenzar a analizar sensiblemente sobre la cuan adecuados son un diseño o
sus requerimientos de mantenimiento.
Rediseño como acciones de default.
El grafico 8.1 muestra que el rediseño aparece al final de las cuatro columnas del diagrama de
decisión. En el caso de fallas que tienen consecuencias medioambientales o de seguridad,
esta es la acción de default obligatoria, y en los otros tres casos, puede “ser deseable”. En esta
parte de este capitulo, consideramos cada caso en mayor detalle, comenzando con el caso de
seguridad.
Consecuencias medioambientales o de seguridad.
Si una falla pudiera afectar la seguridad o el medioambiente y no se logra encontrar una tarea
de seguridad o una combinación de tareas que reduzca el riesgo de fallas a un nivel tolerable,
algo debe ser modificado, simplemente porque estamos tratando con un riesgo de seguridad o
medioambiental que no puede ser previsto adecuadamente. En estos casos, el rediseño se lleva
a cabo con uno de estos dos objetivos:
* Reducir la probabilidad del modo de falla que se presenta a un nivel tolerable. Esto
generalmente se lleva a cabo reemplazando el componente afectado por uno que es más fuerte
o más confiable.
* Cambiar el ítem o el proceso de un modo tal que la falla no tenga más consecuencias
medioambientales o de seguridad. Esto se realiza generalmente instalando uno o más de los
cinco tipos de dispositivos de protección que se categorizaban del siguiente modo en el
capitulo 2:
- Alertar a los operadores sobre condiciones anormales.
- Apagar el equipo en el caso de falla.
- Eliminar o aliviar las condiciones anormales que siguen a una falla y que podrían de otro
modo causar un daño aun mayor.
- Reemplazar una funcion que ha fallado.
- Prevenir que surjan situaciones de peligro.
175
Recordar que si este dispositivo se agrega, también se debe analizar sus requerimientos de
mantenimiento. Las consecuencias de seguridad o medioambientales también pueden
reducirse eliminando material de riesgo de un proceso, o hasta abandonando un proceso de
peligro en su totalidad.
Como mencionamos en el capitulo 5, cuando se trata de seguridad o el medioambiente, RCM
no plantea la cuestión económica. Si el nivel de riesgo asociado a una falla se considera
intolerable, estamos obligados ya sea a prevenir la falla, o a dar seguridad al proceso. La
alternativa es aceptar condiciones que sabemos son inseguras, o que arriesgan el
medioambiente. Esto no es aceptable actualmente en la mayoría de las industrias.
Fallas Ocultas
En el caso de fallas ocultas, el riesgo de una falla múltiple puede reducirse al modificar el
equipo en una de las siguientes formas:
* Hacer evidente la funcion oculta agregando otro dispositivo: Algunas funciones ocultas
pueden convertirse en evidentes al agregar otro dispositivo que llame la atención del operador
a la falla de la funcion oculta.
Por ejemplo, una batería utilizada para hacer funcionar un detector de humo, es una funcion
oculta clásica si no provee protección adicional. Sin embargo, se coloca una luz de
advertencia en la mayoría de estos detectores de modo tal que la luz se encienda si la batería
falla. De esta forma la protección adicional hace evidente la funcion de la batería. (Se debe
tener en cuenta que la luz solo nos indica la condición de la batería, no sobra la habilidad del
dispositivo para detectar el humo.)
En esta área se necesita especial cuidado, porque las funciones adicionales instaladas para este
propósito también tienden a ser ocultas. Si se agregan demasiadas capas de protección, se
vuelve cada vez más difícil- sino imposible- definir tareas de búsqueda de fallas sensibles. Un
método mucho mas efectivo es sustituir una funcion evidente, por una funcion oculta, como
se explica en el siguiente párrafo.
* Sustituir una funcion evidente por una funcion oculta: En la mayoría de los casos esto
aplica sustituir un dispositivo de protección genuino libre de fallas por uno que no sea libre
de fallas. Esto es sorprendentemente difícil de realizar en la práctica, pero si se lo hace, la
necesidad de la búsqueda de falla se elimina de una vez.
Por ejemplo, una forma común de advertir al conductor de un vehiculo que la luz de frenos ha
fallado es instalar una luz de emergencia que se enciende si fallan las luces de freno. (En
muchos casos, la luz también se enciende por un periodo corto cuando la ignición se enciende.
Sin embargo, axial lo están todas las otras luces en el tablero. Bajo estas circunstancias, una
luz de advertencia faltante tiene posisibilidades de ser pasada por alto, de modo que su
funcion es oculta.)
El sistema también debe ser considerado de tal manera que su funcion completa solo puede
ser chequeada al desarmar una luz de freno y axial observar si la luz de advertencia se
enciende. Esta es una tarea mal realizada e invasiva que puede llegar a causar más problemas
de los que resuelve, por lo que tiene posibilidades de ser descartada por impractica. Las fallas
múltiples asociadas con este sistema podrían tener consecuencias de seguridad serias, por lo
que es necesario reconsiderar el diseño.
Una forma de eliminar este problema, es hacer evidente las funciones de las luces de freno y
del sistema de alarma. Esto puede hacerse sustituyendo cables de fibra óptica, y montando
cables como para que el conductor vea a través de ellos las luces de freno, cada vez que frena.
176
(En realidad el ve un pinchazo de luz al final de cada cable.) En esta situación, es aparente
para el conductor si la luz de freno o el cable fallan. En otras palabras, la funcion de este
dispositivo de protección es ahora evidente, de modo que la búsqueda de fallas no es
necesaria de ahora en más.
* Sustituir un dispositivo más confiable (pero aun oculto) por la funcion oculta existente:
El grafico 8.3 sugiere que una funcion oculta más confiable (en otras palabras, una que tiene
intervalos mayores entre fallas) permitirá a la organización alcanzar uno de los tres siguientes
objetivos:
* Reducir la probabilidad de falla múltiple sin cambiar los intervalos de búsqueda de fallas.
Esto incrementa el nivel de protección.
* Incrementar los intervalos entre tareas sin cambiar las probabilidades de falla múltiple. Esto
reduce la necesidad de fuentes.
* Reducir la probabilidad de la falla múltiple, e incrementar los intervalos de tareas, dando
mayor protección con menos esfuerzo.
* Duplicar la funcion oculta: Si no es posible encontrar un dispositivo de protección simple
que tenga un MTBF lo suficientemente alto para otorgar el nivel de protección deseado, aun
es posible alcanzar cualquiera de los tres objetivos superiores duplicando (o hasta triplicando)
la funcion oculta.
Retornemos al ejemplo de la bomba principal con stand by, se explicaba en la pagina 179 que
si los usuarios quieren que la probabilidad de una falla múltiple sea menor a 1 en 1000, y el
porcentaje inanticipado de falla de la bomba principal se reduce a 1 en 10 años, entonces la
disponibilidad de la bomba de emergencia debe ser de un 99% o mas.
Esto lleva a la conclusión de que una tarea de búsqueda de fallas debería ser llevada a cabo
en la bomba de emergencia cada 2 meses, para alcanzar una disponibilidad del 99%
(basándonos en un MTBF para esta bomba de 8 años.) Retornemos al ejemplo de la bomba
principal con stand by, se explicaba en la pagina 179 que si los usuarios quieren que la
probabilidad de una falla múltiple sea menor a 1 en 1000, y el porcentaje inanticipado de falla
de la bomba principal se reduce a 1 en 10 años, entonces la disponibilidad de la bomba de
emergencia debe ser de un 99% o mas.
Esto lleva a la conclusión de que una tarea de búsqueda de fallas debería ser llevada a cabo
en la bomba de emergencia cada 2 meses, para alcanzar una disponibilidad del 99%
(basándonos en un MTBF para esta bomba de 8 años.)
Sin embargo, asumamos que alguien ha decidido que la probabilidad de una falla múltiple en
este sistema no debería exceder 1 en 100.000 (o 10-5) más que 1 en 1000. Si los intervalos
entre fallas no anticipadas de la bomba de emergencia (MTED) no varía a los 10 años, aplicar la
formula 4 en el capitulo 8 muestra que la indisponibilidad (UTIVE) de la bomba de emergencia
no debería exceder:
UTIVE = MTED/ MMF = 10/100.000 = 10-4
De modo que la indisponibilidad de la bomba de emergencia no debe exceder 10-4 (0.01%). Si
el MTBF no sufre cambios a los 8 años, al aplicar la formula 2 del capitulo 8 surge lo
siguiente:
FFI = 2 x 10-4 x 8 años = 14 horas.
Activar una bomba de emergencia con esta frecuencia es simplemente impractico, de modo
que debe pensarse mejor el diseño de este sistema.
En realidad el grafico 9.1 muestra que si fuéramos a agregar una segunda bomba de
emergencia, y fuéramos a asegurar que la disponibilidad de cada bomba de emergencia por si
177
sola excede el 99% (correspondiendo una indisponibilidad del 1%, o 10-2, la probabilidad de
múltiple falla seria:
10-1 x 10-2 x 10-2 = 10-5
o 1 en 100.000. El grafico 8.3 sugiere que esto se puede alcanzar llevando a cabo una tarea de
búsqueda de falla en cada bomba de emergencia a una frecuencia original de 1 cada 8
semanas. En otras palabras, se alcanza un nivel de protección mucho más alto, sin cambiar el
intervalo de tareas.
1 año
Probabilidad de fallas en un año
Bomba principal
Sin cambios. 1 en 10
Disponibilidad 99 %
Indisp. 1 %
Disponibilidad 99 %
Indisp. 1 %
Bomba stand by 1
Bomba stand by 2
Probabilidad de falla multiple en un año
1 en 10 x 1 en 100 x 1 en 1 en 100 = 1 en 100
000
Grafico 9.1: El efecto de duplicar la funcion oculta.
Consecuencias operativas y no operativas
Si no se puede encontrar una tarea preventiva técnicamente viable, que sea beneficiosa para
fallas con consecuencias operativas y no-operativas. La decisión de default inmediata es el
mantenimiento no programado. Sin embrago puede aun ser deseable modificar los equipos
para reducir los costos totales. Para alcanzar esto la planta puede ser modificada para:
* Reducir el número de veces que ocurre una falla, o eliminarla totalmente, haciendo el
componente más resistente o más confiable.
* Reducir o eliminar las consecuencias de la falla (por ejemplo proveyendo dispositivos de
emergencia)
* Hacer efectiva y conveniente una tarea preventiva (por ejemplo, haciendo más accesible un
componente)
Se debe tener en cuenta de que en este caso las consecuencias de la falla son puramente
económicas de modo que las modificaciones deben ser justificadas a nivel de costos, donde
quiera sean la acciones de default obligatorias i las fallas tuvieran consecuencias de seguridad
o medioambientales.
No hay un modo de determinar si una funcion tendrá una buena relación costo-efectividad.
Cada caso depende de un grupo diferente de variables, que incluyen una evaluación anterior y
posterior de mantenimiento y costos operativos, el resto de vida tecnológicamente útil del
bien, la probabilidad de que la modificación dará resultado, el número de otros proyectos
compitiendo por los recursos capitales de la compañía y así sucesivamente.
Un estudio de costos-beneficios que tenga en cuenta todos estos detalles puede consumir
demasiado tiempo, de modo que es muy útil conocer de antemano si este esfuerzo va a ser o
no productivo. Para ayudar a realizar una evaluación preliminar rápida, Nowlan & Heap1978
desarrollaron el diagrama de decisión que observamos en el grafico 9.2
178
¿Es alta la vida útil tecnológica que le
resta al bien?
NO
SI
El rediseño no se
justifica
¿Es el porcentaje de
falla funcional alto?
NO
SI
¿Tiene la falla
consecuencias operativas
mayores?
NO
SI
¿Es alto es costo de mantenimiento
programado o correctivo?
NO
SI
El rediseño
no se
justifica
¿Hay costos específicos que deben ser
eliminados por el cambio de diseño?
¿Hay una alta probabilidad con
la tecnología existente de que el
cambio de diseño sea exitoso?
NO
El rediseño
no se
justifica
El rediseño
no se
justifica
SI
Muestra un estudio de costo de
beneficio una reducción general en
los costos?
NO
El rediseño
no se
justifica
SI
El rediseño
no es
deseable
179
Grafico 9.2: Diagrama de decisión de una evaluación preliminar para una modificación
propuesta.
Sin importar cuan confiable sean, todos los bienes son eventualmente superados por nuevas
tecnologías. Por lo que la primera pregunta a formular es si el bien bajo consideración será
calificado de obsoleto en un futuro cercano.
Si es así, entonces esta claro que no es conveniente modificarlo. Por otro lado, si creemos que
va a ser útil por un tiempo mayor, la modificación tiene la posibilidad de pagarse a si misma,
Es por eso que la primera pregunta del grafico 9.2 es:
¿Es extenso el remanente de vida tecnológicamente útil del bien?
Algunas organizaciones demandan que las modificaciones deberían recuperar sus propios
gastos dentro de un periodo especifico- digamos, dos años. Esto se establece efectivamente.
Este tipo de políticas reduce el número de proyectos iniciados en la base de la relación costobeneficio planeada y asegura que solo sean aprobados los proyectos que se paran a si mismos.
De modo que la respuesta a la primera pregunta del grafico 9.2 es “no”, el rediseño no es
justificado.
Modificacion propuesta:
una rejilla de acero
inoxidable
El problema:
grumos que tapan
la salida del
embudo
Grafico 9.3 - Un embudo de acero inoxidable.
Por ejemplo, en el grafico 9.3 muestra un embudo de acero inoxidable, que sea bloquea con
terrones. Hasta ahora, el proceso de RCM muestra que esto cusa $400 en perdidas de
producción cada vez que esto ocurre, y que no puede ser previsto por el mantenimiento. Se
sugirió que un modo de eliminar el modo de falla puede ser instalar una rejilla de acero
inoxidable sobre la boca del embudo a un costo de $6.000.
Si el embudo fuera a ser reemplazado en dos años, es muy poco probable que esta
modificación valga la pena, especialmente si se tiene en cuanta el hecho de que transcurrirán
varios meses hasta que sea comisionada. Por otro lado, si el embudo fuera a permanecer en
servicio por varios años más, la modificación podría ser beneficiosa.
Si la respuesta a esta pregunta es “si”; la siguiente pregunta seria si la falla esta ocurriendo
con suficiente frecuencia como para ser un problema real:
¿Es el porcentaje de falla funcional alto?
Esta pregunta elimina ítems que fallan con tanta poca frecuencia que el costo del rediseño
podría llegar a ser mayor que los beneficios que se derivan de este (a menos, por supuesto
que una tarea preventiva sea la razón para un porcentaje bajo de falla. Es por eso que un “no”
como respuesta a esta pregunta no aborta la modificación – la tarea de mantenimiento en si
mismo puede ser tan costoso que la modificación puede ser justificada de todas maneras.)
180
Por ejemplo, si e bloqueo del embudo ocurriera cada dos o tres años, nadie le prestaría
demasiada atención. Si ocurriera una vez al mes, seria beneficioso realizar una mayor
investigación.
¿La falla implica consecuencias operativas mayores?
Si la respuesta es si, entonces de debe considerar el rediseño. Como hemos visto, podemos
obtener una respuesta “no” para la pregunta sobre el porcentaje de fallas, solo porque se esta
llevando a cabo una tarea preventiva muy costosa, que esta previniendo las fallas funcionales.
Una respuesta negativa a la pregunta sobre consecuencias operativas, implica que las fallas
pueden no estar afectando la capacidad operativa, pero pueden resultar en costos de
reparación excesivos. Una respuesta positiva a cualquiera de estas preguntas nos lleva
directamente al cambio de diseño en si mismo:
¿Hay costos específicos que pueden ser eliminados por el cambio de diseño?
Esta pregunta se refiere a las consecuencias operativas y los costos directos del
mantenimiento proactivo y/o correctivo. Sin embargo, si estos costos no están relacionados
aun aspecto específico de diseño, es poco probable que el problema se resuelva por un cambio
en este último. De modo que una respuesta negativa a esta pregunta significa que puede ser
necesario vivir con las consecuencias económicas de la falla. Por otro lado, si el problema
pudiera apuntar aun elemento de costo específico, entonces el potencial económico del
rediseño es alto.
¿Hay una probabilidad alta, con la tecnología existente de que la modificación sea exitosa?
A pesar de que un cambio particular pueda ser muy deseable económicamente, existe la
posibilidad de que no tenga el efecto deseado. Un cambio dirigido un modo de falla, puede
no revelar otros modos de falla, requiriendo muchos intentos de resolver el problema.
Cualquier cambio de diseño que implique agregar estructura física, también implica agregar
mayor posibilidades de fallas – tal vez demasiadas.
De modo que si una evaluación a sangre fría del cambio propuesto índica una probabilidad
baja de resultados exitosos, el cambio no tiene posibilidades de ser viable económicamente.
Por ejemplo, en el caso del embudo deberemos asegurarnos de que los terrones no se
acumularan en la rejilla, ni coagularan en un problema mucho más costoso a largo plazo.
¿Puede un estudio económico mostrar el ahorro esperado de costos?
Tal estudio compara la reducción de costos esperada sobre la vida útil remanente del equipo,
con los costos de llevar a cabo la modificación. Para estar sobre el lado seguro, los beneficios
esperados deberían ser considerados como ahorros proyectados si resulta exitoso el primer
intento de mejoras, multiplicado por la probabilidad de éxito en el primer intento. En forma
alternativa, se puede considerar que el cambio de diseño siempre será exitoso, pero solo se
alcanzaran algunos de los ahorros.
Si estamos seguros que la modificación del embudo funcionara, un análisis de flujo
discontinuo provisto para el embudo (a un porcentaje de descuento de un 10%) muestra que la
modificación se pagara a si misma
* En cinco años si el bloqueo se presenta 4 veces al año
* En siete años, si ocurre tres veces al año
* En mas de 10 años si se presenta dos veces por año.
181
Este tipo de justificación no es necesaria, por supuesto, si las características de confiabilidad
de un ítem son sujeto de garantías contractuales o si los cambios son necesarios por razones
diferentes al costo (como ser la seguridad).
9.3 Rondas de Control
Las rondas de control tienen dos propósitos. El primero es identificar los daños accidentales.
Estos controles pueden incluir una cuantas tareas en-condición especificas, por conveniencia,
pero el daño en general puede ocurrir en cualquier momento y no esta relacionado con nivel
alguno de resistencia a la falla.
Como resultado, no hay una base para definir una condición potencial de falla o un intervalo
P-F predecible. Similarmente, los controles no están basados en las características de fallas de
ningún ítem en particular, pero están diseñados para determinar excepciones no previstas en el
comportamiento de las fallas.
Las rondas de control, también tienen como propósito descubrir problemas causados por la
negligencia o la ignorancia, tales como materiales de riesgo u objetos extraños dejados por el
suelo, derrames u objetos de limpieza. También da a los responsables una oportunidad para
asegurarse de que las normas generales de mantenimiento son satisfactorias, y se pueden
utilizar para controlar si la rutina de mantenimiento se sigue correctamente. De nuevo,
generalmente no hay condiciones de falla potencial explicitas y un intervalo P-F no
predecible.
Algunas organizaciones distinguen entre tareas formales programadas y rondas de control
con el pretexto de que una es principalmente técnica y la otra predominantemente
administrativa, de modo que son llevadas a cabo por personas diferentes. En realidad no
importa quien las realiza, siempre y cuando ambas sean realizadas con frecuencia y con la
profundidad necesaria para asegurar un grado razonable de protección de las consecuencias de
las fallas concernientes.
182
10- El Diagrama de Decisión de RCM
10.1 Integrar Consecuencias y Tareas.
Los capitulos 5 a 9 proveyeron una explicación detallada del criterio utilizado para responder
las últimas tres de las siete preguntas que conforman el proceso de RCM. Estas preguntas son:
* De que modo importa cada falla?
* Que puede hacerse para prevenir cada falla?
* Que debería hacerse si no se encuentra una tarea preventiva apropiada?
Este capitulo resume lo mas importante de estos criterios. También describe el diagrama de
decisión de RCM, que integra todos los procesos de decisión en un marco estratégico simple.
Este marco se muestra en la figura 10.1, y se aplicada a cada uno de los modos de falla
enumerados en la planilla informativa de RCM.
Finalmente, este capitulo describe la Planilla de Decisión de RCM, que la segunda de los dos
documentos clave de trabajo utilizados en la aplicación de RCM (Siendo el primero la planilla
informativa del grafico 4.13).
10.2 El Proceso de Decisión de RCM
La planilla de decisión de RCM es ilustrada en el grafico 10.2. El resto del capitulo demuestra
como esta planilla es utilizada para registrar las respuestas a las preguntas en el Diagrama de
Decisión, y en la luz de estas respuestas, registrar:
* Que rutina de mantenimiento se va a realizar, con que frecuencia y quien la va a llevar a
cabo
* Que fallas son lo suficientemente serias como para garantizar el rediseño
* Casos donde se llevo a cabo una decisión deliberada para permitir que ocurran las fallas.
Planilla de
decisión RCM
II
Sistema
N° de sist.
Facilitador:
Fecha
N° de hoja
Sub- Sistema
N° de sub.
sist.
Auditor:
Fecha
De
Referencia Consecuencia de la
De
evaluacion
informacion
F FF FM H S
E
O
H1
S1
O1
N1
H2
S2
O1
N2
Accion de
H3
Default
S3
O3
N3 H4 H5 S4
TAREA
PROPUESTA
Intervalo
Inicial
Puede ser
realizado por
Grafico 10.2 Planilla de Decisión RCM
183
H
S
Puede la Perdida de Funcion causada por este
modo de falla convertirse en evidente para el
grupo de operarios bajo circunstancias
normales?
SI
Causa el modo de falla una
perdida de funcion u otro
daño que pudiera lastimar o
quitar la vida de alguien?
NO
Causa el modo de falla una perdida
de funcion u otro daño que pueda
violar una regulación
medioambiental conocida?
O
SI
01
S1
NO
Es la tarea que va a detectar que la falla esta
ocurriendo o por ocurrir técnicamente viable
y conveniente?
N1
Es la tarea que va a detectar que la falla
esta ocurriendo o por ocurrir técnicamente
viable y conveniente?
Es la tarea que va a detectar que la falla esta
ocurriendo o por ocurrir técnicamente viable
y conveniente?
NO
NO
Tarea en condición programada
NO
Es la tarea de restauración programada que
va a disminuir la frecuencia de falla
técnicamente viable y conveniente?
Tarea en condición
programada
Tarea en condición
programada
Restauración
Programada
S2
NO
SI
SI
SI
SI
H1
Tarea en condición
programada
Tiene el modo de falla un efecto directo
adverso en la capacidad operativa (
rendimiento, calidad, servicio al cliente o
costos operativos además de el costo
directo de reparación?
SI
Es la tarea que va a detectar que la falla esta
ocurriendo o por ocurrir técnicamente viable
y conveniente?
SI
E
N2
02
Es la tarea de restauración programada que
va a evitar la falla técnicamente viable y
conveniente?
Es la tarea de restauración programada
que va a evitar la falla técnicamente
viable y conveniente?
Es la tarea de restauración programada que
va a reducir la consecuencia de la falla
técnicamente viable y conveniente?
NO
SI
H3
SI
NO
SI
NO
Restauración
Programada
Restauración
Programada
S3
Es la tarea de descarte programado que va a
evitar la s fallas técnicamente viable y
conveniente?
Descarte
Programado.
SI
Es la tarea de búsqueda de fallas para
detectar la falla técnicamente viable y
conveniente?
SI
NO
SI
Es la tarea de descarte programado que
va a disminuir la frecuencia de falla
técnicamente viable y conveniente?
03
N3
Es la tarea de descarte programado que va a
disminuir la frecuencia de falla técnicamente
viable y conveniente?
NO
SI
NO
Descarte
Programado.
Es la combinación de tareas técnicamente
posible y conveniente?
Descarte
Programado.
Mantenimiento No
programado
Mantenimiento No
programado
SI
Búsqueda de fallas programada
SI
NO
Descarte
Programado.
NO
Es la tarea de descarte programado que
va a evitar la s fallas técnicamente viable
y conveniente?
Mantenimiento No programado
NO
Podría la falla
múltiple afectar el
medioambiente?
SI
Combinación de tareas.
Rediseño Obligatorio
Puede ser deseable el rediseño
NO
Mantenimiento No programado
Rediseño Obligatorio
184
Grafico 10.1 Diagrama de decisión RCM
La planilla de decisión esta dividida en 16 columnas. Las columnas encabezadas F, FF, y FM
identifican los modos de falla bajo consideración. Se utilizan para hacer referencia a las
planillas informativas y de decisión, como se muestra en el grafico 10.3, abajo.
Sistema
Planilla de
informacion
RCM II
Sistema de enfriamiento de la bomba
Sub Sistema
FUNCION
1
FALLA FUNCIONAL
(perdida de la funcion)
Tranferir agua
del tanque x al
tanque Y a no
menos de 800
ltrs. por
minuto.
A Incapacidad para
transferir agua
MODO DE FALLA
(Causa de la falla)
1
Tamaño del
cojinete a causa
del desgaste
normal
Sistema
Planilla de
informacion
RCM II
Sistema de enfriamiento de la bomba
Sub Sistema
Información Consecuencia de
de referencia la evaluacion
H1 H2 H3
S1 S2 S3
1
FF FM H
O1 O2 O3 H4 H5 S4
N1 N2 N3
1
A
S
E
O
Acciones de
default
1
Grafico 10.3: Remisión de infamación de las planillas informativas y de decisión.
Los encabezados en las siguientes 10 columnas hacen referencia a las preguntas del Diagrama
de Decisión de RCM, del siguiente modo:
* Las columnas encabezadas H, S, E, O y N se utilizan para registrar las respuestas a las
preguntas referidas a las consecuencias de cada modo de falla.
* Las siguientes tres columnas (encabezadas H1, H2, H3 etc.) registra si una tarea proactiva
ha sido seleccionada, y de ser así, el tipo de tarea.
* Si fuera necesario responder a cualquiera de las preguntas de default, se debe utilizar las
columnas encabezadas H4 y H5, o S4 para registrar las respuestas.
Las ultimas tres columnas registran la tarea que ha sido seleccionada (si la hubiera), la
frecuencia con que se realizara esto y quien ha sido seleccionado para hacerlo. La columna
“tarea propuesta” también se utiliza para registrar los casos donde se requiere el rediseño, o en
que se ha decidido que el modo de falla no necesita mantenimiento programado.
185
En los siguientes párrafos, se revisa cada una de estas cuatro sesiones de la planilla de
decisión, en el contexto de las preguntas respectivas en el Diagrama de Decisión.
Consecuencias de las fallas:
Los significados precisos de las preguntas H, S, E, y O en el grafico 10.1 se discuten
extensamente en el capitulo 5. Estas preguntas se realizan para cada modo de falla, y las
respuestas se registran en la planilla de decisión en la base que se observa en el grafico 10.4.
¿Sera la pérdida de funcion causada
por este modo de falla evidente para
el equipo de operaciones bajo
circunstacias normales?
Si
Escriba la letra Y en la columna H y vaya a la pregunta S
¿Podria esta falla causar una
perdida de la funcion u otro daño
que pudiera lastimar o matar a
alquien?
No
Escriba la letra Y en la
columna S y vaya a la
pregunta S1.
Si
Escriba la letra Y en la
columna E y vaya a la
pregunta S1.
Escriba la letra N en la columna E y vaya a la pregunta O
¿Tiene el modo de falla un efecto
directo adverso en la capacidad
operacional?
No
Si
Escriba la letra N en la columna S y vaya a la pregunta E
¿Podria este modo de falla causar
una perdida de funcion u otro daño
que pueda violar alguna regulación o
parámetro ambiental?
No
No
Escriba la letra N en la
columna H y vaya a la
pregunta H1.
Si
Escriba la letra Y en la
columna O y vaya a la
pregunta O1.
Escriba la letra N en la columna O y vaya a la pregunta N1
Grafico 10.4: Utilizar la planilla de decisión para registrar consecuencias de las fallas.
El grafico 10.5 muestra como las respuestas a estas preguntas se registran en las planillas de
decisión. Se debe tener en cuenta que:
186
* Cada modo de falla se analiza en términos de una categoría de consecuencias solamente. De
modo que si se lo clasifica como causante de consecuencias medioambientales solamente (Al
menos cuan llevamos a cabo el análisis de cualquier bien). Esto significa que si por ejemplo,
una “Y” es registrada en la columna “e” nada se registrara en la columna “O”.
* Una vez que se categorizo las consecuencias del modo de falla, el siguiente paso es llevar a
cabo una tarea preventiva apropiada. El grafico 7.5 también resume el criterio utilizado para
decidir si tales tareas con beneficiosas y convenientes.
Referencia de
informacion
Evaluacion de la
consecuencia
F
FF FM H S E O
3
A
1
N
Una falla oculta:
Para ser conveniente, cualquier tarea preventiva debe reducir
el riesgo de una falla multiple hasta un nivel aceptable
5
B
2
Y Y
Consecuencias de fallas:
Para ser conveniente, cualquier tarea preventiva debe reducir el
riesgo de una falla multiple hasta su propio nivel aceptable
2
C
4
Y N Y
Consecuencias para el medio ambiente:
Para ser conveniente, cualquier tarea preventiva debe reducir el
riesgo de una falla multiple hasta su propio nivel aceptable
1
A
5
Y N N Y
Consecuencias operacionales:
Para ser conveniente, cualquier tarea preventiva debe reducir el
riesgo de una falla multiple hasta su propio nivel aceptable
1
B
3
Y N N N
Consecuencias no operacionales:
Para ser conveniente, cualquier tarea preventiva debe reducir el
riesgo de una falla multiple hasta su propia nivel aceptable
Grafico 10.5: Consecuencias de falla, un resumen.
Tareas Proactivas
Las columnas octava a la décima de la Planilla de Decisión se utilizan para registrar si una
tarea proactiva ha sido seleccionada, de la siguiente manera:
* La columna encabezada H1/S1/ O1/ N1 se utiliza para registrar si pudiera encontrarse una
tarea en-condición apropiada para anticipar el modo de falla, con suficiente tiempo para
evitar, eliminar o minimizar las consecuencias.
* La columna encabezada H2/S2/O2/N2 se utiliza para registrar si se identifico una tarea de
restauración programada para prevenir las fallas.
* La columna encabezada H3/S3/O3/N3 se utiliza para registrar si se encontró una tarea de
descarte programado para prevenir las fallas.
En cada caso, una tarea es apropiada si es beneficiosa, conveniente y técnicamente posible.
Los capitulos 6 y 7 explicaban en detalle como establecer si una tarea es técnicamente
posible. Estos criterios se resumen en el grafico 10.6.
187
En esencia, Para que una tarea sea técnicamente posible y sea conveniente, debe ser posible
responder positivamente a todas las preguntas que se muestran en el grafico 10.6 que se
apliquen a esa categoría de tareas, y esta debe cumplir con el criterio de “beneficioso y
conveniente” del grafico 10.5. Si la respuesta a cualquiera de estas preguntas fuera “no”, o
desconocida, entonces se rechazan la tarea en su totalidad. Si todas las preguntas reciben
respuestas positivas, entonces de registra una “Y” en la columna correspondiente.
H1
S1
O1
N1
Y
H2
S2
O2
N2
N
Y
N
N
H3
S3
O3
N3
¿Es técnicamente viable una tarea para detectar si la falla esta por
ocurrir? ¿Hay una condicion de falla potencial clara? ¿Cuál es? ¿Qué
es el intervalo P-F? ¿Es este intervalo lo suficientemente largo para que
se tomen acciones para evitar, eliminar o minimizar las consecuencias
de las fallas? ¿Es práctico monitorear el item a intervalos menores que
el intervalo P-F?
¿Es técnicamente viable una tarea de restauración programada para
reducir la relacion de falla (evitar las fallas con respecto a la
seguridad)?
Hay una edad en la cual hay un aumento rapido en la probabilidad de la
condicion de falla. ¿Cuál es esa edad? ¿Superan la mayoria de los ítems
esta edad? (todo con respecto a seguridad o consecuencias ambientales).
¿Es posible restaurar la resistencia origínal a las fallas del item?
Y
¿Es técnicamente viable una tarea de descarte programado para
reducir la relacion de falla (Evitar todas las fallas con respecto a la
seguridad)?
Hay una edad en la cual hay un aumento rapido en la probabilidad de la
condicion de falla. ¿Cuál es esa edad? ¿Superan la mayoria de los ítems
esta edad? (todo con respecto a seguridad o consecuencias ambientales).
Grafico 10.6 Criterio de Viabilidad técnica
Si se selecciona una tarea, se registra una descripción de esta y la frecuencia con que debe
realizarse como explicamos mas adelante en este capitulo, y el analista se dirige al siguiente
modo de falla. Sin embargo, como mencionamos en el capitulo 7 , se debe tener en cuenta que
si una tarea de bajo orden es aparentemente mas efectiva que una tarea de alto orden, entonces
esta primera debería ser también considerara, y se debería escoger la mas efectiva de las dos.
Las Preguntas de Default
Las columnas encabezadas H4, H5 y S4 en la planilla de decisión se utilizan para registrar las
respuestas a las tres preguntas de default. Las bases en las que se responden estas preguntas se
resumen en el grafico 10.7. (Tenga en cuenta que las preguntas de default son solo fórmulas,
si las respuestas a las preguntas previas son todas negativas.)
188
Referencia de
informacion
Evaluacion de la
consecuencia
H1 H2 H3
S1
S2
S3
Acciones de
Default
O1 O2 O3
FM
FF
3
A 1
4
4
5
4
1
1
B
C
B
C
FM H
4
2
4
2
A 5
B 3
N
N
N
N
N
S
E
O
N1 N2 N3 H4 H5 S4
N N N Y
¿Podria la falla múltiple afectar la seguridad o el medio ambiente?
(Esta pregunta solo se realiza si la respuesta a la pregunta H4 es no.) Si
la respuesta a esta pregunta es si, el rediseño es oblogatorio. Si la
respuesta es no, la accion de default es mantenimiento no programado
perp el rediseño puede ser deseable.
N N N N Y
N N N N N
N N N
N N N
Y N N Y N N N
Y N N N N N N
¿Es una tarea de búsqueda de fallas técnicamente viable y
productiva? Registre “yes” si es que es posible realizar la tarea
y es practico hacerlo con la frecuencia requerida y si reduce el
riesgo de fallas multiples hasta un nivel aceptable.
Y
N
¿Es una combinación de tareas técnicamente posible y productiva?
“Yes” si la combincion de dos o mas tareas proactivas reducira el
riesgo de falla hasta un nivel aceptable (esto es muy poco comun).
Si la respuesta es no, el rediseño es obligatorio.
En estos dos casos, las consecuencias de las fallas son meramente
economicas y no se ha encontrada una tarea proactiva adecuada.
Como resultado, la decisión de default inicial es mantenimiento no
programado, pero el rediseño puede ser deseable.
Grafico 10.7 Preguntas de Default.
Tarea Propuesta
Si una tarea proactiva o una tarea de búsqueda de fallas han sido seleccionadas durante el
proceso de toma de decisiones, se debería registrar una descripción de la tarea en la columna
titulada “tarea propuesta”. Lo ideal seria que la tarea sea descripta con tanta precisión en la
planilla de decisión, como en el documento que recibirá la persona que realiza la tarea. Si esto
no fuera posible, la tarea debería al menos ser descripta con el suficiente detalle para hacer el
intento absolutamente claro a quien sea que escriba la descripción detallada de la tarea.
Por ejemplo, consideremos una situación donde una tarea en-condición fue especificada para
un rodamiento de bolas. El capitulo 7 como tales rodamientos pueden sufrir de una variedad
de condiciones de falla potenciales, incluyendo ruidos, vibraciones, calor, desgaste, y así
sucesivamente. Muchas maquinas poseen mas de un, con frecuencia muchos de estos
rodamientos. Consecuentemente, al menos, la “tarea propuesta” debería especificar que
rodamiento sebe ser controlado por que condición. En otras palabras, si un rodamiento
particular esta por ser controlado por ruidos, la tarea propuesta debería enunciar “Controlar el
rodamiento x por ruidos audibles” y no solamente “controlar el rodamiento”
Este tema se discute en mayor detalle e el siguiente capitulo.
Si el proceso de decisión requiere cambios en el diseño, la tarea propuesta debería proveer
una breve descripción del cambio de diseño. La forma real, del nuevo diseño debería ser
dejada en manos de los encargados de este aspecto.
Por ejemplo, si el proceso de RCM revela que el mecanismo de sujeción de una guardia debe
ser rediseñado por razones de seguridad, la “tarea propuesta” debería establecer algo como
“Se requiere un mecanismo de sujeción mas seguro para la guardia”. No escribir simplemente
189
“Se requiere rediseño”. Por otro lado, debería ser dejado a los diseñadores decidir
exactamente que tipo de mecanismo de sujeción se utilizara.
Finalmente, si se tomo la decisión de permitir que la falla ocurra, en la mayoría de los casos el
término “mantenimiento no programado” debería registrarse en la columna de tarea
propuesta. La única excepción es la falla oculta donde “el perfil de riesgo/ confiabilidad es tal
que no se requiere la búsqueda de fallas”, como se explicaba en la pagina 85.
Intervalo Inicial
Los intervalos de tareas se registran en las planillas de decisión en la columna de
“Intervalo Inicial”. Hemos visto que se basan en lo siguiente:
*Los intervalos de tarea en-condición dependen del intervalo P-F
* La restauración programada y el descarte programados dependen de la vida útil del ítem
bajo consideración.
* Los intervalos de tareas de búsqueda de fallas dependen de las consecuencias de las fallas
múltiples, que dictan la disponibilidad necesaria, y el tiempo medio entre la manifestación de
la falla oculta.
Cuando se completa la planilla de decisión, registrar cada intervalo de tarea por sus propios
meritos- en otras palabras, sin hacer referencia a ninguna otra tarea. Esto es porque la razón
de llevar a cabo una tarea con una frecuencia particular puede cambiar a través del tiempo- en
realidad la razón por la que se llevaba a cabo la tarea puede desaparecer. De modo que si la
frecuencia de la tarea X se basa en la frecuencia de la tarea Y, y la tarea Y se elimina mas
tarde, la razón para la tarea X carece de sentido.
Como explicamos en el próximo capitulo, como nos confrontamos con un número de tareas
que necesitan ser llevadas a cabo en un amplio rango de frecuencias diferentes, el momento
para conservar consolidarlos en un número menor de paquetes de trabajo es cuando
recopilamos los programas de mantenimiento. Sin embargo, la frecuencia de trabajo inicial
siempre deberá permanecer en la planilla de decisión para hacernos recordar como se
derivaron las frecuencias de programas (en otras palabras para preservar el “seguimiento de
auditoria”.)
Tenga también en cuenta que los intervalos de tareas pueden basarse en cualquier medida
adecuada de la exposición al stress. Esto incluye tiempos calendarios, tiempo transcurrido,
distancia recorrida, ciclos de interrupción y reinicio, y cualquier otra variable que tenga
relación directa con el mecanismo de falla. Sin embargo, los tiempos calendarios tienden a ser
utilizados donde fuera posible porque son lo mas simple y menos costoso de administrar.
Puede hacerse mediante...
La ultima columna en la planilla de decisión, se utiliza para enumerar quien debería llevar a
cabo cada tarea. Tenga en cuanta que el proceso de RCM considera este tema un modo de
falla por vez. En otras palabras, no se aproxima al sujeto con ninguna idea preconcebida sobre
quien debería (o no debería) hacer trabajo de mantenimiento. Simplemente pregunta quien
tiene la competencia y confianza para llevar a cabo esta tarea en forma correcta.
190
La respuesta podría ser cualquiera. Las tareas pueden ser destinadas a operadores de
mantenimiento, inspectores de seguridad, de funcion de calidad, técnicos especiales,
vendedores, inspectores de estructuras o técnicos de laboratorio.
Un tema a veces controversial que emerge en esta etapa involucra la alta frecuencia en tareas
en-condición y tareas de búsqueda de fallas. A veces tiene sentido derivas estas tareas a los
mantenedores, pero en muchos casos, utilizar personal de mantenimiento para llevar a cabo
estas tareas tiene las siguientes desventajas (especialmente si son comerciantes capacitados):
* Si el intervalo de tarea es corto, la frecuencia e inspección será muy alta- a veces más que
una por turno. Esto puede llevar a tal número de tareas de alta frecuencia que los encargados
pasaran la mayoría de su tiempo yendo de una tarea a otra. Este tiempo en recorridos, mas el
costo de planificar y controlar los trabajos convierte en muy costosa la utilización de personal
de mantenimiento para este propósito, generalmente al punto donde no es conveniente
destinar a ellos estas tareas.
* Muchas personas capaces consideran las tareas de alta frecuencia aburridas, y son reticentes
a llevarlas a cabo.
* Las personas con gran habilidad para trabajo manual son escasas a nivel mundial, de modo
que seria desde un principio complicado destinarlos a este tipo de trabajo.
Una segunda opción es utilizar operadores para llevar a cabo estas tareas. Esta opción puede
ser atractiva, porque es más económico y más fácil a nivel organización utilizar personas para
realizar tareas de alta frecuencia que esté cerca de los equipos la mayoría del tiempo. Los
operadores también están mas motivados a cuidar de “sus” maquinas. Sin embargo se deben
satisfacer tres condiciones antes de que los operadores sean destinados con confianza a
realizar estas tareas:
* Deben estar capacitados específicamente en como reconocer las condiciones de falla
potenciales, en el caso de tareas en-condición, y deben estar entrenados para llevar a cabo de
un modo seguro las tareas de búsqueda de fallas.
* deben tener acceso a procedimientos simples y confiables para reportar cualquier defecto
que puedan encontrar. (El diseño de estos procedimientos se discute en mayor detalle en el
capitulo 11.)
* Deben asegurarse de que se llevara a cabo una acción en las bases de sus informes, o de que
recibirán feedback constructivo en el caso de un diagnostico erróneo.
Utilizar operadores para este propósito también puede traer profundas implicancias en lo
relacionado a relaciones industriales, y reportes, de modo que esto debe ser tratado con sumo
cuidado.
En general, como con la mayoría de las otras decisiones en el proceso de RCM, las personas
que están en condiciones de decidir quien es el más adecuado para llevar a cabo estas tareas,
son las personas que tienen un mayor conocimiento del equipo.
191
10.3 Completar la Planilla de Decisión
Para ilustrar como se completa la planilla de decisión, consideramos tres modos de falla que
fuero discutidos extensamente en capitulos previos. Estos son:
* El rodamiento que se atasca en una bomba sin stand by, como se discute en las páginas 105
y 106.
* El rodamiento que se atasca en una bomba que si tiene otras de emergencia, como se discute
en las páginas 108 y 109.
* La falla de la bomba de emergencia como un todo, como se discute en las paginas 118 y
179.
Planilla de
decisión RCM
II
Sistema
N° de sist.
Facilitador:
Fecha
N° de hoja
Sub- Sistema
N° de sub.
sist.
Auditor:
Fecha
De
Referencia Consecuencia de la
De
evaluacion
informacion
F FF FM H S
E
O
H1
S1
O1
N1
H2
S2
O1
N2
Accion de
H3
Default
S3
O3
N3 H4 H5 S4
TAREA
PROPUESTA
Intervalo
Inicial
Puede ser
realizado
por
Obreros
Controle el ruido del cojinete de
la bomba principal
Bomba sin stand by
1 A 1
1 A 2
Y N N Y
Bomba principal con stand by
1 A 1
1 A 2
Semanalmente
Mantenimiento no programado
Y N N N N N N
Operador
Bomba stand by
2 A 1
N
N N N Y
Interruptor en bomba stand by en 4 semanas
lugar de una bomba principal y
asegurese de que el stand by sea
capaz de llenar el tanque. Cuando
la prueba finalice, cambie
nuevamente por la bomba
principal
Grafico 10.8: Una planilla de Decisión de RCM con entradas de prueba.
Las decisiones asociadas se registran en la planilla de decisión que vemos en el grafico 10.8.
Notar tres puntos importantes sobre este ejemplo:
* Las primeras dos bombas pueden sufrir de muchos mas modos de falla que la falla bajo
consideración. Cada una de estoas otras fallas también será detallada y analizada por sus
propios meritos.
192
* Se podría haber escogido un número de otras tareas preventivas para anticipar la falla del
rodamiento- las decisiones en el ejemplo tienen carácter ilustrativo solamente.
* La bomba de emergencia es tratada como una “caja negra”. En la práctica si se supiera que
tal bomba sufre uno o más modos de falla dominantes, estas fallas serian analizadas
individualmente.
En esencia, la planilla de RCM no solo muestra que curso de acción ha sido seleccionado para
lidiar con cada modo de falla, sino que también muestra porque se la ha seleccionado. Esta
información es invalorable si se desafía la necesidad de hacer trabajos de mantenimiento en
cualquier momento.
La habilidad para hacer el seguimiento de cada tarea en forma inversa hasta legar a la funcion
y el desempeño deseados también lo convierte en el simple hecho de mantener actualizado el
programa de mantenimiento. Esto es así por que los usuarios pueden inmediatamente
identificar y reevaluar tareas que se ven afectadas por un cambio en el contexto operativo del
bien (tales como un cambio en los turnos de trabajo, o un cambio en las regulaciones de
seguridad), Y evitar la perdida de tiempo reevaluando tareas que no tienen posibilidades de
verse afectadas por el cambio.
10.4 Computadoras y RCM
La información Contenida en las Planillas de RCM y las planillas de decisión se presta para
ser almacenada en una base de datos informática. En realidad, si se están por analizar un gran
numero de bienes, es prácticamente esencial utilizar una computadora para este propósito.
Una computadora también puede utilizarse para ordenar la tarea propuesta en base a los
intervalos y las capacidades, y generar una variedad de otros reportes (modos de falla por
categoría de consecuencias, tareas por categoría de trabajo, y así sucesivamente. Finalmente,
almacenar el análisis en un banco de datos hace infinitamente más fácil refinar y revisar los
análisis a medida que se aprende más y a medida que cambia el contexto operativo. (Como
seguramente lo hará- ver parte 7 del capitulo 13).
Sin embargo, se debe tener en cuenta que solo se debe utilizar una computadora para
almacenar y ordenar la información de RCM, y quizás para asistir con la determinación de los
intervalos de búsqueda de falla as complejos.
193
11. Implementación – Los Pasos Clave
Hemos visto como la aplicación formal del proceso de RCM finaliza con planillas de decisión
completas. Esto especifica un numero se tareas de rutina que necesitan ser realizadas a
intervalos regulares para asegurar que el bien continua cumpliendo con las funciones que los
usuarios esperan, conjuntamente con las acciones default que deben llevarse a cabo i no se
pudiera encontrar una tarea de rutina apropiada.
Las personas que participan en este proceso, gana gran cantidad de conocimientos sobre como
funciona un equipo, y porque falla. Esto en si mismo, causa frecuentemente un cambio en el
comportamiento de los participantes, de una manera que generalmente lleva a mejoras
directas en el funcionamiento de los bienes. Sin embargo, para poder obtener los máximos
beneficios a largo plazo de RCM, se deben seguir pasos para implementar de manera formal
las recomendaciones. Estos pasos deben asegurar que:
* Todas las recomendaciones están aprobadas formalmente por el superior con
responsabilidad general sobre el bien.
* Todas las tareas de rutina están descriptas de modo claro y conciso.
* Todas las acciones que requieren cambios (en el diseño, en el modo en que se opera el
bien, o en la capacidad de operadores o personal de mantenimiento) sean identificadas e
implementadas correctamente.
* Los cambios en las tareas de rutina y en los procedimientos de operación sean incorporados
en paquetes de trabajo apropiados.
* Los paquetes de trabajo y los cambios
son implementados. Esto implica específicamente:
- Incorporar los paquetes de trabajo en sistemas que aseguren que serán llevados a cabo por
las personas adecuadas, en el momento preciso, y serán realizados correctamente.
- Asegurar que se encarara con rapidez cualquier falla encontrada.
Estos pasos se resumen en el grafico 11.1. Lo mas importante de cada uno se discute en
mayor detalle en el resto de este capitulo.
194
Tarea Propuesta
Intervalo Inicial
Mantenimiento no programado
Controlar pernos de uniones
Mensual
Mantenimiento no programado
Rediseño
Controlar nivel de aceite de
Semanalmente
engranaje
Puede
ser
hecho por
Mecánico
Operador
1- AUDITAR PLANILLA
DE DECISIÓN
2- ACTUALIZAR LAS
DESCRIPCIONES DE LAS
TAREAS DE RUTINA.
(Detallar información)
3- IDENTIFICAR CAMBIOS
EXCEPCIONALES
(A la capacidad o a los
procedimientos operativos.)
4- INCORPORAR
DESCRIPCIÓN DE
TAREAS DE PAQUETE
DE TRABAJO.
Programas
de
Sistemas de Planificación y
control para programas de
mantenimiento de alta y
baja frecuencia.
Procedimientos
Operativos
Procedimientos
Operativos Estándar
Procedimientos Para informar y
Corregir Defectos.
Implementar cambios
positivos a la capacidad de
las maquinas o la gente
5- IMPLEMENTAR SISTEMAS
QUE ASEGUREN QUE EL
TRABAJO SE LLEVA A CABO.
Grafico 11.1: Después del RCM
195
11.1 La Auditoria de RCM
Si se aplica correctamente, el proceso de RCM provee el marco estructural más sólido
disponible actualmente para formular estrategias de manejo de bienes. Estas estrategias
afectan profundamente la seguridad, integridad medioambiental, y bienestar económico de la
organización utilizando el bien. Sin embargo, si algo va sumamente mal, a pesar del mejor
esfuerzo de las personal aplicando el proceso, cada decisión será sometida a una revisión
adversaria profunda e intensa, a cargo de organizaciones incluyendo desde autoridades
regulatorias, aseguradoras y accionistas hasta los representantes o victimas
(o sus
sobrevivientes). Como resultado, cualquier organización que adopte RCM, debe tener gran
cuidado en que las personas aplicando este método, tengan pleno conocimiento de lo que
están haciendo, y que se convenzan de que sus decisiones son sensibles y defendibles. El
último paso es conocido como la auditoria de RCM.
La auditoria de RCM implica una revisión formal de los contenidos de las Planillas
Informativas y de Decisión de RCM. Esta sección de este capitulo se enfoca en quien debería
llevar a cabo la auditoria, cuando debería realizarse y que abarcaría.
Quien debería llevar a cabo la auditoria:
Los encargados superiores están a cargo de la responsabilidad general si algo no funciona, de
modo que forma parte de su propio interés y el de sus empleados tener la satisfacción personal
de que se están siguiendo los pasos adecuados para prevenir tales sucesos. Como
mencionamos en el capitulo 1, los superiores no tienen necesariamente que realiza ellos
mismos las auditorias, pero la pueden delegar a alguien que en su juicio tenga la confianza
suficiente. Sin embargo si se hace esto, debe estar siempre entendido que los auditores actúan
en nombre de los responsables superiores, de manera que estos últimos siguen teniendo la
mayor responsabilidad sobre las decisiones. (Quien quiera que lleve a cabo las auditorias,
también debe estar capacitado totalmente en RCM).
Si los auditores no estuvieran de acuerdo con los hallazgos o las conclusiones, debería discutir
el asunto con las personas que llevaron a cabo el análisis. De esta manera los auditores
deberían estar preparados para aceptar que ellos mismos pueden estar equivocados. (En la
mayoría de los casos, no se cuestionan más de un 5% de las decisiones.)
Cuando debe llevarse a cabo la auditoria.
Las auditorias deben ser llevadas a cabo tan pronto como fuera posible una vez que se
completo cada revisión (preferentemente dentro de las dos semanas), por tres razones:
* Las personas que llevaron a cabo el análisis disfrutan de ver el resultado de sus esfuerzos
puesto en práctica. (Si esto sucede muy lentamente, comienzan a perder interés, y lo que es
mas serio, empiezan a cuestionarse si la gerencia fue responsable al involucrarlos a ellos en
este trabajo.)
* Las personas pueden recordar fácilmente las ocasiones en que tomaron decisiones
específicas.
* Cuanto más rápido se implementen las decisiones, mas rápido la organización recibirá los
beneficios finales del ejercicio.
196
Cuando se alcanza un acuerdo general de cada análisis, las decisiones se implementan como
se describen en el resto de este capitulo.
Que abarca la auditoria
Un análisis de RCM necesita ser controlado desde el punto de vista del método y contenido.
Cuando revisa el método, el autor busca asegurar que el proceso de RCM ha sido aplicado
correctamente. Cuando revisamos el contenido, el auditor busca asegurar que se ha reunido la
información correcta y se han formado conclusiones acerca del bien en si mismo, y el proceso
del cual forma parte. Lo asuntos que necesitan atención con mayor frecuencia son los
siguientes.
Niveles de análisis
El análisis debe ser llevado a cabo al nivel adecuado. La falta mas común es analizar bienes a
un nivel muy bajo, y el síntoma normal es grandes números de ítems con solo una o dos
funciones definidas por ítem.
Funciones
Todas las funciones del bien deben ser descriptas correcta y claramente. Puntos clave a tener
en cuenta se incluyen a continuación:
* Cada enunciado de funcion debe definir solo una funcion, aunque puede incorporar mas de
u nivel de desempeño. Como regla, cada enunciado de funcion debe contener un solo verbo (a
menos que sea un dispositivo de protección)
* Los niveles de desempeño deberían ser cuantificados, y deberían indicar que puede llegar a
ser capaz de hacer el bien en su contexto operativo presente más que su potencia nominal
(que puede hacer).
* Todos los dispositivos de protección deberían ser enumerados y se debería enumerar
correctamente sus funciones. (Hacer “X” si sucede “Y”)
* Las funciones de todas las válvulas e indicadores deberían ser alistadas, en forma conjunta
con los niveles deseados de precisión.
Fallas funcionales
Todas las fallas funcionales asociadas con cada funcion deberían ser enumerdas (por lo
general la falla completa mas el negativo de cada parámetro de rendimiento en la afirmación
de la funcion)
Modos de fallas
Asegurar que los modos de falla que se presentaron, que tienen posibilidades razonables, no
hayan sido omitidos. La descripción de los modos de falla también debe ser específica. En
particular,
* Deben incluir un verbo, no solo un componente especifico
* El verbo debe ser una palabra diferente a “falla” o “funciona mal”, a menos que sea
apropiado tratar a la falla de un subconjunto, como modo de falla simple (Opción 3, pagina
87)
197
* Las fallas de válvulas e interruptores deberían indicar si el ítem falla en la posición abierta,
o cerrada.
Los modos de falla se deberían dirigir directamente a la falla funcional bajo consideración, y
no se deberían transponer, como en:
Modo de falla
El motor se dispara
Efecto de Falla
Propulsor de la bomba estancado por una roca.
Otro error común es combinar dos modos de falla sustancialmente diferentes en una
descripción, del siguiente modo:
Erróneo
1 pantallas dañadas o desgastadas.
Correcto
1- Pantallas dañadas.
2- Pantallas desgastadas.
Efectos de las fallas
La descripción de los efectos de las fallas puede hacer posible decidir:
* Si es que (y como) la falla será evidente para el grupo de operarios.
* Si es que (y como) la falla implica una amenaza a la seguridad.
* Que efecto tiene la falla sobre la producción o las operaciones (rendimiento, calidad del
producto, servicio al cliente.)
Los efectos de falla no deberían incorporar palabra de “consecuencias” reales, como ser “esta
falla afecta la seguridad”, o “esta falla es evidente”. Sin embargo, deben enunciar el tiempo
inactivo total posible, en forma opuesta al tiempo de reparación, y debería indicar que debe
hacerse para rectificar la falla (reemplazar, reparar, reiniciar, etc.)
Finalmente los auditores los auditores deben asegurarse de que todo lo dice ser “analizado en
forma separada” sea realmente “analizado en forma separada”.
Evaluación de Consecuencias.
Se debe tener especial cuidado en asegurar que la pregunta de la funcion oculta
(pregunta H, en la pagina 200), ha recibido la respuesta correcta. En particular, los
significados correctos deberán haber sido adjuntados a los términos por si mismo, y bajo
circunstancias normales, como explicamos en la pagina 124 y 126. También se debe prestar
especial atención a la evaluación de seguridad y consecuencias medioambientales, y a la
efectividad de cualquier tarea que pueda haber sido seleccionada para manejar las fallas en
estas dos categorías.
Selección de tareas
Cualquier tarea que halla sido seleccionada, no solo debe satisfacer los criterios de viabilidad
técnica, como se explica en los capitulos 6, 7 y 8, sino que también deben hacer referencia a
las consecuencias de la falla. Puntos clave que se deben considerar:
198
* Si la respuesta a la pregunta H es “NO”, y la respuesta a la pregunta H4 es “No”, entonces
debe responderse la pregunta H5. Si la respuesta a la pregunta H5 es “Si”, la tarea propuesta
no debería ser “mantenimiento no programado”
* Si la respuesta a la pregunta S o E es “Si”, la tarea propuesta no debería ser “mantenimiento
no programado”
* Si la falla tiene consecuencias operativas o no operativas, la tarea debe tener una buena
relación costo- efectividad.
Las tareas propuestas o las acciones de default deberían ser descriptas en detalle suficiente
para dejar al auditor sin dudas sobre lo que se intenta. En particular, la descripción de tareas
de rutina no deberían enunciar simplemente el tipo de tareas (Tareas en condición
programadas “o “búsqueda de fallas programadas”, etc.)
La descripción de tareas también debe estar relacionada directamente con el modo de falla en
cuestión. No debe incorporar una combinación de tareas porque esto generalmente significa
dos modos de falla diferentes (a menos que la respuesta a la pregunta S4 sea “si”). Por
ejemplo:
Erróneo
Inspeccionar la cadena por desgaste y modificar el
Ajuste.
Correcto
Ajustar la tensión de la cadena
O
Inspeccionar el desgaste
Intervalo Inicial
Los intervalos de tareas deberían haber sido establecidos claramente de acuerdo al criterio al
que se hizo referencia en los capitulos 6, 7 y 8. En particular, buscar la tendencia de confundir
los intervalos P-F con vida útil, e intervalos de tarea en condición.
11.2 Descripción de Tareas
Antes de que cualquier tarea alcance a la persona que tiene que llevarla cabo, debe ser
descripta con el suficiente detalle como para no dejar ninguna duda sobre lo que debe hacerse.
Claramente el grado de detalle requerido se vera influenciado por el nivel general de
capacidad y experiencia de los trabajadores involucrados. Sin embrago, se debe tener en
cuenta que cuanto mas se lo tiene fuera de una descripción de tareas, mayor es la chance de
que alguien omitirá un paso clave, o hará la elección equivocada de tarea en forma conjunta.
En este contexto se debe tener especial cuidado con la descripción de cualquier tarea de
búsqueda de fallas que pueda estimular una situación de riesgo para probar el funcionamiento
de un dispositivo de protección.
La descripción de tareas también debería explicar que acción debe llevarse a cabo si se
encuentra un defecto. ( Por ejemplo, puede el defecto ser reportado a un supervisor o al
departamento de mantenimiento – o debe ser rectificado inmediatamente?) Instrucciones
como ser “Chequear el componente A, por la condición B y reemplazarlo si fuera necesario”
debería ser utilizado con cuidado, por que la parte de “chequear” puede solo llevar unos
segundos, mientras que “reemplazar” podría llevar varias horas. Esto puede hacer estragos
con la duración del tiempo de inactividad planificado. Las instrucciones de este tipo deberían
199
ser enunciadas como: “Chequear el componente A por la condición B e informar los defectos
al supervisor”. Solo utilizar “si fuera necesario” para rutinas rápidas de servicio, tales como
“controlar el nivel de aceite de la caja de engranajes utilizando una barrilla y llenar con
Wonderoil Type 900 si fuera necesario”
El grafico 11.2 muestra ejemplo de la forma incorrecta de especificar las tareas.
Erroneo
Controlar del Acoplamiento
Calibrar el diametro
Correcto
Controlar el tornillo de alimentación o afloje los bulones y
reemplacelos si es necesario
O
Controle visualmente si la pestaña del acoplamiento
presenta roturas y reporte cualquier defecto al supervisor
de mantenimiento.
Adaptar una barra calibradora de prueba de 0-20 para
probar el punto y controlar que la lectura en el calibre de
presion PI1204 este dentro de los 0.5 de la lectura en el
calibrador de prueba, cuando el calibrador este en barra 8.
Acomode las calibraciones fuera de las aplicaciones
cuando la planta este cerrada para la limpeza
O
Saque el calibrador de presion PI1204 al taller y calibre el
siguiente procedimiento en el manual 27A.
Grafico 11.2 – Descripción de Tareas.
Las páginas 206 y 207 explicaban que cada tarea debería ser descripta tan claramente como
fuera posible en la planilla de decisión. Esto salva la duplicación de esfuerzos que ocurre mas
tarde otra persona necesita escribir los procedimientos detallados. También redice la
posibilidad de errores de trascripción. Sin embargo, si el tiempo no permite que los
procedimientos sean especificados durante el análisis de RCM, entonces deben ser
especificados más adelante. Como mencionábamos abajo, esto puede ser realizado con
frecuencia como parte de una iniciativa de tipo ISO 9000.
Se debe tener en cuenta que si mas adelante se va a preparar una descripción de tareas
detallada, esto debería ser realizado por alguien que haya participado en el análisis de RCM
original. Si esto no fuera posible, la tercera parte debería entender claramente que se les esta
requiriendo que describan la tarea en la planilla de decisión con mayor detalle, y no que re
audite el análisis.
Información básica
En adición a una clara descripción de la tarea en si misma, el documento en el que la tarea
esta enunciada debería establecer claramente lo siguiente:
* Una descripción del bien al que se aplica conjuntamente con un número de equipo donde
fuera relevante.
* Quien debería hacer la tarea (operador, electricista, montador, técnico, etc.)
* La frecuencia con la que debe llevarse a cabo la tarea.
* Si es que (y si fuera necesario como) se debe detener el equipo y / o aislarlo mientras se
lleva a cabo la tarea, conjuntamente con cualquier otra precaución de seguridad que deba
tomarse.
200
* Herramientas especiales y repuestas prescriptas.
Alistar estos ítems puede ahorrar muchas caminatas improductivas de aquí para allá una vez
que haya comenzado el trabajo.
ISO 9000 y RCM
Uno de los principales objetivos de RCM es identificar que deberían estar haciendo las
personas. (En otras palabras, asegurar que están haciendo “el trabajo correcto”). Por otro lado
una de las mayores imposiciones de los sistemas de calidad como el ISO 9000 es definir que
debería estar haciendo el personal, lo más claramente posible, para minimizar la posibilidad
de error. ( En otras palabras, asegurar que” hacen el trabajo bien”)
Esto sugiere, que el proceso de transferir las tareas desde las planillas de decisión de RCM a
los documentos para el usuario final, puede ser visto como el punto donde el rendimiento de
un análisis de RCM se convierte en el inicio de un ejercicio escrito del procedimiento ISO
9000. Esto también sugiere, que si se fueran a tomar ambas iniciativas, tiene sentido aplicar
primero RCM.
11.3 Implementado Cambios Excepcionales.
Al final de un análisis de RCM típico, no es usual encontrar que entre un 2% y un 10% de los
modos de falla terminan en rediseño. La parte 2 del capitulo 9 mencionaba que en el contexto
de RCM, el rediseño significa un cambio excepcional en cualquiera de las siguientes áreas.
* Un cambio en la configuración Física de un bien o Sistema
* Un cambio en un proceso o un procedimiento operativo
* Un cambio a la capacidad de una persona, generalmente vía entrenamiento.
Una vez que han sido aceptados por los auditores, estos cambios necesitan ser implementados
tan profunda y rápidamente como sea posible. Abajo discutimos asuntos claves en estas tres
áreas:
Cambios al Bien Físico
Todas las modificaciones deberían ser:
* Justificadas en forma apropiada:
El capitulo 9 explica que las modificaciones deberían ser justificadas en términos de sus
consecuencias. Las modificación con objetivo de tratar fallas simples o múltiples, que tengan
consecuencias de seguridad o medioambientales, deberían reducir el riego (frecuencia y /o
severidad) de las consecuencias a un nivel que sea aceptable. El grafico 9.2 mostraba un
algoritmo que puede ser utilizado para justificar modificaciones creadas para lidiar con las
fallas que solamente tienen consecuencias económicas.
* Diseñadas correctamente por ingenieros calificados: Como regla, no se debería hacer
intentos de rediseñar bienes durante el proceso de RCM , pero el diseñador debería consultar a
posterior a las personas que llevaron a cabo la revisión , para así desarrollar una
especificación enfocada apropiadamente.
* Implementadas correctamente: Se deben seguir pasos para asegurar que las modificaciones
son llevadas a cabo según las intenciones en lo que respecta a tiempo, costo y calidad, y que
todos los planos, manuales y partes están correctamente actualizados.
201
* Manejadas apropiadamente: Las modificaciones no deberían interferir con las actividades de
mantenimiento de rutina en otras partes de la planta, y los requisitos de mantenimiento de
todo ítem de equipos modificado debería ser evaluado e implementado correctamente.
Cambios a la forma en que la planta es operada.
Los cambios excepcionales al modo en que una planta puede ser operada se manejan en el
mismo modo que las tareas de rutina que son incorporadas en procedimientos operativos,
como se explica en la próxima parte de este capitulo.
Cambios en la capacidad de las personas.
Como explicamos en el capitulo 4, el proceso de RCM revela frecuentemente modos de fallas
causados por errores o traspiés por parte de los operadores o el personal de mantenimiento
(errores humanos basados en capacidades). Esto se vuelve evidente para el personal
participando en el proceso, y generalmente modifican su comportamiento tan pronto como
entienden que están haciendo mal.
Sin embargo, tenemos que asegurar que las personas que no hayan participado directamente
en el proceso adquieran las habilidades necesarias. En la mayoría de los casos, es revisar o
extender los programas de capacitación existentes o desarrollar nuevos programas. En la
mayoría de las organizaciones, esto se realizara conjuntamente con el departamento de
capacitación.
11.4 Paquetes De Trabajo
Una vez que se especificaron completamente los procedimientos de mantenimiento, necesitan
ser empacados de modo que puedan ser planificados y organizados sin demasiada dificultad, y
que pueda ser presentado de una manera ordenada y compacta a las personas que estarán
llevando a cabo la tarea. Esto puede realizarse de dos modos:
* Los procedimientos de mantenimiento de alta frecuencia que serán llevados a cabo por
operadores pueden ser incorporados en los procedimientos operativos del equipo.
* El resto de las rutinas de mantenimiento se agrupan en programas separados y listas de
control.
Procedimientos Operativos Standard.
La parte previa de este capitulo menciona que todos los cambios que deban ser hechos al
modo en que un bien es operado, deberían estar documentados en procedimientos operativos
estándar o SOP’s. (En la situación en las que existan ya, casi con certeza será necesario
desarrollarlos para asegurar que los cambios son implementados.) En muchos casos, los
SOP’s son también el modo mas simple y mas barato de manejar tareas de alta frecuencia que
necesitan ser llevadas a cabo por operadores, como se ilustra en el grafico 11.3.
Como regla, solo se deberían incorporar tareas en los procedimientos operativos si estas
necesitan ser realizadas a intervalos de una semana o menos. Las tareas que deben ser
llevadas a cabo por operadores a intervalos mayores deberían ser agrupadas en programas
separados, y ser planeadas, organizadas y controladas, del mismo modo que los programas de
mantenimiento, como se describe en la parte 6 de este capitulo.
202
TAREA PROPUESTA
Mantenimiento no programado
INTERVALO
DE INICIO
PUEDE SER
REALIZADA
POR
Mensualmente
Mecanico
Controle el nivel de aceite de la
caja de engranaje
Semanalmente
Operador
Controle la tensión de la cadena de
mando principal
Mensualmente
Mecanico
Calibre el diámetro
Anualmente
Técnico E & I
4 veces por año
Operador
Controle los bulones del
acoplamiento
Rediseñe la guardia
Mantenimiento no programado
Drene el tanque principal y
controle si la alarma de bajo nivel
suena a los 50 litros.
Procedimeitno estandar de
operaciones
Lavadora
Al inicio del turno
•
Llene el embudo
•
Abra la valvula de aire y
espere hasta que la presion
alcance los 50 psi
•
(sabados a la mañana
solamente)
Controle el nivel de aceite
de la caja de engranajes y
reporte si esta por debajo
del nivel 2.
•
Presione el boton de
encendido.
•
Abra la válvula detergente.
•
Inicie el widget feed
•
Etc.
Grafico 11.3: Transferencia de una tarea desde una planilla de decisión a un SOP.
Programas de Mantenimiento
Un programa de mantenimiento es un documento enumerando un número de tareas de
mantenimiento que serán realizadas por una persona con capacidades determinadas, sobre un
bien especifico, a una frecuencia especifica. El grafico 11.4 muestra la relación entre estos
programas y la planilla de decisión de RCM.
TAREA PROPUESTA
Mantenimiento no programado
INTERVALO
DE INICIO
Mensualmente
PUEDE SER
REALIZADA
POR
Intervalo
Realizado por
Mensualmente
Mecanico
Mecanico
Controle los bulones del
acoplamiento
Detenga la maquina y siga el
procedimiento de traba X, luego:
Rediseñe la guardia
Controle el nivel de aceite de la
caja de engranaje
Semanalmente
Operador
Controle la tensión de la cadena de
mando principal
Mensualmente
Mecanico
Calibre el diámetro
Anualmente
Técnico E & I
4 veces por año
Operador
Mantenimiento no programado
Drene el tanque principal y
controle si la alarma de bajo nivel
suena a los 50 litros.
Mantenimiento
Programado
Lavadora
1. Controle visualmente el
acoplamiento del mando principal
para bulones flojos y ajuste si es
necesario.
2. Controle la tensión de la cadena
del mando principal y ajuste el
tensior si el juego entre las ruedas
dentadas excede los 10 mm.
203
Grafico 11.4: Trasfiriendo tareas desde una planilla de decisión a un programa de
mantenimiento.
Compilar programas desde una planilla de decisión de RCM es un proceso directo. Sin
embargo, se debe tener en cuenta unos cuantos factores adicionales como se explica en los
siguientes párrafos.
Consolidar las frecuencias
El capitulo 7 mencionaba que si aparece un amplio rango de diferentes intervalos de tareas en
la planilla de decisión, deben ser consolidados en un numero menor de paquetes de trabajo,
cuando se compilan los programas basados en las planillas de trabajo. El grafico 11.5 da un
ejemplo extremo de la variedad de intervalos de tareas que podrían aparecer un una planilla de
decisión, y como deben ser consolidados en un numero menor de frecuencia de programas.
La tarea más costosa, en términos de costos directos involucrados, y el monto de tiempo
inactivo necesario para llevarlas a cabo, tienden a dictar intervalos de programas básicos. Sin
embargo la planificación se simplifica si los intervalos son múltiples unos de otros, como se
muestra en este ejemplo.
Tenga también en cuenta que si la frecuencia de una tarea cambia en este aspecto, debe ser
incorporada siempre en un programa de mayor frecuencia. Los intervalos de tareas, nunca
deben ser incrementados arbitrariamente, porque el hacerlo podría mover la frecuencia de las
tareas en condición afuera del intervalo P-F para esa falla. O podría mover la tarea de descarte
programada pasada la edad de vida del componente.
Intervalos de tareas
en las hojas de
desicion
Intervalos de
Programas de
Mantenimiento
Diariamente
Semanalmente
2 a la semana
Mensualmente
6 a la semana
2 a la semana
Diariamente
Semanalmente
3 al mes
4 al mes
3 al mes
6 al mes
9 al mes
6 al mes
12 al mes
12 al mes
Mensualmente
Grafico 11.5 Consolidar la frecuencia de tareas.
204
Contradicciones
Cuando un programa de baja frecuencia incorpora uno de mayor frecuencia, debería ser este
ultimo incorporado como una instrucción global, o debería ser reescrito en su totalidad? En
otras palabras, debería un programa anual incluir la instrucción como “realizar los programas
trimestrales”, o deberían todas las tareas en los programas mensuales estar detalladas en el
programa anual?
En realidad es útil reescribir los programas para evitar problemas y contradicciones.
Por ejemplo, consideren que podría suceder en una situación donde un programa trimestral
incluya la instrucción “controlar el aceite de engranaje y llenar si fuera necesario”, y el
programa anual de la misma maquina comenzara con la orden “Realizar el programa
trimestral”, y mas adelante diga “drenar, limpiar y recargar la caja de engranajes.”
Demasiadas anormalidades y contradicciones de esta naturaleza, desgastan rápidamente la
credibilidad en el sistema a los ojos de las personas llevando a cabo el trabajo, de modo que
vale la pena tomar un tiempo extra para asegurar que no ocurran.
Agregando tareas.
Cuando compilamos programas en la base descripta anteriormente, hay generalmente una
gran tentación de agregar tareas aun programa ya terminado. Esto sucede con mayor
frecuencia en la base de “cuando hacemos A y B, también debemos hacer “X, Y Z. Esto
debería evitarse por las siguientes razones:
* Las tareas extras incrementan la carga de trabajo de rutina. Si se agregan demasiadas tareas,
la carga aumenta al punto donde no hay suficiente mano de obra para llevarla a cabo, o el
equipo no puedes ser liberado por el monto de tiempo necesario para llevarlas a cabo, o
ambos.
* Las personas llevando a cabo los programas se dan cuenta al corto tiempo X, Y y Z no son
estrictamente necesarias, y juzgan acordemente el programa como un todo. Como resultado,
comienzan a buscar razones por las que no pueden llevar a cabo el programa como un todo.
Cuando las encuentran, A y B tampoco son realizadas y el programa de mantenimiento en su
totalidad comienza a desmoronarse.
Este programa es común en lo cierres. Muchas tareas de cierre son llevadas a cabo no porque
sean realmente necesarias, sino porque la planta es interrumpida y es posible “llegar al”
equipo. Esto aumenta los costos y muchas veces la cantidad de tiempo de un cierre. El trabajo
innecesario también lleva a un aumento en la mortalidad infantil cuando la planta es puesta
en marcha nuevamente.
(Esto no significa que las personas que llevan a cabo tareas de rutina deban concentrase solo
en las tareas especificadas e ignorar cualquier otra falla potencial o funcional que puedan
encontrar. Por supuesto que deben mantener sus ojos y oídos abiertos. El punto es que el
programa en si mismo solo debe especificar que necesita ser realizado a esa frecuencia. )
205
11.5 Sistemas de Control y Planificación de Mantenimiento.
Programas de mantenimiento de frecuencia alta y baja
Una vez que el trabajo fue agrupado en paquetes de trabajo sensibles el siguiente paso es
establecer sistemas de planificación y control que aseguren de que se llevan a cabo por la
persona correcta en el tiempo adecuado. Un facto clave que influencia el diseño de tales
sistemas es la frecuencia de programas.
En particular, los programas de alta y baja frecuencia se manejan de forma diferente, porque
difieren tanto el contenido de trabajo, como el horizonte de planificación.
Los programas de alta frecuencia se definen como programas llevados a cabo a intervalos de
hasta una semana. Estos programas usualmente consisten solamente en tareas en-condición y
en búsqueda de fallas. Tienen un contenido de trabajo bajo, y por lo tanto pueden ser llevados
a cabo rápidamente. Muchos de ellos pueden llevarse a cabo mientras la planta esta
funcionando, de modo que pueden hacerse en prácticamente cualquier momento. Los dos
factores implican que el sistema de planificación correspondiente puede ser muy simple.
Sin embargo, estos programas de alta frecuencia existen en grandes números, de modo que si
no se los administra con concienzudamente pueden volverse inmanejables con facilidad. Por
ejemplo, programas diarios que deben llevarse a cabo por 350 días del año en 1000 ítems de
la planta, pueden generar 350.000 instrucciones si se aborda cada programa por separado (ya
sea electrónicamente o en papel) cada vez que debe realizarse. Esto carece de sentido
claramente, y el problema que acarrea es la razón común de porque los programas se
administran mal, o directamente no se administran.
Pero las tareas de alta frecuencia son la columna vertebral de un mantenimiento de rutina
exitoso, de modo que debe encontrarse algún modo para asegurar que se lleven a cabo sin
crear una carga administrativa excesiva.
Los programas de baja frecuencia son los llevados a cabo en intervalos de un mes o mayores.
Su horizonte de planeamiento más extenso los hace menos receptivos de sistemas simples de
planeamiento del tipo utilizado para las tareas de alta frecuencia. Generalmente tienen un
contenido mayor de trabajo, de manera que se necesita mas tiempo para llevarlos a cabo, y la
planta generalmente debe ser detenida mientras se llevan a cabo. Como resultado, necesitan
sistemas de planificación y control más complejos.
La siguiente sección de este capitulo sugiere algunas de las opciones que pueden ser utilizadas
para manejar ambos tipos de programas, bajo los siguientes títulos:
* Programas realizados por operadores.
* “programas “realizados por la funcion de calidad.
* Programas de alta frecuencia llevados a cabo por personal de mantenimiento.
* Programas de baja frecuencia llevados a cabo por personal de mantenimiento.
Programas llevados a cabo por los operadores.
Desde el punto de vista del mantenimiento, el atributo más valorable de los operadores es que
están cerca de los equipos la mayor parte del tiempo. Como discutimos en la pagina 209, esto
los pone e una posición ideal para llevar a cabo muchas tareas en-condición y de búsqueda de
206
fallas. Estas son generalmente tareas de alta frecuencia – alguna pueden ser diarias, o hasta
una o dos por turno, de modo que se debe tener especial cuidado en tener el sistema
administrativo correspondiente tan simple como fuera posible.
Los sistemas de recordación que pueden ser utilizados por los operadores en lugar de las
planillas de control formales incluyen:
* Incorporar los controles de mantenimiento en los procedimientos operativos estándar, como
discutimos anteriormente.
* Ubicar el programa permanentemente en una pared o gabinete de control donde los
operadores lo puedan ver fácilmente.
* Entrenar los aperadores de forma tal que las inspecciones se conviertan en segunda
naturaleza (un método de alto riego que no es altamente recomendado.)
Las listas de control formales solo deben ser utilizadas para controles de los operadores
cuando las consecuencias de la falla puedan ser particularmente severas, y halla razón para
dudar si la tarea será llevada cabo sin un recordatorio formal.
Programas y controles de Calidad
Hemos visto como cada vez mas normas de desempeño incorporan normas de calidad del
producto. Esto significa que cada vez más fallas potenciales y funcionales pueden ser
reveladas por controles de calidad del producto. Estos controles ya están siendo realizados
con frecuencia (por ejemplo, el uso de SPC como discutimos en las paginas 151 y 152). Los
puntos clave a tener en cuenta son los siguientes:
* Los controles de calidad deben ser reconocidos como una fuente valida y valuable de
información de mantenimiento.
* Se deberán tomar pasos para asegurar que las fallas potenciales relacionadas con la calidad
se atienden tan pronto como se las nota. Este tema se discute en mayor detalle mas adelante.
Programas de alta frecuencia llevados a cabo por Mantenimiento.
A pesar de todos los comentarios anteriores sobre los meritos de utilizar operadores para
realizar el trabajo de mantenimiento de alta frecuencia, muchas de estas áreas aun necesitan
ser llevadas a cabo por personal de mantenimiento. Esto necesita ser planeado de una manera
mas formal que los controles de los operarios, porque el personal de mantenimiento cubre mas
maquinas ubicadas en un área también mayor que los operadores, y por o general realizan
mayor variedad de tareas.
Un método es dividir la planta en secciones. Y preparar listas de control del tipo que se
muestra en el grafico 11.6 para cada sección.
207
SECCION DE PLANTA
LISTA DE
VERIFICACION
DE
MANTENIMIENTO
CARCASA DE CALDERAS
A ser realizado
por :
Semana de
finalizacion.
MECANICO
ÍTEM N° DESCRIPCION
PROGRAMA
03030401 Sistema de manejo de Carbon
M-265
03030402 Caldera N° 1
M-388
03030402 Caldera N° 1
M-389
03030403 Caldera N° 2
M-388
03030403 Caldera N° 2
M-389
03030404 Sistema de manejo de Cenizas
M-539
03030405 Calentador de Agua
03030406 Sistema de gas de flujo
M-462
M-391
DESTINADA A
M T W T F S S COMENTARIOS
Completada por:
TIEMPO
208
Grafico 11.6 – Una lista de control de programas de mantenimiento de alta frecuencia.
Se deben tener en cuenta los siguientes puntos sobre este tipo de lisas de control:
* La lista solo enuncia los programas a llevarse a cabo, no tareas individuales. Están
abordados en forma separada, generalmente en forma de libro, y recubiertas en plástico para
su protección. De esta forma, solo una lista de verificación es emitida por sesión, por semana,
más que docenas de inventarios cada día.
* Se planear aproximadamente la misma cantidad de trabajo para cada día, y no debería
exceder entre media hora y una hora por día.
* Las listas de verificación pueden ser utilizadas para planificar a intervalos entre diarios y
semanales. Se pueden planificar trabajos para días alternados y dos veces por semana, para
que así la lista de verificación abarque un espectro mas corto que el de los intervalos P-F.
* La lista puede comenzar y terminar en cualquier ciclo de cinco o siete días, no es necesario
adoptar el ciclo Lunes/Domingo que se muestra en el ejemplo.
* Las listas incluyen los planes de programas y se emiten todas las semanas, de modo que no
hay necesidad de ningún tipo de sistema de planificación.
* Las listas no se utilizan para ninguna tarea que este por llevarse a cabo a intervalos mayores
de una semana.
* Cada lista incluye uno o dos documentos por semana por sección. Esto aumenta a no más de
50 documentos por semana para una planta que contenga 1000 ítems sujetos a estos controles.
Algunas tareas de alta frecuencia requieren que se realicen lecturas, ya sea manuales
(cargando un lector métrico) o electrónicamente (análisis de vibraciones). Las lecturas de esta
naturaleza son tareas, mientras que las listas de verificación están diseñadas para programas
completos. Esto puede causar problemas, especialmente si comenzamos a emitir un
documento separado para cada uno de estos registros a los largo de las listas de verificación.
Esto debería evitarse, porque los números de documentos simplemente comienzan a
aumentar. Las siguientes son alternativas posibles:
* Desarrollar un documento especial para todos las lecturas en cada sección, y adjuntar este
documento, a la lista de verificación para esa sección cada semana
* Utilizar una persona para realizar todas esas lecturas en toda la planta.
* Consultar a las personas tomando las lecturas que registren solo esas lecturas que están
fuera de los limites aceptables en la columna de destacados de la lista de verificación (A
menos que las lecturas se registren automáticamente, como en el caso de ciertos dispositivos
de monitoreo de condición.)
* Automatizar el proceso de registros.
209
Emitir programas de alta frecuencia
La lista de verificación es entregada a los mantenedores relevantes la semana antes de que
terminen. Preferentemente, deberían ser la primera actividad llevada a cabo por esa persona
cada día. Se debe tener en cuenta las siguientes características adicionales de un sistema de
verificación bien manejado.
* Si el operador de mantenimiento no puede completar la tarea planeada un día determinado,
la tarea debe realizarse al día siguiente.
* Se anotan toda falla funcional o potencial en la columna de destacados de la lista de
verificación – no en los inventarios en si mismos.
* El mantenedor inicia la acción correctiva al final de cada ronda diaria. En algunas plantas,
esto puede ser la responsabilidad del mantenedor, en otras el o ella deberá trabajar a través de
un supervisor. La acción puede variar desde arreglar para que la llanta se detenga en ese
momento, o arreglar para que la falta sea corregida en la próxima interrupción, Esta decisión
se basa en las posibles consecuencias de falla y del intervalo P-F neto. (Se debe tener en
cuanta que estos asuntos deberían haber sido considerados como parte del proceso de RCM
cuando una tarea de rutina ha sido especificada originalmente.)
* En el caso de los operarios, es importante que se tome acción o que se le diga al mantenedor
porque la acción es innecesaria, o esta siendo descartada, o los mantenedores también pierden
interés en el sistema.
* Al final de cada ciclo, la lista de verificación completa puede ser almacenada como registro
de que las tareas fueron hechas, para que no sea necesario re-ingresarlas en un sistema de
registros históricos. Sin embargo, los problemas que aparecen y las acciones tomadas para
lidiar con ellos, deben ser documentados, como se discute en el capitulo 14.
Control de los programas de alta frecuencia.
Un problema asociado con la mayoría de los sistemas de listas verificación es el
“Síndrome del salón de Te”. Esto significa que las personas indican que la lista de
verificación fue llevada a cabo, cuando en realidad no lo fue. Para evitar este problema, los
supervisores deberían conducir inspecciones casuales. Esto implica hacerlos inventarios en la
lista de verificación en compañía del mantenedor que lo hace normalmente. Si esta no ha sido
hecha correctamente, las fallas no informadas se vuelven aparentes inmediatamente, y el
supervisor toma la acción necesaria.
Programas de baja frecuencia llevados a cabo por el mantenimiento.
Hemos visto que los programas de alta frecuencia pueden ser planificados, organizados y
controlados utilizando una lista de verificación cuidadosamente estructurada. En contraste, el
horizonte de planificación extensa asociados a los programas de baja frecuencia indican que
los pasos necesarios para planificarlos, organizarlos y controlarlos se llevan a cabo en forma
separada. Lo que es mas, los procedimientos utilizados para planificar programas basados en
el tiempo transcurrido difieren notablemente de los basados en el tiempo corriente, pero se
pueden utilizar procedimientos similares para organizar, y controlar los dos tipos de
programas. Como resultado, consideramos el proceso de planificación en forma separada en
los siguientes párrafos, pero consideramos los pasos subsecuentes juntos.
210
Planificación de tiempo transcurrido
Los principios de planificación de tiempo transcurrido son bien conocidos, y se utilizan para
muchos propósitos además de la planificación de mantenimiento. Para programas de baja
frecuencia, la planificación de tiempo transcurrido se basa generalmente en una pizarra de
planificación como se observa en el grafico 11.7 (o su equivalente computarizado.)
Item
Descripción
1
2
3
4
5
6
7
8
9
10
11
12
47
48
49
50
51
52
Grafico 11.7: Una típica pizarra de planificación de baja frecuencia.
La mayoría de estos sistemas, utilizan un horizonte de planificación general de 1 año, dividido
en 52 semanas. Sin embargo, se debe tener en cuenta cuando se organizan tales sistemas que
algunas tareas de búsqueda de fallas en particular, pueden tener tiempos cíclicos de hasta 10
años, y el horizonte de planificación de cada uno de esos sistemas debe acomodar tales tareas.
Cando se establecen estos sistemas, se debe tener en cuanta también que los programas de
baja frecuencia prácticamente siempre traen aparejados interrupción en el funcionamiento de
los equipos, y esto puede traer consecuencias operativas en exactamente el mismo modo que
las interrupciones se supone prevengan, de modo que se debe tener especial cuidado para
minimizar estas consecuencias. Puntos a tener en cuenta incluyen:
* Picos y depresiones en el ciclo de producción. Los programas que mayor tiempo consumen
deben ser planeados para los periodos de menor actividad, para así minimizar sus efectos en
las operaciones.
* Dos maquinas que requieran el mismo recurso especial (por ejemplo una grúa.)
* Casos donde solo es posible realizar un programa, si otras maquinas están detenidas al
mismo tiempo. Esto se aplica especialmente a servicios como plantas de vapor o compresores
de aire.
Por otro lado, Donde sea que tales situaciones lo permitan, tratar de distribuir la carga de
trabajo de mantenimiento tan parejamente como sea posible a lo largo del año para estabilizar
los requerimientos de mano de obra.
Un punto final sobre la planificación de programas de baja frecuencia basados en tiempo
transcurrido, es que considera demasiado simple utilizar computadora para este propósito. Sin
embargo, se debe tener en cuenta que los temas discutidos anteriormente introducen un rango
amplio de compulsiones en el proceso de planificación de tiempo calendario. Por esta razón,
tener mucho cuidado al diseñar o adquirir parámetros minados, o que automáticamente replanean programas que no han sido realizados. El autor ha encontrado un número
considerable de tales sistemas que simplemente mueven los programas semana a semana, sin
tener en cuenta la política de coacción. Esto se vuelve caótico, especialmente cuando los
inventarios que solo deben hacerse en la temporada baja, se mueven gradualmente a mitad de
la temporada alta y así sucesivamente.
211
Planificación de tiempo corriente
La planificación de tiempo corriente incluye los siguientes pasos:
* Se registran los números de ciclos que cada maquina ha completado en cada periodo (Se los
puede medir en términos de tiempo, distancia viajada, unidades de rendimiento, etc.)
* Este registro se ingresa al sistema de planificación.
* El total acumulado de horas corridas se actualiza para reflejar el tiempo corrido desde que
se llevo a cabo el último programa.
Los sistemas manuales de tiempo corriente van desde pizarras sofisticadas que cuestan
cientos- o hasta miles – de pounds, a contadores que mueven piolitas. Si es posible, estos
sistemas deberían contar hasta cero, para que así los planificadores puedan observar cuanto
tiempo falta antes de que los programas se terminan. Esto también provee advertencias
visuales tempranas de picos que podrían recargar el taller.
Los sistemas de planificación de tiempo real, se auto declaran listos para el uso de
computadoras porque implican procesar y almacenar grandes cantidades de datos. También el
dinamismo de los sistemas de tiempo real significa que estos tienen menos compulsiones que
los sistemas de tiempo transcurrido.
Sin embargo, Si la colección de datos de tiempo no esta automatizada, puede ser costosa y
propensa a errores, entonces si se van a utilizar computadoras para la planificación de tiempo
real, la captura de datos también debe ser automatizada si fuera posible.
El sistema también debería ser diseñado para proveer un pronóstico actualizado de la carga de
trabajo programada en cada taller al futuro más lejano posible. Esto les da a los superiores
tiempo suficiente para suavizar cualquier pico o depresión que aparezcan en el pronóstico.
Organización de los programas de baja frecuencia.
La mayoría de los sistemas de planificación comienzan organizando programas de baja
frecuencia la semana anterior a que se venzan los programas (excepto por los de
interrupciones). El proceso de organización, generalmente contiene los siguientes elementos:
* Se prepara una lista de programas que venzan la semana siguiente. Generalmente se separan
en secciones de planta y trabajo manual.
* Se mantienen reuniones con el departamento de operaciones para acordar que día y a que
hora se realizaran los inventarios (especialmente aquellos que requieren inactividad de los
equipos.
* Las tareas en si mismas son elevadas a los supervisores relevantes, que planea quien los
llevara a cabo, y arreglara cualquier otro recurso que pueda ser necesario para otro trabajo de
mantenimiento entrante.
Control de los programas de baja frecuencia
Los programas de baja frecuencia están sujetos a los mismos controles de desempeño que
cualquier otro tipo de programa de mantenimiento. Esto se aplica al tiempo utilizado para
realizar los inventarios, estándares de mano de obra, y etc.
212
Se deben considerar dos factores adicionales. Primero, el sistema de planeamiento debería
indicar cuando vencen los inventarios. Como mencionamos anteriormente, tales inventarios
no deberían ser reprogramados automáticamente, pero deberían ser manejados n una base de
excepciones.
Finalmente, los programas de mantenimiento deberían ser revisados continuamente a la luz de
las circunstancias cambiantes, (especialmente las circunstancias que afectan las consecuencias
de las fallas) la nueva información. En este contexto, se debe tener en cuanta que a cuanto
mas involucradas estén las personas en determinar los requerimientos de un equipo, tienen
mas probabilidades de ofrecer feedback constructivo sobre los futuros requerimientos. Este
asunto se discute en mayor detalle en el próximo capitulo.
11.6 Reportando los Defectos.
Además de asegurar que las tareas se llevan a cabo, también debemos asegurar que cualquier
falla potencial que se encuentre es rectificada, antes de convertirse en fallas funcionales, y que
las fallas funcionales ocultas son rectificadas antes de que tenga oportunidad de presentarse
una falla múltiple. Esto significa que cualquier persona que pueda descubrir una falla
potencial o funcional debe tener acceso irrestricto a un procedimiento simple, confiable y
directo para informarlo de forma inmediata a quien vaya a repararlo.
Esta comunicación tiene lugar de manera instantánea si la persona que opera la maquina, es
también la persona que la mantiene. La velocidad y precisión en la respuesta a defectos que
pueden ser alcanzados bajo estas circunstancias es una de las razones principales de porque
las personas que opera las maquinas, debería también ser capacitada para mantenerlas (o
viceversa). Un segundo beneficio de este método es el sistema formal de reporte de defectos
solo se necesita para fallas que el operador o mantenedor no pueda manejar por si mismo.
Si la estructura de la organización no es posible o practica, la mejor manera de asegurar que
los defectos son atendidos rápidamente es destinar personal de mantenimiento en forma
permanente a un determinado bien, o grupo de bienes. Estas personas no solo llegan a conocer
mejor las maquinas, lo que mejora sus capacidades de diagnostico, sino que la velocidad de
las respuesta tiende a ser mas rápida de lo que serian si trabajan en un taller central. También
es posible mantener los sistemas de reporte de defectos simples e informales.
Si no es posible organizar soporte de mantenimiento de ningún tipo se hace necesario
implementar un sistema de reporte de defectos más formal. En general, cuanto más alejada
esta la funcion de mantenimiento del bien que esta por mantener – en otras palabras cuantas
más centralizadas es- más formales se vuelve el proceso de reporte de defectos. Esto también
es cierto para defectos que solo pueden ser manejados durante las interrupciones mayores.
Básicamente, los sistemas formales de reportes de defectos permiten a todos a informar al
departamento de mantenimiento por escrito (electrónica o manualmente) sobre la existencia
de una falla potencial o funcional. El criterio principal de tales sistemas debe siempre ser la
simpleza, accesibilidad y velocidad.
Los sistemas manuales de reportes de defectos, se basan usualmente en tarjetas de trabajo del
tipo que vemos en el grafico 11.8 (Estas tarjetas también pueden ser utilizadas por el
departamento de mantenimiento para planificar y registrar los trabajos, pero ese aspecto de su
213
uso esta mas allá del alcance de este libro.) Si se utiliza un sistema de reportes de defectos
computarizado, la pantalla es formateada en la misma forma que la tarjeta.
Tarjeta de trabajo
Planta N°
Departamento
Fecha
Descripción de la planta
Pedido de
A (Supervisor)
Trabajo requerido por
trabajo
Por favor atienda lo siguiente ___________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
Instrucción de trabajo
Dirijido a
Fecha
Falla
potencial
Falla funcional
Programa de
mantenimiento
Modificacion
Capital
Aprovado por
Trabajo cancelado
SI
NO
Tiempo estimado
Supervisor
Grafico 11.8: Un típico pedido de trabajo.
El punto final acerca de los sistemas de este tipo es que las personas deben estar motivadas
apropiadamente a usarlas. Esto significa que los defectos que son reportados deba recibir
acción inmediata, o se debe explicar al usuario debe ser informado por que no se ha tomado
acción alguna. Nada matara tal sistema mas rápido que el hecho de que esos defectos fueran
reportado y nada sucedió.
214
12- Análisis Actuarial y Datos de Fallas.
12-1 Los Seis Patrones de Fallas
A través de este libro, se hicieron numerosas referencias a los seis patrones de falla que se
muestran nuevamente en el grafico 12.1 abajo. Se utilizo frecuentemente términos como edad,
vida, y MTBF. Este capitulo explora estos conceptos y la relación entre ellos en mayor
detalle. También considera que rol tienen los registros técnicos históricos y otros datos de
fallas en la formulación de políticas de mantenimiento. Comenzamos con una mirada
detallada a los patrones de falla B y E, porque representan la mas amplia visión de fallas
casuales y relacionadas con la edad. Seguidamente revisamos los patrones C y F, y luego
damos una mirada a los patrones D y A. La segunda parte de este capitulo resume los usos y
limitaciones de los datos de falla
Grafico 12.1: Seis patrones de falla.
Patrón de falla B
Los capitulos 1 y 6 mencionaban que el patrón de falla B representa las fallas relacionadas
con la edad. El capitulo 6 explicaba que a pesar de que esas fallas son el resultado de un
proceso de deterioro mas o menos linear, aun habrá diferencias considerables en el
comportamiento de cualquiera de dos componentes que sean expuestos al mismo esfuerzo
nominal. El grafico 12.2muestra como este comportamiento se traduce en el patrón de falla B.
215
Grafico 12.2 Patrón de falla B
Un ejemplo de un componente que puede actuar como vemos en el grafico 12.2 es el
propulsor de una bomba que es utilizado para bombear un líquido moderadamente abrasivo.
La parte 1 en el grafico 12.2 muestra las caacteristicas de desgaste de una docena de tales
propulsores. Diez de ellos se deterioran a prácticamente el mismo grado, y duran entre 11 y
16 periodos antes de fallar. Sin embargo, dos de los propulsores fallan mucho antes de lo
esperado, “A” porque no fue endurecido apropiadamente, y “B” porque las propiedades del
liquido cambiaron durante un tiempo, provocando que se desgaste mas rápido de lo previsto.
Tener en cuenta que esta distribución de fallas solo se aplica a propulsores que fallan debido
al desgaste. No se aplica a propulsores que fallan por otras razones.
En la parte 2 del grafico 12.2, la distribución de las frecuencias de falla esta revelada en
contra de la edad operativa por una gran muestra de componentes. Muestra que aparte de unas
cuantas fallas “prematuras”, la mayoría de los componentes tienen probabilidades de
conformar una distribución normal sobre un punto.
Por ejemplo, asumamos que hemos acumulado datos reales de falla para un grupo de 110
propulsores, los cuales han fallado debido al desgaste. Diez de estos propulsores fallaron en
216
forma prematura uno en cada uno de los diez primeros periodos. Los otros 100 propulsores
fallaron entre los periodos 11 y 16, y la frecuencia de estas fallas responde a una distribución
normal. (Para una distribución normal, la frecuencia de fallas en los últimos seis periodos será
prácticamente la que resulte de redondear al numero entero al que mas se aproximen.) En la
base de estos números, el tiempo medio entre fallas del propulsor debido a desgaste es 12.3
periodos.
La parte 3 del grafico 12.2 muestra la distribución de supervivencia de los propulsores
basándose en esta distribución de frecuencia.
Por ejemplo, 98 propulsores duraron más de 11 periodos, y 16 duraron más de 14 periodos.
La parte 4 del grafico 12.2 es el patrón de falla B. Este muestra la probabilidad de que ningún
propulsor que haya sobrevivido al comienzo de un periodo, fallara durante ese periodo. Esto s
conoce como la probabilidad condicional de falla.
Permitiendo un grado pequeño de error de redondeo, esto muestra por ejemplo que hay un
14% de posibilidades que un propulsor que ha sobrevivido al comienzo del periodo 12 fallara
en este periodo. Similarmente, 14 de 16 propulsores que lograron llegar al comienzo del
periodo 15 fallaran en ese periodo- una probabilidad condicional de falla de un 87%.
La curva de frecuencia en la parte 2 esta describiendo el mismo fenómeno, pero difieren
notablemente en el modo que en que lo muestran. En realidad, la curva de probabilidad
condicional de falla provee una mejor ilustración que la curva de frecuencia sobre lo que esta
realmente sucediendo, porque esta ultima nos puede llevar a pensar que las cosas están
mejorando luego del pico de la curva de frecuencia.
Estas curvas ilustran un número de puntos adicionales, como ser:
* Las curvas de frecuencia y de probabilidad condicional muestran que la palabra “vida”
puede tener dos significados bastante distintos. El primero es el tiempo medio entre fallas
(que es lo mismo que la vida promedio si todo el modelo falla). La segunda es el punto en el
que hay un crecimiento rápido en la probabilidad condicional de falla. Esto se denomina la
Vida útil.
* Si planeáramos reparar o reemplazar componentes en el tiempo medio entre fallas, la mitad
fallaría antes de alcanzarlo. En otras palabras solo estaríamos previniendo la mitad de las
fallas, lo que puede traer consecuencias operativas inaceptables. Claramente, si queremos
prevenir la mayoría de las fallas, necesitaremos intervenir al final de “la vida útil”. El grafico
12.2 muestra que la vida útil es mas corta que el tiempo medio entre fallas – si la curva
campana es amplia, puede ser mucho mas corta.
Como resultado, solo se puede concluir que el tiempo medio entre falla tiene una utilidad
mínima, si la tiene en establecer la frecuencia de las tareas de restauración programada y
descarte programado para ítems que se identifica con el patrón de falla B.
* Si reemplazamos el componente al final de su vida útil como se define arriba, la vida
promedio de cada componente será más corto que si lo dejamos ir a la falla. Como se discute
en la página 137, esto incrementara el costo de mantenimiento (teniendo en cuenta que no hay
daño secundario asociado con las fallas)
217
Por ejemplo, si estuviéramos por reemplazar todo los propulsores sobrevivientes el grafico
12.2 al final del periodo 10, la vida promedio de los propulsores seria alrededor de 9.5
periodos, en lugar de 12.3 periodos si ellos tuvieran permitido ir a la falla.
* El hecho de que hay dos “vidas” asociadas a las fallas tipo patrón B significa que debemos
tener cuidado en especificar a cual nos referimos cuando utilizamos el termino “vida”.
Por ejemplo, podemos llamar al fabricante de un cierto componente para consultar cual es su
“vida”. Podemos tener en mente la vida útil, pero no explicamos exactamente a lo que nos
referimos, podemos en toda buena fe darnos el tiempo medio entre fallas. Si estos e utiliza
para establecer una frecuencia de reemplazo, surgen todo tipo de problemas, generalmente
resultando en un malestar general innecesario.
Aparte de estos asuntos, quizás el mayor problema asociado con el patrón B es que muy pocos
modos de falla se comportan de este modo. Como se mencionaba en los capitulos 1 y 6, es
mucho mas común encontrar modos de falla que muestren relaciones muestren muy poca
relación a largo plazo entre edad y falla.
Patrón de Falla E
El grafico 7.9 en la pagina 156 ilustraban tres componentes que fallaron en una base casual.
En el capitulo 7 se discutían un numero de razones donde las fallas pueden ocurrir en esa
base. Esta parte de este capitulo explora algunos de los aspectos cuantitativos de las fallas
casuales en mayor detalle, y continua revisando algunas de las implicancias del patrón de falla
E. Para comenzar, el grafico 12.3 muestra la relación entre frecuencia y probabilidad
condicional de fallas casuales.
En la parte 1 del grafico 12.3, las líneas punteadas representan un número de componentes- en
este caso rodamientos de bolas – que fallan casualmente. Como en el grafico 7.9, cada falla
esta precedida por una curva P-F (alargada de alguna manera).
Falla casual significa que la probabilidad de que un ítem falle en cualquier periodo es la
misma que en cualquier orden. En otras palabras, la probabilidad condicional de falla es
constante, como vemos en la parte 2 del grafico 12.3.
Por ejemplo, si aceptamos la evidencia empírica de que los rodamientos generalmente
responden a un patrón de falla casual- un fenómeno observado por primera vez por Davis
1952- la probabilidad condicional de falla es constante como se muestra en el grafico 12.3 ,
parte 2. Específicamente, esto muestra que hay una probabilidad del 10% que un rodamiento
que funciono bien en el comienzo de un periodo, fallara durante ese periodo.
La parte 3 del grafico 12.3, muestra como una probabilidad condicional de falla que es
constante se traduce en una distribución de supervivencia que es exponencial.
Por ejemplo, si comenzamos con un modelo de 100 rodamientos y la probabilidad de falla en
el primer periodo es 10%, luego 10 rodamientos fallaran en el periodo 1 y 90 sobrevivirá más
de un periodo. Del mismo modo, si hay una probabilidad del 10% de que los rodamientos que
sobrevivan más allá del final del periodo 1, fallaran en el periodo 2, entonces 9 rodamientos
podrían fallar en el periodo 2, y 81 rodamientos llegarían al comienzo del periodo 3. La parte
218
3 del grafico 12.3 muestra cuantos rodamientos sobrevivirían al comienzo de cada periodo
subsiguiente por los primeros 16 periodos.
Teóricamente, este proceso de decadencia continuara hasta el infinito. En la práctica, sin
embargo, generalmente nos detenemos en la concordancia_ en otras palabras cuando la curva
de supervivencia baja de uno.
En el ejemplo que se muestra en el grafico 12.3 un porcentaje de deterioro de un 10%,
significa que la concordancia se alcanzará después de aproximadamente 43 periodos. Esto
sugiere que un rodamiento que trabaja por si mismo puede durar 43 periodos, pero la basta
mayoría habrá fallado mucho antes de eso.
Finalmente, la parte 4 del grafico 12.3 muestra la curva de frecuencia derivada de la curva de
supervivencia en la parte 3. Esta curva es también exponencial. (La forma de esta curva de
frecuencia provoca que sea confundida con el patrón de falla F, que es una curva de
probabilidad condicional basada en una diferente distribución de frecuencia).
Grafico 12.3: Patrón de falla F.
219
El hecho de que las curvas de frecuencia y supervivencia cargan indefinidamente el deterioro
significa que la curva de probabilidad condicional también permanece chata indefinidamente.
En otras palabra, el patrón E no muestra en ninguna etapa un crecimiento significante en la
probabilidad condicional de falla, de modo que no existe un punto donde podamos contemplar
las tareas de restauración programadas o de descarte programado. Los siguientes son más
puntos sobre el patrón E:
* MTBF y fallas casuales: A pesar del hecho de que es imposible predecir cuanto durara
cualquier ítem que responda al patrón de falla E (de ahí el uso del termino “falla casual”), es
posible computar un tiempo medio entre fallas para tales ítems. Esta dado por el punto en que
el 63% de los ítems han fallado.
Por ejemplo, la parte 3 del grafico 12.3 indican que el 63% de los ítems han fallado a
aproximadamente la mitad del periodo 10. En otras palabras, el MTBF del rodamiento es 9.5
periodos.
El hecho de que estos ítems tengan un tiempo medio entre fallas, pero no tengan una “vida
útil” como la definimos anteriormente implica que debemos ser doblemente cuidadosos
cuando hablamos sobre la “vida” de un ítem.
* Comparando la confiabilidad:
El MTBF provee una base para comparar la confiabilidad de dos componentes diferentes que
respondan al patrón de falla E, aun cuando la falla es casual en ambos casos. Esto es por que
el ítem con un MTBF mayor, tendrá una probabilidad mas baja de falla en cualquier periodo
dado.
Por ejemplo, Asumamos que los rodamientos de marca X responden a la distribución de fallas
que se muestra en el grafico 12.3. Si la probabilidad condicional de falla de la marca Y es solo
de un 5% en cada periodo, solo tendrán la mitas de posibilidades de falla, y por lo tanto serán
mucho mas confiables.
En el caso de ítems que responden al patrón de falla B, un componente más confiable tiene
una vida útil mas larga, que uno que es menos confiable. De modo que en un lenguaje simple
podría decirse de los componentes del patrón B, que un tipo dura mas que el otro, mientras
que en el caso del patrón E, un tipo fallas con menos frecuencia que el otro.
En la práctica, la confiabilidad de los rodamientos se mide por la vida “B10”. Esta es la vida
bajo la cual los proveedores de rodamientos garantizan que no más de un 10% de sus
productos fallara bajo las condiciones dadas de carga y velocidad. Esto corresponde a un
periodo de la parte 2 del grafico 12.3. Esto también sugiere que si un rodamiento responde a
una distribución de supervivencia exponencial, entonces el MTBF de rodamientos debido al
“uso y desgaste normal “, debería ser alrededor de 9.5 veces la vida B10.
De modo que si el rodamiento marca Y es dos veces mas confiable que el de marca X, la vida
B10- que también se conoce como la vida L10 o la vida N10- de la marca Y será dos veces
mas larga que la de marca X. Esto es útil cuando se toman decisiones de procuración sobre los
rodamientos, pero de todas maneras o nos dice cuanto va a durar un rodamiento en servicio.)
* Las curvas P-F y las fallas casuales: El grafico 7.9 en la pagina 156 y la parte 1 del grafico
12.3 muestran fallas casuales precedidas por curvas P-F. Esto no pretende sugerir que todas
220
las fallas que se presentan en una base casual están precedidas por tal curva. En realidad
muchos modos de falla que responden al patrón E no están precedidos por ningún tipo de
advertencia, o si lo están, el periodo de advertencia es demasiado corto para ser útil. Esto es
especialmente cierto en la mayoría de las fallas la iluminación de los ítems eléctricos y
electrónicos.
Esto no quita validez al análisis. Simplemente significa que ningún tipo de mantenimiento
preventivo – en –condición, restauración programada, o descarte programado- es
técnicamente posible para estos componentes, y deben ser manejados en una base de default
apropiada como se discute en los capitulos 8 y 9.
Grafico 12.4: Distribuciones Weilbull
Una nota sobre distribuciones Weilbull.
En esta etapa, vale la pena comentar sobre las distribuciones Weilbull. Esta distribución es
muy utilizada porque tiene una gran variedad de formas que le permiten incluir muchos tipos
de datos, especialmente datos relacionados a vida del producto. La distribucion de frecuencia
Weilbull (o más correctamente funcion de densidad de probabilidad) es:
f (t) = (B /aB) t B-1 exp [ - (t/a) B]
B es llamado parámetro de forma porque define la forma de la distribución. a es el parámetro
de escala. Define la distribución y corresponde a un 63 % [100 (1- e-1)] de la distribución
acumulativa. La funcion de densidad de probabilidad Weilbull y las curvas de probabilidad
condicional se muestran en el grafico 12.4. (Esto muestra que la probabilidad condicional de
falla también se conoce como grado de riesgo.)
Cuando B =1, la distribución Weilbull es la distribución exponencial. Cuando B esta entre 3 y
4, se aproxima a la distribución normal. Mas tarde en este capitulo vemos como describe otros
patrones de falla.
Patrón de falla C
El patrón de falla C muestra una creciente probabilidad de falla, pero ningún punto en el que
podamos decir “Aquí es cuando se desgasta”. Este capitula considera una posible razón de
porque se presenta el patrón C, y muestra como se lo deriva.
La posible causa que consideramos del patrón C es la fatiga. La teoría de ingeniería clásica
que la falla por fatiga es causada por el stress cíclico y la falla es gobernada por la curva S-N,
como se muestra en el grafico 12.5.
221
Grafico 12.5 La curva S-N
El grafico 12.5 muestra que si se conoce la curva S-N, deberíamos poder predecir la vida del
componente con gran predicción por una amplitud dada de stress cíclico. Sin embargo esto no
es así en la práctica porque la amplitud promedio del stress cíclico no es constante, y la
habilidad del componente para soportar el stress- en otras palabras, la ubicación de la curva SN – no será exactamente la misma para cada componente.
La parte 1 del grafico 12.6 sugiere que la amplitud promedio del stress aplicado debe
responder a una distribución normal sobre algún medio, que esta designado como “S” en el
grafico 12.6.
222
Grafico 12.6 Patrón de falla 6
Esta distribucion esta ilustrada por la curva P. De igual manera la distribucion de las curvas SN puede estar designada por la curva normal Q. La combinación de estas dos curvas será tal
que las edades a las cuales la falla se presenta conformara una distribucion inclinada a la
izquierda. Cuanto es la inclinación depende de la forma de la curva S-N en si misma. Para
argumentar, la parte 2 del grafico 12.6 sugiere que conformara una distribucion Weilbull con
parámetro de forma B = 2 (estrictamente hablando, esta debería ser llamada una distribucion
Weilbull “desviada” porque no comienza en cero).
En la base de esta distribucion , la parte 2 del grafico 12.6 continua sugiriendo cuantas fallas
pueden ocurrir en cada periodo si evaluáramos por fallas una muestra de 1000 componentes.
(El hecho de que los números marcados con asterisco no son enteros explica porque esta
curva debería ser llamada una densidad de probabilidad y no una distribucion de frecuencia.)
La parte 3 del grafico 12.6 traduce la parte 2 en una curva de supervivencia, mientras la parte
4 muestra la probabilidad condicional de falla basadas en las dos curvas precedentes. Las dos
últimas curvas se derivan del mismo modo que las curvas correspondientes en el grafico 12.2.
Más puntos sobre el patrón de falla C incluyen lo siguiente:
* La distribución Weilbull desviada significa que la curva de probabilidad comienza en un
punto a la derecha del tiempo t = 0. El grafico 12.6 muestra que este es el punto donde hay
“un incremento rápido en la probabilidad condicional de falla”, que es por supuesto la vida
útil como la definimos anteriormente. En el grafico 12.6 esto es tres periodos. Sin embargo, la
descripción anterior del patrón C muestra una probabilidad condicional de falla que comienza
sobre cero. Esto puede ocurrir en la practica si un modo de falla lleva a una distribución
Weilbull truncada (una que hipotéticamente comience hacia la izquierda del tiempo t = 0) con
un parámetro de forma de B =2, como se observa en el grafico 12.7.
Grafico 12.7 Distribucion Weilbull truncada y Patrón C.
223
* El declive del patrón C parece estar bastante declinado en estos ejemplos. Sin embargo, se
debe tener en cuenta que el declive real depende del parámetro de escala Weilbull a. Que
puede ser medido en cualquier tiempo que vaya de semanas a décadas (o hasta siglos), de
modo que el declive del patrón C puede variar de bastante empinado a prácticamente recto.
* El patrón C no esta solo asociado con la fatiga. Por ejemplo, se encontró que son útiles para
las fallas de aislacion de los bobinados de ciertos tipos de generadores.
* Contrariamente, no todas las fallas relacionadas con fatiga responden necesariamente al
patrón de falla C.
Por ejemplo, si la curva P en el grafico 12.6 estuviera inclinada hacia el limite Sinferior, y la
curva Q estuviera inclinada hacia el limite R superior , la curva de frecuencia de falla estaría
inclinada notablemente hacia la derecha. Esto daría un parámetro de forma Weilbull mayor a
2, que tiende a una distribución normal y de ese modo da una curva de probabilidad
condicional que se asemeja al patrón B.
Por otro lado, si el limite S inferior esta por debajo del punto en el que el limite R superior se
vuelve asintótico, entonces la distribución de frecuencia desarrollará una “cola” larga a la
derecha. Esto corresponde a una distribución Weilbull donde B esta entre 1 y 2, lo que a su
vez genera el patrón de falla D.
Finalmente, la discusión de la pagina 159 mencionaba que un gran numero de factores
influencian en grado al cual las fallas por fatiga se desarrollan en rodamientos de bolas. Esto
haría muy amplio el alcance de cualquier distribucion, lo que a su vez llevaría a una curva de
probabilidad condicional prácticamente plana. Se debe agregar a esto la variedad de modos de
falla adicionales de rodamientos, enunciadas en la pagina 159 que presentan los mismos
síntomas que la fatiga , y la densidad de probabilidad general se vuelve totalmente
exponencial , lo que lleva a un patrón de falla E como ya hemos visto.
De modo que la fatiga podría manifestarse como patrón de falla B, C, D o hasta E.
Patrón de falla D
Como mencionamos anteriormente, el patrón de falla D es la curva de probabilidad
condicional con una distribución Weilbull cuyo parámetro de falla B es mayor que 1 y menor
que 2.
Patrón de falla F
El patrón F es quizás el más interesante, por dos razones:
* Es el único patrón donde la probabilidad de falla realmente disminuye con la edad (Aparte
de A que es un caso especial)
* Es el mas común de los seis patrones, como se mencionaba en la pagina 13.
Por estas razones, vale la pena explorar en mayor detalle los factores que dan nacimiento a
este patrón.
La forma del patrón de falla F indica que la mayor probabilidad de falla ocurre cuando el
equipo es nuevo, o apenas ha sido reparado. Este fenómeno se conoce como mortalidad
224
infantil, y tiene una gran variedad de causas. Estas se resumen en el grafico 12.8 y se discuten
en los párrafos subsiguientes.
Grafico 12.8: Causas de mortalidad infantil
Diseño
Los problemas de mortalidad infantil atribuibles al diseño ocurren cuando parte de un ítem es
simplemente incapaz de cumplir con el desempeño deseado, y por lo tanto tiende a falla justo
después que es puesto en servicio. Cuando afectan un bien existente, estos problemas solo
pueden ser resueltos con el rediseño, como discutimos en el capitulo 9. Pueden ser anticipados
a algún grado mediante:
* Utilización de tecnología comprobable. El autor encontró una compañía que profesaba
estar “en una carrera a toda prisa por ser segundos” en adoptar una nueva tecnología,
porque descubrió que ser primeros generalmente implica una inversión enorme en “eliminar
“errores del los equipos nuevos – una inversión involuntaria hecha en la forma de
inactividad de los equipos. Por otro lado, ser segundo puede ser competitivamente
desventajoso a largo plazo.
* Utilización de los equipos más simples posibles para cumplir la funcion requerida en la
premisa de que las partes que no existen no pueden fallar.
Fabrica e Instalación
La mortalidad infantil atribuible a la fabricación de equipos ocurre ya sea porque los
estándares de calidad de los fabricantes son muy flojos, o porque las partes involucradas han
sido mal instaladas. Estos problemas solo pueden ser resueltos reconstruyendo los montajes
afectados o reemplazando las partes afectadas. Dos maneras de anticipar estos problemas son:
* Implementar esquemas de SQA (Certificacion de Calidad del Proveedor) y PQA
(Certificacion de Calidad del Proyecto). Tales esquemas funcionan generalmente mejor que
son dirigidos por alguien diferente al contratista primario.
* requerir garantías extendidas, quizás con el soporte full time en planta de técnicos del
vendedor hasta que el equipo este trabajando como se espera por un periodo especifico.
225
Puesta en Servicio.
Los problemas de la puesta en servicio aparecen cuando el equipo es armado en forma
incorrecta, o cuando su puesta en marcha es incorrecta. Estos problemas se minimizan si se
tiene cuidado de que todas las personas involucradas en la puesta en servicio sepan
exactamente como se supone que la planta trabaje, y se les de tiempo suficiente para asegurar
que lo hace.
Mantenimiento de rutina
Un gran porcentaje de mortalidad infantil es causado por tareas de rutina de mantenimiento
que son innecesarias, o innecesariamente invasivas. Estas últimas son tareas que interrumpen
o perturban a los equipos, y sin necesidad provocan malestar en equipos básicamente estables.
La manera de evitar estos problemas es dejar de llevar a cabo tareas innecesarias, y en casos
donde el mantenimiento programado es necesario, seleccionar tareas que perturben los
equipos lo menos posible.
Mano de obra de mantenimiento
Claramente, si algo esta mal armado, se desmantelara rápidamente. Este problema solo puede
evitarse si aseguramos que cualquier persona que sea llamada para realizar una tarea
preventiva o correctiva esta entrenado y motivado para hacerlo correctamente desde un
principio.
Mortalidad Infantil y RCM
La discusión anterior discute que los problemas de mortalidad infantil generalmente se
resuelven por acciones de única vez más que por mantenimiento programado (con la
excepción de unos pocos casos donde puede ser viable utilizar tareas en-condición para
anticipar las fallas). Sin embargo, a pesar del rol pequeño que desempeña el mantenimiento de
rutina, la utilización de RCM para analizar un nuevo bien antes de ponerlo en servicio lleva a
reducciones sustanciales en la mortalidad infantil por las siguientes razones.
* Un estudio detallado del bien generalmente revela un número sorprendente de fallas de
diseño, que si n se corrigen, harán que sea imposible para el bien funcionar.
* Los obreros y operadores aprenden exactamente como se supone que funcione un bien, y de
esa manera tienen una inclinación menor a cometer errores que causen fallas.
* Muchas debilidades que de otra manera llevarían a fallas prematuras son identificadas y
tratadas antes de que el bien entre en servicio.
* El mantenimiento de rutina se reduce al mínimo esencial, lo que implica menos
intervenciones desestabilizantes, pero este mínimo esencial asegura que la vida temprana del
bien esta plagada de fallas que podrían haber sido anticipadas o previstas.
Patrón de falla A
Ahora esta generalmente aceptado que los patrones de falla A – la curva de la bañera- es
realmente una combinación de dos o mas patrones de falla diferentes, uno de los cuales
incluye la mortalidad infantil y el otro que muestra una probabilidad creciente de falla con la
edad. Algunos comentaristas incluso sugieren que la porción (plana) central de la bañera
constituye un tercer periodo de falla (casual) entre los otros dos, como vemos en el grafico
14.9.
226
Grafico 12.9 La vista clásica de “la bañera”
Esto significa que la falla de patrón A describe la probabilidad condicional de dos o más
modos de falla. Desde el punto de vista del manejo de fallas, cada una de estas debe ser
identificadas y tratadas a la luz de sus propias consecuencias, y de sus propias características
técnicas.
Se pueden obtener conclusiones similares sobre el patrón de falla B como se muestra en el
grafico 12.2. Esto es porque las fallas que se presentan entre los periodos 11 y 16 son
causadas por uso “normal” , mientras que las que ocurren entre los periodos 1 y 10 son
causadas por otros factores casuales que aun pueden causar que el propulsor se desgaste, pero
que lo haga mas rápido de lo normal.
Esto comienza a elevar un numero de interrogantes sobre el significado de estos patrones, que
se consideran extensamente en la siguiente parte de este capitulo.
12.2 Datos Técnicos Históricos
El Rol del Análisis Actuarial en Establecer Políticas de Mantenimiento.
Un número sorprendente de personas cree que las políticas de mantenimiento efectivas solo
pueden ser formuladas en la base de información histórica extensiva sobre fallas. Miles de
manuales y sistemas computarizados de registros de datos han sido instalados alrededor del
mundo en la base de esta creencia. También llevo a poner gran énfasis en los patrones de
falla descriptos en la parte 1 de este capitulo. (El hecho de que la curva de la bañera aparezca
en prácticamente todo texto significativo de manejo de mantenimiento es testimonio de la fe
prácticamente mítica que ponemos en la relación entre edad y falla)
Aun así, desde el punto de vista del mantenimiento estos patrones están cargados de
dificultades prácticas, problemas y contradicciones. Algunos de estas se resumen abajo, bajo
los siguientes títulos:
* Complejidad
* Tamaño de prueba y evolución
* Repote de falla
* La ultima contradicción.
Complejidad
La mayoría de las plantas industriales consisten de cientos, sino miles de diferentes bienes.
Estos están formados por docenas de diferentes componentes, que entre ellos exhiben todo
aspecto extremo o intermedio del comportamiento de confiabilidad. Esta combinación de
227
complejidad y diversidad significa que simplemente no es posible desarrollar una descripción
analítica completa de las características de confiabilidad de una planta en su totalidad- o de
cualquier equipo principal dentro de la planta.
Inclusive al nivel de fallas funcionales individual, no es fácil realizar un análisis comprensivo.
Esto es porque muchas fallas funcionales son causadas no por dos o tres, sino por dos o tres
docenas de modos de falla. Como resultado, mientras puede resultar bastante fácil encuadrar
la incidencia de las fallas funcionales. Es una toma principalmente estadística aislar y
describir el modo de falla que se aplica a cada uno de los modos de falla que entra en el sobre
de cada falla funcional. Lo que es más. Muchos modos de falla tienen síntomas físicos
virtualmente idénticos, que los hacen fáciles de confundir con los otros. Esto a su vez hace
prácticamente imposible realizar el análisis actuarial.
Tamaño y Evolución de la Muestra.
Los procesos industriales de gran tamaño generalmente poseen uno o dos bienes de un
determinado tipo. También tienden a ser puestos en operación en series, mas que
simultáneamente. Esto significa que el tamaño de las pruebas tiende a ser demasiado pequeño
para que los procedimientos estadísticos sean convincentes. Para los bienes nuevos, que
incluyen tecnología de punta, siempre son demasiado pequeños.
Estos bienes están también generalmente en un estado continuo de evolución y modificación,
en parte en respuesta a nuevos requerimientos operativos, y en otra parte como un intento de
eliminar fallas que tengan consecuencias serias o que sean muy costosas de prevenir. Esto
significa que el monto de tiempo que un bien utiliza en una configuración dada es
relativamente corto.
De modo que los procedimientos actuariales, no son de mucho uso en estas situaciones porque
el banco de datos es muy pequeño y esta cambiando constantemente. (Como discutimos mas
adelante, la principal excepción son las plantas que utilizan grandes números de componentes
idénticos de una manera más o menos idéntica)
Reporte de fallas.
El problema de analizar los datos de las fallas es mas complicado por diferencias en las
políticas de reportes de una organización a otra. Un área de confusión es la diferencia entre
falla potencial y funcional.
Por ejemplo, en el ejemplo de las ruedas discutido en las páginas 160 y 161, una organización
puede clasificar y registrar las ruedas como “falladas” cuando se las retira para recauchetar
una vez que llanta bajo de 3 mm de grosor. Sin embargo, mientras no se permita un grosor
menos que 2 mm, esta “falla” es realmente una falla potencial, como se la define en el
capitulo 6. De modo que otras organizaciones pueden elegir clasificar esta primera acción de
retirar la rueda como “precaución”, porque las ruedas realmente no fallaron en servicio, o
inclusive hasta “programada”, porque el cambio de ruedas esta: programado” para la primera
oportunidad que se presente una vez que la falla potencial ha sido descubierta. En ambos de
estos últimos casos, el cambio de ruedas puede no ser ni siquiera considerado falla.
Por otro lado, si por alguna razón el grosor de la llanta baja de los 2 mm, no hay duda que la
rueda ha fallado.
228
Diferencias similares pueden ser causadas por las diferencias en las expectativas de
desempeño. El capitulo 3 definía una falla funcional como la inhabilidad de un ítem para
alcanzar un nivel de desempeño deseado, y estos estándares pueden diferir para el mismo bien
si el contexto operativo es diferente.
Por ejemplo, la pagina 50 da el ejemplo de una bomba que falla si no es capaz de bombear
800 litros por minuto, en un contexto y 900 litros/min. En otro diferente.
Esto muestra que lo que es una falla en una organización – o hasta en una parte de una
organización – puede no ser una falla en otra. Esto puede resultar en dos grupos diferentes de
datos de fallas para dos ítems aparentemente idénticos.
Mayores diferencias en la interpretación y presentación de datos de fallas, pueden ser
causadas por las diferentes perspectivas de los fabricantes y usuarios de un bien. El fabricante
generalmente considera como responsabilidad propia el entregar un nivel garantizado de
desempeño bajo condiciones específicas de stress. En otras palabras el garantiza una
capacidad de diseño básica. Y con frecuencia lo hace condicional al seguimiento de
determinadas rutinas de mantenimiento.
Por otro lado hemos visto que muchas fallas ocurren, porque los usuarios operan los equipos
superando sus capacidades de diseño. (En otras palabras el “quiero” excede el “puedo”, como
discutíamos en las paginas 61 - 64.) Mientras los usuarios se inclinan a incorporar datos sobre
estas fallas en sus propios registros históricos, los fabricantes son generalmente reacios a
aceptar responsabilidad por ellos. Esto lleva a muchos fabricantes a “censurar” fallas causadas
por errores de operación por datos de fallas. Como Nowlan and Heap 1978 lo expresaron, el
resultado es que los usuarios hablan de lo que realmente vieron, mientras que los fabricantes
hablan de lo que deberían haber visto.
La ultima contradicción (El acertijo de Resnikoff)
Un tema que confunde el asunto de la historia técnica es el hecho de que, si estamos
recolectando datos sobre fallas, debe ser porque no las estamos previniendo. Las implicancias
de esto están resumidas estrictamente por Resnikoff en el siguiente enunciado.
“La adquisición de información considerada sumamente necesario para los diseñadores de
políticas de mantenimiento – la información sobre fallas criticas – es en principio inaceptable,
y es evidencia de la falla del programa de mantenimiento. Esto es así porque las fallas criticas
implican una perdida potencial (en muchos casos certera) de vida, pero no hay grado de
perdida de vida que sea aceptable para (ninguna) como precio de la información sobre
fallas para ser utilizada en el diseño de políticas de mantenimiento. De modo que el
diseñador de políticas de mantenimiento enfrenta el problema de crear un sistema para el cual
la perdida de vida esperada será menor a una sobre la vida útil planificada para el bien. Esto
significa que en practica y en teoría, la política debe ser diseñada, sin utilizar datos
experimentales otorgados por las fallas que esta política pretende evitar”
A pesar de los mejores esfuerzos del diseñador de políticas de mantenimiento, si ocurriera una
falla critica, Nowlan and Heap, hacen los siguientes comentarios sobre el análisis actuarial.
“El desarrollo de una relación confiabilidad- edad, como lo expresa una curva reprensando
la probabilidad condicional de falla, requiere un monto considerable de datos. Cuando la
falla es una con serias consecuencias, este cuerpo de datos no existirá, ya que se deben haber
tomado necesariamente acciones preventivas luego de la primera falla. Por eso el análisis
229
actuarial no puede ser utilizado para expresar los limites de edad de mayor importancia –
los necesarios para proteger la seguridad operativa”
En este contexto, se debe tener en cuanta los comentarios realizados en la pagina 139 sobre
los limites de seguridad y datos de prueba. Estos datos son generalmente tan escasos que el
límite de vida segura (si lo hubiera) se establece al dividir los resultados de pruebas por algún
factor conservador arbitrario más que por las herramientas del análisis actuarial.
Las mismas limitaciones se aplican a fallas que tienen consecuencias operativas realmente
serias. La primera vez que se presenta una falla de este tipo, se tomas decisiones inmediatas
sobre acciones preventivas o correctivas, sin esperar por los datos necesarios para llevar a
cabo un análisis actuarial.
Todo esto nos lleva a la mayor contradicción concerniente a la prevención de fallas con serias
consecuencias, y la información histórica sobre esas fallas: Que el mantenimiento preventivo
exitoso implica impedir la recolección de datos históricos que consideramos necesitar para
decidir que mantenimiento preventivo deberíamos llevar a cabo.
Esta contradicción se aplica en reversa al otro extremo de la escala de consecuencias. Las
fallas con consecuencias menores tienen permitido ocurrir, justamente porque no son tan
importantes. Como resultado habrá grandes cantidades de datos históricos correspondientes a
estas fallas, porque no importan mucho, lo que implica que habrá muchísimo material para
llevar a cabo un análisis actuarial preciso. Esto puede revelar algunos límites de edad, sin
embargo, porque las fallas no son tan importantes, es muy poco probable que las tareas de
restauración programada o de descarte programado resultantes tengan una buena relación
costo-efectividad. De modo que aunque el análisis actuarial de esta información puede ser
preciso, también puede ser una perdida de tiempo.
El uso principal del análisis actuarial en mantenimiento es estudiar los problemas de
confiabilidad en un piso medio, donde hay una relación incierta entre la edad y las fallas que
tienen consecuencias económicas significativas. Estas fallas caen en dos categorías.
* Las asociadas con grandes números de ítems idénticos, cuyas funciones son para toda
intención y propósito, idénticas. Y cuyas fallas solo pueden tener un impacto menor cuando se
las toma por separado, pero cuyo efecto acumulativo puede ser una consideración de costos
importante.
Las luces de la calle, los componentes de un vehiculo (especialmente los que son partes de
una flota), y muchos de los componentes utilizados por las fuerzas armada, y en las industrias
de distribución de electricidad, gas y agua, son ejemplo de ítems que caen en esta categoría.
Los ítems de este tipo son utilizados en cantidades necesarias para que sea posible llevar a
cabo un análisis actuarial, y se justifique los estudios detallados de costo beneficio.
* La segunda categoría de fallas que hacen merito a la investigación actuarial son las que son
menos comunes, pero aun se las considera relacionadas a la edad, y en las que ambas, el costo
del mantenimiento preventivo y el costo de la falla son muy altos. Como mencionábamos en
la página 134, esto se aplica especialmente a las probabilidades de falla gradualmente
crecientes, tipificadas por el patrón de falla C.
El camino hacia adelante
Los párrafos anteriores indican que salvo por un numero limitado de situaciones
especializadas, el análisis actuarial de la relación entre la edad operativa y la falla, es de muy
poco uso desde el punto de vista del manejo de mantenimiento. Quizás la más seria
característica de la información histórica es que tiene sus raíces en el pasado, mientras que
los conceptos de anticipación y prevención están necesariamente enfocados en el futuro.
230
De modo que se necesita un acercamiento fresco a este asunto- uno que cambie el enfoque del
pasado al futuro. En realidad RCM es solo un método.
Primero, trabaja con los problemas específicos identificados anteriormente de la siguiente
manera:
* Definiendo falla: comenzando con la definición de funciones, y el nivel de desempeño de
cada bien, RCM nos permite definir con gran precisión a que nos referimos por “fallado”.
Distinguiendo claramente entre capacidad inherente, y desempeño deseado; y entre fallas
potenciales (el estado de falla) y fallas funcionales (el estado fallado), elimina toda confusión.
* Complejidad:
RCM divide cada bien en sus funciones, y cada funcion en fallas
funcionales, y recién ahí identifica cada modo de falla que causa las fallas funcionales. Esto
provee un marco estratégico ordenado dentro del cual considerar cada modo de falla. Esto a
su vez los hace mucho mas fáciles de manejar que si tuviéramos que comenzar al nivel de
modos de falla. (Que es el punto de inicio de los más clásicos FMEA y FMCA)
* Evolución: Al proveer un registro comprensivo de todos los niveles de desempeño, las fallas
funcionales y modos de falla asociados a cada bien RCM hace posible determinar
rápidamente como puede afectar al bien cualquier cambio en el diseño o en el contexto
operativo, y revisar políticas de mantenimiento y procedimientos solo en las áreas donde los
cambios necesiten ser llevados a cabo.
* La ultima contradicción: RCM trabaja con la última contradicción de diferente manera.
Primero, obligándonos a completar la planilla informativa descripta en el capitulo 4, enfoca su
atención en que podría suceder. Contrasta esto con el énfasis actuarial de que ha sucedido. En
segundo lugar, preguntando como y cuanto importa cada falla, como se lo establece en el
capitulo 5, asegura que nos enfoquemos en las fallas que tienen serias consecuencias, y que
perdamos tiempo en las que no las tienen. Finalmente adoptando el método estructurado para
la selección de tareas proactivas y acciones de default descriptas en los capitulos 6-9 , RCM
asegura que hacemos lo necesario para prevenir que se presenten fallas serias , y tanto como
sea humanamente posible , evitar tener que analizarlas históricamente.
En segundo lugar, el proceso de RCM enfoca la atención en la información necesaria para
respaldar decisiones específicas. No nos solicita recolectar un montón de datos con la
esperanza de que eventualmente nos serán de utilidad. Este punto se discute en mayor detalle
en la sección siguiente de este capitulo.
Usos específicos de datos al formular Políticas de mantenimiento.
A pesar de todos los comentarios anteriores, la aplicación exitosa de RCM requiere de una
gran cantidad de información. Como explicamos extensamente en los capitulos 2 al 9, mucha
de esta información es descriptiva o cualitativa, particularmente en la planilla informativa de
RCM. Sin embargo teniendo en cuenta el énfasis puesto en temas cuantitativos, el grafico
12.1 resume los principales tipos de datos cuantitativos utilizados para respaldar diferentes
etapas del proceso de decisiones de mantenimiento. Lo hace bajo los siguientes títulos:
* Dato: La pieza de información de interés.
* Aplicación: Un breve resumen dado al uso de cada dato. Se debe tener en cuenta que
algunos son utilizados en conjunción con otros para alcanzar una decisión final, y que muchos
son solo utilizados cuando los datos cualitativos no son lo suficientemente fuertes para hacer
posible una decisión intuitiva.
* Comentarios: donde es posible encontrar la mayoría de los datos; En algunos casos son
establecidos por los usuarios del bien.
* Paginas: hace referencia a las páginas de este libro donde el uso de cada dato se discute en
mayor grado.
231
DATOS
Niveles deseados de
desempeño
APLICACION
Estos niveles definen los
objetivos de mantenimiento para
cada bien
COMENTARIOS
Establecido por los usuarios del
bien ( y por reguladores de
normas de seguridad y
medioambiente)
PAGINAS
22-27
47-52
EVALUANDO CONSECUENCIAS DE FALLAS OPERATIVAS Y NO OPERATIVAS
Tiempo de Inactividad
Costo de pérdida de
producción.
Evaluar si la falla afectara la
producción/ operaciones, y en que
grado
Utilizado con el tiempo de
inactividad para evaluar el costo
total de cada falla que afecte las
operaciones.
No es lo mismo que MTTR (
tiempo medio para reparación)
76
Solo necesario cuando la relación
costo efectividad del
mantenimiento no es
intuitivamente obvia.
105-106
Costo de reparación
Utilizado con el MTBF para
evaluar la efectividad del
mantenimiento
Solo necesario cuando la relación
costo efectividad del
mantenimiento no es
intuitivamente obvia.
(solo para fallas operativas y no
op.)
108- 109
Tiempo transcurrido entre
fallas
Utilizado con el tiempo de
inactividad , costo de producción
perdida y costo de reparación para
comparar el costo de
mantenimiento, con el costo de la
falla
Solo necesario cuando la relación
costo efectividad del
mantenimiento no es
intuitivamente obvia
( Solo para fallas operativas y no
op)
105-106
108-109
EVALUANDO CONSECUENCIAS DE FALLAS DE SEGURIDAD Y MEDIOAMBIENTALES.
Riesgo tolerable de una
falla
Utilizado para evaluar si el
mantenimiento programado es
conveniente para fallas que
pueden tener efectos adversos en
la seguridad o medioambiente
Realizado por los usuarios de los
bienes/ posibles victimas en una
base intuitiva
98- 101
ESTABLECIENDO LAS FRECUENCIAS DE LAS TAREAS DE CONDICIÓN
Falla Potencial
Punto en el que una falla
intermitente se vuelve detectable
Basado en la naturaleza de la
curva P-F , y las técnicas de
monitoreo
144- 145.
Intervalo P-F
Usado para establecer la
frecuencia de las tareas de
condición
Con que frecuencia falla (por lo
general no se registra
formalmente)
145- 149
162-165
DATOS
APLICACION
COMENTARIOS
PAGINAS
FRECUENCIA DE TAREAS DE DESCARTE Y RESTAURACIÓN PROGRAMADAS
Tiempo en el que hay un
aumento rapido en la
probabilidad condicional
de falla.
Se utiliza para establecer la
frecuencia de la mayoria de las
tareas de descarte y restauración
programadas
Vida Util: Se basa en registros
formales si estan disponibles, por
lo general se basa en un consenso
entre las personas que mas
conocen el equipo.
236- 238
Análisis actuarial entre la
relacion entre la edad y la
falla.
Optimizar los intervalos de
descarte/ restauración para
grandes numeros de partes
indenticas cuya falla se crea que
este relacionada con la edad, o
para patrones costosos de fallas
del tipo C.
Solo es necesario con el 1-2% de
los modos de fallas en la mayoria
de las industrias, se necesitan
datos historicos extensivos y
confiables, se utiliza para modos
de fallas que tienen consecuencias
operacionales y no operacionales
253- 254
232
CONSECUENCIAS OCULTAS DE LAS FALLAS Y FRECUENCIA DE TAREAS DE BÚSQUEDA
DE FALLAS
Probabilidad tolerable de
una falla multiple
Tiempo transcurrido entre
una falla de una funcion
protegida
Se utiliza para establecer las
políticas de mantenimiento para
los sistemas protegidos
Se utiliza junto a la “probabilidad
tolerable de una falla múltiple”
para determinar la disponobilidad
deseada de un dispositivo de
protecccion
Disponibilidad deseable
del dispositivo de
proteccion
Se utiliza junto a MTBF del
dispositivo de protección para
establecer el intervalo de la tarea
de búsqueda de falla.
Tiempo transcurrido entre
fallas de un dispositivo de
proteccion
Se utiliza con la capacidad
deseable para establecer el
intervalo de la tarea de búsqueda
de fallas
Se realizan por el usuario del
equipo, solo se utiliza cuando se
esta por hacer un análisis riguroso
Se basa en el pasado y en la
anticipación del futuro
rendimiento de la funcion
protegida. Solo se utiliza para
apoyar un análisis riguroso, no se
necesita en un enfoque intuitivo
(lea a continuación)
Deriva de las dos variables
anteriores si es que la tarea de
frecuencia se basa en un análisis
riguroso, de otra manera se
establece directamente por los
usuarios del equipo en base a un
enfoque intuitivo de los riesgos de
fallas multiples.
118- 120
179- 182
Se basa en los registros de las
fallas encontrados si estan
disponibles, sino, se deberia
utilizar cualquier otra fuente
apropiada de datos, pero a la vez
se deberia iniciar inmediatamente
una base de datos adecuada
175- 182
179- 182
118
175- 179
Tabla 12.1: Resumen de datos claves de respaldo de decisiones de mantenimiento.
Bajo los siguientes títulos se revisa un número de puntos finales concernientes a los datos
cuantitativos.
* Información gerencial
* Nota sobre MTBF
* Historia Técnica.
Información Gerencial:
El cuadro 12.1 solo describe datos que se utilizan directamente para formular políticas
designadas para tratar modos de falla específicos. No incluye datos rescatados para hacer un
seguimiento del desempeño general de la funcion de mantenimiento, usualmente clasificada
como “información gerencial”. Ejemplos de este tipo de información son: las estadísticas de
disponibilidad una planta, estadísticas de seguridad y la información de gastos en
mantenimiento comparada con los presupuestos.
Uno de los aspectos esenciales de la gerencia de mantenimiento es monitorear es desempeño
general de la funcion de mantenimiento. Este tema se discute en mayor detalle en el capitulo
14.
Una nota sobre MTBF:
En los tiempos recientes el concepto “tiempo medio entre fallas” parece haber adquirido una
estatura que es desproporcionada con su valor real en la toma de decisiones de
233
mantenimiento. Por ejemplo, no tiene nada que ver con la frecuencia de tareas en-condición, y
nada que ver con la frecuencia de la restauración programada y las tareas de descarte
programadas, sin embargo tiene ciertos usos específicos. La tabla 12.1 menciona tres de estos:
* Establecer la frecuencia de las tareas de búsqueda de fallas.
* Ayudar a decidir si el mantenimiento programado es beneficioso en el caso de los modos de
falla que solo tienen consecuencias operativas y no-operativas. (En otras palabras nos ayudan
a decidir si tales tareas necesitan o no ser realizadas, pero no con que frecuencia necesitan ser
realizadas.)
* Ayudar a establecer la disponibilidad deseada de un dispositivo de protección.
En el primer caso, el MTBF siempre es necesario para tomar la decisión apropiada, pero en
los otros dos, si la naturaleza y consecuencias de las fallas son tales que se debe llevar a cabo
un análisis riguroso.
El MTBF también tiene un número de usos fuera del campo de la formulación de políticas de
mantenimiento:
* En el campo del diseño: para llevar a cabo una justificación de costos detallados de una
modificación propuesta, como mencionamos brevemente en la pagina 195.
* En el campo de la procuración: Evaluar la confiabilidad de dos componentes diferentes que
sean candidatos para la misma aplicación, como se mencionaba en la pagina 241.
* En el campo del manejo de información: Como discutimos en el capitulo 14, una forma de
evaluar la efectividad general de un programa de mantenimiento es hacer el seguimiento del
tiempo medio entre fallas inanticipadas de un bien.
Una investigación más profunda de estos dos asuntos esta fuera del alcance de este libro. La
tercera es tratada en el capitulo 14.
Historia Técnica
En forma conjunta con los comentarios anteriores sobre el MTBF, la tabla 12.1 puede ser
utilizada para ayudar a decidir que tipo de datos realmente necesitan ser registrados en un
sistema de registros histórico.
Quizás la información más importante que necesita ser registrada en una base formal es que
se encuentra cada vez que se realiza una tarea de búsqueda de fallas.
Específicamente, necesitamos registrar si el ítem resulto ser totalmente funcional, o si estaba
en un estado de falla. Tales registros nos permiten determinar el tiempo medio entre fallas del
dispositivo de protección (Mtive en la pagina 177). Y de ahí controlar la validez del intervalo
de búsqueda de fallas correspondiente. Esta información debe ser registrada para todas las
funciones ocultas- en otras palabras para todos los dispositivos de protección que no son a
prueba de fallas.
En adición a las funciones ocultas, la tabla 12.1 identifica dos áreas más donde los datos
históricos de falla pueden ser utilizados para tomar (o validar) decisiones sobre las políticas
de mantenimiento, de la siguiente manera:
234
* La presencia de modos de falla que tienen consecuencias operativas significantes. Esta
información puede ser utilizada para computar el tiempo medio entre fallas para evaluar el
costo-efectividad del mantenimiento programado. Sin embargo, como mencionamos en la
tabla 12.1, esto solo necesita ser llevado a cabo si los costos-beneficios de las acciones
proactivas no son intuitivamente obvios. Si es así, tales acciones – ya sea mantenimiento
programado o rediseño- serian tomadas y por lo tanto no habría fallas para registrar (excepto
como fallas potenciales si la acción proactiva es una tarea en-condición.)
La tabla 12.1 menciona que en raros casos, también puede ser beneficioso capturar estos datos
para llevar a cabo un análisis actuarial completo con la visión de optimizar la frecuencia de
restauración programada y de descarte programado.
* El tiempo medio entre fallas de una funcion protegida (MTED en la pagina 179.) Este es
necesario si se debe establecer un intervalo de búsqueda de fallas con una base de rigor. Puede
ser determinado al registrar el número de veces que se requiere el funcionamiento del
dispositivo de protección por la falla de la funcion protegida.
Por ejemplo, se puede realizar un registro cada vez que la sobre presurización de una caldera
provoca que la válvula de alivio se ponga en funcionamiento.
Si se van a capturar cualquiera de estos datos, el sistema de reporte de fallas debe ser diseñado
para identificar los datos requeridos – generalmente el modo de falla- tan precisamente como
sea posible. Esto puede llevarse a cabo requiriendo a la persona que realiza la tarea (o que
descubre la falla en el caso de búsqueda de fallas) que:
* Complete un formulario diseñado que será utilizado para ingresar los datos en un sistema de
registros manual o computarizado, o
* Ingresar los datos directamente si se utiliza un sistema de computación no-líen para
ingresarlos.
En la mayoría de las organizaciones los registros pueden almacenarse en:
* Una base de datos simple basada en la computadora
* Un sistema de registros históricos de mantenimiento computarizado o manual.
El diseño de tales sistemas también se encuentra más allá del alcance de este libro. Sin
embargo, la tabla 12.1 que si los sistemas de registro de historia técnica son utilizados para
capturar datos específicos por razones especificas, mas que registrar absolutamente todo con
la esperanza de que nos sea de utilidad, se vuelven contribuyentes útiles y poderosos para la
practica del manejo de mantenimiento, mas que los costoso elefantes blancos que muchos
tienden a ser.
235
13. Aplicar el Proceso de RCM
13.1 ¿Quien Sabe?
Las siete preguntas básicas que conforman el proceso de RCM, han sido consideradas
extensamente en los capitulos 2 al 10. Luego de examinar mas profundamente la información
necesaria para responder estas preguntas, el capitulo 12 concluye que en la mayoría de las
industrias, los registros históricos son raramente lo suficientemente comprensivos para ser
utilizados para este propósito por si mismos. Pero la pregunta debe ser respondida de todas
maneras, de modo que debe obtenerse de algún lugar la información requerida.
Con mas frecuencia que no, “algún lugar” tiende a ser “una persona” – alguien que tiene
conocimiento intimo y experiencia sobre el bien en consideración. Hay también ocasiones
cuando el proceso de acumulación de información revela puntos de vista muy diferentes, pero
deben llegar a un acuerdo antes de tomas decisiones.
Secciones posteriores de este capitulo como los pequeños grupos pueden ser utilizados para
reunir la información, reconciliar distintas visiones y tomas las decisiones. Sin embargo antes
de considerar estos grupos, esta parte de este capitulo revisa la información necesaria para
responder cada pregunta, y considera quien tiene mas posibilidades de poseerla. Lo hace en
referencia a secciones anteriores de este libro, donde las preguntas se analizaron en detalle.
* ¿Cuales son las funciones y nivel de desempeño correspondientes del bien en su contexto
operativo presente?
RCM se basa en la premisa de que todo bien es adquirido para cumplir una funcion o
funciones especificas, y que mantenimiento significa hacer lo que sea necesario para asegurar
que continué desempeñando cada funcion para satisfacción de sus usuarios. En la mayoría de
los casos, los representantes más importantes de los usuarios son los jefes de operaciones y de
gerentes de producción. Para asegurar que RCM genere un programa de mantenimiento que
produzca lo que estos gerentes quieren, necesitan participar activamente en todo el proceso.
(En áreas como ser seguridad, higiene o medioambiente, también se puede necesitar el
consejo especialistas adecuados.)
Sin embargo, también hemos visto que la capacidad inherente del bien – lo que este puede
hacer – es lo máximo que mantenimiento puede otorgar. El personal de Mantenimiento y
Diseño, generalmente a nivel de supervisión, tienden a ser los custodios de esta información,
de modo que ellos también son parte clave de este proceso.
Si esta información se comparte en un foro simple, los mantenedores comienzan a apreciar
más claramente que es lo que los operadores están tratando de alcanzar. Mientras que los
usuarios ganan un claro entendimiento de lo que el mantenimiento puede y no otorgar.
* ¿De que modo falla en cumplir su funcion?:
El ejemplo en la pagina 51 mostraba porque es esencial que los niveles de desempeño
utilizados para juzgar las fallas funcionales deben ser establecidos por personal de
mantenimiento y de operaciones trabajando juntos.
236
* ¿Que causa cada falla funcional?
El capitulo 4 explicaba como el mantenimiento es realmente manejado a nivel de modos de
falla. Continúa enfatizando la importancia de identificar las causas de cada falla funcional. El
ejemplo en la pagina 72 se mostraba como estas causas son generalmente mejor entendidas
por las personas de piso y de supervisión que trabajan cerca de cada maquina (especialmente
los operarios y técnicos que tienen que diagnosticar y reparar cada falla. En el caso de equipos
nuevos, una fuente valida de información sobre lo que puede fallar es un técnico de campo
empleado por el proveedor y que ha trabajado en el mismo equipo, o en equipos similares.
* ¿Que pasa cuando se presenta cada falla?
La parte 5 del capitulo 4 enlista una amplia variedad de información que necesita ser
registrada como efectos de falla. Estas incluyen:
- La evidencia de que la falla se ha presentado, que se obtiene la mayoría de las veces de los
operadores de los equipos.
- El monto de tiempo que la maquina pasa generalmente fuera de funcionamiento cada vez
que la falla se presenta, nuevamente obtenida por operadores o supervisores de primera línea.
- Los riesgos asociados con cada falla, que pueden necesitar consejos de un especialista
(especialmente en lo concerniente a temas tales como ser la toxicidad o inflamabilidad de
tóxicos, o los riesgos asociados con ítems mecánicos como ser vasos de presión, equipamiento
de elevación o componentes rotatorios de gran tamaño.
- Que debe hacerse para reparar la falla, que generalmente se obtiene de los técnicos o
encargados de trabajo manual, que llevan a cabo las reparaciones.
* ¿De que modo importa cada falla?
Las consecuencias de las fallas se discuten extensamente en el capitulo 5 y se resumen en las
4 preguntas en la cabeza de la figura 10.1 en las paginas 200/201.
La evaluación de las consecuencias de fallas solo puede llevarse a cabo en consulta con el
personal de operación/producción, por las siguientes razones:
* Consecuencias de Seguridad y medioambientales: Si los efectos de un modo de falla se
explican con el suficiente detalle, es generalmente fácil evaluar si puede llegar a afectar la
seguridad o el medioambiente. La principal dificultad en esta área reside en decidir que nivel
de riesgo es aceptable. La discusión sobre quien debería evaluar el riesgo en la pagina 101
sugiere que esta decisión debería ser realizada por un grupo que consista en la posible
victimas de la falla, las personas que tendrán la responsabilidad si esta llegara a suceder, y si
fuera necesaria, un experto en las características especificas de la falla.
* Fallas ocultas: El análisis de las funciones ocultas requiere al menos cuatro piezas de
información, especialmente si se utiliza un método de rigor para determinas los intervalos de
las tareas de búsqueda de falla (ver capitulo 8). Esta información se resume abajo:
237
- Evidencia de la falla: la primera pregunta en el Diagrama de Decisión de RCM, pregunta si
la pérdida de funcion causada por este modo de falla se volverá evidente para el grupo de
operadores bajo circunstancias normales. Esta pregunta solo puede ser respondida con
seguridad si consultamos al grupo de operadores responsables.
- Circunstancias normales: Como se explica en la pagina 126 diferentes personas pueden dar
significados también diferentes al termino “normal” en la misma situación, entonces seria
sabio formular esta pregunta en precedía de operarios y supervisores.
- Probabilidad aceptable de una falla múltiple: Esto también debe ser establecido por el grupo
discutido en la pagina 101.
- El tiempo transcurrido entre fallas de una funcion protegida: este es necesario si la
disponibilidad deseada de un dispositivo de protección será determinado en una base de rigor.
Si esta información no ha sido registrada en el pasado, puede ser obtenida preguntando a los
operadores de los equipos que tan seguido se requiere que el dispositivo de protección opere
por la falla de una funcion protegida.
*Consecuencias operativas: Una falla tiene consecuencias operativas si afecta el
rendimiento, la calidad del producto o la atención al cliente, o si lleva a un aumento en los
costos diferentes a los costos directos de reparación. Claramente las personas que están en la
mejor posición para evaluar estas consecuencias son los jefes y supervisores de operaciones,
quizás con la ayuda de los responsables de costos.
* Consecuencias no- operativas: las personas que generalmente están en la mejor posición
para evaluar los costos directos de reparación son los supervisores de mantenimiento de
primera y segunda línea.
* ¿Que puede hacerse para prevenir o predecir cada falla?
La información necesaria para evaluar la viabilidad técnica de diferentes tipos de tareas
proactivas se discutió extensamente de los capitulos 6 al 9, y las consultas claves se resumen
en la pagina 205. Si hay datos actuariales claros para proveer respuestas, las preguntas deben
de nuevo ser respondidas en base al juicio y la experiencia, de la siguiente manera:
* Tareas en- condición: Las páginas 154 y 155 resaltaban que importante es considerar
tantas fallas potenciales como sea posible cuando se busquen tareas en condición. Las
posibilidades de monitoreo van desde sofisticadas técnicas de monitoreo de condición
monitoreo de calidad del producto y de efectos primarios, hasta los sentidos humanos,
debemos consultar a los operadores, supervisores, y si fuera necesario a los especialistas en
las diferentes técnicas.
Un grupo similar necesita considerar la duración y consistencia de los intervalos P-F
asociados, como se explicaba en las páginas 164 y 165.
El monto de tiempo necesario para evitar las consecuencias de la falla (en otras palabras, el
intervalo P-F neto) esta establecido conjuntamente por los supervisores de operaciones y
mantenimiento.
238
* Restauración programada y Descarte Programado: En la ausencia de datos históricos
adecuados, las personas que tienen mayor tendencia en saber si un modo de falla esta
relacionado a la edad, y de ser así, cuando hay un punto en el que haya un rápido incremento
en la probabilidad condicional de falla, son nuevamente los operadores y supervisores que
están cerca de los equipos.
Si es posible o no restaurar la resistencia a la falla original del bien, es generalmente decidido
por el supervisor de mantenimiento, o en casos dudosos, por especialistas técnicos.
* ¿Que sucede si no se logra encontrar una tarea proactiva apropiada?
Las dos acciones de default que necesitan consideración activa son la búsqueda de fallas y el
rediseño:
* Búsqueda de fallas: si la frecuencia de una tarea de búsqueda de fallas se va a establecer
sin llevar a cabo un análisis riguroso del sistema protegido, la disponibilidad deseada del
dispositivo de protección debe ser determinada por un grupo del tipo descrito en la pagina
101.
Ante la ausencia de registros formales, el MTBF del dispositivo de protección puede ser
derivado inicialmente ya sea consultando al fabricante del mismo, o preguntarle a alguien que
haya realizado cualquier control funcional en el pasado que se encontró al realizar estos
controles. Como se mencionaba en la página 183, este es generalmente un operador o
mantenedor.
Los encargados de trabajos manuales en mantenimiento y los supervisores son generalmente
las personas mejor calificadas para evaluar si es posible llevar a cabo una tarea de búsqueda
de fallas de acuerdo al criterio establecido en la pagina 185.
* Rediseño: La cuestión del rediseño se discute extensamente en el capitulo 9. Se debe tener
en cuanta que el proceso formal de RCM solo tiene como fin identificar situaciones donde el
rediseño puede llegar a ser obligatorio o deseable. Los grupos de revisión de RCM no
deberían intentar desarrollar nuevos diseños durante las reuniones de RCM por dos razones:
- El proceso de diseño requiere de habilidades que usualmente no están presentes en un Forum
de RCM.
- Si se hace correctamente, desarrollar hasta un nuevo diseño implica un monto de tiempo
importante. Si ese tiempo se utiliza en las reuniones de RCM, hará más lento y puede llegar a
paralizar el resto del programa. (Esto no pretende sugerir que los diseñadores no deberían
consultar a los usuarios y mantenedores de los bienes – solo que no debería hacerse como
parte del proceso de revisión de RCM.)
Los párrafos anteriores demuestran que es imposible para una persona, o hasta para un grupo
de personas de un departamento aplicar el proceso de RCM por si solos. La diversidad de la
información necesaria y la diversidad de las personas de las cuales esta información se debe
obtener, significa que esto solo puede ser llevado a cabo en la base de consultas extensas y de
cooperación, especialmente entre personal de mantenimiento y de producción y operaciones.
El modo más eficiente de organizar esto es organizar para que las personas claves apliquen el
proceso en grupos reducidos.
239
13.2 Grupos de Revisión de RCM
A la luz de los temas surgidos en la parte 1 de este capitulo, ahora consideramos quien debería
participar en un típico grupo de revisión de RCM, lo que cada grupo hace realmente, y lo que
los participantes obtienen de este proceso.
Quien debería participar?
Las personas mencionadas con mayor frecuencia en la parte 1 de este capitulo eran los
supervisores de primera línea, operadores y encargados del trabajo manual. Esto sugiere que
un típico grupo de revisión de RCM debería incluir las personas que observamos en
Error!
Facilitador
Supervisor de Ingeniería
Supervisor de
Operaciones
Responsable de Trabajado
Manual
Operador
Especialista Externo ( si fuera necesario)
(Tecnico o de Proceso)
.Grafico 13.1 Un grupo típico de revisión de RCM.
En la practica, los lugares de cada grupo no necesitan ser llenados con exactamente las
mismas personas que ilustra el grafico 13.1. El objetivo es reunir un grupo que pueda proveer
la mayor parte, sino toda la información necesaria descripta en la parte 1 de este capitulo.
Estas son las personas que tienen el conocimiento más amplio sobre el funcionamiento de
bien, y del proceso del cual forma parte. Para asegurar que se consideran todos los diferentes
puntos de vista, este grupo debería incluir una sección de usuarios y responsables de
mantenimiento, y una sección de realizan las tareas y de las personas que los dirigen. En
general, deberían consistir en no menos de 4 y no mas de 7 personas, lo ideal siendo entre
cinco o seis.
Como sugerimos en la parte 1 de este capitulo, los “especialistas” pueden ser especialistas en
cualquiera de lo siguiente:
* Algunos aspectos del proceso. Estos tienden a ser temas peligrosos o sensibles
medioambientalmente.
* Un particular mecanismo de falla, como la fatiga o la corrosión.
240
* Un tipo especifico de equipos, como ser sistemas hidráulicos.
* Algunos aspectos de tecnología de mantenimiento, como análisis de vibraciones o
termografía.
A diferencia de otros miembros de grupos, los especialistas solo necesitan atender reuniones
en las que su especialidad este bajo discusión.
¿Que hace cada grupo?
El objetivo de cada grupo es utilizar el proceso de RCM para determinar los requerimientos
de mantenimiento de un bien específico o de una parte discreta de un proceso. Bajo la guía de
un facilitador, el grupo analiza el contexto en el que opera el bien y luego completa la planilla
informativa de RCM como explicamos en los capitulos 2 al 4. (La escritura real es llevada a
cabo por el facilitador, para que los miembros del grupo no tengan que entregar ningún papel
si no lo desasean.) Entonces ellos utilizan el diagrama de decisión de RCM, que se muestran
en las páginas 200 y 201 para decidir como manejar cada modo de falla alistada en la planilla
informativa. Sus decisiones se registran en la planilla de decisión de RCM como explicamos
en el capitulo 10.
La palabra a tener en cuanta en el proceso es “consenso”. Cada miembro de un grupo es
motivado para contribuir en todo lo que pueda en cada paso del proceso, como vemos en el
grafico 13.2.
Nada debe ser registrado hasta que haya sido aceptado por todo el grupo. (Como discutimos
en la parte 3 de este capitulo, el facilitador cumple un rol crucial en este aspecto del proceso.)
Facilitador
Supervisor de
Operaciones
Supervisor de Ingeniería
LA BASE DE
DATOS RCM
Operador
Responsable de Trabajado
Manual
Especialista Externo ( si fuera necesario)
(Tecnico o de Proceso)
Grafico 13.2 Flujo de información en la base de datos de RCM.
241
Este trabajo se realiza en una serie de reuniones que duran unas tres horas cada una, y cada
grupo llega a reunirse en promedio de una a cinco veces por semana. Si los grupos incluyen
trabajadores por turnos, las reuniones deben planearse con un cuidado especial.
El ítem deberá ser subdividido y destinado a diferentes grupos, de un modo tal que ningún
grupo pueda terminar el proceso en su totalidad en no menos de cinco y no mas de quince
reuniones – ciertamente no mas de veinte.
Lo que los participantes obtienen del proceso.
El flujo de información que tiene lugar en estas reuniones no trata solo de base de datos.
Cuando cualquier miembro del grupo hace un aporte, los otros inmediatamente aprenden tres
cosas:
* Mas sobre el bien, mas acerca del proceso del que forma parte y mas sobre lo que debe
hacerse para mantenerlo funcionando. Como resultado, en lugar de tener cinco o seis personas
que saben poco - con frecuencia muy poco- sobre el bien bajo revisión, la organización gana 5
a 6 expertos en la materia.
* Mas sobre los objetivos y metas de sus colegas. En particular el personal de mantenimiento
entiende mejor lo que sus colegas de producción tratan de alcanzar, y los operativos aprenden
como los encargados de mantenimiento pueden- o no pueden- ayudarlos a alcanzar esos
objetivos.
* Mas sobre las fortalezas individuales y debilidades de cada miembro del equipo. En un
balance, se tiende a aprender mucho más sobre fortalezas y debilidades, lo que tiene un efecto
muy saludable en lo que respecta al respeto mutuo y al mutuo entendimiento.
En resumen, los participantes de este proceso ganan un mejor entendimiento de:
* Que debería estar haciendo cada miembro del grupo (incluidos ellos mismos)
* Que se esta tratando de alcanzar mediante esto, y
* Que tan bien equipado esta cada miembro del grupo para hacer esto.
Esto modifica al grupo, que pasa de ser de individuos dispares de dos disciplinas notoriamente
adversas (operaciones y mantenimiento) en un equipo.
El hecho de que cada uno de ellos haya tenido un papel en definir el problema e identificar las
soluciones también otorga un sentido de propiedad más fuerte de parte de los participantes.
Por ejemplo, los operadores comienzan a hablar sobre “sus” maquinas, mientras que el
personal de mantenimiento esta mucho mas inclinado a ofrecer criticas constructivas a “sus”
programas.
Este proceso fue descrito como “aprendizaje simultaneo”, porque los participantes identifican
que necesitan aprender al mismo tiempo que lo aprenden. ( Esto es mucho mas rápido que el
acercamiento tradicional al entrenamiento , que comienza con un análisis de necesidades de
capacitación , continua con el desarrollo de un programa de entrenamiento, y termina con la
presentación de cursos de capacitación- un proceso que puede llevar meses.)
242
Una limitación del grupo de aprendizaje en este aspecto es que a menos que se sigan pasos
específicos para diseminar la información, las únicas personas que se benefician directamente
son los miembros de cada grupo. Dos maneras de superar estos problemas son los siguientes.
* asegurar que todos en la organización puede tener acceso a la base de datos de RCM en
cualquier momento.
* Utilizar los resultados
capacitación.
del proceso de RCM para desarrollar cursos formales de
Las reuniones de RCM también proveen un forum muy eficiente para orientar a las personas
en el aprendizaje de cómo operar y mantener los nuevos equipos, especialmente si uno de los
técnicos participa de los encuentros sostenidos durante las últimas etapas de la puesta en
funcionamiento. El proceso de RCM provee un marco estratégico para que tales técnicos
transfieran todo lo que saben a otros grupos de un modo ordenado y sistemático. Las planillas
de RCM permiten a la organización capturar la información por escrito para diseminarla a
cualquier otra persona que necesite saber.
13.3 Facilitadores.
La parte 2 de este capitulo mencionaba que el facilitador tiene un rol crucial en la
implementación de RCM. La funcion primaria de un facilitador de RCM es facilitar la
aplicación de la filosofía de RCM formulando preguntas de un grupo de personas escogidas
por sus conocimientos de un bien o proceso especifico, asegurando que el grupo alcance
consenso sobre sus respuestas, y registrándolas.
De todos los factores que afectan la calidad superior del análisis, la habilidad del facilitador es
la más importante se aplica a la calidad técnica del análisis, y a:
* El ritmo en el que se completa el análisis
* La actitud de los participantes con respecto al proceso de RCM.
Para alcanzar un Standard razonable, un facilitador de RCM debe ser competente en 45 áreas
clave. Esto puede ser divido en 5 grupos de destrezas:
* Aplicando la lógica de RCM.
* Manejando el análisis.
* Conduciendo los encuentros.
* Manejo de los tiempos.
* Administración, Logística y tendencias ascendentes.
A continuación se discuten puntos clave sobre estos temas:
Aplicando la lógica de RCM
El facilitador debe asegurar que el proceso de RCM es aplicado correctamente por el grupo de
revisión. Esto implica asegurar que todas las preguntas que dan cuerpo al proceso de RCM,
sean formuladas correctamente, en la secuencia apropiada, que fueron correctamente
entendidas por todos los miembros del grupo, y que el grupo logra el consenso sobre las
respuestas.
243
Manejo del Análisis
Las siguientes decisiones son tomadas por el facilitador, y/o el facilitador hace el trabajo solo:
* Preparar para las reuniones: Antes de la primera reunión el facilitador debería recolectar
información básica sobre el bien/ proceso. Esto incluye diagramas de flujo, manuales
operativos, registros históricos y – si los hubiera – planos de circuitos eléctrico, hidráulico y
neumático.
* seleccionar niveles de análisis / definir límites: el equipo a ser analizado por cada grupo de
revisión será identificado durante la fase de planificación. Sin embargo puede ser necesario
agrupar el equipo de un modo diferente para llevar a cabo el análisis. Esto significa que la
decisión final sobre la agrupación de equipos / niveles de análisis, es tomada por el facilitador,
que luego debe definir los limites del análisis acordemente.
* manejar modos de falla complejos de un modo apropiado: Decidir cuando escoger cual de
las cuatro opciones alistadas en el capitulo 4 parte 7 (paginas 86- 88) cuando enumeramos los
modos de falla.
* Saber cuando parar el listado de modos de falla: saber cuando hay que enumerar los modos
de falla que pueden causar una falla funcional es uno de los elementos claves de una
facilitación exitosa, y requiere un juicio cuidadoso. Moverse demasiado rápido hacia la
siguiente falla funcional implica que modos de falla críticos pueden ser pasados por alto, o
que se pueden describir en forma inadecuada los efectos de las fallas. Enunciar demasiados
modos de falla lleva a una parálisis en el análisis.
* Interpretar y registrar las decisiones con un mínimo de jergas: Como regla, el facilitador
registra físicamente las decisiones del grupo. De esta manera, se debe tener cuidado en
asegurar que todos los términos técnicos utilizados serán entendidos por todos en la planta
(incluyendo auditores, ingenieros de diseño, y gerentes)
* Reconocer cuando el grupo no sabe: El facilitador tiene que distinguir entre incertidumbre
(el grupo no esta un 100% seguro, pero esta lo suficientemente seguro para tomas una
decisión viable), e ignorancia (el grupo simplemente no tiene los conocimientos suficientes
para tomar una decisión viable.
* Reducir los intentos de rediseñar el bien en las reuniones de RCM: Los intentos por
rediseñar el bien es el mayor desperdicio de tiempo en las reuniones de revisión de RCM. El
facilitador debería saber simplemente que el rediseño obligatorio / puede ser deseable, y debe
apuntar una sugerencia si la respuesta parece obvia. El proceso de rediseño en si mismo,
debería ser llevado a cabo en algún otro lugar (Esto no quiere decir que el grupo de RCM no
debe involucrarse en el proceso de rediseño – deben hacerlo- simplemente significa que no lo
deberían hacer en las reuniones de RCM.)
* Completar las planillas de RCM: Ya sea que sean almacenados en forma manual o
electrónica, Las planillas Informativas y de Decisión de RCM deben contener un mínimo
razonable de errores ortográficos o gramaticales.
* Preparar un archivo de auditorias: Como discutíamos en el capitulo 11, los manager con
responsabilidad general para cada bien, necesitan auditar el análisis llevado a cabo por los
244
grupos de revisión. Antes de que esto pueda ser llevado a cabo, el facilitador necesita preparar
las planillas de trabajo de RCM de una manera clara y coherente. Esto generalmente los lleva
a la preparación de un documento formal denominado “archivo de auditoria”. Este archivo
debería contener la suficiente información de background – planos esquemáticos, datos de
falla conocidos, hasta fotografías de los equipos- para permitir que los auditores realicen su
trabajo de modo apropiado.
* Ingresar los datos de RCM en una base de datos computarizada: Esto debe realizarse ya sea
por un dactilógrafo, o por el facilitador. Exactamente quien depende de las habilidades con el
teclado y los conocimientos de computación y el tiempo disponible al facilitador. (Los datos
solo deben ser ingresados en la computadora durante las reuniones si el facilitador puede
tipear al menos a la misma velocidad en la que puede escribir, y si lo que esta siendo tipeado
pude mostrarse de manera tal que pueda ser leído fácilmente y de manera inmediata por todos
lo miembros del grupo. Como discutimos en la parte 8 de este capitulo, la computadora nunca
debería utilizarse para “formular” las preguntas.)
Conducción de reuniones
Los siguientes puntos tratan el modo en que el facilitador interactúa con los participantes en
reuniones a un nivel puramente humano.
* Preparar la escena: En el primer encuentro de cada grupo, el facilitador debe acordar normas
básicas con el grupo (temas tales como el uso de nombres, vestimenta, puntualidad, etc.) Y
asegurar que todos los miembros del grupo entienden el alcance y objetivos, y porque han
sido invitados a participar. Al principio de todas las reuniones subsiguientes, el facilitador
debería recapitular que se ha estado haciendo, para poner fecha y proveer una breve agenda
para esta reunión. El facilitador también debería asegurar que el grupo tiene material
suficiente (borradores de planillas de trabajo completas, etc.) para permitirles hacer el
seguimiento del proceso.
* La conducta del facilitador: El modo en el facilitador se conduce a si mismo en las
reuniones tiene un efecto profundo en el modo en que actúan los demás miembros del grupo.
En particular el facilitador debería establecer un buen ejemplo, mostrando una actitud positiva
en el proceso, tener cuidado en preservar la dignidad de los miembros del grupo, y proveer un
feedback positivo en respuesta a contribuciones también positivas.
* Formular las preguntas de RCM en orden: Una vez que las reuniones se están llevando a
cabo, el rol clave del facilitador es formular las preguntas requeridas por el proceso de RCM.
Es esencial evitar cualquier tendencia a saltear preguntas o a tomas las respuestas como
garantizadas. (En particular, tener cuidado en no ignorar o pasar por alto preguntas diseñadas
para establecer si las tareas serán beneficiosas y valdrá la pena llevarlas a cabo.
* Asegurar que cada pregunta se entendió correctamente: A pesar del hecho de que todos ellos
deben haber atendido un curso de RCM básico los miembros de los grupos no están
familiarizados con el proceso de RCM como facilitador. Como resultado, ellos malentienden
la pregunta con frecuencia, especialmente en las primeras etapas, y el facilitador debe estar
alerta de tales malentendidos, En el capitulos 11 parte 2 se discuten los errores comunes.
* Motivar a que todos participen: Todas las personas que tengan algo con que contribuir
deberían hacerlo. Esto implica motivar a las personas reticentes a participar, mientras
245
aseguramos que personalidades dominantes no dominen la reunión excluyendo a todos los
demás. Se puede sostener el interés y se debe promover la participación requiriendo a los
miembros del grupo que trabajen n pequeñas tareas entre reuniones tales como clarificar
puntos técnicos (quizás llamando a un proveedor, midiendo una dimensión, controlando un
nivel de calidad, etc.)
* Respondiendo las preguntas: los facilitadores deberían evitar lo que generalmente se
convierte en una fuente tentación de responder las preguntas de RCM directamente. Sin
embargo, es legítimo clarificar respuestas dudosas con un cuestionamiento más extenso.
* Consenso seguro: Una de las más importantes funciones del facilitador es asegurar que el
grupo alcance el consenso. Consenso no significa que las decisiones se toman por medio de
un voto. Esto tampoco significa que todo el mundo esta preparado para aceptar
completamente cada decisión, significa que todos están preparados para aceptar la visión de la
mayoría. (Si un grupo simplemente no puede alcanzar el consenso el facilitador debería pedir
a alguien cuya experiencia es respetada por todo el grupo para consultarles mas extensamente,
y si fuera necesario para realizar el juicio final.)
* Motivar el grupo:
Como discutimos anteriormente, uno de los factores mas importantes que afectan la actitud
del grupo es la actitud del facilitador. Otros temas relacionados a la motivación con los que el
facilitador deberá trabajar son la perdida de entusiasmo, especialmente si se necesita un
número grande de reuniones para revisar un bien, y el escepticismo, donde los grupos no
creen que sus recomendaciones puedan ser tomadas seriamente por la gerencia.
* Manejar las interrupciones apropiadamente:
Todas las reuniones sufren de interrupciones ocasionalmente. Sin embargo en al caso de
RCM, el grupo trata de llevar a cabo grandes cantidades de trabajo que requiere una intensa
concentración, de modo que las interrupciones pueden especialmente rechazadas. Tres áreas
que necesitan especial atención son la disgregación, choque de de personalidades y
agravancias que no esten relcionadas con el proceso de RCM.
* Asesorar al grupo o a los miembros individuales: A veces es necesario que el facilitador
provea asesoramiento formal a los individuos o al grupo en algún elemento de la filosofía de
RCM. Sin embargo, el asesoramiento es ineficiente y lleva mucho tiempo, de modo que no
debería ser visto como substituto de la capacitación formal de RCM.
Manejo del Tiempo
RCM es un proceso de recursos intensivo, lo suficientemente para que los mandos superiores
tengan en cuenta la cantidad de esfuerzo y tiempo necesario para completar cada análisis.
Tantos los recursos necesarios para aplicar RCM como la duración de cada proyecto se ven
profundamente afectados por el ritmo al cual los facilitadores conducen los encuentros y la
forma en que manejan sus tiempos fuera de las reuniones. Como resultado, los facilitadores
necesitan desarrollar su capacidad de manejo del tiempo con la misma profesionalidad que
trata cualquier otro aspecto de RCM.
A continuación se incluyen cinco claves para el manejo efectivo del tiempo:
* Ritmo de Trabajo: En cada reunión de RCM se encuentran presentes un numero de personas
, de modo que la cantidad de tiempo invertida en estas reuniones tiene el mayor impacto en el
246
numero de horas-hombre utilizadas en el proceso de RCM. Un progreso lento en las reuniones
también implica que se deben llevar a cabo más reuniones, lo que podría retrasar la fecha de
terminación del proyecto. Como resultado esta es la más importante de las cinco medidas para
la efectividad del tiempo.
* Número total de reuniones: El número total de reuniones necesarias para llevar a cabo un
análisis completo debería ser estimado como parte de la fase de planificación del proyecto de
RCM. Una segunda medida para la efectividad del tiempo es comparar el número real de
encuentros sostenido bajo esta estimación. Sin embargo los cálculos pueden ser poco precisos,
por lo que es usualmente aceptable que un facilitador complete cualquier análisis dentro de
un 20% del número estimado de reuniones (con espacio para el proceso de aprendizaje en el
caso de nuevos facilitadores.)
* Fecha de terminación real Vs. Fecha de terminación deseada: La fecha de terminación de
cada grupo de reuniones también debería ser determinada durante la fase de planificación de
RCM. El facilitador debería hacer todo lo que este a su alcance para cumplir con esas fechas.
La terminación de los encuentros se demora generalmente porque el número de reuniones
necesarias excede las estimaciones, o porque no se las lleva a cabo según lo planeado. Si se
presenta cualquiera de estos problemas, se debería hacer cualquier esfuerzo para recuperar el
suelo perdido, si fuera necesario se deben programas reuniones extra.
* Tiempo utilizado en la preparación para auditorias: Como explicamos anteriormente, el
facilitador necesita preparar un archivo de auditoria de RCM una vez que se completaron las
reuniones. Estos pasos deben llevarse a cabo lo más rápido posible, ya que las
recomendaciones no podrán implementarse hasta que haya finalizado la auditoria. Un
facilitador con experiencia debería tener un análisis lista para ser sometido a una auditoria
final dentro de las dos semanas después de haber terminado las reuniones con un grupo de
revisión.
* Tiempo fuera de las reuniones: Los facilitadores son recursos escasos y costosos, de modo
que tienen para consigo mismos, y para con sus empleadores la obligación de utilizar su
tiempo de la manera más efectiva posible. En el contexto de RCM, esto significa que el monto
de tiempo que los facilitadores utilizan en trabajo administrativo fuera de las reuniones
debería ser el mismo que el que utilizan en las reuniones en si mismas.
Administración, Logística y Gerenciamiento.
Esta parte de este capitulo trata las actividades donde el facilitador interactúa con personas
(generalmente encargados) que no son miembros de los grupos de revisión. Esta interacción
incluye tomar decisiones, proveer información y levar a cabo el trabajo. Quien cumple
realmente con cada tarea pude variar de lugar a lugar, pero sin tener en cuenta quien se
supone lo haga, el facilitador desempeña un papel principal en asegurar que el trabajo se hace.
Como resultado, los facilitadores tienden a ser juzgados en progreso tanto en estas áreas como
en cualquier otra:
* Organizar el proyecto de RCM como un todo: Esto consiste en los siguientes pasos:
- Decidir que bien, o que partes de un bien, serán analizados utilizando el proceso de RCM.
- Establecer los objetivos de cada análisis, y acordar como y cuando se medirán sus logros.
247
- Estimar cuantas reuniones de RCM serán necesarias para revisar cada bien.
- Decidir como los bienes serán divididos en diferentes grupos de revisión.
- Decidir quien auditara cada análisis.
Estos pasos se consultan generalmente con el Jefe de Proyecto de RCM, y el responsable del
bien. Si RCM es nuevo para la unidad de negocios, esta fase generalmente se realiza con
asistencia de consultores experimentados (especialmente la estimación del número de
reuniones.)
* Planificar el proyecto: Antes de comenzar cada análisis, lo siguiente debe ser planificado en
detalle:
- Decidir quien va a participar en cada grupo de revisión.
- Organizar la capacitación para miembros de grupos y auditores de RCM que no hayan sido
capacitados aun.
- Decidir cuando, donde y en que momento se llevara a cabo cada reunión.
- Decidir cuando se auditara el análisis.
- Decidir cuando llevar a cabo la presentación a la gerencia general.
Estos pasos generalmente también se llevan a cabo en consulta con el Jefe de proyecto de
RCM y el responsable del bien.
* Comunicar los planes: Los participantes y sus jefes debería recibir aviso por escrito de
planes iniciales de cursos de capacitación y reuniones. Cualquier revisión subsiguiente a estos
planes deberá ser comunicada de antemano. Se debe recordar a los auditores las auditorias
próximas. Una vez que se están llevando a cabo las reuniones, el jefe de proyecto de RCM
debe asegurarse de que las personas realmente participan de las reuniones planeadas. Se
deben definir claramente las normas de participación, se deben difundir y respetar
estrictamente.
* La jurisdicción de la reunión: La sala de reuniones de RCM debería ser lo suficientemente
grande para que las personas se sienten alrededor de una mesa sin tocarse unas a otras, y
debería ser semejante al lugar de trabajo normal de los miembros del grupo. Debe ser
tranquila, razonablemente aislada e iluminada, y contar con ventilación adecuada. No debe
haber interrupciones por llamadas telefónicas o pager. Es esencial una pizarra, y
dependiendo de las normas de la organización, pueden o no servirse refrescos.
* Comunicar los descubrimientos urgentes: Los gerentes adecuados deben recibir
información antes de la auditoria sobre los hallazgos y recomendaciones que puedan ser de
su interés, o que puedan requerir atención urgente (tales como riesgos a la seguridad o el
medioambiente). Esto asegura que los problemas potencialmente peligrosos se tratan con
rapidez, y ayudan a sostener el interés de las personas que proveen recursos al proyecto.
248
* Comunicar el progreso: mantener a la gerencia informada sobre el progreso del plan. Pedir
su atención en problemas que no puede resolver por si solo, y que están impidiendo o
amenazando con impedir el progreso, tales como el ausentismo repetido a las reuniones,
comportamiento contraproducente serio, interrupciones repetidas, etc.
* Asegurar que se controlan las planillas de RCM: El facilitador debería atender las reuniones
de auditorias en persona, para responder consultas, anotar las correcciones y (si fuera
requerido) proveer guía a los auditores del proceso de RCM (a pesar de que los auditores
deben participar de una capacitación formal en RCM antes de antes de intentar realizar una
auditoria de un análisis de RCM). El facilitador debe también asegurarse de que se alcance
consenso entre los auditores y l grupo de revisión durante el proceso de revisión. Esto incluye
informar todo lo encontrado al grupo, y asegurar que se resuelvan las diferencias. Finalmente,
el facilitador debe actualizar las planillas de trabajo para incorporar los resultados de la
auditoria.
* Presentaciones a la gerencia general: Un resumen corto de alta calidad de al menos un
análisis principal de RCM debería ser presentado a los gerentes senior de cada empresa en la
que se aplica el proceso. Este debería mostrar como los objetivos iniciales del proyecto han
sido, o serán alcanzados, y que debía hacerse para alcanzarlos.
* Implementación: Asegurar que se implementan las decisiones de RCM es en general
responsabilidad del encargado del bien, sin embargo el facilitador deberá seguir relacionado.
Los elementos claves del proceso de implementación se discutían en el capitulo 11.
* Un programa de vida: Después de completar cada análisis, el facilitador debería trabajar
con el jefe de proyecto de RCM y los responsables del bien, para agendar reuniones para
reevaluar y actualizar el análisis si fuera necesario. Estas reuniones deberían ser llevadas a
cabo a intervalos de 9 a 12 meses, e idealmente deberían ser dirigidas por el facilitador
original. Este tema se discute en mayor detalle en la parte 5 de este capitulo.
Quien debería Facilitar:
Los facilitadores deberían tener una fuerte formación tecnológica, deben ser muy metódicos,
y formadores naturales de consenso. Pueden trabajar como facilitadores con una base full time
o part time, también deberían tener un entendimiento razonable del proceso y de la tecnología
incluida en el bien bajo revisión, pero n deben ser expertos en ninguna materia. Este método
se basa en la noción de que los otros miembros del grupo son los expertos en estas áreas.
(Esto también explica porque los expertos en proceso y los gerentes de mantenimiento y
supervisores deben participar en el proceso como miembros del grupo, pero no como
facilitadores.)
El campo en el que por supuesto un facilitador debe ser experto es en RCM. Lo que significa
que siempre se requerirán de una capacitación apropiada. Para poder asegurar el nivel mas
alto posible de “propiedad” y de compromiso a largo plazo a las conclusiones sacadas durante
el proceso, el facilitador debe ser un empleado full-time de la organización que estará
operando, o manteniendo el bien en un futuro. (Esta es una de las muchas razones por las que
se recomienda que nunca personas ajenas a la organización sean facilitadores de RCM)
249
13.4 Estrategias de Implementación
Hablando ampliamente, el método grupal de RCM descrito anteriormente puede ser aplicado
de tres modos diferentes.
* El Método de Fuerza de Tarea.
* El Método Selectivo
*El Método Comprensivo
Los aspectos claves de cada uno de estos métodos se discuten en los siguientes párrafos:
El Método de Fuerza de Tarea
Las organizaciones que poseen bienes o procesos que sufren de problemas difíciles con
consecuencias serias, con frecuencia adoptan el método de “Fuerza de Tarea” de RCM. Este
consiste en capacitar a un pequeño grupo (la “fuerza de tarea”) para llevar a cabo un análisis
comprensivo del sistema afectado. Cada un de estos grupos consiste de miembros extraídos de
la misma disciplina como los grupos descriptos en la parte 2 de este capitulo. Ellos muchas
veces trabajan full time en el proyecto de revisión hasta que este esta completo, y luego e
grupo de desintegra.
* La mayor ventaja de este método es que es rápido, porque solo uno o dos grupos tienen que
pasar por la curva de aprendizaje, es fácil de manejar, porque se trata solo de un numero
pequeño de personas, y es exitoso – que es generalmente el caso- puede obtener beneficios
sustanciales (en términos de mejora en los rendimientos de la planta) por una inversión
relativamente pequeña.
* Las mayores desventajas de este método es que no se esfuerza por asegurar el compromiso a
largo plazo de las personas de la organización por obtener los resultados, de modo que estos
tienen menos probabilidades de durar, y al no estar enfocado ampliamente, no tiende a
colaborar en la adopción de una mejor practica en la organización.
El método Selectivo
Además de los problemas de gravedad que llevan al método de fuerza de tarea, la mayoría de
las organizaciones poseen algunos bienes que son más susceptibles que otros a problemas
crónicos difíciles de identificar. Estos problemas generalmente se manifiestan como tiempo
de inactividad, baja calidad en los productos, servicio al cliente empobrecido, o costos de
mantenimiento excesivos. Otras áreas pueden enfrentarse a riesgos inaceptables a la seguridad
o al medioambiente que necesitan ser combatidos en una base sistemática.
Teniendo cientos o miles de ítems de los cuales elegir en las grandes empresas, tiene sentido
aplicar una técnica con el poder de RCM en las áreas donde se encuentran los mayores
problemas. Una vez que se los trato, se tomara la decisión de aplicar RCM o no para analizar
los bienes con problemas menos serios y así sucesivamente.
El autor encontró en la mayoría de los casos, el modo más simple, rápido y efectivo para
identificar donde los bienes físicos están causando los problemas mas serios (especialmente
250
en términos de consecuencias de fallas) es consultar con sus usuarios. Esto significa consultar
a los gerentes de producción u operación en todos los niveles.
Si los peores problemas no son inmediatamente obvios, o si no fuera posible alcanzar el
consenso sobre donde comenzar en una base informal, entonces es a veces necesario decidir
en una base más formal donde se debería aplicar el RCM. Esto puede hacerse en tres etapas:
* Identificar los bienes significativos. Nos referimos a los bienes que pueden obtener mayor
beneficio del proceso de RCM.
* Catalogar los bienes significativos en orden descendiente de importancia.
* Decidir donde utilizar un método “modelo” para bienes similares.
Bienes significativos:
Un bien se considera significativo si puede llegar a sufrir de algún modo de falla que por si
mismo:
* Pudiera amenazar la seguridad o violar una norma medioambiental conocida
* Pudiera tener consecuencias económicas
Los ítems también se juzgan de importancia si contienen funciones ocultas cuyas fallas
pudiera exponer a la organización al riesgo de una falla múltiple con consecuencias de
seguridad, medioambientales, u operativas. Contrariamente, para que un ítem sea clasificado
como no significativo, debemos asegurarnos de que:
* Ninguno de sus modos de falla podría afectar la seguridad o el medioambiente.
* Ninguno de sus modos de fallas puede tener consecuencias operativas significativas.
* No contiene una funcion oculta cuya falla expone a la organización al riesgo de una falla
múltiple significativa.
El proceso de identificar ítems de importancia es rápido, aproximado y conservador. En otras
palabras, si no estuviéramos seguros de que un bien es no significativo en el sentido descripto
anteriormente, entonces debería someterse a una revisión completa de RCM. La evaluación de
importancia puede hacerse a cualquier nivel, con el entendimiento que esto puede no ser el
nivel al cual el análisis de RCM es conducido eventualmente.
Al tomar decisiones sobre la importancia de un bien, se debe tener en cuenta que el proceso
de RCM se aplica a cualquier bien en su contexto operativo. Este contexto es una funcion del
proceso o sistema de cual el bien forma parte, de modo que todo bien debería ser analizado en
el contexto de un proceso específico o sistema (tales como una línea de empaque, una grúa o
un taller de laminación). La selección de ítems significativos nunca debería estar basado en
ítems o componentes genéricos (todas las bombas, todos los rodamientos, todas las válvulas
de despresurización), porque estos deberán ser sacados de contexto necesariamente.
251
En la industria de la aviación civil un porcentaje sorprendentemente alto de ítems pueden ser
clasificados como no significativos en el sentido anteriormente descrito. Sin embargo durante
30 años esta industria ha estado diseñados aeronaves para evitar o minimizar las
consecuencias de las fallas, de modo que hay un nivel de redundancia muy alto (aunque aun
no infalible) ya incorporado a sus bienes.
Los bienes en tras industrias, sin embrago, tienden a beneficiarse de un nivel de redundancia
mucho menor, de modo que una proporción mayor de ítems, tiende a ser considerado
significativo, especialmente si se considera las fallas que pueden afectar la seguridad o el
medioambiente. Esto significa que la mayoría de las organizaciones podrían aun enfrentarse a
u gran número de ítems que deberían ser analizados. Si la respuesta no es evidente la siguiente
pregunta a ser analizada sistemáticamente seria: “Donde comenzamos?”.
Ordenar los ítems significativos por orden de importancia:
Se han desarrollado un gran número de técnicas que intentan proveer una base sistemática,
generalmente cuantitativa para decidir que bienes tienen posibilidad de beneficiarse más con
la aplicación de procesos analíticos como ser RCM. A veces denominadas “evaluaciones de
gravedad”, la mayoría de estas técnicas utilizan algunas variaciones de un concepto conocido
como “numero de probabilidad/riesgo” o PRN
(probability/risk number).
Un PRN se deriva adjuntando un valor numérico a la probabilidad de falla – o grado de fallade un bien (cuanto mas alta es la probabilidad, mas alto es el valor) y otro valor a la severidad
de las consecuencias de la falla (nuevamente, cuanto mas seria es la falla, mas alto es el valor)
los dos números se multiplican para obtener un tercero, que es el PRN. Los bienes con el PRN
más alto se analizan primero, luego los que tienen puntajes menores y así sucesivamente,
hasta que nos encontramos con bienes para los cuales el retorno no justifica levar a cabo el
análisis.
Las variaciones mas sofisticadas de este proceso traen aparejados PRNs compuestos al
adjuntar diferentes pesos numéricos a las diferentes categorías de consecuencias de fallas
(típicamente, alto para consecuencias medioambientales o de seguridad, intermedio para
consecuencias operativas, y bajos para costos directos de reparación) Si tenemos a disposición
datos históricos sobre grados de fallas y costos, esto puede ser aun mas refinado utilizando el
análisis de Pareto.
El ranking sistemático de este tipo puede ser útil para ayudar a clarificar y obtener consenso
sobre cuales bienes son de importancia y sobre donde los sistemas complejos son
particularmente vulnerables. Sin embargo, el criterio y peso utilizado para evaluar la
severidad y la probabilidad varían enormemente de empresa en empresa, de modo que la
mayoría de los procesos de evaluación de gravedad utilizan escalas y valores únicos para cada
organización específica.
Modelos
Otra manera de reducir la inversión en RCM es utilizar el análisis de un bien como “modelo”
para otro. Por razones acentuadas repetidamente en los capitulos 2, 3, 4 y 5, este método solo
puede ser aplicado a bienes o procesos que son muy similares, si no idénticos, y que están
operando en prácticamente el mismo contexto.
Al adoptar este método, un grupo de RCM lleva a cabo un análisis comprensivo de base cero
del primer ítem o proceso de una serie de ítems o procesos muy similares, y luego utiliza este
análisis como base para realizar las revisiones a los demás ítems de la serie. Para hacer esto, el
252
grupo consulta si los niveles de funcion y desempeño son similares para cada ítem
subsiguiente que los que están enunciados en las planillas de trabajo de l ítem de base cero.
Las diferencias (si las hubiera) se registran en la planilla del segundo ítem y los analistas
pasan a comparar las fallas funcionales del mismo modo, y así sucesivamente hasta que hayan
completado el análisis.
Si los ítems son técnicamente idénticos, y el contexto operativo es muy similar, este método
puede ahorrar cantidades notables de tiempo y esfuerzo, porque en la mayoría de los casos
una proporción sustancial permanece intacta ara los ítems subsiguientes.
Sin embargo, mientras es técnicamente atractivo, este método puede traer retrocesos serios en
la motivación, ya que los operadores y mantenedores de un bien se ven forzados a aceptar
decisiones tomadas por otros, lo que disminuye naturalmente su sentido de “propiedad”. En
casos extremos estas personas pueden llegar a rechazar el análisis inicial por que “no se
invento aquí”. Este fenómeno llevo a muchas organizaciones a descartar este método, y
comenzar todos los análisis desde una base cero.
(Interesantemente, esto puede llevar a programas de mantenimiento diferentes a medida que
los diferentes grupos seleccionan diferentes métodos de tratar la misma falla. Una de las
formas en que esto puede ocurrir fue explicado legítimamente en el grafico 7.8 de la pagina
154.)
Ventajas y desventajas del método selectivo
Típicamente, las organizaciones que aplican el método selectivo aplican RCm a un 20% 40% de sus bienes.
* La ventaja principal de este método es que la inversión solo se realizara donde los
resultados serán rápidos y medibles. Al ser RCM aplicado solo a una parte de la planta, el
proyecto general es menos costoso y por lo tanto más fácil de manejar que si se analizara la
planta en su totalidad.
* La principal desventaja de este método es que pone un énfasis mucho mayor en el
desempeño técnico y operativo del equipo que en las personas de las que depende el equipo a
largo plazo (operadores y mantenedores).
El método comprensivo:
El tercer modo de aplicación de RCM pone tanto énfasis en la mejora del conocimiento y
motivación de los individuos, y en el fortalecimiento del trabajo en equipo, como lo hace en el
desempeño del bien por si mismo. Esto se realiza generalmente en dos maneras:
* Analizar todos los bienes de la planta en una campaña corta e intensiva. Las campañas de
este tipo generalmente duran entre 6 y 18 meses en la mayoría de las plantas. Hasta 20 o mas
grupos pueden estar activos al mismo tiempo, trabajando bajo la dirección de tres o cuatro, y
hasta de treinta a cuarenta facilitadores. Tan pronto como un grupo completa el análisis de u
bien o proceso, se activa un nuevo grupo. De esta forma la campaña completa termina
rápidamente y la organización disfruta de los beneficios con la misma rapidez. En realidad
esta es una forma excelente de alcanzar cambios masivos y rápidos en el desempeño de
mantenimiento, en empresas que tienen apuro en hacerlo.
253
Sin embargo este método es sumamente intensivo y utiliza un alto número de recursos, por lo
que necesita una planificación muy cuidadosa y atención gerencial. No debería ser
considerado si se planea implementar otras iniciativas en forma paralela con RCM.
* Una segunda posibilidad sigue siendo revisar todos los equipos de la planta, pero hacerlo en
etapas. Tal vez activando cuatro o cinco grupos por vez, trabajando bajo la dirección de un
facilitador o dos. En esta base, podría llevar de 5 a 10 años analizar todos los equipos en una
planta grande (tres o cuatro en una más pequeña). La organización sigue derivando todos los
beneficios de RCM, pero le lleva mucho mas tiempo hacerlo. Este método es menos
destructivo a corto plazo, pero si no se consideran las expectativas, se podría considerar que
“se prolonga tediosamente”, y por lo tanto se podría quitar la motivación. Por otro lado,
significa que RCM puede ser aplicado en forma paralela a otras iniciativas y viceversa.
Las personas que pueden beneficiarse de este método superan en número a los equipos, de
modo que para que todos puedan formar parte del proceso es necesario analizar la gran
mayoría, sino todos los bienes de la planta.
* Las principales desventajas de este método es que es más lento, porque más personas deben
familiarizarse con la metodología de RCM, y es más difícil de manejar porque participan
muchas mas personas.
* La principal ventaja es que aseguran a más largo plazo un sentimiento de pertenencia e
identificación con los problemas de mantenimiento y sus soluciones, con una base más
amplia. Esto no solo mejora la motivación individual y el trabajo en equipo, sino que también
asegura que los resultados del ejercicio tienen muchas mas posibilidades de durar. (La mejor
practica se convierte en “parte de la manera de hacer las cosas que tenemos”.)
Decidir que método utilizar
Si se aplica correctamente, RCM requiere un compromiso de recursos sustancial. Si se aplica
el método comprensivo descripto anteriormente, es necesaria la total dedicación y
cooperación de muchas personas. Como resultado, es sabio decidir en etapas que método
debería utilizarse.
Como los gerentes deben comprometer los recursos para RCM, tiene sentido comenzar por
darles la oportunidad de aprender de que se trata RCM, para que evalúen por si mismos que
recursos se necesita aplicar, y para juzgar por si mismos que beneficios potenciales ofrece en
sus áreas de responsabilidad. El mejor modo de hacer esto es generalmente acordar para que
participen de un curso de capacitación Inicial.
Si la respuesta es favorable, el siguiente paso es poner en funcionamiento uno o dos
programas pilotos. Esto permite a la organización ganar experiencia de primera mano en la
dinámica del proceso de RCM, qué logra este, y que compromiso de recursos se necesita para
lograrlo.
Sin embargo, antes de comenzar cualquier proyecto piloto, es esencial evaluar los recursos
necesarios comparándolos con los posibles beneficios, y planificando el proyecto con el
mayor detalle posible. Esto debería hacerse consultando a los gerentes de las áreas donde se
puede poner en funcionamiento un proyecto piloto, y que incluye los siguientes pasos:
254
* Confirmar el alcance del proyecto y definir los objetivos (estado actual, y estado deseado)
* Estimar el tiempo necesario para revisar los equipos en cada área.
* identificar el jefe de proyecto y los facilitadores.
* Identificar los participantes (por cargo, o nombre)
* planificar la capacitación para los participantes y facilitadores.
* Planificar fecha, hora y lugar para cada reunión.
Cuando se completan los proyectos piloto, los participantes están en posición de evaluar los
resultados por si mismos y decidir si es que, donde, y que tan rápido se debería aplicar RCM
al resto de los bienes de la organización. El capitulo 14 explica que RCM deja retornos
sustanciales, pero que la naturaleza de estos varia enormemente de organización a
organización. Como resultado, el mejor momento de decidir que método adoptar es una vez
que se completo un numero de proyectos piloto y la organización puede juzgar por si misma
que resultados ofrece RCM en relación con las inversiones.
13.5 RCM en la Perpetuidad.
La aplicación de RCM lleva a un entendimiento mucho mas preciso de las funciones de los
bienes bajo revisión, y una visión mucho más científica de que debe hacerse para lograr que
continúen cumpliendo la funcion requerida. Sin embargo, el análisis no será perfecto- por dos
razones:
* La evolución de una política de mantenimiento es inherentemente imprecisa. Se deben
tomas muchas decisiones basándose en datos concretos incompletos o imprecisos, sobre todo
en lo referente a la relación entre edad y falla. Se deben tomar otras decisiones sobre la
posibilidad y las consecuencias de los modos de falla que no se han presentado aun, y quizás
nunca se presenten. En un medio como este, es inevitable que algunos modos de falla y
efectos sean completamente pasados por alto, mientras que algunas consecuencias de fallas y
frecuencias de tareas pueden ser evaluadas incorrectamente.
* Los bienes y los procesos de los que formas parte estarán en constante cambio. Esto
significa que aun partes del análisis que pueden ser completamente validas hoy en día, pueden
volverse inválidas en el futuro.
Las personas involucradas en el proceso también cambiaran. Esto es en parte porque las
perspectivas y prioridades de los que forman parte del análisis original inevitablemente
cambiaran con el tiempo, y en parte porque las personas simplemente olvidan cosas. En otros
casos, las personas se van, y sus puestos son tomados por otros que necesitan aprender porque
las cosas son lo que son. Todos estos factores implican que la validez de la base de datos de
RCM y la actitud de las personas con respecto a esta se deteriorara inevitablemente si no se
tomas medidas para que esto no suceda.
Una forma de hacer esto utilizar el proceso de RCM para analizar todos los modos de falla
significativos, no anticipados que hayan ocurrido una vez que se halla completado el análisis
255
inicial. Esto puede hacerse congregando un grupo especial que utilice RCM para determinar
la forma mas efectiva de tratar la falla.
Los resultados de sus deliberaciones deben ser ingresados en la base de datos del bien
afectado. El grupo especial debe incluir tantas personas como fuera posible de las que
llevaron a cabo el análisis original.
Una segunda- y mucho más segura- forma de asegurarnos que las bases de datos de RCM
permanezcan actualizadas en la perpetuidad es requerir a los grupos originales que revisen la
base de datos de “sus” bienes en una base formal una vez cada nueva a doce meses. Tal
reunión de revisión no necesita durar más de una tarde. Las siguientes incluyen preguntas
específicas que deberían ser consideradas:
* Ha sufrido el contexto operativo de cambios notorios como para cambiar alguna de las
decisiones tomadas durante el análisis original? ( Ejemplos incluyen la operación de un solo
turno, convertida en doble turno, o viceversa.)
* Han cambiado las expectativas de desempeño a un grado tal que deban modificarse los
niveles de desempeño registrados en las planillas informativas de RCM?
* Desde el encuentro previo, se ha presentado algún modo de falla que deba ser registrado en
la planilla informativa de RCM?
* Debería agregarse, o cambiar algo en la descripción de efectos de fallas? ( Esto se aplica
especialmente a la evidencia de falla y al calculo de tiempo de inactividad)
* Ha sucedido algo que pueda hacer a alguien creer que las consecuencias de fallas deberían
ser evaluadas en forma diferente? ( Las posibilidades aquí incluyen cambios en las
regulaciones medioambientales, y cambio de percepciones sobre los niveles de riesgo
tolerables.)
* Hay alguna razón para creer que cualquiera de las tareas seleccionadas inicialmente no es
en realidad técnicamente realizable o beneficiosa?
* Ha surgido alguna evidencia que sugiera que debería cambiarse la frecuencia de alguna
tarea?
* Ha advertido alguien una técnica proactiva que pudiera ser superior a una de las
seleccionadas anteriormente? ( En la mayoría de los casos “superior” indica mas efectiva a
nivel costos, pero también podría significar técnicamente superior.)
* Hay alguna razón para sugerir que una tarea o tareas debería ser llevada a cabo por alguien
diferente a la persona seleccionada originalmente?
* Ha sido el bien modificado en un modo que agregue o sustraída cualquier funcion o modo
de falla, o que camine la viabilidad técnica de una tarea? ( Se debe prestar especial atención a
los sistemas de control y sistemas d protección.)
256
Si tales revisiones se llevan a cabo regularmente, solo toman una fracción pequeña del tiempo
necesario para establecer la base de datos, pero aseguran que la organización continué
recibiendo los beneficios del ejercicio original en perpetuidad. Estos beneficios se discuten en
mayor profundidad en mayor detalle en el capitulo 14.
13.6 Como no debería aplicarse RCM
Si se aplica correctamente, RCM arroja resultados muy rápidamente. Sin embargo no todas
las aplicaciones de RCM alcanzan su máximo potencial. Algunas llegan a lograr muy poco o
nada. En la experiencia del autor, algunas de las principales razones por las que esto sucede
son de naturaleza técnica, pero la gran mayoría son organizacionales. Las más comunes se
discuten en los siguientes párrafos.
El análisis se lleva a cabo a un nivel muy bajo
Los problemas que se presentan si un análisis de RCM se lleva a cabo aun nivel muy bajo, se
enuncian en detalle en la parte 7 del capitulo 4. Lo mas importante es que el análisis lleva
mucho mas tiempo de lo que debería, resulta en u aumento masivo del papeleo, y se deteriora
la calidad de las decisiones. Como resultado las personas comienzan a sentir que el proceso es
tedioso y pierden interés. Cuesta mucho más de lo que debería y no logra lo que podría
alcanzar.
Aplicaciones demasiado apuradas y demasiado superficiales.
Este es generalmente el resultado de una capacitación insuficiente, o una inversión emocional
demasiado pesada en el status quo de participantes clave. Esto generalmente resulta en un
grupo de tareas que terminan siendo lo mismo que eran al principio.
Demasiado énfasis en los datos de fallas.
Hay con frecuencia una tendencia a sobre enfatizar la importancia de datos como ser MTBF y
MTTR’s. Este tema se discute extensamente en el capitulo 12. Tales datos son casi siempre
sobre enfatizados a costas de normas de desempeño definidas y cuantificadas con propiedad,
la evaluación de consecuencias de fallas y el uso correcto de daos como ser el intervalo P-F.
Solicitar que un solo individuo aplique el proceso
Unos de los modos menos efectivos de aplicar RCM es solicitar que una persona aplique el
proceso por si sola. En realidad, sin importar cuanto esfuerzo ponga un individuo en el
desarrollo de un programa de mantenimiento (ya sea utilizando RCM o cualquier otra técnica)
los programas resultantes caso siempre mueren cuando llegan al piso del taller, por dos
razones:
* Validez Técnica
Ningún individuo puede tener un entendimiento posible de las funciones, los modos de falla y
efectos y las consecuencias de falla de un bien para el que se esta desarrollando el programa.
Esto lleva a programas que serian genéricos en naturaleza, de modo que las personas que los
llevan a cabo generalmente los consideran incorrectos, sino totalmente irrelevantes.
* Pertenencia
Las personas en el taller (supervisores y mecánicos) tiendes a ver los inventarios como
papeleo innecesario que aparece de alguna torre de marfil y desaparece una vez firmado.
Muchos de ellos ven los que firmar los inventarlos y enviarlos nuevamente es más fácil que
257
intentar llevarlos a cabo. (Esto lleva la finalización de programas que al menos mantiene
felices a los planificadores.) La principal razón por la perdida de interés es la falta de
sentimiento de pertenencia.
La única manera de resolver los problemas de validez técnica y de falta de pertenencia, es
involucrar a las personas del taller directamente en el proceso de formulación de estrategias
de mantenimiento como discutimos anteriormente en este capitulo.
Si se realiza correctamente, esto no solo produce programas con un grado más alto de validez
técnica, sino que también produce un grado de pertenencia excepcionalmente alto.
Utilizando el departamento de mantenimiento para aplicar RCM.
En muchas organizaciones aun existe una división prácticamente impenetrable entre las
funciones de mantenimiento y producción. Esto lleva a las personas de mantenimiento en
tales organizaciones a tratar de aplicar RCM por si solos. En realidad, como aclaraba el
capitulo 2, el mantenimiento se trata de asegurar que lo bienes continúes cumpliendo con los
niveles de desempeño requeridos por sus usuarios. Hemos visto que los “usuarios” son casi
siempre personas de operaciones o de producción. Si estas personas no están involucradas en
ayudar a definir las funciones, generalmente surgen dos problemas:
* Las personas de mantenimiento terminan haciéndolo por ellas. En la experiencia del autor,
esto caso siempre lleva a grandes números de enunciados de funciones y de niveles de
desempeño inapropiados, y consecuentemente a programas distorsionados o inadecuados
diseñados para preservar esas funciones.
* No hay “compra” del programa de mantenimiento de parte los usuarios, que al final son los
“clientes” del servicio de mantenimiento. Esto a su vez significa que los usuarios entienden
menos claramente porque es parte de su propio interés liberar las maquinas para
mantenimiento esencial, y también porque se solicita a los operadores que lleven a cabo
ciertas tareas de mantenimiento.
Además de definir que funciones quieren que cumpla el bien, los usuarios tienen una
contribución vital que hacer al resto del proceso de formulación de estrategias. Como
explicábamos en la parte 1 de este capitulo, al participar en el FMEA, aprenden muchísimo
sobre modos de falla causados por errores humanos. Y por lo tanto, que es lo que deben de
hacer para dejar d romper sus maquinas. También desempeñan un rol importante en la
evaluación de las consecuencias de fallas, y tienen experiencia personal invalorable de
muchas de las advertencias de falla más comunes. Todo esto se pierde sino participan del
programa.
En resumen, desde un punto de vista puramente técnico, se esta volviendo rápidamente
aparente de que es virtualmente imposible organizar un programa de mantenimiento viable y
duradero en la mayoría de las empresas industriales sin involucrar a los usuarios del bien.
(Este enfoque en el usuario – o cliente- es por supuesto la esencia de TQM). Si su
participación fuera segura en toas las etapas del proceso, la barrera notoria comienza rápido a
desaparecer, y las dos funciones comienzan a trabajar, muchas veces por primera vez, como
un equipo genuino.
Requerir que los fabricantes o vendedores de equipos apliquen RCM por si solos.
Una característica universal en la provisión de equipos es la insistencia de que el fabricante
del equipo debería proveer un programa de mantenimiento como parte del contrato de
258
provisión de un nuevo equipo. Aparte de todo lo demás, esto implica que los fabricantes sepan
todo lo que debe saberse para planificar programas de mantenimiento adecuados.
En realidad, como explicamos en la pagina 78, los fabricantes de los equipos generalmente
poseen muy poca de la información necesaria para trazar programas de mantenimiento
específicos para un contexto determinado. Además ellos tienen objetivos diferentes al
especificar tales programas, (como ser vender repuestos). Lo que es mas, ellos comprometen
los recursos de los usuarios para hacer el mantenimiento (en cuyo caso ellos no pagan por
esto, y por lo tanto no se preocupan por minimizarlo) o hasta pueden apostar a hacerlos ellos
mismos (en cuyo caso trataran de hacer lo más posible.)
La combinación de objetivos comerciales e ignorancia sobre el contexto operativo indican que
los programas de mantenimiento especificados por los fabricantes generalmente implican in
nivel alto de exceso de mantenimiento (muchas veces con fines lucrativos) aparejados con
provisión masiva de repuestos.
La mayoría de los profesionales de mantenimientos advierten estos problemas. Sin embargo a
pesar de advertirlo, la mayoría de nosotros aun insiste en demandar que los fabricantes
provean estos programas, y luego aceptan que deben ser seguidos para que la garantía
permanezca valida (y de ese modo descomprometernos contractualmente de hacer el trabajo,
al menos por la duración del periodo de garantía.)
Nada de esto pretende sugerir que los fabricantes pretenden aprovecharse de nosotros cuando
expresan sus recomendaciones. En realidad, ellos generalmente hacen lo mejor que pueden en
el contexto de los objetivos de sus propios negocios y con la información que tienen a
disposición. Si alguien esta en falta, somos nosotros – los usuarios- por requerir cosas
irracionales a organizaciones que no están en la mejor posición para cumplirlos.
Un numero de usuarios, pequeño pero creciente resuelven este problema al adoptar un método
completamente diferente n el desarrollo de programas de mantenimiento para nuevos equipos,
involucrando a los técnicos del fabricante en un análisis de RCM dirigido por los usuarios,
como se discute en la pagina 78.
De este modo, los usuarios ganan acceso a la información más útil que el fabricante pueda
proveer, mientras siguen desarrollando un programa de mantenimiento directamente adaptado
al contexto en el que el bien será utilizado.
El vendedor puede perder un poco en ventas de repuestos y mantenimiento, pero
definitivamente ganara todos los beneficios a largo plazo el desempeño mejorado de los
equipos, menores costos de vida y un mejor entendimiento de las necesidades reales de sus
clientes. Una situación clásica en la que todos ganan.
Utilizar personas externas para la aplicación de RCM.
Es sabio mantenerse apartado de la tentación de utilizar terceras partes para formular
estrategias de mantenimiento. En este contexto, ellos sufren de la mayoría de las desventajas
que aplicamos a los individuos en particular, departamentos de mantenimiento trabajando
solos, y fabricantes o vendedores de quipos como explicamos anteriormente. Además, las
personas externas saben poco sobre la dinámica de la organización para la que se están
desarrollando los programas, tal como el contexto operativo de cada bien, el riesgo que la
organización puede tolerar, y las capacidades de los operadores y mantenedores de un bien.
259
Esto generalmente resulta en análisis genéricos que contienen muchas mas deducciones que si
el análisis es realizado por personal interno. Lo que es mas, una vez que se completo el
análisis inicial, las personas externas frecuentemente pasan a trabajar para otra organización.
Una vez que se fueron, no queda nadie con un grado de pertenencia lo suficientemente fuerte
del análisis y sus resultados, para asegurar que permanezcan vivos en el sentido descripto en
la parte 5 de este capitulo.
Finalmente, el hecho de que la mayoría de las personas externas generalmente trabajan bajo
contrato, implica intereses comerciales que pueden distorsionar el proceso de RCM si no se
manejan con mucho cuidado. En particular, la necesidad de finalizar los contratos a tiempo, y
dentro del presupuesto, crea presiones adicionales que puede causar que muchas decisiones se
tomen muy rápidamente. Esto puede traer consecuencias desvastadotas años, o décadas,
después de que el contrato ha finalizado.
Por otro lado, si RCM es aplicado por personal interno capacitado apropiadamente sus
propios trabajos – en realidad su propia vida- prácticamente en un sentido literal depende de
la validez a largo plazo de cada análisis. Como resultado, estarán naturalmente mas inclinados
(y menos reacios) en tomar todo el tiempo extra que sea necesario para asegurar que todo
riesgo predecible sea tratado como corresponde.
Utilizando Computadoras para dirigir el proceso.
El capitulo 10 mencionaba que las bases de datos computarizadas deberían ser utilizadas para
almacenar y clasificar la información generada por el proceso de RCM. Sin embargo, como
sucede con tantas cosas en el mundo de la tecnología informática, es fácil sucumbir a la
tentación de ir más allá del uso que se debería dar a las computadoras, y enfocarse en sus
aparentes usos “que bueno tenerlo”.
Por ejemplo, Es tentador computarizar los algoritmos de RCM tales como el diagrama de
decisión que mostramos en la pagina 200- 201. Esto se realiza creando una pantalla que
formula ( dice) una pregunta H, y programas el sistema de modo que un respuesta “no”,
provoque la aparición de otra pantalla ( o ventana) que formule la pregunta H1, mientras que
una respuesta positiva nos lleve a la formulación de la pregunta S, y así sucesivamente. Esto
se lleva acabo en la creencia de que la sucesión de pantallas acelerara o encauzara el proceso.
En realidad, no hay manera de asegurar que una sucesión de doce o veinte pantallas sea más
rápido que leer una simple hoja de papel, de modo que utilizar la computadora en este caso
hace el proceso más lento.
Utilizar la computadora de forma incorrecta para dirigir el proceso también puede tener una
influencia negativa muy fuerte en la percepción de RCM. Demasiado énfasis en una
computadora implica que RCM comience a ser visto como un ejercicio mecánico de
completar una base de datos, mas que la exploración de las necesidades reales de cada bien
bajo revisión. Por esta razón el autor esta de acuerdo con Smith 1993 cuando el dice que “no
existe un código de software que realice el pensamiento de ingeniería por nosotros”, y que la
computadora “no reemplaza la necesidad de conocimientos y juicios de ingeniería sólidos.”En
resumen, RCM implica pensamiento, no tecnología.
Conclusión:
Estos comentarios sugieren que la mejor manera de alcanzar los beneficios positivos de RCM
es aplicar el proceso en el nivel correcto, y hacerlo en una base formal, utilizando grupos de
260
personas capacitadas para esto que representen las funciones de mantenimiento y operaciones,
y que tengan un conocimiento íntimo del equipo bajo revisión.
13.7 Adquiriendo Conocimientos en RCM
RCM provee un marco común que permite que personas de procedencias diversas logren
consenso sobre un amplio rango de temas altamente técnicos. Sin embargo, este proceso por
si mismo incluye muchos conceptos que son nuevos para la mayoría de las personas. Estas
necesitan aprender que son estos y como se relacionan antes de utilizar el programa de un
modo exitoso. (Algunas personas que estuvieron estancadas en métodos tradicionales de
mantenimiento necesitan descartar muchos de sus conocimientos.)
La mejor manera de asegurar que grandes números de personas adquieran las capacidades
relevantes en forma rápida es proveer el entrenamiento apropiado. La mezcla de cursos mas
apropiada para personas de diferentes niveles es la siguiente:
* Mantenedores y operadores: Un curso sobre los principios básicos de RCM. Tal curso
debería incorporar una variedad de estudios de casos y ejercicios prácticos que permita a los
delegados tener una apreciación de cómo funciona la teoría en la practica.
* Mantenedores, gerentes, ingenieros, jefes de operaciones supervisores y técnicos senior: Un
curso que cubra los mismos aspectos que el curso dado a los operadores y mecánicos, pero
que también explique que debe hacerse para manejar la implementación de RCM.
* Facilitadores: Los facilitadores deberían recibir un curso introductorio de RCM, como el
descripto anteriormente, y luego recibir al menos diez días mas de entrenamiento intensivo
antes de comenzar a trabajar con los grupos. De ahí en más, la mayoría de los facilitadores
necesitarán la tutoría de un practicante de RCM muy capacitado por un periodo de unos
cuantos meses luego del programa de capacitación inicial, antes de convertirse en totalmente
competentes en las 45 áreas claves alistadas en la parte 3 de este capitulo.
(Para una descripción de un programa de entrenamiento extenso, y otros servicios de soporte
que cubran todos los requerimientos anteriores, ver nuestra paginan Web
http://www.aladon.co.uk).
261
14. Lo Que Logra RCM
14.1 Midiendo el Desempeño de Mantenimiento.
Como se discute extensamente en el capitulo 11, la aplicación de RCM brinda tres resultados
tangibles:
* Programas de mantenimiento a ser realizados por el departamento de mantenimiento.
* Procedimientos operativos revisados para los operadores de los equipos.
* Una lista de áreas donde deban realizarse cambios al diseño del bien, o al modo en que este
es operado, para manejar las situaciones donde el bien no funciona al nivel deseado con su
configuración actual.
Otros dos resultamos menos tangibles que se mencionan en el capitulo 13 es el hecho de que
los participantes en ganan conocimientos sobre el funcionamiento del bien, y tienden a tener
un mejor funcionamiento como equipos.
Alcanzar todos estos resultados requiere de grandes cantidades de tiempo y esfuerzo,
especialmente si se aplica RCM del modo descripto en el capitulo 13. Sin embargo, si se
aplica RCM del modo correcto, arroja ganancias que superan ampliamente los costos
involucrados. La mayoría de las aplicaciones se cubren sus gastos en cuestión de meses,
aunque algunas lo hacen en dos semanas o menos. La gran variedad de formas en que RCM
cubre sus propios gastos se discuten extensamente en la parte 4 de este capitulo. Para poder
poner esta discusión en perspectiva, primeros debemos considerar las diferentes formas en
que es posible medir el desempeño de la funcion de mantenimiento.
El desempeño de mantenimiento puede ser considerado desde dos puntos de vista diferentes.
El primero se enfoca en la garantía que da mantenimiento de que los bienes continúen
cumpliendo la funcion que sus usuarios desean. Generalmente se hace referencia a esto con el
término efectividad del mantenimiento, y tiende a ser de mayor interés para los usuarios o
“clientes” del servicio de mantenimiento. El segundo punto de vista se concentra en que tan
bien han sido utilizados los recursos de mantenimiento. No referimos a esto como Eficiencia
de mantenimiento. Es de mayor interés para los gerentes responsables de mantenimiento.
Estos dos temas se consideran en forma separada en las próximas dos secciones de este
capitulo.
Los capitulos 1 y 2 enfatizan que el objetivo de matenimiento es asegurar que todo bien físico
continúe cumpliendo sus funciones al nivel de desempeño deseado por el usuario. Como
resultado, toda evaluación sobre el éxito que esta teniendo mantenimiento en cumplir sus
objetivos, debe incluir una evaluación de el éxito de los bienes en continuar cumpliendo con
sus funciones al nivel deseado. Esto es influenciado por tres problemas:
* “la continuidad” puede medirse de muchas maneras diferentes.
* Los usuarios tienen expectativas diferentes, de las funciones diversas.
* Los bienes individuales pueden tener mas de una, con frecuencia muchas funciones, como
explicamos en el capitulo 2.
Estos temas se consideran más extensamente en los siguientes párrafos:
262
Diferentes Modos de Medir la Efectividad del mantenimiento.
La funcion primaria de cualquier planta de fabricación de alta tecnología y totalmente cargada
es producir minimamente la cantidad de productos que se esperaba produzca cuando se la
instalo (“Totalmente cargada” significa que opera siete días a la semana / 24 horas al día, y de
que hay un mercado esperando cada unidad que la planta puede producir.) En este contexto,
cualquier falla que reduzca el rendimiento da como resultado ventas perdidas.
En casos como este, la medida general más simple del desempeño operativo de la planta como
un todo, es el rendimiento total por periodo.
Si la planta no esta produciendo lo que los usuarios _ generalmente los propietarios_ sienten
que debería estar produciendo en una base regular, no estarán satisfechos hasta que la
situación se solucione. Al menos hasta ese momento, los usuarios juzgaran la efectividad
midiendo los rendimientos finales vs. Objetivos. Esto debería ser reconocido al instalar
cualquier sistema para controlar la efectividad del mantenimiento.
Si el rendimiento final esta dentro de los objetivos, no significa que todo este bien. Una planta
que esta produciendo la cantidad correcta de unidades, podría estar sufriendo problemas que
afecten la seguridad, calidad del producto, costos operativos, integridad medioambiental,
servicio al cliente, y así sucesivamente. De modo que esto también debe medirse de forma
apropiada.
Hay muchas maneras en las que podemos medir la efectividad con que un bien cumple su
funcion. Las siguientes son 5 de las más comunes:
* Que tan seguido falla: Este es el significado mas entendido de la palabra “Confiabilidad”.
Se mide generalmente con el tiempo medio entre fallas, o el porcentaje de fallas.
* Cuanto dura: esto se considera generalmente su “vida” o “vida útil”, al final de la cual el
bien falla, y es reconstruido o descartado y reemplazado por uno nuevo. Hablando
estrictamente, este fenómeno debería ser descripto como “durabilidad”.
* Cuanto tiempo permanece fuera de servicio cuando falla: Nos referimos a esto como
“tiempo de inactividad” o “indisponibilidad”, y mide cuanto tiempo el bien es incapaz de
cumplir con la funcion establecida para satisfacer al usuario, en relación al monto de tiempo
que el usuario quisiera que lo haga. Indisponibilidad (o la contraria disponibilidad) se expresa
generalmente como un porcentaje.
* Cuales son las posibilidades de que falle en el próximo periodo: Asumiendo que haya
sobrevivido al comienzo de ese periodo. Hemos visto que esta es la probabilidad condicional
de falla. Esta podría ser descripta como una medida de “dependencia”, para distinguirla de las
otras tres variables. Una variación común de esta medida es la “vida B10”. El capitulo 10
explicaba que esto se mide usualmente desde el momento en que el ítem es puesto en servicio,
y es el periodo antes del cual no se espera que falle mas de un 10% de los ítems. (En otras
palabras la probabilidad condicional de falla en ese periodo es de un 10%)
* Eficiencia: En el uso común de negocios, el termino eficiencia tiene dos significados
bastante diferentes. El primero mide el rendimiento, relacionado con la inversión, mientras
que el segundo mide que tan bien esta funcionando algo, en relación a que tan bien debería
estar haciéndolo.
Por ejemplo, en una estación eléctrica, la eficiencia de la energía mide la cantidad de energía
exportada en relación con la cantidad de energía liberada por el combustible. Dependiendo de
263
la tecnología utilizada (carbón, gas, ciclo combinado, etc.), esta generalmente va de unos 35%
a 58%. Sin embargo, si una estación que debería alcanzar una eficiencia de energía de un
40%, esta promediando solo 38%, estará exportando el 95% de la energía que debería estar
exportando. En el contexto de este libro la primera medida (40%) es un nivel de desempeño
funcional. Como explicábamos en el capitulo 3, esto se utiliza para juzgar si el ítem ha
fallado. La segunda medida (95%) se utiliza para juzgar la efectividad con la que la
organización esta alcanzando el desempeño deseado en una base continua. “Eficiencia”
también se refiere a ritmo de trabajo, y lo hace también en dos formas- que tan rápido debe
trabajar un equipo relacionado al ritmo al que puede trabajar (desempeño deseado vs.
Capacidad inicial) Hemos visto que el desempeño deseado debe ser menor que la capacidad
inicial, porque se debe dejar lugar al deterioro. De modo que en contexto de este capitulo, la
eficiencia compara el ritmo al que un bien trabaja realmente, con el ritmo en el que debería
trabajar, no con el ritmo al que podría trabajar.
Las medidas de tipo eficiencia también se pueden aplicar de un modo minimamente diferente
al consumo de elementos de mantenimientos consumibles (tales como aceite lubricante, y
aceite hidráulico.) y procesos consumibles (tales como solventes o agentes utilizados en
plantas químicas y para la extracción de minerales.)
Todas estas cinco medidas son validas. Es simplemente cuestión de decidir cual es la más
apropiada en el contexto bajo consideración.
Por ejemplo, un turbo generador tiene el menor costo por unidad de rendimiento entre todos
los utilizados por una planta eléctrica, es probable que sus usuarios quieran que este genere
electricidad por el mayor tiempo posible. En términos de esta funcion, la medida de
mantenimiento más efectiva es la disponibilidad. (Los operadores pueden elegir hacer trabajar
el generador a media carga. También pueden escoger apagarlo de tiempo en tiempo por
razones puramente operativas. Las disminuciones de esfuerzo, o interrupciones de esta
naturaleza afectan la utilización del bien, opuestamente a su disponibilidad. En esencia, la
disponibilidad mide que porcentaje del tiempo la maquina esta disponible para cumplir con
sus requisitos primarios, mientras que la utilización mide cuanto tiempo realmente lo hace.
Por otro lado, el generador puede ser utilizado periódicamente para cubrir demandas picos de
energía. En este caso, la preocupación principal de los usuarios será que el generador se ponga
en funcionamiento tan pronto se lo requiera, de modo que una medida primaria de efectividad
será que tan frecuentemente lo hace (o contrariamente, con que frecuencia falla, expresándolo
en un porcentaje de fallas)
Cuando medimos la seguridad, el desempeño se mide generalmente en el número de días o de
horas trabajadas entre incidentes de pérdidas (o fatalidades). Esta es una forma de tiempo
medio entre fallas. Ara incidentes medioambientales se tomas medidas similares. En el frente
de calidad del producto, un porcentaje de deshechos de un 4% puede considerarse como una
medida d indisponibilidad, en el sentido de que mientras una maquina esta produciendo
deshechos , no esta “ disponible” para producir productos de primer nivel. (Una producción
de desechos de un 4% corresponde a un rendimiento de un 96%) Los porcentajes de
deshechos también pueden ser expresados como 20 partes por millón, que es otra manera de
expresar un porcentaje de falla. Ambas son medidas validas de la efectividad del
mantenimiento, especialmente en procesos altamente mecanizados o automatizados.
264
Expectativas Diferentes.:
Cada funcion se asocia con un set único de expectativas de continuidad (confiabilidad y/o
durabilidad y/o disponibilidad y/o dependencia).
Por ejemplo, dos de las funciones asociadas la carrocería de un auto son “aislar a los
ocupantes de un auto de los demás elementos” y “lucir aceptable”. La mayoría de los
propietarios esperan que esta pieza cumpla con su funcion a través de la vida útil del auto (a
menos que el auto sea convertible, o a menos de que abran una puerta o ventana. Por otro
lado, todos saben que los autos se ensucian- y por lo tanto comienzan a “lucir
inaceptablemente –luego de unos cuantos días o semanas. De modo que en el primer caso
tenemos expectativas de continuidad que puede ser medida en cintos, o miles de décadas,
mientras que en el segundo caso la expectativa de continuidad se mide en cientos de millas o
días.
Este tema se complica por el hecho de que la perdida de casi cualquier las funcion puede ser
causada por mas de un, a veces docenas de modos de falla, cada modo de falla esta saciado a
un porcentaje de falla especifico (o MTBF) y cada una pondrá la funcion fuera de servicio por
un periodo de tiempo que es especifico para ese modo de falla. Como resultado, las
características de continuidad de toda funcion será una mezcla de las características de
continuidad de todos los modos de falla que pudieran causar la pérdida de esa funcion.
Por ejemplo, tomemos la funcion “lucir aceptable” que mencionamos anteriormente. Además
de la acumulación de tierra, esta funcion podría perderse debido al herrumbre o la corrosión,
deterioro de la pintura, daños externos (lados rayados en un estacionamiento) y vandalismo,
entre otros. Debería ser aparente que algunos de estos modos de falla tienen poco y nada que
ver con el mantenimiento. Por ejemplo, el daño externo es principalmente una funcion de
cómo este auto – o el otro vehiculo involucrado es operado, a pesar de que el diseño pueda
formas parte de esto agregando guardas para reducir los daños o haciendo que sea mas fácil y
menos costoso reemplazar los paneles dañados. La probabilidad de vandalismo es también
una funcion relacionada a donde se utiliza el auto (condiciones de las rutas y condiciones
climáticas), y se lo maneja por un programa de mantenimiento apropiado (lavar el auto). La
corrosión y el deterioro de la pintura pueden ser muy influenciados en la etapa de diseño (sin
embargo, nuevamente, el contexto operativo – las condiciones climáticas y la provisión de
resguardo- y en algún grado las actividades de mantenimiento – lustrado y lavado del chasispueden tener responsabilidad en moderar la severidad y frecuencia de estas fallas.)
Este ejemplo nos lleva a dos conclusiones importantes:
* Necesitamos un entendimiento completo de todos los modos de falla que tengan
probabilidades d causar cada perdida de funcion, para así ser capaces de diseñar, operar y
mantener un bien de modo tal que las expectativas de efectividad que tenemos de cada
funcion puedan ser alcanzadas.
* Es irracional hacer responsable al encargado de mantenimiento de un bien por el logro de
los objetivos de continuidad (confiabilidad/ disponibilidad/ durabilidad/ seguridad) para
cualquier bien, o funcion de un bien. El logro de estos objetivos, es también responsabilidad
de cómo esta diseñado, construido y operado. La responsabilidad de alcanzar estos objetivos
debería estar dividida conjuntamente entre las personas encargadas de todas estas funciones.
(En otras palabras, efectividad de mantenimiento como se define en este capitulo no es solo
265
una medida de la efectividad del departamento de mantenimiento. Mide que tan efectivamente
todos los asociados al bien cumplen su funcion d hacer lo que fuera necesario para asegurar
que continúe cumpliendo la funcion que sus usuarios requieren).
Diferentes Funciones
Quizás el punto más importante sobre medir la efectividad de las actividades de
mantenimiento es el hecho de que todo bien tiene mas de una, a veces docenas de funciones
.Como explicamos anteriormente, un set único de expectativas de continuidad esta asociado
con cada funcion. Esto significa que si un bien tiene diez funciones, entonces la efectividad
con la que se esta manteniendo el bien puede medirse en al menos 10 modos diferentes.
Por ejemplo, consideremos como la efectividad del mantenimiento puede ser medida por el
propietario de una estación de gas suburbana típica. Para el propósito de este ejemplo, el
“bien” es un sistema de almacenamiento y bombeo utilizado para gasolina. En este sistema la
gasolina sin plomo es almacenada en un tanque subterráneo con una capacidad de 50.000
litros. Este es llenado periódicamente por un buque cisterna a un nivel de 48.000 litros. Un
interruptor de nivel superior del tanque enciende una luz de advertencia local en la oficina
principal una vez que el tanque ha alcanzado una capacidad de 48.500 litros, y otra enciende
otra luz de advertencia en la oficina principal si el nivel baja a 5000 litros. Una alarma de bajo
nivel suena en la oficina si el nivel del tanque baja a 2000 litros, y una ultima alarme de alto
nivel suena si el tanque alcanza los 49.000 litros. El tanque tiene cobertura reforzada para
asegurar que la gasolina es contenida en el caso de una perdida en la capa interna. Un
indicador de nivel indica el nivel de combustible en el tanque.
El tanque provee gasolina a cinco bombas. Cada bomba se enciende y se apaga al presionar y
liberar una perilla en el pico. La boca también incorpora un interruptor de presión que dispara
la bomba cuando el tanque de combustible esta lleno hasta la punta del pico. Un contador de
flujo mide la cantidad de combustible entregado cada vez que la bomba es activada y muestra
el volumen y valor del combustible entregado al cliente. Este contador vuelve a cero cada vez
que la bombilla vuelve a su sitio.
(Este sistema abarca funciones secundarias adicionales que tratan el acceso al tanque,
drenajes, ventilación, válvulas, facilidad de uso de un cliente, otras protecciones, apariencias y
así sucesivamente. Esto también será enunciado e una situación de la vida real. Sin embargo
para el propósito de este ejemplo, solo consideramos las funciones descriptas anteriormente. )
Sobre esta base, una lista de funciones debería medirse del siguiente modo:
* Bombear entre 25 a 40 litros de gasolina por minuto al vehiculo.
* Indicar volumen y valor de combustible entregado al cliente a entre un 0.03% del volumen/
valor actual.
* Apagar la bomba cuando lo requiera un cliente o cuando el tanque del cliente este lleno.
* Contener la gasolina.
* Almacenar entre 2.000 y 48.000 litros de gasolina
* Encender una luz de emergencia si el nivel del tanque alcanza los 48.500 litros.
* hacer sonar una alarma en la oficina principal si el nivel del tanque desciende de los 2000
litros.
* hacer sonar una alarma si el nivel del tanque alcanza los 49.000 litros.
* Contener los contenidos del tanque en el caso de perdidas.
* Indicar el nivel de combustible en el tanque dentro de un 0.05% del nivel actual.
266
Cuando se evalúa la efectividad de mantenimiento de este sistema, el propietario de la
estación de combustible tendrá un criterio diferente para cada una de las funciones anteriores.
Por ejemplo:
Funcion 1: Bombear entre 25 y 40 litros por minuto de gasolina al vehiculo.
Esta funcion puede fallar de tres maneras distintas, con tres tipos diferentes de consecuencias,
de modo que cada falla funcional necesita ser considerada por sus propios meritos, de la
siguiente manera:
- Falla Funcional A: Incapaz de propulsar liquido: obviamente si una bomba no esta
trabajando, no puede ser utilizada para bombear gasolina. Sin embargo, hay cinco bombas en
la estación de modo que el nivel de disponibilidad requerido depende del patrón de demanda.
Por ejemplo, el propietario de la estación puede decirnos que el “casi nunca” tiene las cinco
bombas trabajando a la misma vez - tan raramente que podemos ignorar la posibilidad. El
también puede decirnos que cuatro bombas tienden a ser usadas simultáneamente por u total
de no mas de una hora por día, y nunca por mas de diez minutos por vez. Si cada bomba tiene
una disponibilidad promedio de un 95%, dos bombas estarán fuera de servicio
simultáneamente por no mas de un 2% del tiempo. En otras palabras, cuatro bombas estarían
disponibles 98% del tiempo, mientras que hay una demanda de 4 bombas un 4% del tiempo.
Bajo estas circunstancias, solo una pequeña fracción de clientes necesitaría esperar por el
combustible, y no demasiado tiempo. Esto puede llevar al propietario a aceptar una
disponibilidad de un 95%. (Si el tuviera regularmente clientes esperando recibir gasolina al
mismo tiempo, esperaría una disponibilidad mucho mayor. Pero puede costarle mas
alcanzarlo, especialmente si tiene que pagar un premio por respuesta rápida cuando se llamen
a los técnicos para que traten las fallas.)
- Falla funcional B: bombea menos de 25 litros/minuto: algunos clientes regulares pueden
considerar la lentitud de las bombas lo suficientemente irritantes para llevar el negocio a
algún otro lugar, especialmente si hay alternativas cercanas mas eficientes.
Consecuentemente, el propietario tiene probabilidades de querer que cualquiera de sus
bombas bombee al ritmo requerido todo el tiempo- o al menos la mayor parte del tiempo
posible- . Esto puede comenzar a significar un 99.8% del tiempo en que la bomba no esta
fuera de acción- otra forma de “disponibilidad”.
* Funcion 2: Indicar el volumen y valor de la gasolina entregada al cliente dentro de un
0.03% del volumen y valor actual. Esta funcion puede fallar de dos maneras:
- Falla Funcional A: indica que se ha entregado mas de un 0.03% de menos combustible que
el real: Si esto sucede, el propietario de la estación parece estar vendiendo menos gasolina de
la que esta realmente vendiendo, entonces pierde dinero. La falla se vuelve aparente después
de un tiempo, porque el radio de gasolina vendida a gasolina recibida comenzara a declinar.
Sin embargo, el propietario seguirá persiguiendo un grado de falla bajo – no más de 1 en 1000
años para cualquier bomba. (Si el indicador falla completamente, muestra que no se ha
entregado nada. Si esto sucede, un cliente puede recibir un tanque gratis de gasolina, entonces
el jefe de la estación deberá apagar la bomba afectada hasta que se rectifique el problema. )
- Falla Funcional B: Indica que se ha entregado más de un 0.03% más de gasolina que la
real: Si esto sucede, y llega a la atención de los clientes o de las autoridades reguladores del
comercio (probablemente a ambos) El propietario de la estación estará en serios problemas.
Muchos de sus clientes se referirán a el como irresponsable, y se Irán otro lugar. La
267
autoridades probablemente lo multaran y dependiendo en la severidad de las discrepancias,
pueden llegar a revocar su licencia para comerciar poniéndolo fuera del negocio). La
severidad de estas consecuencias lo llevaran a buscar un grado de falla muy bajo – digamos
una en 50.000 años para cualquier bomba. (Si esto es alcanzable o no es otro tema).
Funcion 3: Detener una bomba cuando lo requiera un cliente, o cuando el tanque de
combustible del cliente este lleno. Esta funcion también puede fallar de tres maneras:
- Falla Funcional A: falla en cerrarse cuando lo requiere el cliente: Si la bomba sigue
trabajando una vez que el cliente libera la manija, la presión trasera debería cerrarla cuando el
tanque esta lleno. Como resultado, el cliente terminara con mucha más gasolina en el tanque
de la que quería, esto llevara a una discusión sobre cuanto debería pagar, y a la perdida de un
cliente. Como resultado, el propietario de la estación requerirá un grado de falla bajodigamos 1 en 1000 para cualquier bomba.
- Falla Funcional B: Falla en cerrarse cuando el tanque esta lleno: Muchos clientes confían
en el sensor para advertirles cuando el tanque esta lleno. Si falla en esto, la bomba debería
cerrarse cuando el cliente libera la perilla. Sin embargo, es posible que el tanque se rebalse en
los zapatos del cliente antes de que el o ella sea capaz de reaccionar, causando una
incomodidad total, y tal vez una demanda. Esto también llevara al propietario a pretender un
grado de falla bajo – digamos nuevamente 1 en 1000 años para cualquier bomba.
_ Falla Funcional C: los dos interruptores locales incapaces de detener la bomba: si tanto el
sensor, como la manija fallan en detener la bomba, esta continuara bombeando gasolina sobre
el predio hasta que se suspenda la provisión eléctrica, esto traerá aparejado un riesgo de
incendio considerable, de modo que el propietario esperar un nivel de falla muy bajo – uno en
1.000.000 de años.
Funcion 4: contención: Cuando se le consulta sobre esta funcion, el propietario de la estación
deberá decir algo como “tuvimos una perdida en el sistema de combustible en los últimos 10
años- y eso fue demasiado” aquí el usuario esta midiendo la efectividad en términos de un
porcentaje de falla. Cuando se lo presiona el debe aceptar un porcentaje de 1 en 500 años
para una pérdida “pequeña”, que el debe definir como menos de 5 litros por hora.
Funcion 5: almacenar entre 2000 y 48.000 litros de gasolina. Esta funcion puede también
fallar de tres modos, cada uno de los cuales debe ser considerado por separado, de la siguiente
manera:
_ Falla Funcional A: El nivel disminuye por debajo de los 2000 litros, en base a los patrones
normales de demanda, se ordena un nuevo suministro de gasolina cuando el nivel del tanque
se aproxima a los 5000 litros, y según nos dicen, casi siempre son entregados antes de que el
nivel alcance los 2000 litros, hay una creciente oportunidad de que el tanque quede vacio , lo
cual provocaria perdidas en la estacion. Como resultado, el gerente de la estacion, acelera la
entrega si el nivel disminuye a 2000 litros (como lo indica la alarma de bajo nivel). El afirma
que necesita acelerar las entregas aproximadamente una vez al año, sobre lo cual dice “es
apenas aceptable”. Nuevamente esta juzgando la efectividad en terminos de una relacion de
falla. (Note que este estado de falla es causado por una demanda en aumento o por una
entrega lenta. No tiene nada que ver con el Departemento de Mantenimiento en el sentido
clásico. Sin embargo, lidiar con esta falla puede ser considerado como “matenimiento” porque
estamos buscando generar “que continue el negocio”.)
268
_ Falla Funcional B: El nivel se eleva por encima de los 48 000 litros. El nivel del tanque
solo tiene probabilidades de alcanzar los 48 000 litros si el conductor de entrega no le esta
prestando atención al indicador de nivel del tanque mientras que se llena el tanque o si el
indicador de nivel ha fallado. En ambos casos, la luz de alarma se enciende a los 48 500 litros.
Según nos cuentan , esto sucede una vez cada seis meses, otra relacion de falla, que la gente
involucrada puede decir que acepta.
_ Falla Funcional C: El tanque contiene algo mas que gasolina. El tanque solo puede
contener algo mas si es llenado con algo mas, Diesel por ejemplo. Si esto sucede los clientes
podrían llenar sus tanques con el tipo incorrecto lo cual causaria serios daños. El dueño de la
estacion reconoce que la mala publicidad resultante y las quejas por daños podrian sacarlo del
negcocio, por lo tanto, preferiria que esto no ocurriera nunca. Cuando recuerda que “nunca”
es un ideal inalcanzable, puede decidir aceptar una relacion de fallas de, digamos, una vez en
100 000 años.
Funcion 6: Encender una luz de advertencia si el nivel disminuye por debajo de los 5 000
litros. El gerente de la estacion por lo general registra el nivel en todos los tanques de
combustible todos los dias con el fin de registrar la consumicion, y pide mas combustible
cuando los niveles se aproximan a los 5 000 litros. La luz de advertencia de bajo nivel sirve
como un recordatorio si falla el indicador de nivel o si hay un brusco aumento de demanda
entre las lecturas. La luz en necesario aproximadamente dos veces al año (Mted = 2 años). Si
no funciona cuando se la necesita, la alarma de bajo nivel suena cuando el nivel disminuye a
2000 litros. Si se realiza un pedido inicial en esta etapa, el tanque seguramente se secara y la
estacion estara sin gasolina durante varias horas. El dueño dice que aceptaria una frecuencia
de esta falla multiple de 400 años. A la luz de estas expectativas, la formula en la pagina 116
indica que la maxima indisponibilidad que la estacion podria tolerar en el caso de la luz de
advertencia de bajo nivel es Mted/ Mmf = 2/ 400 = 0.5%. Significa que la alarma de bajo
nivel es efectiva si se mantiene por encima del 99.5% de disponibilidad.
Funcion 7: Encender una luz de advertencia local si el nivel aumenta por encima de los
48500 litros. La luz de advertencia de alto nivel es respaldada por una alarma audible,
entonces siguiendo la misma logica que en el ejemplo anterior, el dueño puede llegar a la
conclusión que puede aceptar una disponibilidad de 97.5 % con respectp a esta luz de
advertencia.
Funcion 8: disparar una alarma si el nivel del tanque baja de los 2000 litros. Si el nivel del
tanque baja de los 2.000 litros y no suena la advertencia de nivel bajo, la entrega no esta
expeditada. Se nos dice que bajo estas circunstancias, hay un 50% de posibilidades de que el
tanque se seque antes de que el camion cisterna llegue, y la estación se quedara sin gasolina
por alrededor de una hora en promedio bajo tales circunstancias. Esto lleva al propietario de la
estación a llegar a la conclusión de que el no aceptara la falla múltiple (el nivel baja de los
2000 litros mientras falla la alarma.)
Una lógica similar debe seguirse para determinar la disponibilidad de las funciones de este
sistema que no estaban incluidas en la lista anterior. Sin embargo, para las funciones
discutidas, las expectativas de efectividad del propietario de la estación pueden resumirse de
la siguiente manera.
269
MEDICIÓN DE
EFECTIVIDAD
FUNCION
1
2
3
4
5
6
7
8
FALLA
FUNCIONAL
A
B
C
A
B
A
B
C
A
A
B
C
A
A
A
Comentarios
Disponibilidad
MTBF
> 95%
> 99%
>50 anios
>1000 anios
> 50.000 anios
> 1000 anios
>1000 anios
>1.000.000anios
> 500 anios
>1 anio
> 6 meses
> 100.000 anios
Cada Bomba
Cada Bomba
Cada Bomba
Cada Bomba
Cada Bomba
Cada Bomba
Cada Bomba
Sist. Completo
Tanque
Tanque
Tanque
Luz de Advert. Luz
de Advert.
Alarma
El ejemplo ilustra muchos puntos importantes sobre la medida de la efectividad del
mantenimiento:
* Cuando se mide el desempeño del mantenimiento, no estamos midiendo la efectividad del
equipo – estamos midiendo la efectividad funcional. La distinción es importante, porque
llevando el énfasis del equipo a sus funciones ayuda a las personas- a los mantenedores en
particular- a enfocarse en lo que hace el equipo más que en lo que es.
* Incluso los bienes simples tienen un número sorprendente de funciones. Cada una de estas
funciones tiene un grupo único de expectativas de desempeño. Antes de que sea posible
desarrollar un sistema de informes de mantenimiento efectivo y abarcativo, necesitamos saber
que son estas funciones, y debemos estar preparados para establecer lo que el usuario piensa
que el aceptable en cada caso.
* Hay una tendencia en enfocarse demasiado en las funciones primarias al evaluar la
efectividad del mantenimiento para un bien. Esto es un error, porque en la práctica las
funciones secundarias aparentemente triviales generalmente implican amenazas mayores a la
organización si fallan que las funciones primaria. Como resultado cada funcion debe ser
considerada al establecer como objetivo y objetivos de efectividad del mantenimiento.
Distintos niveles de desempeño y EEO
Si una funcion abarca distintos niveles de desempeño, es tentador trata de desarrollar una
medida simple de efectividad para toda la funcion. Por ejemplo, la funcion primaria de una
maquina llevando a cabo una operación de conversión en una fábrica, generalmente incorpora
tres niveles de desempeño de la siguiente manera:
* Debe trabajar en su totalidad
* Debe trabajan en el lugar adecuado
* Debe producir la calidad requerida.
La efectividad con la que continúa alcanzando cada una de estas expectativas se mide por
disponibilidad, eficiencia y rendimiento. Esto sugiere que una medida compuesta de
efectividad con la que esta maquina es completando su funcion primaria en una base continua
podría ser determinada al multiplicar estas tres variables del siguiente modo:
270
Efectividad General = disponibilidad x eficiencia x rendimiento.
Por ejemplo, la funcion principal de una maquina amoladora, es amolar 101 + 1 piezas por
hora a una profundidad de 11+ 1 mm.
Si esta maquina esta fuera de servicio, digamos un 5% del tiempo, su disponibilidad será de
un 95%. Si solo es capaz de producir 96 piezas por hora cuando esta trabajando, la eficiencia
será de un 96%. Si un 2% del producto final es rechazado, su rendimiento es de un 98%.
Aplicar la formula anterior da una efectividad general de 0.95 x 0.98 x 0.96 = 0.894 o 89.4%.
Este resultado compuesto se conoce generalmente como Efectividad General del equipo,
“Overall equipment effectiveness” o OEE. Las medidas de este tipo son muy populares
porque permiten evaluar un bien rápidamente. También parecen ofrecer una base para
comparar el desempeño de bienes similares. Sin embargo estas medidas también sufren de
muchas desventajas.
* El uso de tres variables en la misma ecuación, significa que las tres tienen un peso similar.
Este puede no ser el caso en la práctica.
Por ejemplo, en el ejemplo de la amoladora mencionado anteriormente, una pieza puede tener
un valor de $200 a ese punto del proceso. La organización puede estar sacando una ganancia
gruesa de $100 en el precio de venta del producto terminado, digamos $500. Esto significa
que 1% del tiempo de inactividad, o 1% de perdida de efectividad cuestan a la compañía una
venta por hora. Por otro lado, un 1% de deshecho implica que la organización debe desechar
una pieza por hora, representando $200 – de pérdida de trabajo en proceso, mas $100 de
pérdida de ganancia es decir $300 por hora. La maquina en este ejemplo esta perdiendo:
(5 x 100) + (4x100) + (2 x 300) = $ 1500 por hora.
* Es posible que muchos bienes, operen con demasiada rapidez o demasiada lentitud. Acelerar
excesivamente un equipo podría aumentar el OEE. Como los definimos, lo que podrían
aumentar aparentemente el rendimiento y el desempeño general, forzando al equipo a trabajar
en un estado de falla.
Por ejemplo, un nivel inicial de desempeño de la maquina amoladora mencionada
anteriormente deberá producir 101 + 1 piezas en una hora, el +1 indica que si la maquina
produce mas de 102 unidades en una hora, esta en estado de falla (tal vez porque comienza a
ir mas rápido en el proceso cuello de botella de montaje, aumentando la cantidad de trabajo en
espera, o porque al ir demasiado rápido la sierra de recalienta, dañando piezas, o produce un
desgaste de las herramientas.)
* El OEE como se lo define anteriormente solo hace referencia a la funcion primaria de
cualquier bien. Esto es confuso, porque como en el caso del sistema de almacenamiento de
gasolina, todo bien, incluidas las herramientas de una maquina – tienen muchas mas funciones
que la funcion primaria, y cada uno de esos tendrán sus expectativas de desempeño
particulares y únicas. Consecuentemente, el EEO no es una medida de efectividad general
para nada, solo una medida del cumplimiento de la funcion primaria del bien.
* Finalmente, por las razones discutidas anteriormente, el mantenimiento realmente orientado
al usuario, deben quitar su atención a la efectividad del “equipo” y centrarla en la efectividad
funcional. DE modo que si se necesita usar medidas de este tipo, es mucho mas apropiado
271
referirse a ellas como medidas de “efectividad de las funciones primarias” (PFE), mas que
“efectividad general del equipo”
Conclusión
Las dos conclusiones más importantes que emergen de la parte 2 de este capitulo son:
* Al evaluar la contribución que hace el mantenimiento al desempeño de cualquier bien, la
efectividad con la que se cumple cada funcion debe ser medida en una base continua. Esto a
su vez requiere un entendimiento claro como el agua de todas las funciones del bien, en forma
conjunta con un entendimiento igualmente claro de a que nos referimos cuando se lo
considera “fallado”
* El arbitro mas importante de la efectividad es el usuario (cuyas expectativas deben ser
realistas). Lo que los usuarios esperan variara – legítimamente- de funcion en funcion y de
bien en bien, dependiendo del contexto operativo.
14.3 Eficiencia del Mantenimiento
Como se mencionaba al comienzo de este capitulo, la efectividad del mantenimiento mide que
tan bien las funciones de mantenimiento están utilizando los recursos a su disposición. El gran
numero de formas en las que puede hacerse esto son generalmente bien entendidas, de modo
que solo son discutidas brevemente en esta parte de este capitulo lograr una compleción.
Las medidas de eficiencia pueden agruparse en cuatro categorías: costos de mantenimiento,
mano de obra, repuestos y materiales; y planeamiento y control.
Costos de Mantenimiento
Los costos a los que se refiere esta parte de este capitulo son los costos directos de mano d
obra de mantenimiento, materiales y contratistas, en forma opuesta a los costos indirectos
asociados con un desempeño muy pobre. Los últimos temas se discuten en la parte 3 de este
capitulo.
En muchas industrias, el costo directo de mantenimiento es el tercer elemento de los costos
operativos, debajo de la materia prima y de la mano de obra de producción o energía. En
algunos casos a escalado al segundo o hasta el primer puesto. Como resultado controlar estos
costos se volvió una prioridad principal.
Algunas industrias ofrecen alcance de reducción sustancial en los costos directos de
mantenimiento, especialmente aquellas cuyos procesos involucran altas tecnologías estables,
y que tienen un fuerte legado del pensamiento de la segunda generación incorporado a sus
prácticas de mantenimiento. Sin embargo, en otras industrias, especialmente las que están
mecanizando o automatizando sus procesos a un porcentaje significativo, el volumen de
mantenimiento es tal que los costos de mantenimiento tienen probabilidades de aumentar
enormemente en los próximos 10 años. Como resultado se debe tener cuidado en evaluar el
ritmo y dirección de los cambios tecnológicos antes de comprometerse a reducciones
sustanciales a largo plazo en los costos totales de mantenimiento.
Las formas mas comunes en que los costos de mantenimiento son medidos y analizados son
los siguientes.
272
* Costo total de mantenimiento (real y presupuestado)
* Para toda la planta
* Para cada unidad de Negocios
* Para cada bien o sistema
* Costos de mantenimiento por unidad de rendimiento.
* Radio de partes para gastos de mano de obra.
Mano de Obra
El costo de mano de obra de mantenimiento típicamente acumula entre un tercio y dos tercios
de los costos totales de mantenimiento, dependiendo de la industria y el nivel de salarios
generales del país involucrado. En este contexto, los gastos de mano de obra deberían incluir
costos de contratos laborales (que se agrupa en forma incorrecta bajo “repuestos y materiales”
porque es algo que e compra) Cuando consideramos la mano de obra de mantenimiento, es
sabio no cometer el error común de tratar el trabajo de mantenimiento realizado por los
operadores como un costo cero “porque los operadores están ahí de todos modos”. Al usar
operadores para este trabajo, la organización compromete recursos a mantenimiento, y los
costos deberían conocerse de acuerdo a esto.
Las formas comunes de medir y analizar la eficiencia de la mano de obra de mantenimiento
incluyen las siguientes:
* Costo de mano de obra de mantenimiento (total por unidad de rendimiento)
* Recuperación de tiempo (tiempo llevando a cabo tareas específicas como porcentaje del
tiempo total pagado.
* Tiempo extra (horas absolutas y como porcentaje de horas normales.)
* Cantidades de tiempo relativas y absolutas utilizadas en diferentes categorías de trabajo
(tareas proactivas, acciones de default y modificaciones, y subgrupos de estas categorías)
* Acumulación (por número de orden de trabajo y por horas estimadas.)
* Grado de gastos en contratistas de mantenimiento a gastos en empleados de mantenimiento
full time.
Repuestos y materiales.
Repuestos y materiales son responsable generalmente por la porción d gastos de
mantenimiento que no vienen ajo el titulo de “mano de obra”. De las siguientes formas se
analiza que tan bien están administrados:
* Gastos totales en repuestos y materiales (total y por unidad de rendimiento)
* Valor total de los repuestos en stock.
* Turnos de stock (valor total de repuestos y materiales divido en los gastos totales anuales en
esos ítems.)
* Niveles de servicios (porcentaje de ítems en stock requeridos, que están en stock cuando se
realiza el pedido)
* Valores relativos y absolutos de los diferentes tipos de stock (consumibles, repuestos
activos, repuesto de “seguro”, stock muerto.)
Planificación y control
Todos los aspectos de la eficacia y eficiencia de mantenimiento se ven afectados por que tan
bien se planifican y controlan las actividades de mantenimiento, desde la utilización general
273
de mano de obra, hasta la duración de interrupciones individuales. Las medidas típicas
incluyen:
* Total de horas de tareas preventivas, predictivas – de búsqueda de fallas de mantenimiento
solicitadas por periodo.
* Las horas anteriores como porcentaje de horas totales.
* Porcentaje de estas tareas que se completo según lo planeado.
* Horas planeadas trabajadas, versus horas no planeadas.
* Porcentaje de trabajos para los que se estimo el tiempo.
* Precisión en los cálculos (horas estimadas versus horas reales para los trabajos calculados.)
Algunas de estas medidas de eficiencia son útiles para tomar decisiones inmediatas o iniciar
acciones administrativas a corto plazo (gastos vs. Presupuestos, recuperación de tiempo,
grados de compleción de los programas, reservas). Otras son mas útiles para controlar las
tendencias y comparar el desempeño de plantas similares para poder planear soluciones a mas
largo plazo (costos de mantenimiento por unidad de rendimiento, niveles de servicio en
general) .En forma conjunta son de gran ayuda en enfocar la atención en que debe hacerse
para asegurar que los recursos de mantenimiento son utilizados tan eficientemente como es
posible.
La eficiencia de mantenimiento es también fácil de medir. Los temas que abarca están
generalmente bajo el control directo de los gerentes de mantenimiento. Por estas dos razones.
Hay una tendencia de estos managers de enfocar demasiada atención en la eficiencia y no
suficiente en la efectividad del mantenimiento. Esto es poco afortunado, porque los temas
discutidos bajo el titulo de efectividad de mantenimiento generalmente tienen un impacto
mayor en el bienestar físico y financiero de la organización que los alistados bajo eficiencia
de mantenimiento.
14.4 Que logra RCM
El grafico 1.1 del capitulo 1 muestra como las expectativas de la funcion de mantenimiento,
reproducida en el grafico 14.1, han evolucionado en los 50 años pasados.
Tercera Generación
Segunda Generación
*Mayor disponibilidad
de plantas.
* Vida de equipos más
extensa.
* Costos más bajos
Primera
Generación
*Repara cuando
Se rompe.
1940
1950
1970
*Mayor
disponibilidad
y
confiabilidad de las plantas.
* Mayor seguridad
* Mejor calidad del producto.
*
No
perjudican
el
medioambiente.
* Más extensa vida de los
equipos
* Mejor relación costoefectividad.
1980
1990
2000
Grafico 14.1 Expectativas crecientes en el mantenimiento.
274
El uso de RCM ayuda a completar todas las expectativas de la tercera generación. El grado en
el que lo hace se resume en los siguientes párrafos, comenzando con la integridad
medioambiental y de seguridad.
Mayor integridad Medioambiental y de Seguridad.
RCM contribuye a mejorar la protección medioambiental y de seguridad de los siguientes
modos:
* La revisión sistemática de las implicancias medioambientales y de seguridad de toda falla
evidente antes de considerar los problemas operativos significa que la integridad
medioambiental y de seguridad se convierten en prioridades máximas de mantenimiento
* Desde el punto de vista técnico, el proceso de decisión dicta que las fallas que puedan
afectar la seguridad o el medioambiente deben ser tratadas de algún modo- simplemente no se
tolera la inacción. Como resultado se seleccionan tareas diseñadas para reducir los riesgos
medioambientales y de seguridad a un nivel aceptable, sino lo eliminan completamente.
* El método estructural para los sistemas protegidos, especialmente el concepto de funcion
oculta, lleva a mejoras sustanciales en el mantenimiento de dispositivos de protección. Esto
reduce enormemente la posibilidad de fallas múltiples que presentan serias consecuencias.
(Esta es quizás la característica más poderosa de RCM. Utilizarla correctamente reduce
significantemente l riesgo de hacer negocios. )
* Involucrar grupos de operadores y mantenedores directamente en el análisis los vuelven más
sensitivos a los riesgos reales asociados con sus bienes. Esto les da menos probabilidades de
cometer errores de peligro y una mayor tendencia a tomas las decisiones correctas cuando las
cosas salen mal.
* La reducción general en el numero y frecuencia de las tareas de rutina (especialmente las
tareas invasivas que desestabilizan sistemas básicamente estables) reduce el riesgo de fallas
criticas que se presentan cuando el mantenimiento esta en camino, o al poco tiempo de la
puesta en marcha.
Como se menciona en la parte 2 de este capitulo el modo mas común de controlar el
desempeño en la áreas de seguridad e integridad medioambiental, es registrar el numero de
incidentes que ocurren, típicamente registrando el numero de perdidas por millón de horas
hombre en el caso de seguridad, y el numero de excursiones (incidentes donde se viola una
norma o regulación) por año en caso del medioambiente. Mientras que el objetivo final en
ambos casos es generalmente cero, el objetivo a corto plazo es siempre mejorar el record
anterior.
Para proveer una indicación de lo que RCM logra en el campo de la seguridad, el grafico 14.2
muestra el número de accidentes por millón de despegues registrados en la industria de
aviación civil comercial durante el periodo de desarrollo de la filosofía de RCM (excluyendo
los accidentes causados por sabotaje, acción militar o turbulencias). El porcentaje de choques
causados por fallas en los equipos también declino. Mucha de la confiabilidad mejorada es
por supuesto causada por el uso de materiales superiores y una mayor redundancia, pero la
mayoría de estas mejoras estaban dirigidas a su vez por la advertencia de que el
275
mantenimiento por si mismo no puede obtener el nivel deseado de los bienes del modo en que
estaban configurados.
Grafico 14.2 Seguridad en la industria de aviación civil.
Una mayor confiabilidad y disponibilidad de planta
El alcance en la mejora de desempeño claramente depende del desempeño final. Por ejemplo,
una empresa que alcanza un 95% de disponibilidad tiene menos potencial de mejora que una
que actualmente alcanza un 85%. Sin embargo, si se aplica correctamente RCm alcanza
mejoras notables sin importar el punto de inicio.
Por ejemplo, la aplicación de RCM contribuyo a lo siguiente:
* 16% de incremento en el rendimiento total de un bien existente de una planta procesadora
de leche que trabaja 24 horas al día, 7 días a la semana. Esta mejora se alcanzo en 6 meses, y
la mayor parte se atribuyo a una revisión exhaustiva de RCM realizada durante ese periodo.
El desempeño de una planta mejora por supuesto al reducir el numero y la severidad de las
fallas inanticipadas que tienen consecuencias operativas. El proceso de RCM ayuda a alcanzar
esto de los siguientes modos.
* La revisión sistemática de las consecuencias operativas de cada falla que no halla sido
tratada como un riesgo a la seguridad, en forma conjunta con el criterio estricto utilizado para
evaluar la efectividad de las tareas. Asegurar que solamente las tareas más efectivas son
seleccionadas para tratar cada modo de falla.
* El énfasis destinado a las tareas en-condición ayuda a asegurar que las fallas potenciales son
detectadas antes de convertirse en fallas funcionales. Esto ayuda a reducir las consecuencias
operativas de tres maneras:
- Los problemas pueden ser rectificados en un momento cuando el detener la maquina tenga
un efecto menor en las operaciones
276
- Es posible asegurar que todos los recursos necesarios para reparar la falla esten disponibles
antes de que esta ocurra, lo que acorta los tiempos de reparación.
- Las rectificaciones solo se realizan cuando los bienes realmente las necesitan, lo que
extiende los intervalos entre intervenciones correctivas. Esto a su vez significa que el bien
debe ser puesto fuera de servicio con menos frecuencia.
Por ejemplo, el ejemplo que se refería a las ruedas en la página 130, muestra que las ruedas
necesitan ser puestas fuera de servicio u 20% menos de veces para recauchetar, si se utiliza un
mantenimiento en-condición en lugar de la restauración programada.
*Al relacionar cada modo de falla con la falla funcional relevante, las planillas informativas
proveen una herramienta para un diagnostico rápido de las fallas que nos lleva a su vez a
tiempos de reparación mas cortos.
* El ejemplo previo sugiere que un mayor énfasis en el mantenimiento en condición reduce la
frecuencia de reparaciones mayores, con un aumento en la disponibilidad a largo plazo.
Además, una lista comprensiva de todos los modos de falla que son posibles, en forma
conjunta con una evaluación imparcial de la relación entre edad y falla. Revela que no existe
razón para llevar a cabo reparaciones de rutina. Este lleva a una reducción en el tiempo de
inactividad previamente programado sin un aumento en el no programado.
* A pesar de los comentarios anteriores, es a veces necesario planificar una interrupción o una
reparación por las siguientes razones:
- Para prevenir una falla genuinamente relacionada a la edad.
- Rectificar una falla potencial
- Para rectificar una falla funcional oculta.
- Para llevar a cabo una modificación.
En estos casos, la revisión disciplinada de la necesidad de acción preventiva o correctiva que
es parte del proceso de RCM, lleva listas de trabajo mas cortas, lo que lleva a interrupciones
también menores. Las interrupciones más cortas son más fáciles de manejar y por lo tanto
tienen más probabilidades de ser completadas según lo planeado.
* Las listas de trabajo mas cortas, también traen aparejada una mortalidad infantil menor,
cuando la planta es puesta en marcha luego de la interrupción, porque no fue perturbada tanto.
Esto también lleva a un aumento general en la confiabilidad.
* Como se explica en la página 268, RCM provee una oportunidad para aquellos que
participan en el proceso de aprender rápida y sistemáticamente como operar y mantener una
nueva planta. Esto les permite evitar muchos de los errores que de otra manera se cometerían
como resultado del proceso de aprendizaje y asegurar que la planta es mantenida
correctamente desde el principio.
Al menos cuatro organizaciones con las que el autor ha trabajado en UK, y USA alcanzaron lo
que se describe como “La puesta en marcha mas rápida y natural en la historia de la
Compañía” luego de aplicar RCM a las nuevas instalaciones. En cada caso, RCM se aplico en
las etapas finales de la puesta en marcha. Las compañías involucradas son la automotriz,
acero, papel y sectores de confección.
277
* La eliminación de plantas superfluas y por lo tanto de fallas superfluas. Como se
mencionaba en el capitulo 2, no es normal encontrar que entre el 5% y el 20% de los
componentes de una planta compleja son superfluos, pero pueden perjudicar el
funcionamiento cuando fallan. Eliminar estos componentes lleva a una mayor confiabilidad.
* Utilizar un grupo de personas que conocen el equipo bien como para llevar a cabo un
análisis sistemático de modos de fallas, se hace posible identificar y eliminar las fallas
crónicas que de otra manera parecen desafiar la detección y tomar la acción adecuada.
Calidad del Producto Mejorada
Al enfocarnos directamente en asuntos de calidad del producto, como mostrábamos en las
páginas 48 y 49, RCM hace muchísimo por mejorar el rendimiento de procesos
automatizados.
Por ejemplo, una operación de montaje electrónico utilizaba RCM para reducir los desechos
de un 4% (4.000 partes por millón) a 50 ppm.
Mayor eficiencia de Mantenimiento
RCM ayuda a reducir, o al menos a controlar el porcentaje de crecimiento de los costos de
mantenimiento de la siguiente manera:
Menos mantenimiento de rutina:
Donde sea que RCM haya sido aplicado correctamente sistema de mantenimiento preventivo
existente totalmente desarrollado, esto llevo a una reducción de un 40 % a un 70% en la carga
de trabajo de mantenimiento de rutina. Esta reducción se debe en parte porque se reduce el
número de tareas, pero principalmente debido a un aumento en los intervalos entre tareas.
Esto también sugiere que si se utiliza RCM en el desarrollo de programas de mantenimiento
para nuevos equipos o para equipos que no esten sujetos actualmente a un programa de
mantenimiento preventivo formal , la carga de rutina seria de un 40% - 70% menor que si el
programa de mantenimiento se desarrollara por otros medios.
Se debe tener en cuenta que en este contexto, “rutina” o “programa” de mantenimiento
significa cualquier trabajo realizado en una base cíclica , ya sea la lectura diaria de una
válvula de presión, una lectura mensual de vibración, un control funcional anual de un
interruptor de temperatura o un servicie general realizado cada cinco años. En otras palabras,
cubre las tareas en-condición programadas, la restauración programada, tareas de descarte
programado, y búsqueda de fallas programada.
Por ejemplo, RCM provoca las siguientes reducciones en las cargas de mantenimiento de
rutina cuando se aplican a los siguientes sistemas existentes:
* Un 50% de reducción en la carga de mantenimiento de rutina de una planta de confección.
* Un 50% de reducción en los requisitos de mantenimiento de los transformadores 11kV en
un sistema de distribucion eléctrica.
* Un 85% de reducción en los requerimientos de rutina de un sistema hidráulico en una
plataforma de petróleo.
278
* Una reducción del 62% en el número de tareas de baja frecuencia que necesitaban ser
llevadas a cabo en una maquina de línea de una fábrica de motores.
Se debe tener en cuenta que las reducciones mencionadas anteriormente son reducciones en
los requisitos de mantenimiento de rutina percibidos. En muchos sistemas PM, menos de la
mitad de los programas emitidos por la oficina de planificación se cumplen realmente. Este
cálculo es con frecuencia tan bajo como un 30%, y a veces, inclusive mas bajo. En estos
casos, un 70% de reducción en la carga de trabajo de rutina solo traerá lo que es emitido con
lo que realmente se lleva a cabo, lo que significa que no habrá reducción en las cargas
actuales de trabajo.
Irónicamente, la razón por la que tantos sistemas Pm tradicionalmente derivados sufren de un
programa tan bajo, es que se percibe que los trabajos de rutina son innecesarios. Si solo un
tercio del trabajo prescripto se lleva a cabo en cualquier sistema, ese sistema esta totalmente
fuera de control. Una revisión de RCM de base cero, colabora en gran medida a peor bajo
control situaciones como esta.
Una mejor compra de servicios de mantenimiento
La aplicación de RCM a los contratos de mantenimiento trae aparejados ahorros en dos áreas:
Primero, un entendimiento claro de las consecuencias de falla permite a los compradores
especificar mas precisamente los tiempos de respuesta- inclusive especificar diferentes
tiempos de respuesta para los diferentes tipos de fallas en diferentes tipos de equipos.
Teniendo e cuanta que la respuesta rápida es generalmente el aspecto mas costoso del
mantenimiento de un contrato, una buena sintonización en esta área puede traer aparejados
ahorros importantes.
En segundo lugar e l análisis detallado de las tareas preventivas permite a los compradores
reducir tanto los contenidos como la frecuencia de la porción de rutina de los contratos de
mantenimiento, generalmente por el mismo monto, (40% a 70%) como cualquier otro
programa que haya sido preparado en una base tradicional. Esto lleva a los correspondientes
ahorros en los costos contractuales.
Menor necesidad de emplear expertos caros.
Si los técnicos de campo empleados por los proveedores de los equipos participan de las
reuniones de RCM como se sugiere en la pagina 269, el intercambio de conocimientos que
tiene lugar, lleva a un salto en la capacidad de los mantenedores empleados por los usuarios
para resolver situaciones problemáticas. Esto también lleva a una caída igualmente dramática
en la necesidad de requerir ayuda de aquí en más.
Una Guía mas clara para obtener tecnología de mantenimiento
El criterio utilizado para decidir si una tarea proactiva es técnicamente posible y beneficiosa
se aplica directamente a l adquisición del monitoreo de condición del equipo. Si estos criterios
se aplican automáticamente a tales adquisiciones, se logran evitar un número de errores muy
costosos.
La mayoría de los ítems enunciados bajo “Mejora en el rendimiento operativo”
* Un diagnostico de fallas mas rápido significa que se desperdiciara menos tiempo en cada
reparación.
279
* Detectar las fallas potenciales, antes de que se conviertan en funcionales no solo significa
que las reparaciones pueden planearse apropiadamente, y por lo tanto ser llevadas a cabo con
mayor eficiencia, sino que también reduce las posibilidades de daños secundarios muy
costosos que la falla funcional podría causar.
* La reducción o eliminación de rehabilitaciones en forma conjunta con listas de trabajos
mas cortas para cada interrupción, puede llevar a ahorros sustanciales en los gastos en
repuestos y mano de obra (generalmente de mano de obra contratada.)
* La eliminación de plantas superfluas, significa también la eliminación de la necesidad de
prevenir que falle de un modo que interfiera con la producción, o de repararla cuando falla.
* Aprender como debería ser operada la planta, en forma conjunta con la adquisición de
fallas crónicas lleva a una reducción en el número y severidad de fallas, lo que también lleva
a una reducción en el monto de dinero que debe gastarse en repararlas.
El caso mas espectacular que el autor encontró sobre este fenómeno fue un caso de una falla
causada por el ajuste incorrecto de una maquina (error operativo) en una planta procesadora
de gran tamaño. Se identifico en una revisión de RCM y se considero que le costo a la
organización que utilizaba ese bien $ 1 MM en costos de reparación durante un periodo de 8
años. Se elimino al requerir a los operarios que regulen la maquina de un modo diferente.
Vida Útil más Extensa para los Ítems Costosos
Al asegurar que cada equipo recibe el mínimo de mantenimiento esencial- en otras palabras la
cantidad de mantenimiento necesario para asegurar que lo que pueda hacer sea siempre
superior a lo que los usuarios quieren que haga- El proceso de RCM hace mucho para ayudar
a asegurar que cada bien puede prepararse para durar mientras sus estructura básica
permanezca intacta, y se tengas repuestos disponibles.
Como mencionamos en muchas ocasiones anteriores, RCM ayuda a los usuarios a disfrutar
del máximo de vida útil de los componentes individuales, al seleccionar el mantenimiento encondición en preferencia a otras técnicas donde fuera posible.
Mayor motivación para el personal.
RCM ayuda a mejorar la motivación de las personas involucradas en el proceso de revisión de
diferentes maneras. Primero, el entendimiento claro de la funcion del bien, y de lo que debe
hacerse para mantenerlo trabajando, fortalece su competitividad y por lo tanto su confianza.
En segundo lugar, un entendimiento claro de los problemas que están más allá del control de
los individuos en particular – en otras palabras de los límites de lo que ellos pueden lograr- les
permite trabajar mas cómodamente dentro de esos limites. (Por ejemplo, los supervisores de
mantenimiento no son considerados responsables automáticamente por cada falla, como
sucede frecuentemente en la práctica. Esto les permite a ellos- y a sus colaboradores- trabajar
sobre la falla con más calma y un mejor razonamiento.)
En tercer lugar, el conocimiento de que cada miembro del grupo formo parte de la
formulación de objetivos, de decidir que debe hacerse para cumplir las metas, y quien debe
hacerlo, lleva a que todos tengas un gran sentimiento de pertenencia.
280
Esta combinación de competencia, confianza, comodidad y pertenencia lleva a que las
personas hagan su mejor esfuerzo para realizar bien el trabajo desde un principio.
Mejor Trabajo en Equipo.
De un modo curioso, el trabajo en equipo se ha convertido en un medio para un fin, y en un
fin en si mismo para muchas organizaciones. En la pagina 268 se resume la forma en que las
fuertes estructuras de RCM para analizar y tomar decisiones en problemas de mantenimiento
contribuyen a la formación de equipos de trabajo. Este método no solo forja el trabajo en
equipo dentro de los grupos de revisión, sino que también mejora la comunicación y la
cooperación entre:
* Los departamentos de producción y operaciones y la funcion de mantenimiento,
* Gerentes, Supervisores, técnicos y Operadores
* Diseñadores de equipos, vendedores, usuarios, y personal de mantenimiento.
Una Base de Datos de Mantenimiento:
Las Planillas Informativas y de Decisión de RCM proveen un número de beneficios
adicionales, de la siguiente manera:
* Adaptarse a situaciones cambiantes: La base de datos de RCM hace posible hacer el
seguimiento del motivo de cada tarea de mantenimiento desde las funciones y contexto
operativo del bien. Como resultado, si cualquier aspecto del contexto operativo cambia, es
fácil identificar las tareas afectadas y revisarlas respectivamente. (Ejemplos típicos de estos
cambios son las nuevas reglas medioambientales, cambios en la estructura de costos
operativos, que afectan la evaluación de consecuencias operativas, o la introduccion de
nuevas tecnologías de proceso.) Contrariamente, se tiene la misma facilidad para identificar
las tareas que no están afectadas por tales cambios, lo que significa que no se pierde tiempo
revisando esas tareas.
En el caso de los sistemas de mantenimiento derivados tradicionales, tales cambios significan
frecuentemente que el programa de mantenimiento debe ser revisado en su totalidad. Esto
suele ser visto como una empresa demasiado grande, causando que el sistema como un todo,
vaya cayendo gradualmente en desuso.
* Auditoria : La parte 3 del capitulo 5 mencionaba que mas que prescribir tareas especificas, a
una frecuencia también especifica , cada vez mas legislaciones de seguridad están
demandando que los usuarios de bienes físicos sean capaces de producir evidencia
documentada de que sus programas de mantenimiento están edificados sobre fundamentos
racionales y defendibles. Las planillas de RCm proveen esta evidencia de una forma
coherente, lógica y fácil de entender.
* Manuales y planos más precisos:
El proceso de RCM trae aparejado generalmente que los manuales y planos sean leídos bajo
una nueva luz. Las personas comienzan preguntando “ que hace?” , en lugar de “ que es?” ,
Esto los lleva a identificar un numero sorprendente de errores que no se notaban en la
confección de los planos ( especialmente planos de proceso e instrumentación) . Esto sucede
con mayor frecuencia si los operadores y mecánicos que trabajan con las maquinas participan
de los equipos de revisión.
281
* Reducir los efectos de las rotaciones de personal:
Todas las organizaciones sufren cuando las personas con experiencia de van o se jubilan,
llevándose todas su experiencia y conocimientos. Al registrar toda esa información en la base
de datos de RCM, la organización se vuelve mucho menos vulnerable a esos cambios.
Por ejemplo, una fábrica importante automotriz enfrenta una situación en que la planta estaba
por mudarse a otra localidad, y la mayoría de los trabajadores decidieron no mudarse con los
equipos. Sin embargo, al haber utilizado RCM para analizar los equipos antes de que hayan
sido retirados, la compañía pudo transferir gran parte los conocimientos y experiencias de los
trabajadores que se retiraban, a las nuevas personas empleadas para operar y mantener los
equipos n su nueva ubicación.
* La introduccion de sistemas expertos:
La información en la planilla informativa provee un cimiento excelente para un sistema
experto. En realidad, muchos usuarios consideran esta planilla como un sistema experto por si
misma, especialmente si la información es almacenada en una base de datos simple
computarizada, y distribuida de forma adecuada.
Un marco estructural Integrador
Como mencionábamos en el capitulo 1. Todos los temas discutidos anteriormente son parte de
la corriente principal de la administración de mantenimiento, y muchos son ya el objetivo de
programas de mejoras. Una característica clave de RCM es que provee un marco paso- a paso
efectivo para abarcarlos de una sola vez, y para involucrar a todas las personas que tengan
algo que ver con el equipo en proceso.
282
15- Una Breve Historia de RCM
15-1 La Experiencia de las aerolíneas.
En 1974 el Departamento de Defensa de los Estados Unidos encarga a United Airlines
preparar un informe de los procesos utilizados por la industria de aviación civil en la
preparación de programas de mantenimiento para aeronaves. El informe resultante se titulo
Mantenimiento Centrado en la Confiabilidad.
Antes de revisar la aplicación de RCM en otros sectores, los siguientes párrafos resumen la
historia de RCM, hasta el momento de la publicación del informe por Nowlan and Heap 1978.
Los párrafos en cursiva hacen referencia a párrafos de ese informe.
El Enfoque Tradicional del Mantenimiento Preventivo
El enfoque tradicional a los proyectos de mantenimiento programado estaba basado en el
concepto que cada vez que toda pieza de un equipo tiene una “edad adecuada” en la que
necesita un reacondicionamiento completo para asegurar la seguridad y la confiabilidad
operativa. A través de los años, sin embargo, se descubrió que muchos tipos de fallas no
podían ser prevenidos o reducidos con eficacia por esas actividades de mantenimiento, sin
importar la intensidad con la que se llevaban a cabo. En respuesta a este problema, los
diseñadores de aeroplanos comenzaron a desarrollar piezas para disminuir las
consecuencias de las fallas- esto significa que aprendieron a diseñar aeronaves “tolerantes a
las fallas”.Las practicas tales como la repercusión de funciones del sistema, el uso de
motores múltiples y el diseño de estructuras protegidas contra daños, debilito notablemente
la relación entre seguridad y confiabilidad, aunque esta no se elimino completamente.
Sin embargo, había una pregunta en lo que respecta a la relación entre mantenimiento
preventivo y confiabilidad. A finales de 1950, el tamaño de la flota de la aerolínea comercial
había crecido al punto en que había datos amplios para estudiar, y el costo de las actividades
de mantenimiento había llegado aun punto elevado para garantizar la investigación de los
resultados actuales de prácticas existentes.
Al mismo tiempo, la Agencia de Aviación Federal, que era responsable de regular las
practicas de mantenimiento de la aerolínea, estaba frustrada por las experiencias que
demostraban que no era posible controlar el nivel de fallas de ciertos tipos de motores no
confiables con ningún cambio viable en el contenido ni frecuencia de los
reacondicionamientos programados. Como resultado en 1960 se formo una fuerza de tarea,
que consistía en representantes de la FAA y de las aerolíneas, para investigar las
capacidades del mantenimiento preventivo.
El trabajo de este grupo llevo a establecer el Programa de Confiabilidad/ FAA, descripto de
la siguiente manera en la introducción del documento autorizante:
“El desarrollo de este programa tiene por objetivo el control de la confiabilidad a través de
un análisis de los factores que la afectan, y proveer un sistema de acciones para mejorar los
niveles bajos de confiabilidad cuando existan. En el pasado, se puso muchísimo énfasis en el
control de los periodos de reacondicionamiento para proveer un nivel de confiabilidad
satisfactorio. Luego de cuidadosos estudios el comité esta convencido de que la confiabilidad
283
y los controles de reacondicionamiento no son necesariamente temas directamente
relacionados…”
Este enfoque fue un desafío directo al concepto tradicional de que la cantidad de tiempo entre
los reacondicionamientos sucesivos de un bien Era un factor importante en controlar el
grado de falla. El grupo de trabajo desarrollo un programa de propulsión de confiabilidad, y
cada aerolínea involucrada en este grupo fue autorizada a desarrollar e implementar
programas de confiabilidad en el área de mantenimiento en la que estaba más interesada.
Durante este proceso, se aprendió una gran cantidad sobre la condición que debía existir
para que el mantenimiento programado sea efectivo. Dos descubrimientos fueron
especialmente sorprendentes:
* El reacondicionamiento programado tiene un efecto mínimo en la confiabilidad general
de un ítem complejo, a menos que el ítem tenga un modo de falla dominante.
* Hay muchos ítems para los que no hay forma efectiva de mantenimiento programado.
La Historia del Análisis de RCM
El siguiente paso fue un intento por organizar lo que se había aprendido de los numerosos
programas de confiabilidad y desarrollar un método de aplicación lógica y general al diseño
de programas de mantenimiento preventivos. Una técnica de diagrama de decisión
rudimentaria se diviso en 1965, y en Junio de 1967se presento un informe de su uso en el
AIAA Encuentro de Diseño y Operaciones de Aeronaves Comerciales.
Los cambios y refinamientos de esta técnica estaban en un manual de evaluación y desarrollo
de programas, cuyo borrador fue realizado por un grupo de mantenimiento formado para
seguir el curso del programa inicial para el nuevo avión Boeing 747. Este documento,
conocido como MSG-1, fue utilizado por grupos especiales de industrias, y por el personal de
FAA para desarrollar el primer sistema de mantenimiento programado basado en los
principios del mantenimiento centrado en la confiabilidad. El programa de mantenimiento
para el Boeing 747fue exitoso.
El uso de la técnica de diagrama de decisión trajo mayores mejoras, que fueron incorporadas
dos años después en un segundo documento , MSG-2: Documento de Planificación de
Programas de Mantenimiento de Fabricantes de Aeronaves.
El MSG2 fue utilizado para desarrollar los programas de mantenimiento para los aviones
Lockheed 1011 y el Douglas DC10. Estos programas también fueron exitosos. El MSG2
también fue aplicado a naves de táctica militar: las primeras aplicaciones fueron para naves
como ser el Lockheed S-3 y P-3 y el McDonell F4J. Un documento similar preparado en
Europa fue la base del programa inicial para aeronaves como el Airbus Industrie A-300 y el
Concorde.
El objetivo de la técnica subrayada en MSG-1 y MSG-2 era desarrollar un programa de
mantenimiento que asegurara la máxima seguridad y confiabilidad de que fuera capaz el
equipo, y tambien que las provea al costo mas bajo posible. Como ejemplo de los beneficios
económicos alcanzados por este método, bajo las políticas de mantenimiento tradicionales el
programa inicial para el Douglas DC-8 requería reacondicionamiento programado para 339
ítems, en contraste con 7 ítems en el programa DC10. Uno de los ítems que esta sujeto a
límites de reacondicionamiento fue el motor de la turbina de propulsión. La eliminación de
284
los reacondicionamientos de motores programados trajo aparejado grandes reducciones en
los costos de mano de obra y materiales, y tambien reducciones en el inventario de repuestos
de motores requerido para cubrir el taller de mantenimiento por más de un 50%. Teniendo en
cuenta que los motores para ese tipo de aeroplanos costaban mas de U$1MM , estos fueron
ahorros respetables.
Como otro ejemplo, bajo el programa MSG-1 para el Boeing 747, United Airlines gasto solo
66.000 horas hombre en inspecciones estructurales, antes de alcanzar un intervalo básico de
20.000 horas para las primeras inspecciones de este avión. Bajo las políticas tradicionales de
mantenimiento esto significo un gasto de más de 4 millones de horas hombre para llegar al
mismo intervalo de inspección estructural para el pequeño y menos complejo Douglas DC-8.
Las reducciones de costos de esta magnitud son de importancia para cualquier organización
responsable de mantener flotas de equipos complejos. Lo que es aun más importante:
* Tales reducciones en los costos se alcanzan sin disminuir la confiabilidad. Por el
contrario, un mejor entendimiento del proceso de falla en los equipos complejos ha
mejorado la confiabilidad haciendo posible dirigir las tareas preventivas a la evidencia
específica de fallas potenciales.
A pesar de que los documentos MSG-1 y MSG-2 revolucionaron los procedimientos a seguir
en el desarrollo de programas de mantenimiento para aeronaves de transporte, su aplicación
a otros tipos de equipos se vio limitada por su enfoque breve y especializado. Además, la
formulación de ciertos conceptos estaba incompleta. Por ejemplo, la lógica de decisión
comenzaba con una evaluación de tareas propuestas, mas que una evaluación de las
consecuencias de fallas que determinaba si se las necesitaba, y si esto era así, su propósito
real. No se mencionaba el problema de intervalos de tareas, el rol de las funciones ocultas
estaba poco claro, y el trato del mantenimiento estructurado era inadecuado. Tampoco había
guía en el uso de información operativa para refinar o modificar el programa inicial una vez
que el equipo entraba en servicio, o que los sistemas de información necesitaban un manejo
efectivo de los programas continuos.
Todas estas carencias, conjuntamente con la necesidad de clarificar muchos de los principios
utilizados, llevo a los procedimientos analíticos de mayor alcance y sus aclaraciones a la
disciplina lógica conocida como mantenimiento centrado en la Confiabilidad.
15.2 La Evolución de RCM
El autor y sus colaboradores comenzaron trabajando con la aplicación de RCM en los sectores
mineros y de manufactura a principios de 1980. Ellos utilizaron una versión con una
modificación mínima del diagrama del Nowlan and Heap entre 1983 y 1990. Durante este
periodo, el medioambiente se volvió todo un tema. En los primeros días, los facilitadores
tenían la orden de tratar los riesgos medioambientales con la misma seriedad que los riesgos
de seguridad. Sin embargo en la práctica esto significaba que muchos problemas
medioambientales que no representaban una amenaza directa a la seguridad eran pasados por
alto. El medioambiente puede ser un tema altamente contencioso que no se permite una
evaluación subjetiva como lo hace la seguridad.
Como resultado, en 1988 el autor comenzó a trabajar con un número de organizaciones
multinacionales para desarrollar un enfoque mas preciso hacia las fallas que amenazaban el
medioambiente.
285
Esto termino en el agregado de la pregunta E del diagrama de decisión en 1990. El uso de
normas y reglamentos como base para esta decisión quito el elemento de subjetividad. Sin
embargo, al tema se le dio la misma importancia acorde a la prioridad de la seguridad , en
reconocimiento a la prioridad cada vez mayor que la sociedad pone en el medioambiente,
como se discute extensamente en la parte 3 del capitulo 5. La suma de esta pregunta sola
cambio el diagrama de decisión lo suficiente para garantizar el cambio de su nombre a RCM
2.
Otros cambios Incorporados a RCM 2:
Cuando se lanzo RCM 2 en septiembre de 1990, se incorporaron un número de otros cambios
en el proceso de decisión que había estado bajo desarrollo por varios años. Estos fueron los
siguientes:
* Los términos “técnicamente viable” y “Conveniente y beneficioso” fueron substituidos por
“Aplicable” y “efectivo”.
* El pequeño pero significante numero de casos donde la búsqueda de fallas era imposible o
impractica llevo al agregado de un criterio de selección formal para esta tarea. También llevo
a la suma del proceso de decisión secundario para las funciones ocultas que se explican en la
pagina 186.
* La pregunta H fue enmendada para evitar un número de ambigüedades.
* La pregunta S también se altero para evitar posibles ambigüedades traídas por el significado
de la palabra “seguridad”.
* Se agrego la extensión en cursiva a la pregunta O porque muchos usuarios tendían a
interpretar esta pregunta de un modo muy estrecho.
* Las preguntas H1/ S1/ O1/ N1 se modificaron para hacerlas mas fáciles de entender.
* El termino “restauración Programada” se sustituyo por “reconstrucción programada” en las
preguntas H2/ S2/ O2/ N2 porque “reconstrucción” tiene un sentido diferentes en las fabricas.
Esto frecuentemente causaba confusión.
* Las preguntas en el diagrama de decisión revisado fueron re- codificadas.
Con la posible excepción de la pregunta referida a las consecuencias medioambientales,
ninguno de estos cambios representa una separación de la filosofía remarcada en el diagrama
de decisión de Nowlan and Heap…
El efecto neto de estos cambios fue llevar a cabo una técnica que ya sea extraordinariamente
robusta a nivel teórico aun mas fuerte, y hacerla mas fácil y rápida de aplicar.
¿Cuando se aplico RCM?
RCM se aplico en más de 1000 plantas en 41 países. Los proyectos van desde capacitación in
–company (dentro de la empresa), para gerentes de operaciones y mantenimiento, hasta la
aplicación completa de RCM a todos los niveles y equipos de la planta. Los sectores en los
que se llevaron a cabo los proyectos alcanzan casi todos los campos del esfuerzo humano.
Estos incluyen minas, fabricas, petroquímicas, Servicios (electricidad, gas y agua), trasporte
286
masivo (especialmente trenes) construcciones y servicio a constructoras y plantas militares
(fuerzas aéreas, armada y marina.)
El espacio no permite una consideración detallada del trabajo realizado en cada caso. Sin
embargo, el capitulo 14 provee un resumen general de los resultados alcanzados hasta ahora,
en forma conjunta con una breve revisión de algunos puntos destacados.
15.3 Otras Versiones de RCM y de la Norma SAE.
El resto de este capitulo provee un resumen de la evolución de RCM en general. Los párrafos
en cursiva fueron extraídos directamente de un articulo titulado “La nueva Norma RCM de
SAE” por Netherton 2000.
En 1980, [la Asociación Americana de Transporte Aéreo] produjo MSG-3, Documento para
el Desarrollo de Programa de Mantenimiento para Aerolínea/Fabricante. MSG-3 estaba
influenciado por el libro de 1978 de Nowlan and Heap, pero se intento sea una continuación
de la tradición empezada por los primeros documentos de MSG. Este es el documento que
hoy guía el desarrollo de los programas iniciales de mantenimiento programado de los
nuevos aviones comerciales de los Estados Unidos.
Sin embargo la línea de pensamiento en los libros de Nowlan and Heap tomo vida por si
misma. Ellos estaban encargados de escribir su libro por pedido del Departamento de
Defensa de EE.UU. (DoD), que buscaba a la aviación comercial para disminuir sus propios
costos de mantenimiento. El Departamento de defensa había tomado conocimiento de que la
aviación comercial había encontrado un método revolucionario para el mantenimiento
programado, y esperaba beneficiarse de su experiencia. Una vez que el Departamento de
Estado publico el libro de Nowlan and Heap, la fuerza militar comenzó a desarrollar
procesos de RCM para su uso interno: uno de la armada, uno de las Fuerzas Aéreas, y dos de
la Marina- Porque las comunidades de navíos y aviación insistían en que un proceso de
RCM que funcionaba para una, no podría funcionar para la otra. Los contratistas y
vendedores de equipos aprendieron a utilizar estos procesos cuando vendían nuevos equipos
a la Milicia americana. Los procesos de publicaron en Reglamentos Militares y
Especificaciones (que nunca se actualizaron) a mediados de 1980.
En un trabajo separado pero paralelo, a principios de 1980, el Instituto de Investigación de
Energía Eléctrica (EPRI), un grupo de investigación para los servicios de energía eléctrica
de USA, llevo a cabo dos aplicaciones piloto de RCM en la industria de energía eléctrica. Su
interés surgió de una creencia de que esta industria estaba alcanzando niveles adecuados de
seguridad y confiabilidad, pero que estaban manteniendo en exceso sus equipos. Como
resultado, su principal objetivo era simplemente reducir los costos de mantenimiento , mas
que mejorar la confiabilidad, y modificaron el proceso de RCM de acuerdo a eso.( Tanto, en
realidad, que tiene poco que ver con el proceso de RCM original descripto por Nowlan y
Heap; debería ser descripto mas correctamente como Optimización Planeada de
Mantenimiento PMO, mas que RCM. ) Este proceso modificado, fue adoptado en una base
amplia industrial por la industria de energía nuclear Americana en 1987, y muchas
variaciones de este enfoque fueron adoptadas por otras utilidades nucleares, otras ramas de
la generación y distribucion de electricidad, y parte de l industria petrolífera.
Al mismo tiempo, cierto especialitas en la formulación de estrategias de mantenimiento, se
interesaron en la aplicación de RCM en industrias diferentes a la aviación. Primero entre
ellos estaba John Moubray y sus socios. Este grupo trabajo inicialmente con RCM en
287
industria mineras y de manufacturas, al Sur de África bajo la tutoría de Stan Nowlan, y
seguidamente se mudaron al Reino Unido. Desde ahí sus actividades se expandieron hasta
cubrir la aplicación de RCM en prácticamente todos los sectores industriales en más de 40
países. Agrandaron el trabajo de Nowlan, manteniendo siempre el enfoque en la seguridad de
los equipos y la confiabilidad. Por ejemplo, han incorporado asuntos medioambientales en el
proceso de toma de decisiones, clarificaron el modo en que debe definirse las funciones de un
equipo, desarrollaron reglas mas precisas para la selección de tareas de mantenimiento e
intervalos de tareas, e incorporaron el criterio de riesgo cuantitativo en el establecimiento de
intervalos de tareas de búsqueda de fallas. Su versión mejorada de RCM se conoce como
RCM 2.
La Necesidad de una Norma: Década del 90.
Desde comienzos de los 90, muchas mas organizaciones desarrollaron variaciones del
proceso de RCM , Algunas, como el Comando Aéreo Naval de Estados Unidos con sus “Guía
para el Proceso de Mantenimiento centrado en la Confiabilidad (NAVAIR 00-25-403)” y la
Marina Real Británica con sus Normas de Ingeniería Naval orientadas a RCM ( NES45),
permanecieron fieles al proceso expuesto originalmente por Nowlan and Heap. Sin embargo,
a medida que comenzó a rodar el vagón de RCM, emergieron un montón de nuevos
procedimientos llamados “RCM”, pero que pero que se parecen en poco y nada al proceso
original, investigado meticulosamente, estructurado, y totalmente comprobado. Como
resultado, si una organización decía que necesitaba ayuda en usar o aprender a usar RCM,
no podía saber con certeza que proceso le estaban ofreciendo.
En realidad, cuando la marina Norteamérica solicito a los proveedores de equipos que
apliquen RCM al construir una nueva clase de barcos, una compañía ofreció utilizar un
proceso relacionado al proceso de 1970 MSG-2. Esta defendió su oferta diciendo que su
proceso utilizaba un diagrama de decisión lógico. Como RCM también utiliza un diagrama
de decisión lógico, la compañía argumento que su proceso era el proceso de RCM.
La Marina de USA no tenia respuesta para ese argumento, porque en 1994 William Perry , el
Secretario de Defensa de EE.UU. , estableció una nueva política sobre normas y
especificaciones militares, que decía que la milicia norteamericana no solicitaría nunca mas
a los proveedores industriales utilizar los procesos estándares o específicos del cuerpo
militar. En lugar de esto, se establecerían requisitos de desempeño, y permitiría a los
proveedores utilizar cualquier proceso que provean equipos que cumplan con esos requisitos.
Este desarrollo coincidió con el repentino interés del mundo industrial en RCM. Durante los
90, revistas y conferencias devotas al mantenimiento de equipos se multiplicaron, y los
artículos de revistas y escritos de conferencias sobre RCM se volvieron cada vez más
numerosos. Esto mostró que procesos muy diferentes están siendo dados por el mismo
nombre, “RCM”. De modo que tanto la milicia Americana como la Industria Comercial
vieron la necesidad de definir que es un proceso de RCM.
En su memorando de 1994, Perry dijo “yo incentivo a el Subsecretario de Defensa
(adquisición y tecnología) que forme sociedades con asociaciones industriales para
desarrollar normas no-gubernamentales para el reemplazo de normas militares donde sean
practicables. “ En realidad El Equipo Normas Técnicas del SAE, tuvo una relación larga y
cercana la comunidad de la milicia americana, y estuvieron trabajando por varios años para
288
ayudar a desarrollar normas comerciales para reemplazar las normas militares y las
especificaciones, cuando sea necesario y cuando no se cuente con ninguna existente.
Entonces en 1996, la SAE comenzó a trabajar en una norma relacionada a RCM, cuando
invito a un grupo de representantes de las comunidades de RCM de la Marina Americana,
para ayudar a desarrollar una norma para los Programas de Mantenimiento. Estos
representantes habían estado reuniéndose por prácticamente un año en un esfuerzo por
desarrollar un proceso de RCM de la Marina Americana que fuera común para las
comunidades de barcos y aviones, de modo que ellos ya habían llevado a cabo una cantidad
de trabajo considerable cuando comenzaron a reunirse bajo SAE como sponsor. A finales de
1997, habiendo ganado miembros de la industria comercial, el grupo se dio cuenta de que
era mejor enfocarse por completo en RCM. En 1998, este completo su borrador de la norma,
y SAE lo aprobó y publico.
Luego de una breve discusión sobre las dificultades practicas asociadas con el intento de
desarrollar un estándar universal de esta naturaleza, Netherton continúa diciendo:
La norma ahora aprobada por la SAE no presenta un programa Standard (RCM). Su titulo es
“Criterio de Evaluación para Procesos de Mantenimiento Centrado en la Confiabilidad
(SAEJA1011)”. Esta norma presenta un criterio contra el cual se puede comparar un
proceso. Si el proceso cumple con ese criterio, puede ser considerado un “Proceso de RCM”
con confianza. (Esto no significa necesariamente que los procesos que no cumplen con la
norma SAE RCM no sean procesos validos para la formulación de estrategias de
mantenimiento. Simplemente significa que no se debería aplicar el termino “RCM”).
Como mencionamos en el capitulo 1, el proceso de RCM descripto en los capitulos 2 al 10 de
este libro cumple totalmente con las normas SAE.
289
Apéndice 1:
Jerarquías del Bien y Diagramas de Bloque Funcionales.
Registros de planta y jerarquías del bien.
La mayoría de las organizaciones poseen, o al menos usan, cientos o miles de bienes físicos.
Estos bienes abarcan en tamaño desde pequeñas bombas a talleres siderúrgicos,
transportadores de aviones o cuadras de oficinas. Estos pueden estar concentrados en una
planta pequeña o dispersos en miles de millas cuadradas. Algunos de estos bienes será
móviles, otros fijos.
Antes de que una organización pueda aplicar RCM- un proceso utilizado para determinar que
debe hacerse para asegurar que un bien continua cumpliendo con las funciones pretendidas
por el usuario – debe saber cuales son estos bienes y donde están. En todas las empresas por
pequeñas y simples que sean, esto significa que se debe preparar una lista de toda la planta,
equipos y edificios pertenecientes o utilizados por la organización que necesitan
mantenimiento de cualquier especie. Esta lista se conoce como registro de planta.
El registro debe ser diseñado de manera que sea posible realizar un seguimiento de los bienes
que ya han sido analizados utilizando RCM, lo que serán analizados y los que no. (El registro
de planta también es necesario para otros aspectos del manejo de mantenimiento, tales como
la planificación y programación de tareas de mantenimiento de rutina y no rutinarias, registros
históricos, y cálculos de costos de mantenimiento.)
El capitulo 4 explicaba que RCM puede ser aplicado a casi cualquier nivel en una jerarquía.
Tambien sugiere que el nivel mas apropiado es el nivel que lleva a un
Numero manejable de modos de falla por funcion. Los niveles “apropiados” se vuelven
mucho mas fáciles de identificar si el registro de planta esta organizado como una jerarquía
que haga posible identificar cualquier sistema o cualquier bien , a cualquier nivel de detalle ,
hasta llegar a e incluyendo componentes individuales ( ítems reemplazables) o hasta
repuestos.
El camion de la pagina 85 provee un ejemplo de tal jerarquía. El grafico A1.1 muestra otro
ejemplo que cubre una caldera en una fábrica de alimentos.
290
ComidaCo Inc
Fabrica 1
Fabrica 2
Fabrica 3
Departamento
de preparacion
Departamento
de empaque
Suministro de
potencia
Sistema de aire
Sistema de
agua
Sistema de manejo
de carbon
Caldera 1
Caldera 2
Caños y tuberias
Chimenea
Bomba de
alimentacion
Bomba
Servicios
locales
Motor
Oficina Central
Distribución
Departamento de
Mantenimiento
Caldera
Sistema de manejo de
cenizas
Ventilador FD
Etc.
Etc.
Válvula de
seguridad
Caja de cambios
Grafico A1.1 Jerarquía del Bien.
Puede aparecer una lista de la jerarquia de los bienes, en conjunto con un sistema numerico
jerarquico para cada bien, como se muestra en la figura A1.2
Numero
01
02
03
0301
0302
0303
030301
030302
030303
Bien
ComidaCo Inc
Fabrica 1
Fabrica 2
Fabrica 3
Dep. de preparación
Dep. de empaque
Servicios locales
Suministro de potencia
Sistema de aire comprimido
Sistema de Agua
291
030304
03030401
03030402
0303040201
0303040202
0303040203
030304020301
030304020302
030304020303
0303040204
03030403
03030404
0304
04
05
Caldera
Sistema de manejo de carbon
Caldera 1
Caños y tuberías
Chimenea
Bomba de alimentación
Bomba
Motor
Caja de cambios
Ventilador FD
Caldera n° 2
Sistema de manipuleo de cenizas
Departamento de mantenimiento
Distribución
Oficina Central
Grafico A1.2 Registro de Planta y Sistema Numérico Jerárquico.
Jerarquías Funcionales y Diagramas de Bloques Funcionales.
Es posible desarrollar una jerarquía mostrando la funcion primaria de los bienes en la
jerarquía del bien. El grafico A1.3 como debe hacerse esto para la jerarquía del bien en el
grafico A1.1.
Para mostrar la relación entre funciones al mismo nivel, se utilizan variaciones de la jerarquía
funcional del grafico A1.3. Esto se conoce generalmente como diagramas de bloque
funcional” y pueden ser utilizados para describir la relación de diferentes modos. Por ejemplo,
Smith 1993 define un diagrama de bloque funcional como “una representación de primer
nivel de las funciones más importantes que cumple el sistema”. Por otro lado, Blanchard &
Fabrycky 1990, quien prefiere el termino “diagrama de flujo funcional”, sugiere que estos
diagramas pueden ser preparados a niveles muy diferentes. Smith tiende a utilizar los
diagramas para mostrar el movimiento de materiales, energía y señales de control a través y
entre diferentes elementos de un sistema, mientras Blanchard & Fabrycky los utiliza para
describir el movimiento de bienes simples a través de diferentes fases (tales como una
aeronave pasando desde puesta en marcha, taxi, despegue, escalar, descenso, aterrizaje, etc.)
Un diagrama de flujo funcional para la caldera en el grafico A.1 muestra que el carbón fluye
desde la planta de almacenaje a las dos calderas, y los residuos a la planta de cenizas.
Tambien muestra que materiales y servicios fluyen a través del sistema. Esto se ilustra en el
grafico A1.4 de la página 332, que continúa mostrando un diagrama de flujo más complejo
para una de sus calderas.
Las jerarquías funcionales y diagramas de bloque funcionales son una parte esencial en el
proceso de diseño de equipos, porque el diseño comienza con una lista de funciones deseadas,
y los diseñadores tienen que especificar una entidad (bien o sistema) que sea capaz de cumplir
con los requisitos funcionales. Como mencionábamos en el capitulo 2, los diagramas de flujo
funcionales pueden ser de ayuda, cuando se aplica RCM a plantas donde los procesos o las
relaciones entre ellos no son intuitivamente obvias. Estas tienden a ser estructuras monolíticas
de gran tamaño tales como plantas navales, aeronaves de combate, y las partes menos
accesibles de plantas nucleares.
292
Sin embargo, en la mayoría de otras aplicaciones industriales (tales como estaciones de
energía termal, plantas de fábricas de automotores y alimentos, plataformas petrolíferas,
plantas petroquímicas y farmacéuticas y flotas de vehículos.) generalmente no hay necesidad
de dibujar diagramas de bloque funcionales antes de embarcarse en un proyecto de RCM, por
las siguientes razones:
ComidaCo Inc
01
Fabrica 1
02
Fabrica 2
03
Fabrica 3
04
Distribución
0301
Departamento de
preparación
0302
Departamento de
empaque
0303
Servicios locales
030301
Suministro de
potencia
030302
Sistema de aire
030303
Sistema de agua
03030401
Sistema de manejo de
carbón
03030402
Caldera 1
03030403
Caldera 2
0303040201
Caños y tuberías
0303040202
Chimenea
0303040203
Bomba de
alimentación
05
Oficina Central
0304
Departamento de
Mantenimiento
030304
Caldera
03030404
Sistema de manejo de
cenizas
0303040204
Ventilador FD
Etc.
Etc.
0303040205
Válvula de
seguridad
Grafico A1.3: Jerarquía del bien…
293
ComidaCo Inc
Mision
Producir 26000 ton.
por año de galletitas
Producir 17000 ton.
por año de postres
Producir 35000 ton.
por año de caramelos
Producir 78000 ton. por
año de alimentos
Recibir los
ingredientes para
fabricar 35000 ton.
de caramelos por año
Empaquetar y
distribuir 35000 ton.
de caramelos por año
Suministrar potencia,
agua, vapor a los
departamentos de
produccion
Distribuir 1200 kW
de 380 volt., fase 3
de electricidad
Suministrar 500 cu
m/min de aire de
instrumento seco y
limpio
Suministrar 50000
litros por hora de
agua potable.
Almacenar 200 ton. de
carbon y suministrarlo a las
calderas a 2,5 ton por hora.
Generar hasta 10000
Kg7hr de vapor seco
y limpio a 185° C
Generar hasta 10000
Kg7hr de vapor seco
y limpio a 185° C
Contener 2500 litros de
agua hervida a barra 12.
Quemar 1.2 ton de
carbon por hora
Suministrar 10000
litros/hr de agua a
las calderas a barra
10.
Dar dirección
estrategica y apoyo a
todas las unidades
Adquirir, instalar y
mantener todos los
bienes fisicos en la
fabrica 3.
Etc.
Suministrar 20000
Kg por hora de vapor
a 185°C
Remover 0.2 ton de cenizad de
las calderas y almacenar 40
ton de cenizas
Suministrar 12000
cu m/hr de aire a la
chimenea
Etc.
Liberar el vapor a la
atmosfera si la
presion excede barra
11.
Grafico A1.3 Con su correspondiente Jerarquía Funcional…
294
Nivel 4: Caldera
Potencia AC
Carbon
Agua
Potencia AC
Vapor
Gas
Suministrar
aceite a la
caldera
Generar vapor
Generar gas
Pre calentar el
agua
Generar vapor
Remover las
cenizas
Potencia
AC
Vapor
Vapor
Potencia AC
Cenizas
Nivel 5: Caldera 1
Tratamiento
quimico
Agua
Potencia
AC
Aire
Potencia
AC
Carbon
Agua sucia
Suministrar
agua al tambor
Forzar el aire a
traves de la
chimienea
Cargar
carbon
Potencia
AC
Eliminar el agua
sucia
Contener agua
Circular aire
caliente por el
agua
Quemar
carbon
Hervir
agua
Descargar cenizas
Gas
Cenizas
Descargar vapor
Liberar el exceso
de presion de
vapor
Vapor
Grafico A1.4 Diagramas de Bloque Funcionales.
* En la mayoría de las industrias la relación entre los diferentes procesos es generalmente bien
entendida por los participantes de los grupos de Revisión de RCM, lo que hace estos
diagramas innecesarios.
Por ejemplo, los operadores y mantenedores de una planta de calderas estarán totalmente al
tanto de que el carbón, agua y aire entran por un extremo de la caldera, y el vapor, gas y
cenizas (y ocasionalmente agua sucia) salen por el otro. La mayoría de ellos apoyaran la
noción que realizar un diagrama con estos datos simples será una perdida de tiempo. Como se
discute extensamente en el capitulo 2, el verdadero desafío no esta en identificar la relación
295
simple y obvia de los procesos, sino en definir el desempeño deseado relativo a la capacidad
inicial de los componentes de un sistema, y luego definir que debe hacerse para asegurar que
el sistema continúe cumpliendo con el desempeño deseado.
En casos de incertidumbre, los equipos son generalmente lo suficientemente accesibles para ir
y ver que va en cada parte, y si no, la información requerida puede extraerse de los planos de
proceso e instrumentación. En realidad, un buen grupo de P&ID’s prácticamente siempre
elimina la necesidad de diagramas de bloques, como precursor a la aplicación de RCM. En
tales casos, los diagramas de bloque aumentan los costos, esfuerzo y tiempo del proceso de
RCM, y no agregan nada aso valor.
* Los diagramas Funcionales d Bloque solo identifican las fallas funcionales a cada nivel, de
modo que solo cuentan parte de la Historia. (Por ejemplo, casi todos los bienes del nivel 4 y
menores del grafico A1.1 tienen una funcion secundaria de contención. Esto no puede
mostrarse en un diagrama de bloque funcional sin hacerlo muy difícil de manejar.)
* Como explicaba la parte 3 del capitulo 2, las principales funciones de los bienes
jerárquicamente por encima del nivel escogido para el análisis debería ser resumido en
enunciados correctos del contexto operativo. Estos enunciados se formulan solo para bienes
relevantes para el análisis en cuestión. Como resultado, no se pierde tiempo en definir las
funciones de bienes que no son aplicables al bien bajo consideración. ( Si se analizan grandes
números de bienes , estos enunciados de contenidos de nivel superior evolucionar hasta
convertirse en una jerarquía Funciones de facto para toda la organización, una mucho mas
detallada que el diagrama de un enunciado por bien.)
*Los bienes al nivel o por debajo del nivel escogido para el análisis son tratados como parte
normal del proceso de RCM. La parte 7 del capitulo 4 mostraba que las funciones de los
bienes de niveles mas bajos se enuncian ya sea como funciones secundarias en el análisis
principal, o manejadas como modos de falla, o en el caso de subsistemas excepcionalmente
complejos , quebradas para análisis por separado.
Por ejemplo, el ejemplo del camion que se observa en el cuadro 4.11 en el capitulo 4 mostraba
como un bloqueo en la línea de combustible podía ser tratado simplemente como un modo de
falla del motor o de la caja de dirección, sin necesitar un enunciado de funcion separado para
el sistema de combustible o la línea de combustible.
(En la experiencia del autor, Los diagramas funcionales de bloque tienden a ser de mayor
valor para personas externas tratando de aplicar RCM para beneficio de los usuarios de
equipos. Porque son personas externas, necesitan estos diagramas – generalmente preparados
a expensas de los propietarios del bien – para mejorar su propio entendimiento del proceso
que está por analizar. La mejor manera de evitar este gasto es no emplear personas externas
como analistas, en primer lugar, sino dar el puesto de facilitadores a personas que tengan
conocimientos de primera mano de la planta.)
Limites del Sistema:
Cuando se aplica RCM a cualquier bien o sistema, es por supuesto importan definir
claramente donde “comienza” el sistema a ser analizado y donde termina. Si se grafico una
jerarquía de bienes comprensiva y se tomo la decisión de analizar un bien en particular a un
nivel determinado, entonces el sistema generalmente de modo automático abarca todos los
bienes por debajo de ese en la jerarquía. La única excepción son los subsistemas, que son
296
considerados tan insignificantes que no serán analizados para nada, o los subsistemas muy
complejos que serán separados para un análisis por aparte.
Se debe tener cuidado con los circuitos de control que consisten en un sensor en un sistema
que envía una señal a un procesador en un segundo sistema, que a su vez activa un actuador
en un tercer paso. El capitulo 4 explicaba que se puede manejar este tema conduciendo el
análisis a un nivel lo suficientemente alto como para asegurase que el “sistema” cubre el
circuito en su totalidad.
También se necesita tener cuidado para asegurar que el bien o sus componentes que están el
limite no caigan entre los cortes. Esto se aplica especialmente a ítems como ser válvulas.
Es sabio no ser demasiado rígidos al definir los limites, porque el entendimiento crece a través
del proceso de RCM, y las percepciones de lo que debería o no incorporarse cambian con
frecuencia. Esto significa que los límites pueden necesitar extenderse para incorporar algunos
subsistemas, otros se eliminaran o se ubicaran por aparte para un análisis posterior.
297
APÉNDICE 2:
Errores Humanos.
El capitulo 4 mencionaba que muchas fallas en los equipos son causadas por “errores
humanos”. Yo continué mencionando que si un error humano especifico es considerado una
razón creíble para que ocurra una falla funcional, entonces ese error debe ser incluido en la
(FMEA). Sin embargo los errores humanos representan un tema de enorme importancia. El
propósito de este Apéndice es proveer un resumen corto, y sugerir como se los debe tratar
dentro del marco de RCM.
Categorías principales de errores humanos.
Cuando consideramos la interacción de personas y maquinas, Blanchard 1995, agrupaba los
principales factores bajo 4 títulos:
* Factores antropométricos
* Factores sensoriales humanos
* Factores Psicológicos
* Factores Fisiológicos.
Prácticamente todo error humano puede ser trazado a una falla o problema, que puede haber
ocurrido en el menos una de estas cuatro áreas. Como resultado, las revisamos brevemente en
esta parte de este apéndice, antes de buscar con más detalle la cuarta categoría.
Factores Antropométricos:
Los factores antropométricos son los relacionados al tamaño o fuerza de los operadores o
mantenedores. Los errores ocurren porque una persona (o parte de una persona, tales como
una mano o brazo):
- Simplemente no entra en el espacio disponible para llevar a cabo una tarea.
- No puede alcanzar algo
- No tiene la suficiente fuerza para levantar o mover algo.
Si se presenta una falla, o tiene posibilidades reales de ocurrir por cualquiera de estas razones
es muy poco probable que se encontrara una tarea de mantenimiento proactivo para
manejarla. Además, si un error humano ocurre por una de estas razones, el error humano no
es la raíz. El modo de falla es un error de diseño, el error humano es un efecto de la falla.
Si las consecuencias de una falla que esta presentándose por razones antropométricas son tales
que deba hacerse algo al respecto, el único curso de acción viable será el rediseño. Esto casi
siempre involucrara la reconfiguracion de un bien de modo tal que sea más accesible o fácil
de mover. En este contexto, el grafico A2.1 muestra algunas dimensiones consideradas por la
marina de USA, adecuadas para el acceso razonable de seres humanos en espacios aislados.
298
Grafico A2.1 Donde caben las personas.
Factores Humanos Sensoriales:
Los factores sensoriales humanos hacen referencia a la facilidad de las personas para ver, oír,
sentir, y hasta oler lo que sucede alrededor. En el caso de los operadores esto tiene a aplicarse
a la visibilidad y legibilidad de instrumentos en consolas de control. Para el personal de
mantenimiento, se refiere a la visibilidad de los componentes en escondijos de sistemas
complejos. Los niveles y variabilidad de ruido también afectan la capacidad de operadores y
mantenedores de discernir que esta pasando con sus equipos.
Se debe tener en cuanta que si se presentan o se considera que se pueden presentar errores por
estas razones, el error humano no es la causa raíz, sino el efecto de alguna otra razón. La
solución generalmente implica el rediseño del bien (hacer las cosas mas fáciles de ver, reducir
el nivel ruidos, etc.
Factores Fisiológicos
El termino “factores Fisiológicos” se refiere a presiones medioambientales que afectan el
desempeño humano. Estas presiones incluyen temperaturas altas o bajas, ruidos fuertes o
molestos, humedad excesiva, altas vibraciones, exposición a químicos tóxicos o radiación, o
simplemente el trabajar por demasiadas horas – especialmente en una tarea con exigencias
físicas o mentales- sin los descansos adecuados.
299
La exposición continua a estas presiones lleva a una capacidad sensorial reducida, respuesta
motriz más lenta y a una lucidez mental reducida. Estas son todas manifestación de fatiga
humana, y todas aumentan las posibilidades de que las personas cometan errores, deslices o
tengan lapsos.
Si estos errores humanos ocurren, la falla es causada por otra razón. De nuevo, i las
consecuencias lo justifican, la solución será el rediseño. Ya sea el diseño del ambiente físico,
para reducir los causantes de estos errores (por ejemplo, reduciendo la temperatura o
proveyendo protección auditiva) o los procedimientos operativos pueden ser cambiados de
modo que se les de a las personas estresadas la oportunidad de recuperarse (descansos mas
largos, o mas frecuentes.)
Otra presión ambiental es el clima organizacional hostil o tenso. Mientras este no tare
necesariamente aparejado un stress fisiológico, puede llevar a una predisposición creciente a
cometer errores Psicológicos. En muchos casos, lleva al uso inapropiado de las relaciones de
liderazgo, Desafortunadamente RCM no puede hacer mucho en este aspecto.
Sin embargo lo que puede hacer RCM es aliviar o eliminar la relación hostil que existe entre
mantenimiento y operaciones, como se explica en la pagina 268. Esto hace que las personas se
inclinen menos a culparse unas a otras por los errores, y ha inclinarse mas por encontrar
soluciones.
Factores Psicológicos
Hay tres series de factores discutidos hasta ahora, y todos de refieren a factores externos que
causan el error humano. Como resultado son muy fáciles d identificar y de manejar (aunque
hacerlo puede llegar a ser costoso).
Una categoría mucho mas compleja y desafiante de errores son aquellas que tienen sus raíces
en la psiquis de lo seres humanos.
Errores psicológicos
Reason 1991, divide las categorías psicológicas de errores humanos entre los que son in
intencionales, y los intencionales. Un error no intencional es uno que ocurre cuando alguien
realiza una tarea que se supone lleve a cabo, pero la hace en forma incorrecta (“Hace el
trabajo en forma incorrecta”). Un error intencional ocurre cuando alguien es deliberadamente
puesto a hacer un trabajo inapropiado (hace el trabajo incorrecto), Reason divide estas
categorías en mayor detalle del siguiente modo:
Desacierto
Falla de Atención
Llevar a cabo una tarea de
forma incorrecta o en la
secuencia errónea.
Acción no
intencional
LAPSO
Fallas de Memoria
Saltearse un paso en una
frecuencia de eventos.
ERROR
FALTAS
Acción
Intencional
VIOLACIÓN
Faltas Basadas en Reglas
Mal aplicación de una buena regla, o mala aplicación
de una regla.
Faltas basadas en conocimiento
Respuesta inapropiada a una situación nueva anormal.
Violaciones de Rutina
Violaciones excepcionales
Actos de Sabotaje
300
Grafico A2.2 Categorías de errores psicológicos.
* Los errores no intencionales de dividen en desaciertos y lapsos.
* Los errores intencionales si dividen en faltas y violaciones.
Estas categorías se ilustran en el grafico A2.2 se discuten brevemente en los siguientes
párrafos.
Desaciertos y Lapsos:
Los desaciertos y lapsos se conocen también errores basados en la capacidad. Estos ocurren
cuando alguien totalmente calificado para llevar a cabo una tarea – y que puede haberlo hecho
en forma correcta muchas veces en el pasado- hace el trabajo en forma incorrecta. Los
desaciertos ocurren cuando una tarea se hace en forma errónea (por ejemplo un electricista
conecta en forma incorrecta un motor, haciendo que este vaya en reversa). Los lapsos ocurren
cuando alguien pasa por alto un punto clave en una secuencia de actividades. (Por ejemplo, si
un mecánico se olvida una herramienta después de trabajar en una maquina, o se olvida de
colocar un componente de importancia a rearmarla.)
Estos errores generalmente suceden porque la persona estaba distraída, preocupada, o
simplemente con la mente ausente. Como resultado, son generalmente impredecibles, aunque
las posibilidades aumentan si la persona no tiene un buen ambiente de trabajo, o si la tarea es
excesivamente compleja. Sin embargo, si el ambiente es benigno, y la tarea es simple,
entonces se podría considerar este caso como la raíz del error.
La posibilidad de muchos desaciertos y lapsos puede reducirse si los operadores y personal de
mantenimiento están involucrados directamente con el proceso de RCM (especialmente en la
FMEA). Esto les deja un entendimiento mucho más amplio y profundo de los efectos y
consecuencias de sus acciones, lo que a su vez resulta en una motivación mayor para hacer el
trabajo bien desde un principio. Esto se aplica especialmente a tareas donde las consecuencias
de las fallas tienden a ser mas serias. Otro método esta basado en a creencia de que si algo
puede ser mal instalado, lo será. La solución es volver al trazado de planos y:
* Rediseñar los sistemas de modo que solo puedan ser montados en la secuencia correcta.
* Rediseñar los componentes individuales de modo que solo puedan ser instalados del lado
correcto y en el lugar preciso.
Esta es la esencia del concepto japonés de poya yoke (“a prueba de errores”). Esta filosofía
debería ser aplicada a los diseños originales, más que hacerlo en bienes ya existentes, ya que
es mas fácil imponer una buena practica desde el principio, que modificar una practica mala
mas adelante.
Faltas 1: Faltas basadas en las reglas.
Estas faltas ocurren cuando las personas creen estar siguiendo el modo de acción correcto al
llevar a cabo la tarea (en otras palabras al aplicar una regla). Pero en realidad el curso de
acción es inapropiado. Las faltas basadas en las reglas se dividen en mala aplicación de una
buena regla, o aplicación de una mala regla.
En el primer caso, bajo un grupo de condiciones dadas, una persona selecciona un grupo de
acción que parece ser apropiado, generalmente porque su aplicación fue exitosa en el pasado-
301
de aquí el termino “buena regla”. Sin embargo alguna variaciones provocan que el curso de
acción _ elegido en forma premeditada_ sea incorrecto.
La aplicación de una mala regla implica su sentido literal. La elección del curso de acción
prescripto es simplemente incorrecta.
En estos casos, la causa raíz de la falla es la regla en si misma, o el proceso que se utilizo
para seleccionarla. Si la regla fue promulgada o seleccionada por una persona diferente a la
que lleva a cabo la tarea, en otras palabras si la persona haciendo el trabajo solo esta
siguiendo ordenes, entonces el error es realmente el resultado de otra falla.
El proceso de RCM ayuda a reducir de dos maneras la posibilidad de aplicación errónea de
buenas reglas:
* El análisis de profundo de los efectos de falla , especialmente de lo que podría suceder si la
funcion oculta esta en estado de falla cuando se la necesita, significa que las personas tienen
una menor tendencia a sacar conclusiones inapropiadas cuando la situación se presenta (
especialmente si están involucradas en el proceso de RCM.)
* Al enfocar la atención en las funciones de mantenimiento de los dispositivos de protección,
el proceso de RCM reduce enormemente la probabilidad de que estos dispositivos esten en
estado de falla en un principio.
La posibilidad de crecimiento de los malos hábitos también se reduce si se tiene cuidado
durante un FMEA en identificar los modos de falla que están alertando, y seguir los pasos
para reducirlos a un mínimo. (En los casos donde la frecuencia y/o las posibles consecuencias
de una falsa alarma lo justifiquen, el remedio mas apropiado generalmente implica el
rediseño.)
RCM ayuda a reducir la posibilidad de aplicar malas reglas, porque el proceso de RCM en su
totalidad trata de definir las reglas mas apropiadas para el mantenimiento de cualquier bien.
Por supuesto, se debe tener cuidado en que las reglas de RCM por si mismas no se apliquen
en forma errónea. La mejor manera de lograrlo es asegurar que todas las personas
involucradas en el proceso sean capacitadas intensamente.
Faltas 2: faltas basadas en el conocimiento.
Las faltas basadas en el conocimiento ocurren cuando alguien se confronta con una situación
en que no fue anticipada y que no tiene precedentes (para la que “no hay reglas”). En
situaciones como esta, la persona tiene que tomar una decisión sobre el curso apropiado de
acción, y un error se presenta si esta decisión esta equivocada.
En la practica, el autor encontró que un problema común que se presenta en este contexto, es
la creencia por parte de los gerentes e ingenieros de que “Yo se, por lo tanto la empresa sabe”.
En realidad si se presenta un problema en un horario en que todos los superiores están fuera
de la planta, ese conocimiento es absolutamente inútil si la persona que tiene que tomar la
decisión del curso a seguir frente al problema no lo posee.
Esto sugiere que lo primero que debe hacerse para evitar faltas basadas en el conocimiento, es
mejorar los conocimientos de las personas que deben tomar decisiones. En la mayoría de los
302
casos, estos son operarios y personal de mantenimiento. Los operadores y mantenedores
tienden a tomar decisiones apropiadas con mayor frecuencia, si entienden claramente como
trabaja el sistema (sus funciones), que puede salir mal, (fallas funcionales modos de falla),
los síntomas de cada falla (efectos de fallas). Como mencionamos repetidas veces en los
capitulos 12, 13 y 14, este entendimiento es enormemente reforzado si los operadores y
mantenedores se involucran directamente en el proceso de RCM. Los descubrimientos más
importantes pueden ser diseminados subsecuentemente a las personas que no participan en el
análisis, si se los incorpora en los programas de capacitación.
Si fuera necesario, la posibilidad de faltas basadas en el conocimiento, también puede
reducirse al diseñar o rediseñar sistemas de modo que:
* Se minimice la complejidad, para que haya menos que saber.
* Se minimice la renovación, porque las tecnologías nuevas y extrañas, ponen a las personas
al comienzo de la curva de aprendizaje donde los errores tienen más posibilidades de ocurrir.
* Evitar las consecuencias domino. Esto significa diseñar sistemas de modo tal que si se
presenta una falla, las consecuencias evolucionen con una lentitud tal para darles a las
personas tiempo de pensar y tomar decisiones adecuadas.
Violaciones
Una violación ocurre cuando alguien comete un error bajo conocimiento y de manera
deliberada. Estas se dividen entres categorías:
* Violaciones de rutina: Por ejemplo cuando las personas tienen el habito de no utilizar la
indumentaria de seguridad (tales como los cascos) a pesar de las reglas que establecen
claramente que deberían hacerlo.
* Violaciones excepcionales: Por ejemplo, si alguien que usualmente usa un casco,
deliberadamente sale al exterior sin el caso porque “no lo podían encontrar o no tenían tiempo
para buscarlo.”
La solución a esto generalmente consiste en actitudes de la jefatura que forjen a cumplir las
reglas. Sin embargo, nuevamente, el empapase del proceso de RCM le da al las personas un
entendimiento mas claro de los procedimientos de seguridad y del riesgo que corren si los
violan.
Conclusión:
Las conclusiones más importantes que emergen de este apéndice son:
* No todos los errores humanos son necesariamente culpa de la persona que cometió el error.
En muchos casos esta forzado por circunstancias externas, o por reglas inapropiadas. De
modo que si se debe encontrar un culpable, se debe tener cuidado en identificar la fuente real.
* El error humano es una razón tan común de que los equipos fallen en cumplir sus funciones,
como lo es el deterioro, o inclusive más que este. Como resultado, Debe ser tratada como
parte del proceso de RCM, ya sea como modo de falla cuando es la causa raíz, o como efecto
de la falla cuando consiste en respuestas inapropiadas a otras fallas.
* En el contexto industrial, solo es posible trabajar los errores humanos, si las personas que
los cometen, están involucradas directamente con identificarlos, y desarrollar soluciones
apropiadas.
303
APÉNDICE 3:
Continuidad de Riesgo
El capitulo 5 sugería que puede ser posible producir un programa de riesgos tolerables que
combine riesgos de seguridad y riesgos económicos en una continuidad. Sugiere que esto
puede ser posible al combinar los gráficos 5.2 y 5.14 de alguna manera.
El grafico 5.14, repetido como figura A3.1, mostraba que una organización puede decidir lo
que es capaz de aceptar para un evento que tiene consecuencias económicas solamente.
Trivial
Hasta $ 100
$ 1000
$ 10 000
$ 100 000
$ 1 000 000
$ 10 000 000 +
1
10-1
10-2
10-3
10-4
10-5
10-6
Grafico A3.1 Tolerabilidad de riesgo económico.
El grafico 5.2 Describía que puede estar preparado un individuo para tolerar en una situación
especifica de cualquier evento que pudiera ser fatal en esa situación, como se resume en el
grafico A3.1.
Control completo, eleccion total
(en mi auto o en mi casa)
Cierto control, cierta eleccion (en
el trabajo)
Sin control, cierta eleccion (en un
avion de pasajero)
Sin control, sin eleccion (fuera del
sitio)
10-4
10-5 10-6
10-7 10-8
Grafico A3.1 Tolerabilidad de riesgo fatal.
En realidad, estas dos tablas no pueden ser combinadas de esta forma, porque el grafico A3.1
esta basado en la probabilidad de un solo evento, mientras que el A3.2 describe lo que un
individuo puede tolerar en cualquier evento.
Sin embargo, la parte 3 del capitulo 5 mostraba que es posible utilizar lo que un individuo
tolera de cualquier evento en una situación dada como base para decidir que probabilidades se
aplican para cada evento que pudieran ponerlo/la en una situación de riesgo.
304
El primer paso es convertir lo que una persona tolera en un determinado lugar en una cifra
general. En otras palabras, si yo tolero una probabilidad de 1 en 100.000 (10-5) de ser
asesinado en el trabajo en cualquier momento y tengo 1000 compañeros de trabajo que
comparten la misma opinión, entonces todos aceptamos que en promedio una persona sera
asesinada en el trabajo una vez en 100 años, y esa persona puedo ser yo, y puede suceder ese
año.
El siguiente paso es traducir la probabilidad que tanto yo como mis compañeros de trabajo
estábamos preparados para tolerar, de que uno de nosotros puede morir por cualquier evento
en el trabajo, en una probabilidad tolerable de cada evento particular (modo de falla o falla
múltiple) que pudiera terminar con la vida de alguien.
Por ejemplo, continuando con la logica del ejemplo previo, la probabilidad de que cualquiera
de mis compañeros sea asesinado en cualquier año es de 1 en 100 (asumiendo que todos en el
lugar enfrentan los mismos peligros). Aun mas, si las actividades desarrolladas en el lugar
involucran 10 000 eventos capaces de matar a alguien, entonces la probabilidad promedio de
que cada evento pueda matar a una persona debe ser reducida a 10-6. Esto significa que la
probabilidad de un evento capaz de matar a 10 personas debe ser reducido a 10-7, mientras
que la probabilidad de un evento que tiene la oportunidad de 1 en 10 de matar a alguien debe
ser deducido a 10-5. En un lugar que esta dividido en diferentes areas y en el cual cada area
esta dividida en diferentes secciones, este proceso de sub dividir el riesgo aceptable puede ser
llevado a cabo en etapas de la siguiente manera:
* Un modo de falla simple (como se lo define en FMEA) que por si mismo tiene
consecuencias letales. La probabilidad relacionada a este tipo de eventos define el “nivel
tolerable” al que se hace referencia cuando el proceso de RCM formula la pregunta “ reduce
esta tarea la probabilidad de falla a un nivel tolerable? ver pagina 102.
* Una falla múltiple donde el sistema protegido falla, y el dispositivo de protección que
debería haber asegurado que el sistema no es letal, también esta en un estado de falla. La
probabilidad relacionada con este tipo de evento define el “nivel tolerable” al que se hace
referencia cuando el proceso de RCM pregunta “ reduce esta tarea la probabilidad de falla
múltiple a un nivel tolerable?” Ver pagina 122. Esta es también la probabilidad utilizada para
establecer MMF cuando se establezcan los intervalos de búsqueda de fallas. Ver pagina 179.
El propósito de este apéndice es sugerir como puede ser posible convertir los riesgos que los
miembros individuales de una sociedad pueden estar preparados para tolerar (otra
manifestación de desempeño deseado) en información significativa que puede utilizarse para
establecer un programa de mantenimiento diseñado para otorgar ese desempeño.
El proceso descripto anteriormente puede ser utilizado para producir un grafico que muestre
las probabilidades de un evento fatal en el trabajo que puede fluir de los riesgos que un
individuo esta preparado a aceptar, bajo la creencia de que todos en la planta aceptan su
juicio. Esto se ilustra en el grafico A3.4. Se debe tener en cuanta que en los próximos 4
gráficos, el eje X representa la probabilidad de cualquier evento, presentándose en un año
cualquiera (o mas precisamente el grado de falla anual).
305
10-5
10-6 10-7
10-8
10-9
10-10
1 en 10 oportunidades de matar un empleado
Probabilidad de matar 1 empleado
Probabilidad de matar 10 empleados
Probabilidad de matar 100 empleados
Probabilidad de matar 1000 empleados
Grafico A3.4 Tolerabilidad de un evento letal en el que tengo algo de control y elección.
El mismo proceso puede ser aplicado a una situación en la cual las posibles victimas no tienen
control, pero si algún grado de elección sobre exponerse al riesgo. El ejemplo del grafico
A3.2 sugiere que un pasajero de avión puede ser un ejemplo típico de alguien es esta
situación. Desde el punto de vista del mantenimiento, tales personas suelen ser usuarios de
sistemas masivos de transporte. O personas visitando grandes edificios
(comercios,
oficinas, estadios deportivos, teatros, y así sucesivamente). En general estas personas pueden
ser llamadas “clientes.”
En este caso, si todos ellos toleran el mismo riesgo que las personas en el grafico A3.2
(Y
en hay el mismo numero de eventos que amenazan la vida humana inherentes al sistema), el
proceso de dividir los riesgos utilizado en el grafico A3.5 puede llevar a probabilidades de
eventos individuales como s muestra en el grafico A3.5
10-6
10-7 10-8
10-9
10-10
10-11
1 en 10 oportunidades de matar un cliente
Probabilidad de matar 1 cliente
Probabilidad de matar 10 clientes
Probabilidad de matar 100 clientes
Probabilidad de matar 1000 clientes
Grafico A3.5 Tolerabilidad de un evento letal donde no tengo control, y si algún grado
elección.
Un razonamiento similar aplicado a aun escenario de no control/ no opción puede arrojar las
probabilidades de eventos aisladas que se muestran en e grafico A3.6. (En la práctica la
mayoría de los individuos tienden a tolerar una probabilidad aun menor de perder su vida por
esta razón que lo que se muestra en la figura A3.2 – El llamado factor miedo. Sin embargo en
la mayoría de las organizaciones, pocos eventos tienen probabilidades de tener consecuencias
306
fuera de sus inmediaciones, de modo que la probabilidad para cada evento es mas o menos la
misma).
10-6
10-7 10-8
10-9
10-10
10-11
1 en 10 oportunidades de matar una persona fuera del sitio
Probabilidad de matar una persona fuera del sitio
Probabilidad de matar 10 personas fuera del sitio
Probabilidad de matar 100 personas fuera del sitio
Probabilidad de matar 1000 personas fuera del sitio
Grafico A3.6 Probabilidad de un evento letal donde no tengo control ni elección.
Una vez que las probabilidades tolerables para los eventos como se los muestra en el grafico
A3.1, A3.4, A3.5 y A3.6 , es por supuesto posible combinarlos en una “continuidad de riesgo”
como se muestra en el grafico A3.7
1
10-1
10-2
10-3
10-4
10-5
10-6
10-7
10-8
10-9
1
10-1
10-2
10-3
10-4
10-5
10-6
10-7
10-8
10-9
Trivial
Hasta $ 100
$ 1000
$ 10 000
$ 100 000
$ 1 000 000
$ 1 m o 1 en 10 oportunidades de
matar a un empleado
>$10 m o probabilidad de matar
a un empleado
Probabilidad de matar 10
empleados o un cliente
Probabilidad de matar 100
empleados o 10 clientes
Probabilidad de matar 1000
empleados o 100 clientes
Grafico A3.7 Continuidad de Riesgo
307
El Grafico A3.7 no pretende tampoco implicar que un empleado valga $10MM. Este número
representa un punto en el cual dos sistemas de valores diferentes coinciden. El riesgo
financiero que su organización puede tolerar, y los riesgos personales que sus empleados y
clientes (Y la sociedad como un todo en el caso de riesgos de no control/no elección), están
preparados para tolerar, puede llevar a un numero de cifras completamente diferentes en su
contexto operativo.
El punto clave es que el criterio sobre el cual se basa la filosofía de RCM es que es tolerable;
no que es practicable, o cual es la norma actual de la industria (aunque esto pueda coincidir).
La parte 3 del capitulo 5 sugería que las personas que están moralmente y prácticamente en la
mejor posición para decidir que es tolerable son las posibles victimas. Estas serian los
accionistas y gerentes representantes en el caso de riesgos financieros; y empleados, clientes y
superiores
responsables en el caso de riesgos personales. Como se mencionaba
anteriormente, este apéndice muestra una forma en la que puede ser posible convertir el
consenso de información sobre riesgo tolerable en un marco para establecer objetivos para
programas de mantenimiento.
Finalmente, por favor tener en cuenta que el enfoque resaltado en este apéndice no pretende
ser prescriptivo. Si Uds., tienen acceso a un marco diferente que satisfaga a las personas
involucradas, entonces deben darle uso.
308
Apéndice 4
Técnicas de Monitoreo de Condición.
1- Introduccion:
El capitulo 7 explicaba extensamente que la mayoría de las fallas dan aviso del hecho de que
están por ocurrir. Esta advertencia se denomina falla potencial, y se define como una
condición física identificable que indica que una falla funcional esta por ocurrir o en el
proceso de ocurrir. Las técnicas para detectar las fallas potenciales se conocen como tareas
de mantenimiento en condición, porque los ítems son inspeccionados y dejados en servicio en
la condición de que alcanza los niveles de desempeño especificados. La frecuencia de estas
inspecciones es determinada por el intervalo P-F, que es el intervalo entre la aparición de la
falla potencial y su transformación en falla funcional.
Las técnicas básicas de mantenimiento en condición existieron desde que existe el reino
humano, en forma de sentidos humanos (vista, oído, tacto y olfato). Como se explicaba en el
capitulo 7, la principal ventaja técnica de utilizar personas para realizar estas tareas, es que
ellas pueden detectar un amplio rango de fallas potenciales utilizando estos cuatro sentidos.
Sin embargo las desventajas son que las inspecciones realizadas por humanos son
relativamente imprecisas, y el intervalo P-F relacionado es generalmente muy corto.
Pero cuanto antes pueda ser detectada una falla potencial, mas largo será el intervalo P-F.
Intervalos más largos significan que las inspecciones necesitan ser realizadas con menor
frecuencia y/o que hay más tiempo para tomar la acción necesaria para evitar las
consecuencias de la falla. Es por esto que se destina tanto esfuerzo a definir falla potencial y a
desarrollar técnicas para detectarlas que den los intervalos P-F más largos posibles.
Sin embargo, el grafico A4.1 muestra que un intervalo P-F largo implica que la falla potencial
pueda ser detectada en un punto que este muy arriba de la curva P-F. Pero cuanto mas
elevemos esta curva, menor será la desviación de la condición “normal”, especialmente si las
etapas finales del deterioro no son lineares. Cuando menor es la desviación, mas sensible debe
ser la técnica de monitoreo para detectar la falla potencial.
Grafico A4.1 Intervalos P-F y desviaciones de la condición “normal”
309
2- Categorías de Técnicas de Monitoreo de Condición.
La mayoría de las desviaciones más pequeñas tienden a estar mas allá del alcance de los
sentidos humanos, y solo pueden ser detectadas por instrumentos especiales. En otras
palabras, unos equipos son utilizados para monitorear la condición de otros equipos. Lo que
da el nombre a las técnicas de monitoreo de condición. Este nombre las distingue de otros tipo
de mantenimiento en condición (monitoreo de desempeño, variaciones en la calidad, y los
sentidos humanos).
Como mencionábamos en el capitulo 7, las técnicas de monitoreo de condición, son
simplemente versiones mas sensitivas de los sentidos humanos. Del mismo modo en que los
sentidos humanos reaccionan a los síntomas de una falla potencial, (ruido, olores, etc.) así las
técnicas de monitoreo de condición están diseñadas para detectar síntomas específicos
(vibración, temperatura, etc.) Para hacer esto más simple, estas técnicas se clasifican de
acuerdo a los síntomas (o efectos de fallas potenciales) que ellas monitorean:
* Efectos dinámicos: el monitoreo dinámico detecta fallas potenciales (especialmente las
asociadas con equipos rotativos) que causan que cantidades de energía anormales se emitan en
forma de ondas tales como la vibración, pulsos o efectos acústicos.
* Efectos de partículas: El monitoreo de partículas detecta fallas potenciales que causan que
se liberen partículas de diferentes formas y tamaños en el ambiente en que el equipo esta
operando.
* Efectos químicos: El monitoreo químico detecta fallas potenciales que causan la liberación
de cantidades de componentes químicos en el medioambiente.
*Efectos físicos: Los efectos de las fallas físicas abarca cambios en la apariencia física o en la
estructura del equipo que pueden ser detectados directamente, y las técnicas de monitoreo de
condición respectivas detectan fallas potenciales en forma de grietas, fracturas o efectos
visibles de desgaste y cambios dimensionales.
* Efectos de temperatura: Las técnicas de monitoreo de temperatura buscan fallas potenciales
que eleven la temperatura del equipo. (De forma opuesta aun aumento en la temperatura del
material que esta siendo procesado por el equipo.)
* Efectos eléctricos: Las técnicas de monitoreo eléctrico buscan cambios en la resistencia,
conductividad, fuerza dieléctrica y potencial.
Se han desarrollado una enorme variedad de técnicas, y más siguen apareciendo
constantemente, de modo que no es posible producir una lista exhaustiva de todas las técnicas
disponibles en un determinado momento.
Este apéndice provee un resumen breve de 96 técnicas disponibles actualmente. Algunas de
estas son muy conocidas y bien establecidas, mientras que otras están aun bajo desarrollo.
Sin embargo, Si estas técnicas son beneficiosas y técnicamente viables debería ser evaluado
con el mismo rigor que cualquier otra tarea en-condición. Para colaborar con este proceso,
este apéndice menciona lo siguiente para cada técnica:
* La falla potencial que se supone que la técnica detecte (condiciones monitoreadas).
310
* El equipo para el cual es diseñado (aplicaciones)
* El intervalo P-F típicamente asociado con la técnica. (Intervalo P-F)
* Como trabaja (operación)
* El entrenamiento y/o nivel de capacitación necesarios para aplicar la técnica (capacidad)
* Las ventajas de la Técnica (ventajas)
* Las desventajas de la técnica (desventajas)
Finalmente, antes de considerar las técnicas especificas, vale la pena remarcar que hoy en día
se enfoca mucha atención en el monitoreo de condición, por su novedad y complejidad, se lo
considera un aspecto totalmente separado de los demás en lo que respecta a mantenimiento
programado.
3- Monitoreo Dinámico
Una Nota Preliminar sobre el Análisis de Vibraciones.
Los equipos que contienen partes móviles vibran con diferentes frecuencias. Estas frecuencias
dependen de la naturaleza de las fuentes de vibración, y pueden variar a lo largo de un
espectro muy amplio. Por ejemplo, la frecuencia de vibración asociada a una caja de
engranajes la frecuencia primaria de rotación de las ruedas, la frecuencia de contacto de los
dientes de los diferentes grupos de engranajes, las frecuencias de baso de los rodamientos y
así sucesivamente. Si cualquiera de estos componentes comienza a fallar, las características de
las vibraciones tambien cambia, y el análisis de vibraciones trata de detectar y analizar esos
cambios.
Esto se lleva a cabo midiendo cuanto vibra el ítem como un todo, y luego utilizando técnicas
de análisis de espectro de la vibración de cada componente para ver si algo esta cambiando.
Sin embargo, la situación es complicada por el hecho de que es posible medir tres diferentes
características de vibración. Estas son la amplitud, velocidad y aceleración. Entonces el
primera paso será decidir que característica vamos a medir- y que dispositivo de medición
vamos a utilizar, y el paso dos será decidir que técnica se utilizara para analizar la señal
generada por el dispositivo medidor (o sensor). En general los sensores de amplitud (o
desplazamiento) son mas sensibles a frecuencias menores los sensores de velocidad lo son en
los puntos intermedios, y los de aceleración en frecuencias mayores. La fuerza de la señal a
cualquier frecuencia tambien esta influenciada por la proximidad de los sensores a la fuente
de la señal a esa frecuencia.
Otra característica importante de la vibración es la fase. Fase se refiere a la posición de una
parte vibrante en un instante dado, con referencia a un punto fijo de otra parte vibrante.”
Como regla, las medidas de fase no se toman durante las mediciones de vibración de rutina,
pero pueden proveer información de valor cuando se ha detectado un problema (tal como el
desbalance, desalineamiento, desajustes mecánicos, fuerzas reciprocas o engranajes fuera de
centro)
El análisis de Fourier tambien juega una parte importante en el análisis de vibración. Fourier
descubrió que todas las curvas de vibración complejas (nivel contra tiempo) pueden ser
desintegradas en muchas curvas sinusoidales simples (cada frecuencia con una amplitud). Por
lo tanto, al hacer un “análisis de Fourier” una onda compleja puede ser dividida en una
variedad de niveles (amplitudes) a una variedad de frecuencias. En efecto, el nivel de
311
variación contra tiempo ha sido transformado en una muestra de amplitud constantemente
cambiante contra la frecuencia. El proceso por el cual esto se lleva a cabo se llama ahora
“transformación rápida de Fourier “FFT”
El rol de los sistemas expertos en el análisis de vibraciones es antiguo. Algunos sistemas
pueden encontrar un problema de diagnosis tan consistente como los análisis de vibraciones
experimentados. Son grandes ahorrista de tiempo, y tambien permite a los usuarios comparar
las lecturas con todos los datos de medidas previas.
3.1 Análisis de Vibración de Banda Ancha.
Condición monitoreada: cambios en las características de vibración causados por fatiga,
desgaste, desbalance, desalineamientos, desajuste mecánico, turbulencia, etc.
Aplicaciones: Ejes, cajas de engranajes, transmisión por correa, compresores, motores,
rodamientos de bolas, chumaceras, motores eléctricos, bombas, turbinas, etc.
Intervalo P-F: Advertencia limitada de falla.
Operación: Un sistema de vibración de banda ancha consiste primariamente de dos partes: un
transductor que se monta en el punto de medición para convertir las vibraciones mecánicas en
señales eléctricas, y un dispositivo indicador llamado medidor de vibración, que se calibra en
unidades de vibración. Monitorea la lectura general de las vibraciones que es simplemente el
valor de la corriente efectiva (RMS) de la vibración de banda ancha.
Habilidad: Utilizar el equipo y registrar las vibraciones: un trabajador de capacidad media.
Ventajas: Puede ser muy efectivo en detectar un desbalance mayor en equipos rotativos.
Puede ser utilizado por personal sin experiencia. Barato y compacto. Puede ser potable o
permanecer instalado. Mínima carga de datos. La interpretación y aceptación pueden basarse
en criterios publicados de aceptación de condición tales como el VDI 2056 de Alemania.
Desventajas: La señal de Banda ancha provee poca información sobre la naturaleza de la falta.
En un espectro inicial, los picos son mínimos y contribuyen muy poco al trabajo de banda
ancha. Cuando los picos crecen el equipo ya esta en un estado de deterioro avanzado. Es
difícil establecer niveles de alarma. Carece de sensibilidad.
3.2 Análisis de Banda de Octavo
Condiciones monitoreadas y aplicaciones: las mismas que para las vibraciones de banda
ancha.
Intervalo P-F: Días a semanas dependiendo de la aplicación.
Operación: Octavo fijo contiguo y filtros fraccionales de octavo dividen la frecuencia del
espectro en una serie de bandas de interés, que tienen un ancho constante cuando se ubican
logaritmicamente. El rendimiento promedio de cada filtro se mide sucesivamente, y los
valores se miden con medidor o se trazan en un registro.
Habilidad: Operar el equipo e interpretar resultados: Un técnico con capacitación adecuada.
312
Ventajas: Simple de usar cuando los parámetros de medición han sido determinados
previamente por un ingeniero: Portables, relativamente accesibles, Buena capacidad de
detección utilizando filtros fraccionales: grabador provee un registro permanente.
Desventajas: Información limitada para propósitos de diagnósticos: capacidad de diagnostico
tambien limitada por la escala d frecuencia logarítmica, tiempo de análisis relativamente
largo.
3.3 Análisis de Ancho de Banda Constante.
Condición monitoreada: Cambios en las características de vibración causados por fatiga,
desgaste, desbalance, desalineamientos, desajustes mecánicos, y turbulencia, e identificar
múltiples armónicos y bandas paralelas.
Aplicación: Ejes, cajas de engranajes, correas de transmisión, compresores, motores,
rodamientos, chumaceras, motores eléctricos, bombas, turbinas, y desarrollo, diagnostico y
trabajo experimental (especialmente en los engranajes)
Intervalo P-F : Generalmente varias semanas o meses.
Operación: Un acelerómetro detecta la vibración y la convierte en una señal eléctrica que es
amplificada, sujeta un filtro de ancho de banda constante y luego alimentando un analizador.
Los anchos constantes de banda están entre 3.16 Hz y 1000 Hz , y la frecuencia va de 2 Hz a
200 Hz . Tanto la frecuencia linear como la logarítmica deben ser seleccionadas, pero la linear
se escoge cuando se identifican los armónicos. Para analizar los picos en mayor detalle, se
pueden cambiar los anchos de banda y los grados de frecuencia.
Habilidad: Operar el equipo: Un trabajador capacitado adecuadamente. Interpretar los
resultados: Un técnico experimentado.
Ventajas: Fácil de usar cuando se han establecido los parámetros de medición. Bueno para
grandes rangos de frecuencia, y para la investigación detallada a alta frecuencia. Identifica
armónicos y bandas laterales múltiples que se presentan en intervalos de frecuencia constante.
Equipo portable.
Desventajas: Tiempo de análisis relativamente largo. Se requiere un entendimiento profundo
de los armónicos y bandas laterales de la maquina para interpretar los resultados.
3.4 Análisis de Ancho de Banda de Porcentaje constante.
Condición monitoreada: Shock y vibración
Aplicaciones: Ejes, cajas de engranajes, transmisión por correa, compresores, motores,
rodamientos, chumaceras, motores eléctricos, bombas turbinas, etc.
Intervalo P-F : generalmente varias semanas a meses.
Operación: El análisis de alta resolución de la frecuencia del ancho de banda angosto, se lleva
a cabo partiendo del grado de frecuencia deseada (2Hz a 20 Khz.) utilizando un ancho de
banda de porcentaje constante. (1% ,3%,6%,12%,23%) que separa las frecuencia o armónicos
313
de espacios cortos. Un filtro de banda ancha de porcentaje constante de una estrechez de 1%
permite análisis de resolución muy fina.
Habilidad: Para operar el equipo un trabajados capacitado adecuadamente, para interpretar los
resultados un técnico con experiencia.
Ventajas: El análisis puede ser hecho en tiempo real y por lo tanto es mas rápido que el
análisis FFT, y no sufre de algunas decadencias causadas por la naturaleza desorganizada de
FFT, tales como la perdida de datos. Los espectros CPB son muy buenos para la rápida
detección de fallas. Equipo portable.
Desventajas: Se requiere alta capacitación para interpretar los resultados.
3.5 Análisis de Tiempo Real.
Condición monitoreada: Señales de vibraciones y acústicas. Medidas y análisis de shock y
señales transitorias.
Aplicaciones: maquinas rotativas, ejes, cajas de engranajes.
Intervalo P-F: varias semanas a meses.
Operación: Una señal se registra en cinta magnética y se reproduce en un analizador de
tiempo real. La señal se prueba y transforma al campo de frecuencia. Se produce un espectro
de ancho de banda constante, medido en 400 intervalos de frecuencia espaciados
equitativamente a través de un rango de frecuencia de 0-10 Hz a 0- 20. Se puede seleccionar
un modo de alta resolución para dar un análisis de “cámara lenta” permitiendo que se
observen los cambios en la banda base.
Habilidad: Operar el equipo e interpretar los resultados: un ingeniero experimentado.
Ventajas: Analiza todas las bandas de frecuencia simultáneamente: La Muestra instantánea de
gráficos del espectro actualizado se ve instantáneamente: No hay necesidad de esperar la
lectura de nivel: Sirve para análisis de señales de corta duración, tales como la vibración
transitoria y el shock: Los registradores X-Y proveen un registro permanente.
Desventajas: Equipo no portable y muy costoso, necesita altos niveles de capacitación:
análisis fuera de línea.
3.6 Analisis en forma de onda de tiempo
Condicion monitoreada: dientes de engranajes desgastados y quebrados, cavitacion de
bomba, desalineamiento, flojera mecanica, excentricidad, etc.
Aplicaciones: Cajas de engranajes, bombas, cojinetes de bola, etc.
Intervalo P-F: Por lo general varias semanas o meses
Operación: Un Osciloscopio es conectado a un analizador de vibraciones estandar o a un
analizador de tiempo real. Una señal de vibracion es aplicada a la entrada vertical del
314
osciloscopio. El eje vertical en el CRT es una escala de amplitud y el eje horizontal es una
escala de tiempo representada en segundos por ejemplo. La parte vertical del osciloscopio es
ajustada hasta que el valor maximo de la forma de onda exhibido en el CTR corresponda a
una lectura de amplitud en el medidor de vibracion. Cuando una maquina genera una sola
frecuencia, la forma de onda de tiempo es simplemente una onda con la relacion de repetición
de la velocidad de funcionamiento del equipo. Cuando el equipo genera mas de una
frecuencia, se genera una forma de onda compuesta y compleja. Las frecuencias adicionales
pueden ser generadas en forma de pulso, modulacion, etc, lo cual se suma a la complejidad de
la forma de onda. Para reducir la complejidad de la forma de onda, es util y hasta esencial
utilizar filtros de paso.
Habilidad: Se necesita de considerable experiencia y practica para interpretar las formas de
onda complejas.
Ventajas: Es bueno para verificar la amplitud de modulacion. Por lo general proporciona mas
información que el analisis de frecuencia. La forma de onda puede ser utilizada para distinguir
entre los espectros producidos por los impactos o los ruidos.
Desventajas: Las maquinas que generan frecuencias multiples por lo general generan ruido, lo
cual hace que las formas de ondas de tiempo sean tan complejas y confusas que son difíciles
de dividir en partes componentes. Para examinar una forma de onda, se necesita un largo
registro de tiempo.
3.7 Análisis de Promedio de sincronización de tiempo
Condición monitoreada: Desgaste, fatiga, ondas de stress emitidas como resultado de impacto
de metal con metal, micro soldadura, etc.
Aplicaciones: Dientes de engranajes, rodamientos, ejes, rollos en maquinas de papel,
maquinas rotativas.
Intervalo P-F: Generalmente varias semanas a meses.
Operación: La mayoría de los sistemas rotativos mecánicos predicen una señal con una
variación mínima cada vez que rotan. Cuanto mas cerca están las tolerancias de las partes
deslizantes o rotativas, menor es la variación, pero aun así hay una variación. En muchos
sistemas, esta diferencia puede ser tan grande que enmascara que existe un cambio debido a
una falla en desarrollo. La presencia de ruidos casuales tambien puede confundir la señal.
Estos problemas pueden ser resueltos si se lleva a cabo un control de nivel en la misma parte
de la rotación cíclica utilizando un contador de velocidad para iniciar la captura de datos en
un colector de datos. Un número de ciclos o de registros de tiempo se promedian en forma
conjunta. Las señales que no están relacionadas con el RPM del eje, se promedian por aparte,
dejando un “tiempo real” muy claro relacionado a la velocidad de una sola vuelta. La forma
promediada puede examinarse directamente o se puede generar un espectro a partir de esta.
Habilidad: Un trabajador capacitado apropiadamente. Se requiere Práctica y experiencia
considerables para poder leer los resultados.
315
Ventajas: las cajas de engranajes- principalmente los engranajes simples- pueden ser
analizados en detalle. Muy útil para analizar equipos que tienen muchos componentes rotando
a prácticamente la misma velocidad.
Desventajas: Se debe tener cuidado con las maquinas con rodamientos de bolas, ya que los
tonos de los rodamiento no serán sincrónicos con el RPm y se promediaran por aparte.
3.8 Análisis de Frecuencia.
Condición monitoreada: Cambios en las características de la vibración causados por fatiga,
desgaste, desbalance, desalineamientos, desajustes mecánicos, turbulencia, etc.
Aplicaciones: Ejes, cajas de engranajes, transmisión por correa, compresores, motores,
rodamientos, chumaceras, motores eléctricos, bombas turbinas, etc.
Intervalo P-F: varias semanas a meses.
Operación: Se recogen datos de puntos de medicion En el dominio de tiempo y se
transforman en dominio de frecuencia utilizando el algoritmo FFT , ya sea con el colector de
datos o con una computadora extra. La el grado de frecuencia requerido de las medidas,
depende de la velocidad de la maquina . Cada Maquina que tiene partes moviles producira un
espectro de frecuencias.
Habilidad: Un trabajador capacitado adecuadamente. Se requiere práctica y experiencia
considerable para leer los resultados.
Ventajas: El equipo de recolección de datos es portable y fácil de utilizar. Los sistemas
expertos facilitan la interpretación de datos.
Desventajas: Los espectros resultantes de impactos o de ruidos casuales pueden parecer
similares.
3.9 Cepstrum
Condiciones monitoreadas: desgaste causante de vibraciones espectrales en armónicos y
bandas laterales.
Aplicaciones: Rodamientos, ejes, engranajes, correa rotativa,
pompas y ventiladores.
y frecuencia cuchillas de
Intervalo P-F: Varias semanas a meses.
Habilidad: Profundo entendimiento del funcionamiento de la maquina (armónicos y bandas
laterales) y software pericial.
Ventajas: Puede analizar los armónicos y bandas laterales que generalmente se sobreponen en
las maquinas complejas. Las bandas laterales son fáciles de identificar en el espectro de
rodamientos de bolas. Pueden ser llevados a cabo por un sistema de peritaje.
316
Desventajas: Las habilidades y experiencia necesaria para interpretar armónicos y bandas
laterales.
3.10 Desmodulación de Amplitud.
Condición monitoreada: Tonos de rodamientos enmascarados por el ruido, grietas en las
guiaderas de cojinetes, engranajes dañados, desajustes mecánicas.
Aplicaciones: Turbinas de vapor, rodamientos en cajas de engranajes, componentes rotativos
de baja velocidad de maquinal de papel, maquinas alternativas.
P-F intervalo: Varias Semanas a meses.
Operación: La señal análoga de aceleración (dominio de tiempo) esta sujeto a altas
filtraciones y después desmodulación de amplitud. Es aquí donde una frecuencia discreta es
llamada “portadora” en el espectro será modulado por otra frecuencia denominada
moduladora, La señal resultante es sujeta a un análisis de frecuencia. La desmodulación de
amplitud es llevada cabo en el colector de datos antes de que la señal sea digitalizada.
Habilidades: Un técnico experimentado y capacitado adecuadamente.
Ventajas: La detección temprana de problemas de engranajes y rodamientos (especialmente
de engranajes (especialmente problemas completamente enmascarados por el ruido) pueden
ser identificados. Trabaja bien en aplicaciones de alta velocidad tales como maquinas de
papel.
Desventajas: Se necesita alta capacitación y experiencia necesaria para entender e interpretar
los resultados. Difícil de implementar en rodamientos de baja velocidad porque las ondas de
stress en eventos son eventos de corta transición, entones se filtra muy poca presión, haciendo
difícil la detección de la falla.
3.11 Análisis de Valor Máximo ( Peak Vue)
Condiciones Monitoreadas: Ondas de Stress causada por el impacto de metal con metal,
rasgamiento y grietas de metales, desgaste abrasivo.
Aplicaciones: Cojinetes anti-fricción, ejes de engranajes y cajas de engranajes.
Intervalo P-F: Varias semanas a meses dependiendo de las aplicaciones.
Operación: Separa las faltas de baja energía, tales como las que ocurren en los cojinetes anti
fricción y engranajes, y refuerza sus señales haciendo que permanezcan por encima del piso
del ruido. Esto las hace más fáciles de reconocer. Primero separa las ondas de tensión de la
forma de onda de vibración utilizando un filtro de paso alto. Esta entonces condicionado a
reforzar su amplitud y anchura de pulso. La forma de onda condicionada es entonces
procesada para determinar la frecuencia a la que ocurren las ondas de tensión.
Desventajas: Se necesita mucha experiencia y alta capacitación para interpretar los resultados.
317
3.12 Energía Pico o Spike EnergyTM
Condiciones monitoreadas: bombas trabajando en seco, cavitacion, desgaste de rodamientos
causando contacto metal con metal, imperfecciones en la superficie o dientes de engranaje,
flujo de vapor de alta presión o aire, ruido de las válvulas de control, lubricación escasa.
Aplicaciones: Bombas utilizadas en la industria química y petro química, cajas de engranajes,
cojinetes chumacera de rodillos.
Intervalo P-F: Varias semanas a meses.
Operación: Algunas fallas alteran las frecuencias naturales de componentes y estructuras. La
intensa energía generada por impactos mecánicos transitorios repetitivos, causan que una
señal se presente como picos periódicos de energía de alta frecuencia, en un espectro que
puede ser medidas por un acelerómetro. Un filtro de paso de alta frecuencia se utiliza para
filtrar las señales de vibraciones de baja frecuencia. Las señales de alta frecuencia pasan a
través de un detector de picos que detecta y mantiene las amplitudes pico de la señal. Esto se
denomina envoltura, los resultados de las medidas se expresan en unidades: “gSE” .Los
pulsos de amplitud alta y muchas repeticiones producen lecturas gSE altas.
Habilidad: Un trabajador capacitado y con experiencia. Se requiere práctica y experiencia
para interpretar s resultados.
Ventajas: Parámetros sensitivos adecuados a la detección de problemas de bombas no selladas
que generalmente son difíciles de detectar utilizando sensores de vibración convencional tales
como medidores de velocidad y acelerómetros.
Desventajas: Alta capacitación y entrenamiento para interpretar los resultados.
3.12 Análisis de Proximidad:
Condición monitoreada: Desalineamientos, remolinos de aceite, frotaciones,
desbalanceados, resonancia, fuerzas reciprocas, correas y engranajes excéntricos, etc.
ejes
Aplicaciones: Ejes, montaje de motores, cajas de engranajes, ventiladores, uniones, etc.
Intervalo P-F: Días a semanas.
Operación: En el modo básico, una señal de un transductor opera como ordenador contra un
tiempo base. Con un solo impulso, las curvas sinusoidales indican un desbalance, ejes
torcidos, remolinos de aceite, desalineamientos. Dos señales producen un diagrama polar que
provee más información de características que las que provee un diagrama X-Y. Se puede
obtener más información una marca indicadora de fase en la forma de onda de la pantalla del
osciloscopio. Estas marcas se generan a un porcentaje de una revolución por un levantamiento
incorporado en el eje de velocidad del tacómetro.
Habilidad: Técnico capacitado y entrenado adecuadamente.
Ventajas: detalla problemas específicos. Puede ser utilizado para balancear: Portables, muy
fáciles de usar.
318
Desventajas: Intervalo P-F cortos, tiempo de análisis largo: Capacidad de diagnostico
limitada.
3.13 Análisis de pulsos de shock
Condiciones monitoreadas: Deterioro de la superficie y falta de lubricación causando ondas
mecánicas de shock. Con los datos se puede identificar la instalación incorrecta de los
rodamientos o reemplazo inadecuado, utilización de tipo de lubricante incorrecto, lubricante
insuficiente, o el mal mantenimiento de contenedores de lubricantes, etc.
Aplicaciones: Rodamientos de bolas, cojinetes anti fricción, herramientas de impacto
neumático, válvulas de motores de combustión interna, etc.
Intervalo P-F: semanas a varios meses.
Operación: El tipo y tamaño del rodamiento se coloca en el analizador. Un acelerómetro
instalado en la caja del rodamiento detecta el impacto mecánico de las pulsaciones, causada
por el impacto de dos masas. (Tales como el contacto rotativo entre las
Superficies de la bola y el riel.) La magnitud de los golpes dependen de la condición de la
superficie y de la velocidad periférica del rodamiento (rpm y tamaño). Los pulsos establecen
una oscilación en el transductor como su frecuencia resonante. El transductor es sintonizado
mecánica y eléctricamente a una frecuencia de 32 kh2. La amplitud pico de esta oscilación es
directamente proporcional a la velocidad de impacto. A medida que la condición del
rodamiento se deteriora de buena a falla inminente, las medidas de los pulsos de shock pueden
aumentar hasta 1000 veces.
Habilidad: Un técnico capacitado adecuadamente.
Ventajas: Relativamente fácil de operar. Portable. Puede ser utilizado en virtualmente
cualquier rodamiento de bolas. E analiza la condición y estado de lubricación en segundos.
Los impulsos de shock no están influenciados en gran escala por la vibración y los ruidos
ambientales. Identifica cambios sutiles en la condición del cojinete o e su lubricación, que
pueden no ser diferenciados por análisis convencionales de vibración.
Desventajas: Necesita información exacta sobre el tamaño y velocidad del rodamiento antes
de tomas la medida. Limitado a rodamientos de bolas.
3.15 Análisis ultrasónico
Condición monitoreada: Cambios en los patrones sonoros (señales sonoras) causadas por
perdidas, fatiga, desgaste y deterioro.
Aplicación: Perdidas en los sistemas de presión y al vació. (Ej. Calderas, condensadores,
columnas de destilación, permutador térmico, hornos al vacío, sistemas especializados de
gas.) Desgaste o fatiga del cojinete: trampa de vapor: desgaste en la válvula y asiento de
válvula: cavitacion de válvula: descargue estático: la integridad de cierres y burletes en los
tanques, sistemas de cañerías: perdidas subterráneas o de los tanques.
Intervalo P-F: Variable enormemente, depende de la naturaleza de la falla.
319
Operación: La tecnología ultrasónica se encarga de ondas de sonido de alta frecuencia por
encima de la percepción humana (20 Hz a 20 Khz.), que van de 20 kHz 100 kHz. Las ondas
de sonido de alta frecuencia son extremadamente cortas, y tienden a ser direccionales, de
modo que es fácil aislar estas señales de otros ruidos y detectar su ubicación exacta. Todos los
equipos operativos y la mayoría d los problemas de perdidas producen diferentes sonidos. A
medida que se presentan los cambios sutiles, con el deterioro, la naturaleza del ultrasonido
permite que estas señales se detecten desde un primer momento. Los traductores ultrasónicos
convierten el ultrasonido captado por el instrumento en un rango audible donde los usuarios
pueden captarlos y reconocerlos mediante el uso de auriculares.
Habilidad: Un trabajador capacitado.
Ventajas: Rápido y fácil. Puede ser utilizado en áreas muy ruidosas (los audífonos cancelan el
ruido ambiental) Permite al operador identificar un amplio espectro de sonidos. Portable.
Desventajas: No indica el tamaño de las perdidas, los tanques subterráneos solo pueden ser
controlados al vacío.
3.14 Curtosis
Condiciones monitoreadas: Pulsos de shock.
Aplicación: Rodamientos de bolas, cojinetes anti fricción.
Operación: Restringida prácticamente a rodamientos donde se examinan frecuencias
especificas (3-5kHz, 5,10 kHz, 10-15 kHz). Curtosis es un análisis estadístico de la señal
basada en tiempo, y observa la diferencia del cuarto momento de la amplitud de espectro, del
nivel medio. Una distribucion normas tiene un valor de Curtosis (K) de 3.
Habilidad: Un trabajador entrenado, de capacidad media.
Ventajas: Aplicables a cualquier material con una superficie dura. Equipo portable. Muy
simples de usar.
Desventajas: Aplicación limitada, y afectada en forma significativamente, por ruidos de
impacto de otras fuentes. Considerado como demasiado sensitivo.
3.15 Emisión Acústica
Condición monitoreada: Deformaciones plásticas y formación de grietas causadas por fatiga,
tensión y desgaste.
Aplicaciones: Material metálico utilizado en estructuras, vasos de presión, cañerías, y
excavaciones mineras subterráneas.
Intervalo P-F: varias semanas dependiendo de la aplicación.
Operación: ondas de tensión audibles, debidas a cambios cristalográficos, emitidas por
materiales sujetos a cargas. Esas ondas de tensión son recogidas por los transductores, a
320
enviadas mediante un amplificador al analizador de pulsos, y luego a un registrador X-Y o a
un osciloscopio. La señal obtenida se evalúa a posterior.
Habilidad: Un técnico adecuadamente entrenado, con experiencia.
Ventajas: Detección automática de fallas. Cubre estructuras completas. Sistema de medicion
organizado rápidamente, Alta sensibilidad. Requiere acceso limitado a probar objetos. Detecta
fallas activas. Solo se requieren cargas relativas. Puede ser utilizado para pronosticas fallas de
cargas.
Desventajas: La estructura debe ser cargada. Actividad A-E dependiente de los materiales.
Los ruidos irrelevantes mecánicos y eléctricos pueden interferir con las mediciones. Da
información limitada del tipo de falla. La interpretación puede ser complicada.
4 Monitoreo de Partículas.
4.1 Ferrografia.
Condiciones monitoreadas: partículas de desgaste, fatiga y corrosión.
Aplicación: Grasas. Aceites utilizados en motores diesel y nafteros, turbinas a gas,
trasmisiones, cajas de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: Generalmente varios meses.
Operación: Una prueba representativa se diluye con un solvente fijador (Tetraclorothylene) y
luego pasado sobre un reglilla de vidrio inclinado bajo la influencia de un campo magnético
graduado. Las partículas son distribuidas al lo largo de la reglilla de acuerdo a su tamaño. Las
partículas mayores se depositan cerca de la entrada, mientras que las más finas se depositan a
la salida. La reglilla, conocida como ferrograma, retrata de modo que las partículas se
adhieren a la superficie cuando se cambia el aceite. Las partículas ferrosas se separan
magnéticamente y se distinguen por su alineamiento con la línea de campo magnético,
mientras que las partículas no magnéticas y no metálicas se distribuyen de modo casual a
través de toda la reglilla. La densidad total de las partículas, y el rango de partículas grandes a
pequeñas indican el tipo y extensión del desgaste. El análisis se lleva a cabo mediante una
técnica conocida como reexaminación microscópica biocromatica. Esta utiliza fuentes de luz
cromática y reflejada (que pueden ser utilizadas en forma simultánea). Los filtros rojos,
verdes y polarizados, tambien se utilizan para distinguir el tamaño, composición, forma y
textura de las partículas metálicas y no metálicas. Un microscopio electrónico tambien puede
ser utilizado para determinar la forma de las partículas y proveer una indicación de la causa de
falla.
Habilidad: Para manejar las muestras, y operar un ferrografo: un trabajador entrenado de
capacidad media. Para analizar e interpretar los resultados: un técnico experimentado.
Ventajas: mas sensitivo que la espectrometría en las primeras etapas de desgaste. Mide
tamaño y forma de las partículas: provee registros pictoriales permanentes.
321
Desventajas: No es una técnica on-líen. Lleva mucho tiempo, y requiere equipos de apoyo
analítico muy costosos. Mide generalmente siempre solo las partículas ferromagnéticas.
Requiere un microcopio electrónico para un análisis profundo.
4.2 Ferrografia Analítica:
Condiciones monitoreadas: Partículas de desgaste, fatiga y corrosión.
Aplicaciones: Grasas. Aceites utilizados en motores diesel y nafteros, turbinas a gas,
trasmisiones, cajas de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: Generalmente varios meses.
Operación: Se utiliza un ferrografo analítico para preparar un ferrograma bajo la ferrografia.
Una vez que las partículas han sido depositadas en el ferrograma. Se utiliza una limpieza para
lavar cualquier aceite remanente o lubricante al agua. Una vez que el agua se evapora las
partículas quedan pegadas al substrato de ferrograma. Un scanner lo scanner en menos de 20
segundos, y genera resultados estándar que corresponden al mecanismo de desgaste. Se
separan las partículas por tipo y forma que revelan problemas específicos. Por ejemplo, los
metales laminares (que tienen una apariencia pelada, largos y finos) generalmente indican un
problema con los rodamientos de bolas. Los tonos rojos son generalmente oxido (posible
contaminación de agua). El software informa los niveles de desgaste y la condición del
componente.
Habilidad: Para manejar las muestras, y operar un ferrografo: un trabajador entrenado de
capacidad media. Para analizar e interpretar los resultados: un técnico experimentado.
Ventajas: Evaluación profunda, registros fotográficos y manejo de datos. Menos afectado por
la contaminación de aguas y fluidos que cualquier otro sistema. Equipo muy costoso.
Desventajas: Se necesitan operadores de gran experiencia. Análisis y preparación de muestras
extensos. La necesidad de diluir las muestras, implica que esas muestras pueden no ser un
ejemplo exacto del desgaste real.
4.3 Ferrografo de Lectura Directa ( DRF)
Condiciones monitoreadas: Partículas de desgaste, corrosión y fatiga de maquinarias.
Aplicaciones: Grasas. Aceites utilizados en motores diesel y nafteros, turbinas a gas,
trasmisiones, cajas de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: Generalmente varios meses.
Operación: Un DRF mide cuantitativamente la concentración de partículas ferrosas en un
fluido, al precipitar estas partículas al fondo de un tubo de vidrio sujeto a un fuerte campo
magnético. Los haces de fibra óptica direccional la luz a través de un tubo de vidrio en dos
posiciones correspondientes a la ubicación dónde la magneto deposita las partículas grandes
y pequeñas. La luz se reduce en relación a las partículas depositadas en el tubo de vidrio, y
esta reducción es monitoreada y expuesta electrónicamente. Entonces se obtienen dos grupos
322
de lecturas para las partículas de mayor y menor tamaño (arriba y debajo de 5 micrones) que
se arman en u grafico.
Habilidad: Un técnico entrenado y capacitado.
Ventajas: técnica on- line, compacta, portable, fácil de operar. Menos sensible a la
contaminación de agua y fluidos que otras técnicas.
Desventajas: Mide solamente las partículas ferromagnéticas, requiere un análisis analítico
ferromagnético cuando las lecturas son altas.
4.4 Contador de Partículas por oscurecimiento de malla. (Presión diferencial)
Condición monitoreada: Partículas en los sistemas de lubricación hidráulica causadas por
desgaste, fatiga, corrosión y contaminantes.
Aplicaciones: Sistemas cerrados de lubricación hidráulica tales como, motores, cajas de
engranajes, transmisiones, compresores. Etc.
Intervalo P-F: Generalmente varias semanas a meses.
Operación: Este instrumento mide la presión diferencial a través de tres rejillas de 5, 15, 25
micrones de alta preedición, cada una con una cantidad de poros conocida. A medida que el
lubricante pasa por cada rejilla , las partículas mas grandes que los poros quedan atrapadas en
la superficie de la malla, lo que reduce las áreas abiertas de la rejilla y aumenta la presión de
goteo a través de la rejilla. Los sensores miden el cambio de presión, que se convierte para
reflejar el número de partículas mayor que el tamaño de la pantalla. Esto se convierte a su vez
en códigos de limpieza ISO 4406.
Habilidad: Operar la unidad portable. Un trabajador de capacidad media entrenado
acordemente. Para interpretar los resultados: un técnico con experiencia apropiadamente
capacitado.
Ventajas: No requiere preparación previa de muestras. El equipo es portable y puede ser
utilizado en el campo en el laboratorio. Una versión en- línea de l equipo puede ser utilizada
para monitoreo constante. El conteo de partículas se calibra a una norma de limpieza ISO
4406. La mayoría de los lubricantes pueden ser analizados en cuestión de minutos. No se ve
afectado por burbujas, aceites oscuros ni emulsiones que limitan a los analizadores láser.
Desventajas: No provee indicación de la composición química de partículas, solo s explica a
sistemas de circulación de lubricantes. Equipos moderadamente costosos.
4.5 Técnica de Bloqueo de Poros (Disminución de flujo)
Condición monitoreada: Partículas en los aceites lubricantes e hidráulicos causadas por
desgaste, fatiga, contaminación y corrosión.
Aplicaciones: Aceites utilizados motores diesel y nafteros. Turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
323
Intervalo P-F: Generalmente varias semanas a meses.
Operación: Una muestra del fluido se presuriza entre 30 y 150 psi (puede llegar hasta 3000
psi) y se permite que fluya a través de una rejilla de precisión calibrada (5,10, 15 micrones)
dependiendo de la viscosidad del aceite, en un dispositivo sensor. Las partículas más grandes
que la rejilla se comienzan a acumular, restringiendo el flujo. Las partículas más pequeñas se
reúnen alrededor de las mayores, restringiendo aun más el flujo. El resultado es una curva de
disminución de flujo. La computadora de mano utiliza un programa para convertir la curva
de disminución de flujo en una distribucion de partículas por tamaño. Esto se utiliza para
computar un código de limpieza ISO.
Habilidad: Operar la unidad portable: Un trabajador entrenado. Para interpretar los
resultados: Un técnico experimentado con previa capacitación.
Ventajas: No requiere preparación previa de muestras. El equipo es portable y puede ser
utilizado en el campo en el laboratorio. Una versión en- línea de l equipo puede ser utilizada
para monitoreo constante. El conteo de partículas se calibra a una norma de limpieza ISO
4406. La mayoría de los lubricantes pueden ser analizados en cuestión de minutos.
Desventajas: No provee indicación de la composición química de las partículas. Solo se aplica
a sistemas de circulación de aceites. Equipos moderadamente costosos.
4.6 Contador de partículas de Extinción de Luz.
Condiciones monitoreadas: Partículas en los aceites lubricantes e hidráulicos causadas por
desgaste, fatiga, contaminación y corrosión.
Aplicaciones: Aceites utilizados motores diesel y nafteros. Turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: varias semanas a meses.
Operación: El contador de partículas de extinción de luz consiste en una fuente de luz
incandescente, una célula objetiva y una foto detectora. El fluido muestra fluye por el
objetivo, bajo condiciones controladas de fluido y volumen. Cuando las partículas opacas del
fluido pasan a través del rayo este bloquea una cantidad de luz proporcional al tamaño de las
partículas. El numero y tamaño de las partículas en la muestra de aceite determinan cuanta luz
es bloqueada o reflejada, y cuanta luz pasa a través de la foto diodo. El cambio resultante en
la señal eléctrica en la foto diodo se analiza de acuerdo a un Standard de calibración para
calcular el número de partículas en tamaños predeterminados y muestra el conteo. De esta
información se determina una lectura directa del valor de limpieza ISO.
Habilidad: Para operar la unidad portable: un trabajador capacitado.
Ventajas: Considerablemente mas rápido que la filtración graduada visual. Resultados
disponibles en minutos. Generalmente la prueba es precisa y reproducible.
Desventajas: Carece de la intensidad y consistencia del láser y falla en superar la reacción de
ondas de luz de diferentes largos. La precisión depende de la opacidad de los fluidos, el
número de partículas translucidas, burbujas de aire y contaminación de agua. El conteo y
324
tamaño tambien pueden variar depende de la orientación de partículas de formas inusuales,
largas o finas, en el rayo de luz. Resolución limitada a un rango de partículas de 5 micrones.
No provee información sobre la composición química de los contaminantes.
4.7 Contador de partículas dispersas.
Condición Monitoreo: Partículas en los aceites lubricantes e hidráulicos causadas por
desgaste, fatiga, contaminación y corrosión.
Aplicaciones: Sistemas cerrados de lubricación e hidráulicos como, trasmisiones, cajas de
engranajes, compresores, etc.
Intervalo P-F: varias semanas a meses.
Habilidad: Un trabajador capacitado adecuadamente.
Operación: El contador de partículas dispersas consiste en tres componentes principales; una
fuente de luz láser, un objetivo, y un foto diodo. La muestra de fluido pasa a través del
objetivo bajo condiciones controladas de flujo y volumen. Cuando las partículas opacas del
fluido pasan a través del rayo, la dispersión de la luz se mide y traduce en un contador de
partículas. De esta información se determina una lectura automática del valor de limpieza
ISO.
Ventajas: Buen rendimiento en situaciones donde las condiciones están controladas. Alta
preedición. Mide partículas tan pequeñas como 2 micrones. Mas rápido que la filtración
graduada visual – resultados de la prueba disponibles en minutos. Es posible un monitoreo
continuo.
Desventajas: Precisión dependiente de la opacidad del fluido, el numero de partículas
translucidas, y burbujas de aire y contaminación del agua. El conteo y tamaño tambien puede
variar dependiendo de la orientación de partículas de formas, largo y grosor inusuales en el
rayo de luz. No provee información obre la composición química o los contaminantes. Se
requiere dilución para las altas concentraciones de partículas para evitar errores de
coincidencias donde muchas partículas se juntan y aparecen como una partícula de mayor
tamaño.
4.8 Sensor Ferromagnético de Tiempo Real.
Condiciones monitoreadas: Partículas ferromagnéticas causadas por fatiga.
Aplicaciones: Aceites utilizados motores diesel y nafteros. Turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: Semanas a meses.
Operación: Un sensor ferromagnético análogo utiliza un principio inductivo o magnético para
medir la cantidad de partículas ferrosas que pasan por el sensor. El sensor atrae las partículas
ferrosas con un electro magneto. Las partículas se agrupan alrededor de un espiral causando
un cambio en la frecuencia del oscilador. La frecuencia se calibra para indicar la masa de
325
partículas ferrosas recogida. Después de que se ha tomado una medida, las partículas se
liberan. Medidas pueden cambiar a los largo del tiempo.
Habilidad: Un trabajador o técnico experimentado.
Ventajas: técnica on – líen
Desventajas: Limitada a recolectar solamente partículas ferromagnéticas. Indica la masa de
partículas ferromagnéticas exclusivamente.
4.9 Sensores de Escombros Metálicos.
Condiciones monitoreadas: Partículas ferrosas y no ferrosas causadas por desgaste y fatiga.
Aplicaciones: Diseñadas específicamente para la protección de rodamientos de turbinas de
gas.
Intervalos P-F: Semanas a meses.
Operación: la cabeza del sensor consiste en tres espirales ubicados alrededor de una sección
aislada de la cañería. Los espirales estimulo exteriores son energizados por una señal opuesta
de alta frecuencia. El espiral sensitivo (en el medio) es ubicado exactamente en el punto nulo
entre los espirales de estimulo. Cuando una partícula ferrosa pasa a través del sensor, perturba
el primer campo y el segundo, generando una señal detectable en el espiral sensor. Una
partícula no ferrosa genera una sinal opuesta y única. El sensor detectara la mayoría de los
rangos severos de partículas. Están señales se capturan y se almacenan en como información
temporal, y se utiliza como tiempo real ara alertar a los operadores, o para sentar respuestas
automáticas de sistemas de control.
Habilidad: Trabajador o técnico capacitado para inclinar los resultados.
Ventajas: Detecta y cuantifica las partículas de desgaste ferrosas y no ferrosas. Baja
probabilidad de falsas indicaciones. Los sensores a bordo, pueden capturar y almacenar los
datos de tiempo de varios modos de dañino que pueden ser utilizados para identificar las
fuentes de desgaste en prácticamente su tiempo real.
Desventajas: No pueden determinar la composición química ni el tamaño de las partículas.
4.10
Filtración Graduada
Condiciones monitoreadas: Partículas en los aceites lubricantes e hidráulicos causadas por
desgaste, fatiga, contaminación y corrosión.
Aplicaciones: Aceites utilizados motores diesel y nafteros. Turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: Generalmente varias Semanas a meses.
Operación: Una pequeña cantidad de aceite (100 ml) es diluida y pasada a través de una serie
de discos de filtros estándar. Cada disco es luego examinado bajo un microscopio y las
326
partículas son contadas en forma manual. Los resultados se expresan como el número de
partes de un rango de tamaños particular. Su distribucion estadística se muestra con la forma
de un grafico. Los análisis del perfil de la distribucion de partículas se muestran en forma de
grafico. El análisis de los perfiles de distribucion de partículas indican si el desgaste es normal
o no.
Habilidad: Para el muestreo: un analista de laboratorio. Para el examen de los perfiles de
distribucion de partículas: Un Ingeniero o técnico con experiencia en laboratorio.
Ventajas: Los contaminantes tales como astillas de metal, piezas de material de sellado, o
suciedad pueden ser identificados visualmente. Relativamente baratos.
Desventajas: Es subjetivo, porque el operador debe detectar visualmente el tamaño de las
partículas, aun cuando hay cuadriculas para referencia. Examinar cada disco de filtro lleva
varias horas. Se requiere un especialista para interpretar los resultados de la prueba. La
identificación de los elementos de partículas presenta dificultad.
4.11 Detección Magnética de Astillas
Condición monitoreada: desgaste y fatiga.
Aplicaciones: Aceites utilizados motores diesel y nafteros. Turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: Días a semanas.
Operación: Un enchufe magnético es montado en el sistema de lubricación de modo que la
sonda magnética se expone al lubricante en circulación. Las pequeñas partículas metálicas, o
copos metálicos causados por desprendimientos por fatiga, son capturados por la sonda. La
sonda se retira regularmente para el examen microscópico de las partículas extraídas. Un
tamaño de partícula aumentado indica una falla creciente. Los escombros tienen diferentes
características (forma, color, textura) dependiendo de la fuente.
Habilidad: Recoger la muestra: Un trabajador capacitado adecuadamente. Para analizar los
deshechos: Un técnico experimentado.
Ventajas: Bajo Costo. Un microscopio de baja potencia solo requerido para el análisis de los
escombros: Algunas sondas pueden retirarse sin pérdida de lubricante.
Desventajas: Intervalos P-F corotes requiere alta capacitación para interpretar los escombros.
4.12 Evaluación de Manchas
Condiciones monitoreadas: metales desgastados, partículas de corrosión, fatiga, etc.
Aplicaciones: Aceites utilizados motores diesel y nafteros, turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: unos pocos días a pocas semanas.
327
Operación: Se colocan una o dos gotas de aceite en una pieza plana de papel de filtro. La gota
de aceite se desparrama y se seca, las partículas mayores permanecen en la corona circular
dentro de un radio pequeño. Esto retira muchos aditivos organometalicos y dispersantes
detergentes. Una dispersión mayor lleva a la filtración de aceite a través del papel, de modo
que se definen claramente las zonas circulares correspondientes al tamaño de las partículas
transportadas por el aceite filtrante. Un anillo bien definido alrededor del área húmeda con
aceite indica la presencia de sedimentos. Se necesita un periodo de 24 horas para que el aceite
“manche” completamente, luego del cual los resultados pueden analizarse fotometricamente.
La prueba provee una indicacion de cuando los dispersantes del aceite de motor estan
alcanzando el fin de su vida útil. Algunos kits de prueba portátiles poseen estándares de
referencia que pueden proveer una indicación e los niveles de sedimentos presentes.
Habilidad: Para la prueba de manchas: Un trabajador sem. capacitado. Para el análisis: un
técnico con experiencia.
Ventajas: costos bajos, fácil de usar e instalar, provee un registro: indicador de oxidación de
aceites moderadamente preciso.
Desventajas: se necesitan 24 horas para que el aceite penetre, se requiere una capacitación
considerable para interpretar los resultados, provee una indicación rustica de el nivel de
sedimentos. No indica la composición química de las partículas.
4.13 Prueba de Bacheo
Condiciones monitoreadas: metales desgastados, partículas de corrosión, fatiga, sedimentos
etc.
Aplicaciones: Aceites utilizados motores diesel y nafteros, turbinas a gas, trasmisiones, cajas
de engranajes, compresores y sistemas hidráulicos.
Intervalo P-F: unos pocos días a pocas semanas.
Operación: Se utiliza un vacío para determinar u volumen estándar de fluido de prueba a
través de un disco de filtro de 47 mm Millipore de 5 micrones. El grado de decoloración del
filtro se compara con una escala Standard de coloración de la membrana de filtro, y la escala
de evaluación de partículas para determinar e nivel de contaminación. Los niveles de
partículas mayores producen un gris mas oscuro, o una mancha de color mas fuerte. El agua
aparece ya sea como gotas durante el procedimiento de prueba, o como manchas en el filtro
de prueba. El bache es examinado utilizando un microscopio para determinar si el sistema esta
muy cargado de partículas y para dar una impresión rápida del tipo y tamaño de las partículas.
Una ratina de limpieza aproximada (cualitativa) se puede determinar al comparar el bache.
Habilidad: Un trabajador capacitado adecuadamente.
Ventajas: Los resultados de la prueba son lo suficientemente confiables, repetitivos y
sensitivos como para detectar cualquier cambio significativo en la limpieza. Buena medicion
cualitativa de la contaminación. Portátil.
Desventajas: Utilizar un microscopio para contar las partículas de desgaste o contaminación
es tedioso, no puede ser calibrado, y esta sujeto a muchas variaciones de usuario a usuario.
328
4.14
Sedimentos ( ASTA D1698)
Condiciones
monitoreadas: Sedimentos inorgánicos por contaminación, sedimentos
orgánicos por el deterioro de aceite o la contaminación; sedimentos solubles del deterioro de
aceites.
Aplicaciones: Aceites aislantes derivados del petróleo en transformadores, cables e
interruptores.
Intervalo P-F: varias semanas.
Operación: Una muestra de aceite se centrífuga para separar los sedimentos del aceite. La
porción superior libre de sedimentos es utilizada para medir los sedimentos solubles por
disolución con pentano para precipitar los insolubles en pentano y la filtración a través del
crisol del filtro. Después de secar y pesar para obtener el sedimento total el crisol es
incendiado a 500 ° C, y pesada nuevamente. La perdida en el peso es orgánica, y el remanente
es el contenido inorgánico del sedimento.
Habilidad: Para tomar la muestra: un electricista. Para conducir la prueba: un técnico de
laboratorio entrenado adecuadamente.
Ventajas: Prueba rápida y fácil. El transformador no necesita ser retirado para monitorear el
fluido aislante.
Desventajas: Prueba aplicable a aceites de baja viscosidad, por ejemplo 5.7 a 13.0 CST a 40 °
C. La prueba debe ser llevada a cabo en un laboratorio. El pentano es toxico e inflamable.
4.15 LIDAR ( Detección y clasificación de luz)
Condición monitoreada: Presencia de partículas en la atmósfera.
Aplicaciones: Calidad y dispersión de plumas de humo de los tubos de escape
Intervalo P-F: Variable depende de la aplicaron.
Operación: Se dirige un haz de luz al área bajo investigación. La cantidad de partículas se
evalúa al medir la retrodispersion. Las ubicaciones de determinan por la triangulación
basadas en lecturas tomadas desde dos puntos.
Habilidad: Un ingeniero experimentado.
Ventajas: Una técnica sensitiva que puede cubrir grandes áreas.
Desventajas: Muy costosa. Implica altos grados de capacitación.
329
5
Monitoreo Químico.
Una nota preliminar sobre la detección química de los contaminantes en los fluidos.
Las técnicas descriptas en esta sección de la parte 5 se utilizan para detectar elementos en
fluidos – generalmente aceite lubricante- que indican que una falla potencial se ha presentado
en algún otro lugar del sistema, en forma opuesta a la falla insipiente del fluido en si mismo.
Los elementos detectados mas comúnmente por estas técnicas se enuncian abajo, y pueden
aparecer como resultados de desgate, perdidas o corrosión.
Metales desgastados: Los siguientes metales desgastados se miden en aceites lubricantes:
- Aluminio: de pistones, chumaceras, laminitas, arandelas de empuje, accesorios, cajas de
cojinetes de planetarios, bombas, engranajes, bombas lubricadoras, etc.
-Antimonio: de algunos rodamientos de aleación y componentes grasos.
-Cromo: de desgaste de componentes enchapados como ser ejes, cerraduras, anillos de
pistones, cilindros, cajas de cojinetes y algunos rodamientos.
-Cobre de chumaceras, cojinetes de empuje, brazos de apoyo de oscilación de leva,
engranajes, válvulas, Se presentan en bronce o cobre y se detectan en conjuncion con el zinc
en el primero y lata en el segundo.
- Hierro: forros de cilindros fundidos, anillos de pistones, ejes de leva, cigüeñales, guías de
válvulas, rieles de cojinetes antifricción , engranajes, ejes, bombas de lubricación, y
estructuras de maquinarias , etc.
- Plomo: de chumaceras y cerraduras.
- Magnesio: de accesorios de turbinas, ejes y válvulas.
- Manganeso: De válvulas y ventiladores.
- Molibdeno, de anillos superiores de pistones enchapados en algunos motores diesel.
- Níquel de válvula, paletas de turbinas, rodamientos y platos de leva
- Plata de motores locomotrices, cojinetes soldables
- Estaño: de cojinetes, bronce, sellos y soldaduras.
- Titanium:
- Zinc; de componentes de bronce, sellos de neopreno
Perdidas: Los siguientes elementos están asociados a pérdidas:
-Aluminio: de la contaminación atmosférica
- Boro: de perdidas enfríantes de aceite
- Calcio: Si se lo encuentra en el combustible, generalmente indica contaminación de agua
marina.
- Cobre: de agua de enfriamiento en aceites,
- Magnesio: de contaminación de agua marina.
- Fósforo: de una pérdida de enfriamiento en aceite
- Potasio: de contaminación por agua marina en el aceite
- Silicio: de contaminación por silicio de sistemas de inducción o fluidos de limpieza
-Sodio: de agentes anti corrosión en las soluciones de enfriamiento de motores, generalmente
como resultado de una perdida de enfriamiento.
Corrosión: Los siguientes elementos se asocian con la corrosión:
Aluminio: De la corrosión de bloque de motor.
Hierro: Por la corrosión estanques de almacenamiento y cañerías
Manganeso: a veces se lo encuentra con el hierro como resultados de la corrosión de metales.
330
Download