jueves, 10 de marzo de 2016

RCA: Análisis de Causa Raíz


Este documento tiene por objetivo describir la metodología para la realización de un análisis de causa raíz (RCA), debido a fallas en equipos o sistemas. Donde puede aplicarse  a todos los procesos y áreas del los diferentes empresas.

Veamos primero algunas principales definiciones:
  1. Análisis Causa Raíz (RCA):Es un conjunto de métodos de solución de problemas que permiten, de manera sistemática, identificar las causas raíces de problemas o eventos, y determinar unas acciones que las eliminen o mitiguen su recurrencia.
  2. Fallas esporádicas: Una falla esporádica es una falla dramática e inesperada que causa un gran impacto en producción, HSE y/o mantenimiento y por lo tanto es altamente visible dentro de la compañía. Generalmente el problema es evidente y se adelantan investigaciones para determinar las causas raíces. La eliminación de un problema esporádico estabiliza la situación llevándola a rangos aceptables para la organización. Típicamente, los problemas esporádicos no deseados están asociados con la afectación de la disponibilidad.
  3. Fallas crónicas: Una falla crónica es la falla típica repetitiva que tiene un impacto importante en las operaciones o el mantenimiento en el mediano y largo plazo, pero que en el momento en que sucede no resulta dramática y el costo de reparación, impacto en producción y HSE son considerados bajos. A largo plazo pueden representar altos costos para la organización y desencadenar en un problema crítico. La eliminación de un problema crónico está enfocada a optimizar el desempeño de las organizaciones, reducir costos no evidentes y prevenir la ocurrencia de problemas críticos. Típicamente, los problemas crónicos están asociados con la afectación de la eficiencia. Los problemas crónicos se pueden detectar con Pareto el cual prioriza los activos que tuvieron una mayor frecuencia de fallas o mayores gastos por mantenimiento. 
  4. Matriz de disparo de Análisis de Falla 
  5. EvidenciaToda partes, posiciones, papeles (documentos) o personas (entrevistas, declaraciones) que corroboran una conclusión.
  6.  Reporte de Falla – 24 HorasEs un Reporte que describe los hechos, impactos en producción o HSE y plantea unas primeras hipótesis, el cual es elaborado por los Técnicos de Mantenimiento con la revisión y emisión del Supervisor de Mantenimiento.
  7. Términos de Referencia (TOR): Documento emitido para formalizar el comienzo de un RCA, vincula oficialmente a las personas que harán parte del grupo investigador y compromete los recursos necesarios para su desarrollo.
  8. Árbol LógicoLos árboles lógicos proporcionan una representación simbólica conveniente de la combinación de eventos que producen la ocurrencia del evento de la cima. 
  9. Modos de FallaLlamamos modo de falla al fenómeno o mecanismo responsable del evento o condición de falla, los modos de falla en general pueden afectar a un componente estructural.
  10. Causa Raíz Física: Mecanismo de falla a nivel de componente.
  11. Causa Raíz Humana: Punto de acción indebida o error humano.
  12. Causa Raíz Latente: Problema del sistema o la organización.
  13. Acción Correctiva: Acción tomada para eliminar la causa raíz detectada del RCA.
Tenemos a continuación algunas condiciones a tomar en cuenta:

  • Toda Falla de un equipo o sistema que interrumpe el proceso debe ser reportado en el reporte de falla de 24 horas y ser analizado en la matriz de disparo de análisis de Falla para dar inicio a este procedimiento.
  • La responsabilidad para la presentación del reporte de falla de 24 horas y la evaluación en la matriz de disparo de análisis de Falla recae en primera instancia sobre el Jefe del Área/proceso en la cual se presenta la falla.
  • Si la matriz indica que el impacto de la falla debe de realizar el RCA es responsabilidad del Jefe del Área/proceso en la cual se presenta la falla coordinar con el jefe de Mantenimiento de la planta para formar el grupo de personas que realizaran el RCA.
  • En caso de que la acción correctiva o preventiva tomada, genere cambios en las metodologías de trabajo, dichos cambios deben quedar consignados en la documentación respectiva. 

Vamos a describir a continuación los pasos a seguir con una breve descripción de cada paso:

A. Identificación en la Matriz de disparo de RCA

Cuando la información del reporte de falla – 24 hrs  sea verificada en la matriz de disparo de RCA y esta resulte dentro de la zona crítica, el jefe de área debe de coordinar con el jefe de Mantenimiento de la planta para formar el grupo de personas que realizaran el RCA.
B. Aseguramiento del sitio y recopilación de las evidencias

       Atender las consecuencias del evento de falla. La prioridad es la atención al personal lesionado y restaurar las instalaciones a una condición segura.
       La obtención de evidencia inmediatamente después del evento es crucial, en lo posible se debe acordonar el área de manera que la evidencia no se manipule. Se congela el área hasta que se haya recogido toda la información conocida.

       Se deben guardar cuidadosamente aquellas piezas que fueron afectadas durante el evento para su posterior análisis (si no se requieren para restaurar la función del activo), tratando de no manipularlas excesivamente, ya que esto puede ocasionar pérdida de la información.

       Las posiciones de todas las partes y equipo se deben fotografiar siempre que sea posible. En su defecto hacer diagramas mostrando la ubicación y estado (tanto físico, como de accionamiento) de las válvulas (cerrada/abierta), interruptores (encendido/apagado), indicadores, personas, etc., con orientación y distancias desde un punto fijo de referencia. 

       Las entrevistas se deben realizar individualmente, poco después de que haya ocurrido un evento y antes de que los testigos conversen entre ellos, siempre que sea posible.

       El historial de las tendencias de las condiciones del proceso (temperaturas, presiones, flujos, niveles) y de variables de monitoreo por condición, tales como vibraciones, análisis de aceite, etc. Deben ser revisadas y guardas para el análisis.

C. Términos de Referencia y Conformación de equipo de trabajo

    • Términos de Referencia


El Término de referencia es un documento emitido para formalizar el comienzo de un RCA, vincula oficialmente a las personas que harán parte del grupo investigador y compromete los recursos necesarios para su desarrollo con base en él los coordinadores o supervisores de las diferentes áreas programarán sus recursos con antelación, teniendo en cuenta el personal que quedará “fuera de línea” al ser vinculado a la realización del ejercicio.

El término de referencia debe incluir:

I.              Introducción
II.             Antecedentes
III.            Objetivos
IV.            Alcance
 V. Áreas Involucradas 
VI. Responsabilidades
VII.          Metodología
VIII.         Recursos
IX.           Tiempo Establecido  - Cronograma 
X.          Producto esperado 
XI.       Resultados.

Emitido por: 
Fecha de Emisión:

    • Conformación de equipo de trabajo


       La conformación del equipo variará dependiendo de la falla que se esté analizando. Un equipo puede constar de tres a seis  o más personas y contar con recursos externos adicionales. Al menos una persona del equipo debería ignorar los eventos de la falla, ser ajeno a ella, entre los miembros de un equipo se pueden incluir operadores, técnicos, supervisores, ingenieros, inspectores, especialistas, proveedores, etc.

       El facilitador encaminará el análisis ceñido a la metodología. Deberá ser imparcial, tenaz y conciliador.

       El Líder del análisis persona responsable de liderar y completar un análisis RCA. También es llamado Analista Principal. 

       El especialista, según la severidad del evento a analizar, el recurso adicional puede incluir un especialista en el equipo que presentó la falla. 

       Cualquier investigación de importancia merece una “sala de análisis”. Se trata de un salón para uso exclusivo del Equipo RCA donde podrá recopilar/evaluar las evidencias, dotado de: Mesa de conferencia, tableros, Marcadores, papel, video-proyector.

D.Definición del problema y realización del árbol lógico de falla – verificación de hipótesis

    • Definición del problema
Se debe responder a las preguntas:
        ¿Qué sucede?
       ¿Cómo sucede?
       ¿Dónde sucede?
       ¿Cuándo sucede?

Incluir dentro de la definición del evento, las consecuencias del mismo, esto nos asegura que el RCA no se centre en el modo de falla únicamente, sino en todas las condiciones que se presentaron durante el evento y que causaron el efecto en la magnitud correspondiente.

    • Realización del árbol lógico de falla – verificación de hipótesis

Generalmente se presentan condiciones que pudieron haber agravado la severidad de la falla, tener cuidado de no pasarlas por alto e incluirlas en el análisis como hipótesis.

Análisis de 5 por qué e Ishikawa

Para realizar reporte de fallas debe ser acompañado de un análisis utilizando las metodologías de 5 por qué e Ishikawa que conllevará a encontrar causas raíces evidentes.

E. Determinación de las causas raíces (Física, Humana y Latente)

La verificación de las hipótesis de causa es un factor determinante de éxito, de este modo el Equipo RCA tendrá la certeza de identificar claramente los tres niveles de causa raíz, a saber:

       Causa Raíz Física; mecanismo de falla a nivel de componente.
       Causa Raíz Humana; punto de acción indebida o error humano.
       Causa Raíz Latente; problema del sistema o la organización.

F. Identificación e Implementación de las acciones correctivas

Las soluciones del problema deben seleccionarse si estas evitan o al menos reducen la recurrencia de la falla o problema.

Por otro lado la solución debe soportarse en un análisis de costo beneficio riesgo que justifique su aplicación. 









Criterios principales para formular acciones correctivas

       ¿La acción correctiva prevendrá la recurrencia?
       ¿Es factible la implementación de la acción correctiva?
       ¿Permite la acción correctiva cumplir con los objetivos primarios o misión y obligaciones de la empresa?
       ¿La acción correctiva introduce nuevos riesgos? ¿Están completamente identificados los riesgos asumidos? (La seguridad de otros sistemas no debe ser degradada por la acción correctiva propuesta)
       ¿Las acciones inmediatas fueron tomadas apropiada y efectivamente?
       ¿Es medible la implementación de las acciones correctivas?


Tener cuenta los siguientes formatos:

       Formato de reporte de falla – 24 Hrs. 

Esperemos le sea un buen aporte para realizar análisis de causa raíz.

No hay comentarios:

Publicar un comentario