Tolerancia a fallos

En ingeniería de confiabilidad, la tolerancia a fallas es la capacidad de un sistema de no sufrir fallas (es decir, interrupciones del servicio) incluso en presencia de fallas. La tolerancia a fallos es uno de los aspectos de la fiabilidad. Es importante tener en cuenta que la tolerancia a fallos no garantiza la inmunidad frente a todos los fallos, sino solo que los fallos para los que se ha diseñado la protección no causan fallos. Las comprobaciones de protección (que se realizan en tiempo de ejecución), junto con comprobaciones similares realizadas de forma estática (como en tiempo de diseño o compilación), son una metodología muy eficaz para lograr una alta robustez (detección rápida de errores y su confinamiento) en un sistema. La tolerancia a fallos puede conducir a un empeoramiento de otras prestaciones, por lo que en el diseño de un sistema es necesario encontrar optimizaciones y compromisos adecuados.

La robustez es la propiedad de aquellos sistemas que aseguran la detección rápida de errores y que permiten su contención. Los estudios estadísticos han demostrado que al menos dos de cada tres errores se deben a solicitudes ilegales de operaciones sobre objetos, es decir, precisamente aquellas solicitudes que los controles de protección evitan. Una medida típica de tolerancia a fallos es el cálculo del tiempo medio entre fallos del sistema (MTBF).

La tolerancia a fallos varía según el tipo dependiendo del aspecto al que se aplique y puede tener tipos de implementación muy diferentes. Puede pasar de un simple sistema de tolerancia a fallas en el suministro de equipos electrónicos, utilizando una fuente de alimentación ininterrumpida o UPS : en caso de ausencia de la tensión de alimentación, el equipo continuará funcionando durante un período dependiente de la capacidad del sistema de respaldo. Un sistema más complejo, siempre relacionado con la fuente de alimentación de los dispositivos activos, consiste en la replicación de la fuente de alimentación; si falla la fuente de alimentación principal, el dispositivo continuará funcionando gracias a una o más fuentes de alimentación redundantes. La tolerancia a fallos corresponderá, por supuesto, al número de fuentes de alimentación redundantes utilizadas en el sistema: trivialmente, si un aparato tiene tres fuentes de alimentación y todas fallan al mismo tiempo, el aparato se detiene. En el campo de los microprocesadores, la técnica SMP permite utilizar varios microprocesadores al mismo tiempo, aprovechando la potencia de cálculo total y, en caso de que uno de los procesadores se detenga, la operación cambiará al procesador (s) que aún esté en funcionamiento. En la protección de datos, se pueden utilizar sistemas RAID, en los que la tolerancia a fallos es una función del esquema Raid adoptado y la adopción o no de discos de repuesto en caliente.

Técnicas de defensa informática

Teoría de sistemas

Teorías de la Informática

Mantenimiento en diseño

Frase

Una frase de contraseña (de la contraseña y frase en inglés, Lett. "frase clave" , "frase de contraseña" o " frase de contraseña ") , en el área de computación ...

Digitalización

La digitalización es el proceso de conversión que, aplicado a la medición de un fenómeno físico, determina la transición del campo de los valores continuos al d...

Cifrado

Terminología informática

Esta página se basa en el artículo de Wikipedia: Fuente, Autores, Licencia Creative Commons Reconocimiento-CompartirIgual.
This page is based on the Wikipedia article: Source, Authors, Creative Commons Attribution-ShareAlike License.
contactos
Política de privacidad , Descargos de responsabilidad