Soft errors detection and automatic recovery based on replication combined with different levels of checkpointing

D Montezanti, E Rucci, A De Giusti, M Naiouf… - Future Generation …, 2020 - Elsevier
Handling faults is a growing concern in HPC. In future exascale systems, it is projected that
silent undetected errors will occur several times a day, increasing the occurrence of …

Fault-tolerant execution of parallel applications on x86 multi-core processors with hardware transactional memory

F Haas - 2019 - opus.bibliothek.uni-augsburg.de
To satisfy the enduring demand for increasing computational power, the processor
manufacturers try to raise the performance per Watt of a chip, which can be achieved by …

Arquitecturas para Aplicaciones con Inteligencia Artificial: Un Mapeo Sistemático de la Literatura

FL Chayle, A Tommasel - Memorias de las JAIIO, 2024 - publicaciones.sadio.org.ar
Antecedentes. La integración efectiva de la inteligencia artificial (IA) en aplicaciones de
software es crucial en un entorno digital caracterizado por avances tecnológicos constantes …

Tecnologías de Smart IoT y aprendizaje automático para la solución de problemas en el medio productivo

JR Osio, J Salvatore, M Salina… - XXIV Workshop de …, 2022 - sedici.unlp.edu.ar
El presente proyecto se basa en la utilización de internet de las cosas (IoT) como
herramienta fundamental para proveer soluciones a problemáticas de interés social, como …

Handling memory errors in computing systems

A Pandey, R Diamant - US Patent 10,908,987, 2021 - Google Patents
An error handling technique for a computing device includes detecting a memory error
during execution of the program instructions to generate a computational result, and gener …

[PDF][PDF] Towards Soft Error Resilience in SWE with TeaMPI

A Rahma - 2021 - mediatum.ub.tum.de
Increasing demand for HPC applications has resulted in large clusters with thousands of
nodes that can suffer from various types of failures which are even expected to increase in …

[PDF][PDF] Resumen de tesis: SEDAR: Detección y recuperación automática de fallos transitorios en sistemas de cómputo de altas prestaciones

DM Montezanti - XXII Workshop de Investigadores en Ciencias …, 2020 - sedici.unlp.edu.ar
SEDAR: Detección y Recuperación Automática de Fallos Transitorios en Sistemas de Cómputo
de Altas Prestaciones Page 1 SEDAR: Detección y Recuperación Automática de Fallos …

Determinación de la eficiencia en el procesamiento sobre Arquitecturas Multiprocesador y Estrategias de Tolerancia a Fallos en HPC

JR Osio, DM Montezanti, MA Cappelletti… - XXII Workshop de …, 2020 - sedici.unlp.edu.ar
Dentro de la línea de investigación que se está desarrollando, existen varios enfoques. Por
un lado se viene trabajando sobre la implementación de algoritmos de procesamiento de …

[PDF][PDF] Arquitecturas multiprocesador: Hardware, Software, Modelos, Métricas y Tendencias

JM Paniego, MP Puig, C Estrebou, L Libutti, C Manuel… - core.ac.uk
El eje de esta línea de I/D lo constituye el estudio de las arquitecturas multiprocesador que
integran sistemas distribuidos y paralelos. Incluye como temas centrales:-Arquitecturas …

SEDAR: Detección y recuperación automática de fallos transitorios en sistemas de cómputo de altas prestaciones

DM Montezanti - 2020 - sedici.unlp.edu.ar
El manejo de fallos es una preocupación creciente en el contexto del HPC; en el futuro, se
esperan mayores variedades y tasas de errores, intervalos de detección más largos y fallos …