Towards management of energy consumption in HPC systems with fault tolerance (Record no. 57367)

MARC details
000 -CABECERA
campo de control de longitud fija 01897naa a2200253 a 4500
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL
campo de control AR-LpUFIB
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
campo de control 20250311170510.0
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL
campo de control de longitud fija 230201s2020 xx o 000 0 eng d
024 8# - Otro identificador estandar
Número estándar o código DIF-M8301
-- 8521
-- DIF007594
040 ## - FUENTE DE LA CATALOGACIÓN
Centro catalogador/agencia de origen AR-LpUFIB
Lengua de catalogación spa
Centro/agencia transcriptor AR-LpUFIB
100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA
Nombre de persona Morán, Marina
245 10 - MENCIÓN DE TÍTULO
Título Towards management of energy consumption in HPC systems with fault tolerance
300 ## - DESCRIPCIÓN FÍSICA
Extensión 1 archivo (506,8 kB)
500 ## - NOTA GENERAL
Nota general Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca)
520 ## - SUMARIO, ETC.
Sumario, etc. High-performance computing continues to increase its computing power and energy efficiency. However, energy consumption continues to rise and finding ways to limit and/or decrease it is a crucial point in current research. For high-performance MPI applications, there are rollback recovery based fault tolerance methods, such as uncoordinated checkpoints. These methods allow only some processes to go back in the face of failure, while the rest of the processes continue to run. In this article, we focus on the processes that continue execution, and propose a series of strategies to manage energy consumption when a failure occurs and uncoordinated checkpoints are used. We present an energy model to evaluate strategies and through simulation we analyze the behavior of an application under different configurations and failure time. As a result, we show the feasibility of improving energy efficiency in HPC systems in the presence of a failure.
534 ## - NOTA SOBRE LA VERSIÓN ORIGINAL
Encabezamiento principal del original IEEE Congreso Bienal de Argentina (ARGENCON) (2020 : Resistencia, Chaco)
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada COMPUTACIÓN DE ALTO RENDIMIENTO - HPC
653 ## - TÉRMINO DE INDIZACIÓN--NO CONTROLADO
Término no controlado consumo de energía
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona Balladini, Javier Aldo
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona Rexachs, Dolores Isabel
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona Rucci, Enzo
856 40 - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS
Identificador Uniforme del Recurso <a href="https://doi.org/10.1109/ARGENCON49523.2020.9505498">https://doi.org/10.1109/ARGENCON49523.2020.9505498</a>
942 ## - ELEMENTOS DE PUNTO DE ACCESO ADICIONAL (KOHA)
Tipo de ítem Koha Capítulo de libro
Holdings
Estado de retiro Estado de pérdida Estado dañado Disponibilidad Colección Biblioteca permanente Biblioteca actual Fecha de adquisición Total de préstamos Signatura topográfica completa Fecha visto por última vez Identificador Uniforme del Recurso Precio válido a partir de Tipo de ítem Koha
      No corresponde Biblioteca digital Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025   A1161 11/03/2025 http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2259 11/03/2025 Capítulo de libro