Matches in SemOpenAlex for { <https://semopenalex.org/work/W2160147580> ?p ?o ?g. }
- W2160147580 abstract "Scientific computing and computer-based simulation technology evolved to indispensable tools that enable solutions for major challenges in science and engineering. Applications in these domains are often dominated by compute-intensive mathematical tasks like linear algebra matrix operations. The provision of correct and trustworthy computational results is an essential prerequisite since these applications can have direct impact on scientific, economic or political processes and decisions. Graphics processing units (GPUs) are highly parallel many-core processor architectures that deliver tremendous floating-point compute performance at very low cost. This makes them particularly interesting for the substantial acceleration of complex applications in science and engineering. However, like most nano-scaled CMOS devices, GPUs are facing a growing number of threats that jeopardize their reliability. This makes the integration of fault tolerance measures mandatory. Algorithm-Based Fault Tolerance (ABFT) allows the protection of essential mathematical operations, which are intensively used in scientific computing. It provides a high error coverage combined with a low computational overhead. However, the integration of ABFT into linear algebra matrix operations on GPUs is a non-trivial task, which requires a thorough balance between fault tolerance, architectural constraints and performance. Moreover, ABFT for operations carried out in floating-point arithmetic has to cope with a reduced error detection and localization efficacy due to inevitable rounding errors. This work provides an in-depth analysis of Algorithm-Based Fault Tolerance for matrix operations on graphics processing units with respect to different types and combinations of weighted checksum codes, partitioned encoding schemes and architecture-related execution parameters. Moreover, a novel approach called A-ABFT is introduced for the efficient online determination of rounding error bounds, which improves the error detection and localization capabilities of ABFT significantly. Extensive experimental evaluations of the error detection capabilities, the quality of the determined rounding error bounds, as well as the achievable performance confirm that the proposed A-ABFT method performs better than previous approaches. In addition, two case studies (QR decomposition and Linear Programming) emphasize the efficacy of A-ABFT and its applicability to practical problems. Wissenschaftliches Rechnen und rechnergestutzte Simulationstechnik haben sich zu unentbehrlichen Werkzeugen entwickelt, die Losungen fur wichtige Probleme in Wissenschaft und Technik ermoglichen. Anwendungen in diesen Bereichen werden haufig von rechenaufwandigen mathematischen Operationen, wie zum Beispiel Matrixoperationen aus der linearen Algebra, dominiert. Die Bereitstellung korrekter und vertrauenswurdiger Berechnungsergebnisse ist daher eine zentrale Grundvoraussetzung da die genannten Anwendungen direkten Einfluss auf Prozesse und Entscheidungen in Wissenschaft, Wirtschaft und Politik haben konnen. Grafikprozessoren (GPUs) sind hochparallele Many-Core-Prozessorarchitekturen die eine ausergewohnlich hohe Gleitkommarechenleistung bei sehr niedrigen Kosten ermoglichen. Dies macht sie besonders interessant fur die deutliche Beschleunigung von komplexen Anwendungen in Wissenschaft und Technik. Wie die meisten nanoskalierten CMOS-Schaltkreise sehen sich auch GPUs einer wachsenden Zahl von Storfaktoren gegenuber die ihre Zuverlassigkeit massiv beeintrachtigen. Dies macht die Integration von Fehlertoleranzmasnahmen unabdingbar. Algorithmenbasierte Fehlertoleranz (ABFT) erlaubt den Schutz wichtiger mathematischer Operationen die im wissenschaftlichen Rechnen zahlreiche Anwendung finden. ABFT bietet dabei eine hohe Fehlerabdeckung und verursacht nur einen geringen Mehraufwand bei der Berechnung. Die Integration von ABFT in Matrixoperationen auf Grafikprozessoren ist jedoch sehr anspruchsvoll da sie die Balance zwischen Fehlertoleranz, Prozessorarchitektur und Performanz erfordert. Daruber hinaus zeigt sich beim Einsatz von ABFT fur Operationen die in Gleitkommaarithmetik ausgefuhrt werden haufig eine reduzierte Wirksamkeit der Fehlererkennung und -lokalisierung auf Grund von unvermeidlich auftretenden Rundungsfehlern. Die vorliegende Arbeit stellt eine umfangreiche Analyse von ABFT fur Matrixoperationen auf Grafikprozessoren unter den Gesichtspunkten verschiedener gewichteter Prufsummenkodes, partitionierte Kodierungsschemata und ausfuhrungsrelevanter Architekturparameter bereit. Daruber hinaus wird mit A-ABFT eine neuartige Methode fur die effiziente Bestimmung von Rundungsfehlerschranken zur Laufzeit vorgestellt, die die Fehlererkennung und -lokalisierung von ABFT deutlich verbessert. Umfangreiche experimentelle Untersuchungen der Fehlererkennung, der bestimmten Rundungsfehlerschranken, sowie der erzielbaren Performanz bestatigen, dass die vorgeschlagene A-ABFT-Methode bessere Ergebnisse erzielt als bisherige Ansatze. Daruber hinaus wird die Anwendbarkeit und Effektivitat von A-ABFT fur praxisrelevante Probleme anhand zweier Fallstudien (QR-Zerlegung und Lineare Optimierung) gezeigt." @default.
- W2160147580 created "2016-06-24" @default.
- W2160147580 creator A5075469773 @default.
- W2160147580 date "2015-01-01" @default.
- W2160147580 modified "2023-09-25" @default.
- W2160147580 title "Algorithm-based fault tolerance for matrix operations on graphics processing units : analysis and extension to autonomous operation" @default.
- W2160147580 cites W106889926 @default.
- W2160147580 cites W1498265245 @default.
- W2160147580 cites W1533071485 @default.
- W2160147580 cites W164528542 @default.
- W2160147580 cites W1738124305 @default.
- W2160147580 cites W1874341760 @default.
- W2160147580 cites W1893923069 @default.
- W2160147580 cites W1966619865 @default.
- W2160147580 cites W1967816524 @default.
- W2160147580 cites W1968989269 @default.
- W2160147580 cites W1969261086 @default.
- W2160147580 cites W1987398446 @default.
- W2160147580 cites W1995596660 @default.
- W2160147580 cites W1997996976 @default.
- W2160147580 cites W1998484176 @default.
- W2160147580 cites W2006071024 @default.
- W2160147580 cites W2008492897 @default.
- W2160147580 cites W2010211394 @default.
- W2160147580 cites W2014918217 @default.
- W2160147580 cites W2021157069 @default.
- W2160147580 cites W2031533321 @default.
- W2160147580 cites W2042544282 @default.
- W2160147580 cites W2062470986 @default.
- W2160147580 cites W2065963893 @default.
- W2160147580 cites W2071039340 @default.
- W2160147580 cites W2081340222 @default.
- W2160147580 cites W2091230023 @default.
- W2160147580 cites W2102927018 @default.
- W2160147580 cites W2103308354 @default.
- W2160147580 cites W2104238795 @default.
- W2160147580 cites W2108238461 @default.
- W2160147580 cites W2111785162 @default.
- W2160147580 cites W2112548389 @default.
- W2160147580 cites W2115933959 @default.
- W2160147580 cites W2117076170 @default.
- W2160147580 cites W2118558147 @default.
- W2160147580 cites W2121211420 @default.
- W2160147580 cites W2123131789 @default.
- W2160147580 cites W2123475473 @default.
- W2160147580 cites W2127255681 @default.
- W2160147580 cites W2128285278 @default.
- W2160147580 cites W2131025551 @default.
- W2160147580 cites W2133642410 @default.
- W2160147580 cites W2139129111 @default.
- W2160147580 cites W2148039812 @default.
- W2160147580 cites W2152169652 @default.
- W2160147580 cites W2153985054 @default.
- W2160147580 cites W2156278309 @default.
- W2160147580 cites W2161190431 @default.
- W2160147580 cites W2162696040 @default.
- W2160147580 cites W2164119437 @default.
- W2160147580 cites W2164387646 @default.
- W2160147580 cites W2165174896 @default.
- W2160147580 cites W2167273147 @default.
- W2160147580 cites W2167502740 @default.
- W2160147580 cites W2169022172 @default.
- W2160147580 cites W2169946305 @default.
- W2160147580 cites W2260378502 @default.
- W2160147580 cites W2942537621 @default.
- W2160147580 cites W338929813 @default.
- W2160147580 cites W41485005 @default.
- W2160147580 doi "https://doi.org/10.18419/opus-3545" @default.
- W2160147580 hasPublicationYear "2015" @default.
- W2160147580 type Work @default.
- W2160147580 sameAs 2160147580 @default.
- W2160147580 citedByCount "0" @default.
- W2160147580 crossrefType "dissertation" @default.
- W2160147580 hasAuthorship W2160147580A5075469773 @default.
- W2160147580 hasConcept C111919701 @default.
- W2160147580 hasConcept C113775141 @default.
- W2160147580 hasConcept C11413529 @default.
- W2160147580 hasConcept C120314980 @default.
- W2160147580 hasConcept C121684516 @default.
- W2160147580 hasConcept C136625980 @default.
- W2160147580 hasConcept C139352143 @default.
- W2160147580 hasConcept C162372511 @default.
- W2160147580 hasConcept C173608175 @default.
- W2160147580 hasConcept C21442007 @default.
- W2160147580 hasConcept C2524010 @default.
- W2160147580 hasConcept C2779960059 @default.
- W2160147580 hasConcept C33923547 @default.
- W2160147580 hasConcept C41008148 @default.
- W2160147580 hasConcept C63540848 @default.
- W2160147580 hasConcept C84211073 @default.
- W2160147580 hasConceptScore W2160147580C111919701 @default.
- W2160147580 hasConceptScore W2160147580C113775141 @default.
- W2160147580 hasConceptScore W2160147580C11413529 @default.
- W2160147580 hasConceptScore W2160147580C120314980 @default.
- W2160147580 hasConceptScore W2160147580C121684516 @default.
- W2160147580 hasConceptScore W2160147580C136625980 @default.
- W2160147580 hasConceptScore W2160147580C139352143 @default.
- W2160147580 hasConceptScore W2160147580C162372511 @default.
- W2160147580 hasConceptScore W2160147580C173608175 @default.
- W2160147580 hasConceptScore W2160147580C21442007 @default.