14 - Programming Techniques for Supercomputers/ClipID:32668 vorhergehender Clip nächster Clip

Aufnahme Datum 2021-05-11

Sprache

Englisch

Einrichtung

Friedrich-Alexander-Universität Erlangen-Nürnberg

Produzent

Friedrich-Alexander-Universität Erlangen-Nürnberg

This lecture investigates the performance of the Schoenauer Vector triads benchmark over the full memory heirarchy of a single core Intel Haswell processor. Analysing the data transfers throughout the memory hierarchy a performance modell is established which qualitatively describes the performance levels for data sets in different memory hierarchy levels. Further, the dense matrix vector multiplication is investigated to identify performance imporvements by increasing the temporal reuse of vector data. As first optimization strategy outer-loop unroll&jam is identified and successfully tested.

Nächstes Video

Wellein, Gerhard
Prof. Dr. Gerhard Wellein
2021-05-12
IdM-Anmeldung
Wellein, Gerhard
Prof. Dr. Gerhard Wellein
2021-05-18
IdM-Anmeldung
Wellein, Gerhard
Prof. Dr. Gerhard Wellein
2021-05-19
IdM-Anmeldung
Schloss1
Dr. Georg Hager
2021-05-26
IdM-Anmeldung
Wellein, Gerhard
Prof. Dr. Gerhard Wellein
2021-06-01
IdM-Anmeldung

Mehr Videos aus der Kategorie "Friedrich-Alexander-Universität Erlangen-Nürnberg"

2024-11-13
IdM-Anmeldung
geschützte Daten  
2024-11-14
IdM-Anmeldung
geschützte Daten  
2024-11-14
Studon
geschützte Daten  
2024-11-14
IdM-Anmeldung / Studon
geschützte Daten  
2024-11-13
Frei
freie Daten