Prof. Dr. Rudolf Berrendorf

Seminar Spezialisierung Komplexe Software-Systeme (WS 14/15)

Die nachfolgenden Angaben gelten für meine Seminargruppe.

Aktuelles

Ankündigung

Die Ankündigung zur Veranstaltung finden Sie hier .

Abschluss

Das Seminar wird abgeschlossen durch ein Prüfung in Form eines Kolloquiums. Dazu muss eine Seminarausarbeitung abgegeben werden (pdf; 15-20 Seiten) und ein Seminarvortrag von 30 Minuten gehalten werden. Voraussetzungen für die Erteilung der Credits sind (alle Kriterien müssen erfüllt sein):

Zeitliche Planung

Datum Meilenstein
02.10.2013, 17:00 Auftaktveranstaltung und Themenausgabe C118
14.10.2013, 9:00 Präsentationstechniken C013.1
30.10.2014, 23:59 Gliederung,Literatur
25.11. und 02.12.2014 9-10:30, Raum C013.1 Zwischenpräsentation
06.01.2015, 23:59 Ausarbeitung
Do 15.1.2015 (vormittags) und Fr 16.1.2015 (ganztags), Raum C016 Präsentation

Zeitlots für Beratung

Vereinbaren Sie mit mir per E-Mail einen Beratungstermin. Je früher, desto besser. 20-Minuten-Zeitslots gibt es immer dienstags 9-10:30 Uhr.

Unterlagen der Auftaktveranstaltung

Themen

Nr Themenblock bearbeitet von Zwischenpr. Ausarbeitung Vortragsfolien (Einstiegs-)Paper
1 Speicherformate T.Lindlar Folien Ausarbeitung Folien Speicherformate für dünnbesetzte Matrizen in Intel MKL und Nvidia cuSPARSE und deren praktische Nutzung
2 Speicherformate J.A.Steffens Folien Ausarbeitung Folien M.Kreutzer et.al.: A Unified Sparse Matrix Data Format for Efficient General Sparse Matrix-Vector Multiply on Modern Processors with Wide SIMD Units arXiv:1307.6209v2, 2014
3 Optimierungen J.Knack Folien Ausarbeitung Folien M.Shantharam et.al.: Exploiting Dense Substructures for Fast Matrix Vector Multiplication Intl.Journal of High Performance Computing Applications, 2011
4 Optimierungen H.Klohn Folien Ausarbeitung Folien K.Matam et.al.: Accelerating Sparse Matrix Vector Multiplication in Iterative Methods Using GPU Intl.Conf. on Parallel Processing, 2011
5 Optimierungen Chr.Arera Folien Ausarbeitung Folien W.Tang et.al.: Accelerating Sparse Matrix-Vector Multiplication on GPUs using Bit-Representation-Optimized Schemes SC'13, 2013
6 Optimierungen T.Metzler Folien Ausarbeitung Folien A.Ashari et.al.: An Efficient Two-Dimensional Blocking Strategy for Sparse Matrix-Vector Multiplication on GPUs ICS'14, 2014 und Z.Kosa et.al.: Compressed Multirow Storage Format for Sparse Matrices on Graphics Processing Units SIAM J.Sci.Comput., 2014
7 Optimierungen D.Hiendl - - - D.Mukunoki et.al.: Optimization of Sparse Matrix-Vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs Proc. ICCSA, 2013
8 Optimierungen M.Weierstall Folien Ausarbeitung Folien Efficient Sparse Matrix-Vector Multiplication on x86-Based Many-Core Processors Proc. ICS'13, 2013
9 Reordering A.Zarychta Folien Ausarbeitung Folien A.Pinar et.al.: Improving Performance of Sparse Matrix-Vector Multiplication SC99, 1999
10 Autotuning J.Menzenbach Folien Ausarbeitung Folien J.Byun et.al.: Autotuning Sparse Matrix-Vector Multiplication for Multicore TR UCB/EECS-2012-215, 2012
11 Leistungsvorhersage E.Glaser Folien - - S.Williams et.al.: Roofline: An Insightful Visual Performance Model for Multicore Architectures CACM Vol.52, No.4, 2009
12 Leistungsvorhersage G.Pilz - - - E.Peise et.al.: Performance Modeling for Dense Linear Algebra arXiv-1209.2364v2, 2012
13 Leistungsvorhersage M.Kerp Folien Ausarbeitung Folien P.Guo et.al.: Accurate Cross-Architecture Performance Modeling for Sparse Matrix-Vector Multiplication (SpMV) on GPUs Concurrency and Computation: Practice and Experience, 2014 und P.Guo et.al.: A Performance Modeling and Optimization Analysis Tool for Sparse Matrix-Vector Multiplication on GPUs IEEE Trans. on Parallel and Distributed Systems, Vol.25, No.5, 2014

Prof. Dr. Rudolf Berrendorf