Nr |
Themenblock |
bearbeitet von |
Zwischenpr. |
Ausarbeitung |
Vortragsfolien |
(Einstiegs-)Paper |
1 |
Speicherformate |
T.Lindlar |
Folien |
Ausarbeitung |
Folien |
Speicherformate für dünnbesetzte Matrizen in Intel MKL und Nvidia cuSPARSE und deren praktische Nutzung |
2 |
Speicherformate |
J.A.Steffens |
Folien |
Ausarbeitung |
Folien |
M.Kreutzer et.al.: A Unified Sparse Matrix Data Format for Efficient General Sparse Matrix-Vector Multiply on Modern Processors with Wide SIMD Units arXiv:1307.6209v2, 2014 |
3 |
Optimierungen |
J.Knack |
Folien |
Ausarbeitung |
Folien |
M.Shantharam et.al.: Exploiting Dense Substructures for Fast Matrix Vector Multiplication Intl.Journal of High Performance Computing Applications, 2011 |
4 |
Optimierungen |
H.Klohn |
Folien |
Ausarbeitung |
Folien |
K.Matam et.al.: Accelerating Sparse Matrix Vector Multiplication in Iterative Methods Using GPU Intl.Conf. on Parallel Processing, 2011 |
5 |
Optimierungen |
Chr.Arera |
Folien |
Ausarbeitung |
Folien |
W.Tang et.al.: Accelerating Sparse Matrix-Vector Multiplication on GPUs using Bit-Representation-Optimized Schemes SC'13, 2013 |
6 |
Optimierungen |
T.Metzler |
Folien |
Ausarbeitung |
Folien |
A.Ashari et.al.: An Efficient Two-Dimensional Blocking Strategy for Sparse Matrix-Vector Multiplication on GPUs ICS'14, 2014 und Z.Kosa et.al.: Compressed Multirow Storage Format for Sparse Matrices on Graphics Processing Units SIAM J.Sci.Comput., 2014 |
7 |
Optimierungen |
D.Hiendl |
- |
- |
- |
D.Mukunoki et.al.: Optimization of Sparse Matrix-Vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs Proc. ICCSA, 2013 |
8 |
Optimierungen |
M.Weierstall |
Folien |
Ausarbeitung |
Folien |
Efficient Sparse Matrix-Vector Multiplication on x86-Based Many-Core Processors Proc. ICS'13, 2013 |
9 |
Reordering |
A.Zarychta |
Folien |
Ausarbeitung |
Folien |
A.Pinar et.al.: Improving Performance of Sparse Matrix-Vector Multiplication SC99, 1999 |
10 |
Autotuning |
J.Menzenbach |
Folien |
Ausarbeitung |
Folien |
J.Byun et.al.: Autotuning Sparse Matrix-Vector Multiplication for Multicore TR UCB/EECS-2012-215, 2012 |
11 |
Leistungsvorhersage |
E.Glaser |
Folien |
- |
- |
S.Williams et.al.: Roofline: An Insightful Visual Performance Model for Multicore Architectures CACM Vol.52, No.4, 2009 |
12 |
Leistungsvorhersage |
G.Pilz |
- |
- |
- |
E.Peise et.al.: Performance Modeling for Dense Linear Algebra arXiv-1209.2364v2, 2012 |
13 |
Leistungsvorhersage |
M.Kerp |
Folien |
Ausarbeitung |
Folien |
P.Guo et.al.: Accurate Cross-Architecture Performance Modeling for Sparse Matrix-Vector Multiplication (SpMV) on GPUs Concurrency and Computation: Practice and Experience, 2014 und P.Guo et.al.: A Performance Modeling and Optimization Analysis Tool for Sparse Matrix-Vector Multiplication on GPUs IEEE Trans. on Parallel and Distributed Systems, Vol.25, No.5, 2014 |