Im Rahmen des Projektes wurden für das Klimamodell ECHAM5 die Problematik der effizienten Parallelisierung mit MPI, OpenMP sowie deren Kombination für die Systeme IBM RS/6000 SP und pSeries untersucht. In ECHAM5 sind globale Daten durch die Wahl unterschiedlicher Darstellungen für die jeweiligen Teilprobleme entkoppelt. Die parallele Verarbeitung innerhalb einer Darstellung erfolgt dann kommunikationsfrei, der Wechsel von Darstellungen erfordert jedoch globale Kommunikation. Am Beispiel des Transportschemas SPITFIRE wurden Optimierungsmöglichkeiten von Kommunikation und Lastverteilung untersucht. Für MPI wurden verschiedene Kommunikationsmuster und Kommunikationsroutinen verglichen. Bei OpenMP spielt die lokale Cache-Nutzung für die Parallelisierungseffizienz eine besondere Rolle. Für eine cache-optimierte Implementation des Transportschemas ergibt sich mit OpenMP eine bessere Skalierung als mit MPI. Auf der SP wurde das hybride Programmiermodell mit einer reinen MPI-Implementation verglichen. Mit zunehmender Prozessorzahl steigt die Bedeutung der Lastverteilung. Hier wurde ein Verfahren zum Lastausgleich entwickelt, das zurückliegende Zeitmessungen extrapoliert und daraus eine Neuverteilung der Iterationen ableitet.

Weitere Informationen

UniVZ-Eintrag

Kontakt

E-Mail