Home | english  | Impressum | Sitemap | KIT
Leistungsbewertung der Cloud-Plattform Apache Hadoop am Anwendungsbeispiel verteilter Simulationen
Autor: O. Jetter, J. Dinger, H. Hartenstein Links:
Quelle: In: Praxis der Informationsverarbeitung und Kommunikation (PIK), Band 33, Nr. 1, ISSN 0930-5157, S. 36-44, Januar 2010
Dieser Artikel beschreibt, wie die Cloud-Plattform Apache Hadoop für verteilte Simulationen eingesetzt werden kann („Howto“) und präsentiert zugehörige Leistungsbewertungen sowie Nutzungserfahrungen. Diskrete ereignisbasierte Simulationen benötigen typischerweise beträchtliche Rechenkapazitäten, da die zugehörigen Modelle in der Regel einen großen zu explorierenden Parameterraum besitzen. Bislang wurden zumeist dedizierte Cluster für die Bewältigung dieser Aufgaben verwendet. Cloud Computing bietet nun immense Rechenressourcen in einer flexiblen und kosteneffizienten Art und Weise an. Folglich kann Cloud Computing eine potentielle Basis für die verteilte Durchführung von Simulationsstudien bieten, ohne dabei ein Rechencluster vor Ort besitzen zu müssen. Jedoch ist die manuelle Verteilung von hundert oder tausend Simulationsläufen sehr aufwendig. Daher wird in dieser Arbeit ein Ansatz vorgestellt, der es ermöglicht, die Verteilung von Simulationsläufen automatisiert unter Verwendung des sogenannten MapReduce-Konzepts durchzuführen. MapReduce ermöglicht es, sehr rechenintensive Aufgaben in kleinere unabhängige Teilaufgaben zu unterteilen und ist im Umfeld des Cloud Computing etabliert. Der Fokus dieser Arbeit liegt auf der Verteilung von untereinander unabhängigen und somit trivial parallelisierbaren Simulationsläufen, d.h. beispielsweise Läufe mit unterschiedlichen Parameterwerten. Zunächst wird die Umsetzung der beiden benötigten Funktionen Map und Reduce präsentiert. Die anschließende Leistungsbewertung erfolgte unter Verwendung der Open-Source Implementierung Apache Hadoop sowie der Cloud-Umgebung Amazon Elastic Compute Cloud (EC2).