Home | english | Impressum | Sitemap | KIT

Praxis der Softwareentwicklung

Praxis der Softwareentwicklung
Typ: Praktikum
Ort: nach Vereinbarung
Zeit: nach Vereinbarung
Dozent: Prof. Dr. Hannes Hartenstein
Matthias Keller
Philipp Andelfinger
Tristan Gaugel

Visualizing Trends - Was verrät uns Twitter?

Visualizing Trends - Was verrät uns Twitter?
Erstes Treffen:

Team A (Inhaltsanalyse): Dienstag, 4.11.2014, 14:00 Uhr

Team B (Analyse der Informationsverbreitung: Dienstag, 4.11.2014, 15:00 Uhr

in Gebäude 20.50, Engesserstraße 2, 1.OG links.

Sollte dieser Termin nicht möglich sein, so nehmen Sie bitte Kontakt mit uns auf: philipp.andelfinger (at) kit.edu, matthias.keller (at) kit.edu und tristan.gaugel (at) kit.edu.


"Big Data" ist nach wie vor in aller Munde. Öffentliche wie nicht-öffentliche Inhalte des World Wide Web werden beispielsweise von Industrieunternehmen ausgewertet, um Rückschlüsse zu ziehen, die für zielgerichtete Werbung, zur Marktforschung oder zur Verbesserung von Diensten genutzt werden können. Durch die Verbreitung von Online Social Networks, deren Inhalte in großen Teilen öffentlich zugänglich sind, können Inhalte auch durch Dritte gesammelt und analysiert werden. Beispielsweise ist es möglich, die Beliebtheit einzelner Inhalte und ihre geographische Verbreitung zu beobachten.

Im PSE-Projekt "Visualizing Trends - Was verrät uns Twitter?" sollen die Möglichkeiten zu einer Analyse großer Mengen von Inhalten aus dem Twitter-Netzwerk untersucht werden. Ziel ist es, ein Werkzeug zur Sammlung, Auswertung und Visualisierung von Inhalten des Twitter-Netzwerk zu implementieren.

Im Fokus stehen für die beiden PSE-Teams jeweils unterschiedliche Aspekte:

Team A "Inhaltsanalyse" befasst sich mit der Analyse von Inhalten, beantwortet also die Frage "Wo ist welcher Inhalt besonders interessant?". Basis hierfür sind unter anderem die in Twitter-Nachrichten häufig verwendeten Hashtags, die eine thematische Zuordnung erlauben.

Team B "Analyse der Informationsverbreitung" untersucht die Datenflüsse über geographische Grenzen hinweg, beantwortet also die Frage "Wohin verbreiten sich welche Inhalte?". Hierfür wird unter anderem auf die Tweet-Retweet-Beziehung zwischen Nachrichten zurückgegriffen.

Kern des Projekts ist die Umsetzung einer effizienten Infrastruktur, die die folgenden Schritte durchführt:
- Sammeln von Tweets mittels der Twitter-API
- Auswertung durch austauschbare Analysekomponenten
- Visualisierung der Analyse-Ergebnisse in einer graphischen Oberfläche

Teile der Analyse der Twitter-Nachrichten können mittels existierender Werkzeuge beispielsweise zur Inhaltsbestimmung und zur geographischen Zuordnung gelöst werden.

Neben dem Entwurf und der Implementierung eines IT-Systems im Team können in dem Projekt Erfahrungen mit der Interaktion zwischen Desktop-Applikationen und Web-Diensten sowie mit Fragen der Effizienz bei der Verarbeitung großer Datenmengen gesammelt werden.