Home | english  | Impressum | Sitemap | KIT
Being Google - Studierende entwickeln Plattform für verteiltes Web-Crawling
Autor: P. Andelfinger, T. Neudecker Links:
Quelle: SCC-News, Heft 02/2014, Steinbuch Centre for Computing (SCC), Dezember 2014
Moderne Suchmaschinen können Seiten des World Wide Web in gigantischen und fortlaufend aktualisierten Datenbanken durchsuchen und selbst komplexe Suchanfragen in wenigen Millisekunden verarbeiten. Dienste dieser Art sind kaum denkbar ohne die Verwendung hochverteilter Ansätze beim Crawling im Web und bei der Bearbeitung von Nutzeranfragen. Im Rahmen der Lehrveranstaltung "Praxis der Softwareentwicklung" im Bachelor-Studiengang Informatik hat ein Team von Studenten im Projekt "Being Google - Verteiltes Web-Crawling und Suche" ein Software-System entworfen und implementiert, das ein effizientes Crawling von textuellen Web-Inhalten, die Indexierung in einer verteilten Datenbank sowie eine performante Suche nach abgelegten Inhalten erlaubt.