zu fachzeitungen.de

zurück zu www.fachzeitungen.de

pfeil_rechts

Suchen und Finden

Service

Informationsextraktion von Webseiten via RoadRunner

von: Pawel Broda

GRIN Verlag , 2010

ISBN: 9783640518449 , 21 Seiten

Format: PDF, OL

Kopierschutz: frei

Windows PC,Mac OSX

für alle DRM-fähigen eReader

Apple iPad, Android Tablet PC's

Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 13,99 EUR

Mehr zum Inhalt

Informationsextraktion von Webseiten via RoadRunner

Kapitelübersicht
Kurzinformation
Inhaltsverzeichnis
Leseprobe
Blick ins Buch
Fragen zum eBook

Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik, Note: 1, Ludwig-Maximilians-Universität München (Centrum für Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum größten existierenden und frei verfügbaren Daten- und Informationsbestand entwickelt. Im Netz, wo es ein absoluter Datenüberfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach benötigten Informationen wird durch unzählige Dokumente gestöbert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Während die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert können, bleibt ein sehr großer Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zurückgeführt. Die gesuchten Informationen sind nicht mehr statisch verfügbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt. In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden können. Im nächsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.

© 2009-2024 ciando GmbH
AGB
Datenschutz
Impressum
Kontakt
F.A.Q
Widerruf

Alle Preise verstehen sich inklusive der gesetzlichen MwSt.