Angebotsbeschreibungen für Online-Einkaufsportale zur automatischen Klassifizierung und Informationsextraktion mittels Rekursiver Transitionsnetzwerke - Eine linguistisch-strukturelle Analyse

von: Anja Klein

GRIN Verlag , 2007

ISBN: 9783638837705 , 58 Seiten

Format: PDF, OL

Kopierschutz: frei

Windows PC,Mac OSX für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 18,99 EUR

Mehr zum Inhalt

Angebotsbeschreibungen für Online-Einkaufsportale zur automatischen Klassifizierung und Informationsextraktion mittels Rekursiver Transitionsnetzwerke - Eine linguistisch-strukturelle Analyse


 

Examensarbeit aus dem Jahr 2007 im Fachbereich Informatik - Internet, neue Technologien, Note: 1,0, Ludwig-Maximilians-Universität München (Centrum für Informations- und Sprachverarbeitung), Sprache: Deutsch, Abstract: Das Einkaufen im Internet hat sich neben dem stationären Handel in den letzten Jahren zu einer tragenden Säule der Wirtschaft entwickelt. Die Menge der im Internet umgesetzten Waren hängt jedoch nicht zuletzt davon ab, ob der Verbraucher einen Anbieter und bei diesem das für ihn passende Produkt findet. Ohne eine umfassende Klassifikation von Produkten und eine ausgereifte Suchtechnologie ist das jedoch kaum möglich. Großer manueller Aufwand dafür ist natürlich sehr kostspielig. Eine Möglichkeit dem zu begegnen, ist die Entwicklung von Werkzeugen, die durch umfassende Konfigurierbarkeit helfen, große Mengen von Produkt- und Angebotsdaten weitestgehend automatisch zu analysieren und klassifizieren bzw. parametrisieren. Die Arbeit stellt einen Ansatz vor, der in einem kommerziellen Umfeld eingesetzt wird. Im Bereich des elektronischen Handels findet er Anwendung, um Prozesse der automatischen Verarbeitung von deutschsprachigen Produkt- und Angebotsdaten zu unterstützen, die letztlich das Ziel haben, die zentrale Problematik des Online-Shoppings - das Suchen und Finden von Produkten - zu optimieren. Die Idee ist dabei, linguistische Informationen - insbesondere lexikalische Daten und syntaktische Strukturen - aus den Angebotstexten zu nutzen, um die darin beschriebenen Produkte zu klassifizieren. Die dafür relevanten Informationen werden mittels Informationsextraktion gewonnen und bearbeitet. Dabei werden bestimmte wiederkehrende und aussagekräftige Muster erkannt und formalisiert, so daß durch Abstraktion auf einen Zusammenhang zwischen der Struktur des Angebotstextes und der Art und Zusammensetzung des konkreten Verkaufsobjektes geschlossen werden kann. Die Arbeit besteht aus zwei Teilen: einem theoretischen, linguistisch-analytischen Abschnitt, in dem das Phänomen der sogenannten Relatoren zunächst ganz allgemein anhand des vorliegenden Korpus (Produkt- bzw. Angebotsinformationen aus dem Online-Handel) analysiert wird, und einem praktisch-anwendungsorientierten Abschnitt, in dem die Erkenntnisse der linguistischen Untersuchung konkret für eine ausgewählte Produktkategorie - Telekommunikationsprodukte - und mit einem Zweck - Erkennen einer Set-Relation - umgesetzt werden.