Maschinelles Lernen im Onlinehandel - Eine Extraktion produktspezifischer Daten

von: Leonardo Hübscher

GRIN Verlag , 2018

ISBN: 9783668833579 , 24 Seiten

Format: PDF

Kopierschutz: frei

Windows PC,Mac OSX für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's

Preis: 15,99 EUR

Mehr zum Inhalt

Maschinelles Lernen im Onlinehandel - Eine Extraktion produktspezifischer Daten


 

Bachelorarbeit aus dem Jahr 2018 im Fachbereich Informatik - Internet, neue Technologien, Note: 1.0, Universität Potsdam (Hasso Plattner Institut), Sprache: Deutsch, Abstract: Durch die Vielzahl von Onlineshops und Fülle an Angeboten verliert der Onlinekäufer schnell die Übersicht. Preisvergleichsplattformen wie idealo helfen dem Kunden das günstigste Angebot im Netz zu finden. Die Gewährleistung der möglichst vollständigen Markttransparenz ist eine grundlegende Herausforderung für idealo. Das von uns entwickelte Softwaresystem Scout soll dabei helfen, den Produktkatalog von idealo auf Vollständigkeit zu überprüfen und fehlende Angebote aufzulisten. Ein wichtiger Prozessschritt ist dabei die Extrahierung von Produktinformationen, wie Produktname oder Preis, aus den einzelnen Webseiten. Die Schwierigkeit der Extraktion liegt darin, dass jeder Shop einen individuellen Aufbau besitzt und unterschiedlich strukturiert ist. Im Rahmen dieser Arbeit wurde ein Algorithmus entwickelt, welcher mittels maschinellem Lernen die Produktinformationen aus den Webseiten extrahiert. Messungen, welche auf 50 verschiedenen Shops basieren, haben ergeben, dass die Produktinformationen mit einer Precision von über 95 Prozent bei einer Accuracy von etwa 50% extrahiert werden können.