Produktdaten Crawlen

Produktdaten und Produktbeschreibungen crawlen und als Datensätze speichern

Während es bei der Anbieterrecherche um die Identifizierung möglicher Anbieter für bestimmte Produkte geht, handelt es sich bei der Produktrecherche um das Auffinden möglichst aller Produkte, welche zu einer bestimmten Produktgruppe gehören oder die bestimmte Anforderungen erfüllen. Die Produktsuche wird - wie alle unsere Crawling-Dienstleistungen - mit unserer automatisierten und individuell konfigurierbaren Crawler-Technologie durchgeführt, die in diesem Fall speziell für die durchzuführende Produktrecherche konfiguriert wird.

Für folgende Aufgabenstellungen haben wir erfolgreich Lösungen für unsere Kunden entwickelt:

A. Auf bestimmten Websites sollen die dort veröffentlichten Produktdaten als strukturierte Datensätze mit Produktnamen, Produktbeschreibung, Produktabbildung, Deeplink etc. gecrawlt und erfasst werden. In diesem Fall findet die Produktrecherche nur auf der zu analysierenden Website statt.

B. Mittels einer Produktrecherche sollen diejenigen Websites identifiziert werden, auf denen Produkte bestimmter Produktgruppen oder mit bestimmten Produktbezeichnungen angeboten werden. Auf diesen Websites sollen die Produktbeschreibungen sowie alle relevanten Produktdaten und Produktabbildungen gecrawlt, erfasst und in Datenbanken gespeichert werden.

C. Aus den Produktbeschreibungen sollen bestimmte Produktmerkmale bzw. Produktattribute extrahiert und als separate Datenfelder gespeichert werden. In diesem Fall handelt es sich nicht um eine klassische Produktsuche bzw. Produktrecherche, sondern es werden bestimmte Text-Mining-Verfahren eingesetzt, die für ihre Anforderungen individuell angepasst werden.

D. Ein weiterer Anwendungsfall ist die Online-Recherche von Produktkatalogen, Produktbroschüren, Produktvideos, Preislisten etc., welche auf Websites von Unternehmen veröffentlicht sind. Auf diese Weise können in kürzester Zeit umfangreiche und einzigartige Datenbanken erstellt werden.

E. Die Erstellung von komplexen Produktdatenbanken (linkear a page 08 H1 Crawlerbasierte Generierung von Produktdatenbanken und Produktdatensätzen). gehört ebenfalls zu den Standardaufgaben für unsere Crawler-Technologie. Hierbei werden zum einen die Produktdaten während der Produktrecherche in Datenbanken gespeichert. Zum anderen erfolgt eine automatische Einteilung bzw. Zuordnung der Produkte zu einem oder mehreren Kategoriensystemen.

Die Arbeitsschritte im Rahmen von Produktrecherchen sind in der Regel die folgenden:

  • Identifizierung der Websites von Anbietern der gesuchten Produkte
  • Crawling der Websites
  • Selektion der Produktinformationen auf den gefundenen Websites
  • Extraktion der relevanten Produktbeschreibungen und Produktabbildungen
  • Generierung von spezifischen Produktattributen oder Produktparametern
  • Generierung von Produktdatenbanken
  • Datenübergabe Dateien oder Schnittstellen nach Ihren Anforderungen
  • optional: regelmäßige Aktualisierung der Datenbestände