Data-Mining


Data Mining - oder Data Mining - kann in zwei Bereiche unterteilt werden. Der erste Bereich des Data Minings ist das Web-Content-Mining. Hierbei geht es um die Extraktion der Inhalte einzelner Webseiten oder Websites. Die gecrawlten Inhalte werden nach Informationstypen klassifiziert. Dies kann während des Crawlens oder in nachgelagerten Prozessen erfolgen.

Ein Teilgebiet des Web-Content-Minings ist das Text-Mining. Mit Text-Mining, das auch Text Data Mining oder Textual Data Mining genannt wird, werden Verfahren genannt, die in der Lage sind, Texte inhaltlich zu erschließen. Außerdem sind sie in der Lage, in Texten, die zum Beispiel von Crawler zu Verfügung gestellt werden, bestimmte Text-Attribute zu erkennen und als separate Datenfelder in Datenbanken zu speichern.

Das zweite Teilgebiet des Web Mining ist das Web-Structure-Mining. Web-Structure-Mining bedeutet, dass nicht nur die Seiten Inhalte erfasst werden, sondern auch die Beziehungen der verschiedenen Webseiten eines Internetauftrittes untereinander. Genauer gesagt geht es hier um die hierarchischen Beziehungen, die die inhaltliche Struktur von Internetauftritten definieren.

Man kann sich die Website-Struktur als eine Art Inhaltsangabe eines Internetauftrittes vorstellen, bei welcher - je nach Anforderung - nur die ersten zwei oder drei Ebenen, oder aber auch alle vorhandenen Ebenen erfasst werden können.

Im Bereich der Produktdaten-Erfassung handelt es sich hierbei vor allem auch um Kategorien und Kategoriensysteme, in welcher die auf einer Shopping-Website, einem Shop, einem Online-Marktplatz oder einer Unternehmenswebsite aufgeführten Produkte klassifiziert sind.

Auch in anderen Bereichen des Web Minings bzw. des Data Minings ist die Erfassung der Linkstrukturen bedeutsam, um schnell einen Überblick über die Inhalte und die thematischen Bereiche der zu crawlenden Website zu erhalten.

Die Crawler-Technologie der i-market GmbH ist deshalb so konzipiert, dass unabhängig von den verwendeten Webtechnologien immer auch die Strukturen der zu analysierenden Websites erfasst werden können. Egal ob es sich hierbei um HTML-Webseiten, datenbankgenerierte Webseiten, PDF-Dateien oder andere Dokumenttypen handelt; unsere Crawler-Technologie findet, crawlt und erfasst die gewünschten Informationen und stellt sie Ihnen als strukturierte Datensätze in den von Ihnen gewünschten Datenformaten (linkear a page 11 H1 Datenformate, Dateitypen und Datenschnittstellen) zur Verfügung.

Im Folgenden präsentieren wir Ihnen einen Auszug von möglichen Einsatzgebieten und Anwendungsfällen:

  • Crawling von Produktbeschreibungen aus Shops oder aus elektronischen Marktplätzen
  • Crawling von Veranstaltungsdaten oder Seminarangebote
  • Crawling von Immobilienangebote aus Immobilien-Websites
  • Crawling von Auto- oder Kfz-Daten aus Fahrzeugportalen
  • Crawling von Firmendaten, Impressumsdaten, Handelsregistereinträgen
  • Crawling von Reiseangebote aus Reiseportalen, Flugangebote aus Flugportalen
  • Crawling von Stellenangebote aus Stellenbörsen
  • Crawling von Patentdaten
  • und vieles mehr ...

Kontaktieren Sie uns, damit wir Ihnen unverbindlich und kostenfrei erläutern können, wie in Ihrem speziellen Fall am besten vorzugehen ist. Sie werden sich wundern, niedrig die Preise für unsere Leistungen sind! weiter