schwerpunkt.tech

Datenanreicherung

Webcrawler

Das Modul sucht pro SKU nach passenden Produktseiten im Web (über Serper.dev) und crawlt die gefundenen URLs (über Zyte). Aus den gecrawlten Seiten werden strukturierte Produktdaten extrahiert — als Input für Beschreibungen, Merkmalsextraktion und Kategorisierung.

Ihre Vorteile

Automatische Recherche statt Handarbeit

Web-Suche, Crawling und Extraktion laufen im Batch — ohne manuelles Öffnen jeder Herstellerseite.

Hersteller-Quellen bevorzugt

Technische Angaben direkt vom Hersteller sind meist vollständiger als händisch gepflegte Stammdaten.

Abrechnung pro SKU

Eine Einheit = ein recherchiertes Produkt. Kein Abo-Mindestvolumen, keine versteckten API-Gebühren.

Typische Anwendungsfälle

  • Händler mit lückenhaften Stammdaten vor Kategorisierung oder Merkmalsextraktion
  • Automatische Auswertung von technischen Datenblättern und Herstellerseiten
  • Anreicherung von Marktplatz-Listings mit fehlenden Produktinformationen

Version & Preise

Die wirtschaftliche Basis

Geeignet für die initiale Strukturierung von Bestandsdaten, Migrationen und Workloads, in denen eine stichprobenartige Qualitätskontrolle ausreicht. Jedes Ergebnis enthält einen Konfidenzwert zur gezielten Nachprüfung.

Modul-Funktionen

  • Web-Suche über Serper.dev
  • Crawling über die Zyte API
  • Strukturierte Extraktion aus gecrawlten Seiten
  • Priorisierung von Hersteller- und Händlerseiten
  • Batch-Verarbeitung beliebiger Sortimentsgrößen
  • Abrechnung pro SKU

Basic – zusätzlich

  • Web-Suche und Crawl pro Produkt
  • Standard-Quellenfilter
  • Für reine Anreicherung empfehlen wir Pro (höhere Quellengüte)

Preise

SKUs

Monatliches Abo / SKU / Monat

0.25 €

Gesamt: 250,00 € / Monat

Batch-Job / SKU (einmalig)

0.50 €

Gesamt: 500,00 € einmalig

Alle Preise netto zzgl. ges. USt. Angebot für Unternehmer (§ 14 BGB).

Häufige Fragen

Welche Quellen werden durchsucht?
Web-Suche über Serper.dev, Crawling über die Zyte API. Hersteller- und Händlerseiten werden bevorzugt.
Ist das rechtlich unbedenklich?
Es werden nur öffentlich zugängliche Produktdaten (Fakten, Spezifikationen) extrahiert. Geschützte Inhalte werden nicht 1:1 übernommen.
Wie wird abgerechnet?
Pro SKU. Die Tierstufen unterscheiden sich in Rechercheumfang und Qualität, nicht im Output-Format.

Interesse an Webcrawler?

Wir analysieren Ihren Datenstamm und zeigen Ihnen, was das Modul aus Ihren Produktdaten herausholen kann.