Datenanreicherung
Webcrawler
Das Modul sucht pro SKU nach passenden Produktseiten im Web (über Serper.dev) und crawlt die gefundenen URLs (über Zyte). Aus den gecrawlten Seiten werden strukturierte Produktdaten extrahiert — als Input für Beschreibungen, Merkmalsextraktion und Kategorisierung.
Ihre Vorteile
Automatische Recherche statt Handarbeit
Web-Suche, Crawling und Extraktion laufen im Batch — ohne manuelles Öffnen jeder Herstellerseite.
Hersteller-Quellen bevorzugt
Technische Angaben direkt vom Hersteller sind meist vollständiger als händisch gepflegte Stammdaten.
Abrechnung pro SKU
Eine Einheit = ein recherchiertes Produkt. Kein Abo-Mindestvolumen, keine versteckten API-Gebühren.
Typische Anwendungsfälle
- Händler mit lückenhaften Stammdaten vor Kategorisierung oder Merkmalsextraktion
- Automatische Auswertung von technischen Datenblättern und Herstellerseiten
- Anreicherung von Marktplatz-Listings mit fehlenden Produktinformationen
Version & Preise
Die wirtschaftliche Basis
Geeignet für die initiale Strukturierung von Bestandsdaten, Migrationen und Workloads, in denen eine stichprobenartige Qualitätskontrolle ausreicht. Jedes Ergebnis enthält einen Konfidenzwert zur gezielten Nachprüfung.
Modul-Funktionen
- Web-Suche über Serper.dev
- Crawling über die Zyte API
- Strukturierte Extraktion aus gecrawlten Seiten
- Priorisierung von Hersteller- und Händlerseiten
- Batch-Verarbeitung beliebiger Sortimentsgrößen
- Abrechnung pro SKU
Basic – zusätzlich
- Web-Suche und Crawl pro Produkt
- Standard-Quellenfilter
- Für reine Anreicherung empfehlen wir Pro (höhere Quellengüte)
Preise
Monatliches Abo / SKU / Monat
0.25 €
Gesamt: 250,00 € / Monat
Batch-Job / SKU (einmalig)
0.50 €
Gesamt: 500,00 € einmalig
Alle Preise netto zzgl. ges. USt. Angebot für Unternehmer (§ 14 BGB).
Häufige Fragen
- Welche Quellen werden durchsucht?
- Web-Suche über Serper.dev, Crawling über die Zyte API. Hersteller- und Händlerseiten werden bevorzugt.
- Ist das rechtlich unbedenklich?
- Es werden nur öffentlich zugängliche Produktdaten (Fakten, Spezifikationen) extrahiert. Geschützte Inhalte werden nicht 1:1 übernommen.
- Wie wird abgerechnet?
- Pro SKU. Die Tierstufen unterscheiden sich in Rechercheumfang und Qualität, nicht im Output-Format.
Interesse an Webcrawler?
Wir analysieren Ihren Datenstamm und zeigen Ihnen, was das Modul aus Ihren Produktdaten herausholen kann.