⚡ Begrenzter Vorrat — Nur wenige Router verfügbar. Nächste Lieferung in 2 Wochen.
Zurück zum Blog
Web Scraping & Automatisierung 4.6.2026 5 min

Web-Scraping ohne Captcha: Der Entwickler-Leitfaden zur Konfiguration von 5G-Mobile-Proxies

Genug von Cloudflare- und DataDome-Captchas? Dieser technische Ratgeber erklärt die Funktionsweise von mobilem CGNAT und zeigt, wie Sie Ihre Skripte (cURL, Scrapy, Puppeteer) mit IP-Rotation per API konfigurieren.

Web-Scraping ohne Captcha: Der Entwickler-Leitfaden zur Konfiguration von 5G-Mobile-Proxies

Die Mechanik der IP-Sperre: Wie Anti-Bots Ihre Skripte identifizieren

Moderne Anti-Bot-Lösungen wie Cloudflare, DataDome oder Akamai analysieren nicht mehr nur Ihre HTTP-Header oder Browser-Fingerprints (Browser Fingerprinting). Sie überwachen in erster Linie die Reputation und das Verhalten Ihrer IP-Adresse.

IP-Adressen aus Rechenzentren (wie AWS, GCP oder DigitalOcean) haben einen Vertrauenswert (Trust Score) nahe Null. Kein "normaler" menschlicher Nutzer surft von einem Cloud-Server aus im Web. Folglich wird jede Anfrage von diesen IP-Bereichen sofort blockiert oder mit einem Captcha konfrontiert.

Der Netzwerk-IP-Vertrauenswert (IP Trust Score) Mobile IP-Adressen (4G/5G) besitzen den höchsten Vertrauenswert im Web. Warum? Weil sie CGNAT (Carrier-Grade NAT) verwenden, eine wichtige Netzwerktechnologie, die unten erklärt wird.

Die Mauer des CGNAT: Das Geheimnis der mobilen Unsichtbarkeit

Aufgrund der weltweiten Knappheit an IPv4-Adressen weisen Mobilfunkanbieter (Orange, SFR, Free, Bouygues) nicht jedem verbundenen Smartphone eine eindeutige öffentliche IP-Adresse zu. Stattdessen nutzen sie CGNAT (Carrier-Grade NAT), damit sich Tausende echte Mobilfunknutzer gleichzeitig eine einzige öffentliche IP-Adresse teilen.

Für ein Sicherheitssystem wie Cloudflare (wie in der technischen Dokumentation von Cloudflare erklärt) ist das Sperren einer verdächtigen mobilen IP-Adresse extrem riskant. Wenn ein Filter die IP 90.84.14.112 blockiert, weil ein Bot sie nutzt, sperrt er gleichzeitig Tausende echte Orange-Kunden, die im selben Moment über diese IP in derselben Region surfen.

Durch die Nutzung eines 5G-Mobile-Proxys erben Sie dieses Schutzschild. Anti-Bots sind gezwungen, ihre Wachsamkeit zu verringern und Ihre Anfragen durchzulassen, um das Erlebnis potenzieller echter Kunden nicht zu zerstören.

IP-Rotation per API: Mobilfunk-Erneuerung erzwingen

Obwohl mobile IPs extrem robust sind, führt das Senden von Millionen sich wiederholender Anfragen an denselben Server mit derselben IP-Adresse schließlich zu Verhaltenswarnungen (Rate Limiting). Hier kommt die IP-Rotation ins Spiel.

Bei Proxym steuern Sie einen dedizierten physischen Router. Wenn Sie unsere Rotations-API aufrufen, trennt der Router die Verbindung zur Mobilfunkantenne physisch für 3 Sekunden und verbindet sich dann neu. Der Anbieter (z. B. Free Mobile oder Orange) sieht, dass sich ein neues Gerät mit dem Netzwerk verbindet, und weist ihm eine frische, andere öffentliche IP-Adresse zu.

Puppeteer-Integration (JavaScript)

const puppeteer = require('puppeteer');

async function scrapeWithRotation() {
  // 1. Neue IP vom Router anfordern
  await fetch('https://api.proxym.io/v1/proxies/rotate', {
    method: 'POST',
    headers: { 'Authorization': 'Bearer IHR_API_KEY' }
  });
  
  // 8 Sekunden warten, bis sich der Router wieder mit der Antenne verbindet
  await new Promise(resolve => setTimeout(resolve, 8000));

  // 2. Browser mit dem Proxym-Proxy starten
  const browser = await puppeteer.launch({
    args: ['--proxy-server=http://proxy.proxym.io:8080']
  });
  
  const page = await browser.newPage();
  await page.authenticate({
    username: 'ihr_benutzername-port-9081',
    password: 'ihr_passwort'
  });

  await page.goto('https://target-website.com');
  await browser.close();
}

Scrapy-Integration (Python)

Um Proxym in Ihren Scrapy-Bots zu verwenden, konfigurieren Sie einfach die Proxy-Middleware in Ihrer settings.py-Datei:

# settings.py
DOWNLOADER_MIDDLEWARES = {
    'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware': 110,
    'myproject.middlewares.ProxymProxyMiddleware': 100,
}

# middlewares.py
class ProxymProxyMiddleware:
    def process_request(self, request, spider):
        # Basisauthentifizierung im Request-Header integriert
        request.meta['proxy'] = "http://proxy.proxym.io:8080"
        # Base64-Codierung der Zugangsdaten: username-port-9081:password
        request.headers['Proxy-Authorization'] = b'Basic dXNlcm5hbWUtcG9ydC05MDgxOnBhc3N3b3Jk'

Best Practices zur Konfiguration von Scrapy, Puppeteer und Playwright

Um die Effektivität Ihrer 5G-Mobile-Proxies zu maximieren, befolgen Sie diese kritischen Konfigurationsregeln:

  • Verwenden Sie das HTTP-CONNECT- (oder SOCKS5-) Protokoll: Es ermöglicht eine vollständige Ende-zu-Ende-Verschlüsselung des Traffics. Die Firewalls der Zielseiten sehen die Authentifizierungs-Header des Proxys nie.
  • Rotationslatenz handhaben: Eine Mobilfunk-Reaktivierung dauert zwischen 5 und 10 Sekunden. Ihre Skripte müssen temporäre Verbindungsfehler während dieser Phase abfangen und die Anfrage nach Wiederherstellung des Tunnels erneut versuchen.
  • WebRTC-Leaks vermeiden: Deaktivieren Sie WebRTC in Ihrem Headless-Browser (Puppeteer/Playwright), um zu verhindern, dass die Zielseite Ihre echte lokale IP-Adresse hinter dem Proxy ausliest.

Steigen Sie noch heute auf unsichtbares Scraping um

Modernes Scraping ist kein Katz-und-Maus-Spiel mehr, bei dem man Millionen schmutziger Einweg-IPs kauft. Es ist eine Frage der Infrastrukturqualität. Durch die Kombination der Leistung von französischem CGNAT und der programmierbaren Rotation von Proxym umgehen Sie Anti-Bots nativ und senken Ihre Kosten für die Skriptwartung auf Null.

FAQ: Scrapen ohne Captcha

Warum scheitern Rechenzentrum-Proxies bei Cloudflare?

Weil Cloudflare alle IP-Bereiche von Cloud-Anbietern kennt. Proxym verwendet Mobilfunk-SIM-Karten von großen Publikumsanbietern (Orange, SFR, Free), die einen tadellosen Ruf genießen.

Wie schnell ist die Wiederverbindung nach einer IP-Rotation?

Eine vollständige Rotation (Trennen und Wiederverbinden des RUTX11-Modems mit der Antenne) dauert je nach lokalem Anbieter zwischen 6 und 10 Sekunden.

Kann ich für meine Proxies eine bestimmte Stadt in Frankreich anvisieren?

Ja. Unsere physischen Router sind über mehrere französische Großstädte (Marseille, Paris, Bordeaux, Lyon) verteilt. Sie können eine Stadt anvisieren, indem Sie den Tag -city-[name] an Ihre Verbindungs-ID anhängen.

Web-Scraping ohne Captcha: Der Entwickler-Leitfaden zur Konfiguration von 5G-Mobile-Proxies | Proxym