Guida pratica Web scraping avanzato con Python in pratica: una guida alla costruzione di architetture distribuite e al reverse engineering.
Questo corso è pensato per sviluppatori che desiderano passare dalle nozioni base di web scraping a competenze ingegneristiche avanzate. Si concentra sull'architettura distribuita e sulle complesse pratiche di reverse engineering anti-scraping, con l'obiettivo di migliorare la stabilità e le capacità di analisi della raccolta di dati su larga scala.
Punti chiave da apprendere:
– Architettura distribuita: crea cluster di crawler distribuiti, altamente disponibili e scalabili, per risolvere i colli di bottiglia prestazionali delle macchine singole.
– Reverse engineering: analisi approfondita di algoritmi di crittografia, firme dinamiche e meccanismi anti-scraping per ottenere un'acquisizione accurata dei dati.
– Formazione pratica avanzata: copre l'intero processo, dall'introduzione di base all'implementazione di progetti a livello aziendale, potenziando le capacità di implementazione ingegneristica.