ASN — l'autoroute du scraping
Comment j'ai réduit mes coûts de proxy de 68$ à 5.50$ par mois en analysant les ASN et en automatisant la qualité.
ASN — l’autoroute du scraping
Comment j’ai réduit mes coûts de proxy par 10 et arrêté de me battre avec les 429
En informatique, beaucoup de problèmes deviennent plus simples quand on trouve une bonne analogie dans le monde réel. Pour moi, cette analogie a été l’autoroute : l’ASN.
Ces derniers mois, j’ai réussi à réduire mes coûts de proxy de 68$ à 5,50$ par mois, sans perte de qualité de données. Dans cet article, j’explique comment et pourquoi cela a fonctionné.
Comment tout a commencé
Les trois derniers mois, j’ai travaillé presque en continu sur mon propre scraper. Je suis parti de zéro et j’ai progressivement complexifié l’architecture.
Avant, tout était simple :
- ajouter du jitter,
- limiter la fréquence,
- activer la rotation d’IP,
- changer de pays.
Mais ces dernières années, les backends des grands services se sont beaucoup complexifiés. Les méthodes simples ont cessé de fonctionner.
Les erreurs 429 ont commencé à apparaître même avec une charge prudente.
Ma base de défense
Au moment des tests, j’avais déjà un système assez élaboré :
- pas plus d’une requête par seconde sur 150 proxys,
- timing dynamique + jitter à 15 %,
- changement automatique d’adresses,
- chaine de repli : Google → Proxy → Node,
- serveurs propres dans plusieurs datacenters avec des IPv4 “propres”,
- système de rotation “Feu tricolore”,
- émulation de différents appareils et navigateurs.
Sur le papier, tout était correct. Mais les résultats variaient toujours fortement selon le pays et selon les pools.
Une observation étrange
Avec le temps, j’ai remarqué une régularité intéressante.
Dans un même pays, différents proxys affichaient :
- 90 % de taux de succès,
- 70 %,
- parfois moins de 50 %.
Pourtant :
- la charge était identique,
- le comportement identique,
- le timing identique.
La différence se résumait à un seul paramètre : l’ASN.
Hypothèse : les limites ne sont pas par IP, mais par ASN
Une hypothèse s’est imposée :
Les services modernes limitent de plus en plus non pas les IP isolées, mais des systèmes autonomes entiers (ASN).
La logique est simple :
Si un ASN contient beaucoup d’activité suspecte, il est plus simple de ralentir tout le bloc que de filtrer adresse par adresse.
Conséquences :
- même des IP “propres” commencent à recevoir des 429,
- le taux de succès baisse,
- les coûts augmentent.
Si, dans le même ASN, quelqu’un d’autre fait du scraping agressif, vous en subissez les effets.
Comment je l’ai vérifié
J’ai commencé à collecter des statistiques par ASN :
- taux de succès,
- nombre de 429,
- temps de dégradation,
- récupération.
Après quelques semaines, une tendance claire est apparue :
- dès qu’un ASN “décroche”,
- tous les IP en son sein chutent,
- changer d’adresse n’aide pas,
- changer d’ASN aide.
Ce n’est pas une preuve formelle, mais la corrélation était trop stable pour être un hasard.
Le système “Feu tricolore”
Pour automatiser la qualité des proxys, j’ai mis en place un système “Feu tricolore”. Le principe est simple, comme en logistique.
Vert
L’adresse est stable. Le taux de succès dépasse le seuil.
→ Utilisée activement.
Jaune
10 erreurs d’affilée.
→ L’adresse part “se reposer” quelques heures.
Rouge
Après récupération, nouvelle série d’erreurs.
→ Exclusion complète du pool.
Pourquoi c’est utile
Imaginons :
- un proxy a 99 % de réussite,
- puis il se dégrade,
- à cause de la rotation, le système ne le remarque que plusieurs jours après.
Pendant ce temps, des milliers de requêtes partent dans le vide, avec un coût réel.
Le “Feu tricolore” permet de filtrer les mauvaises adresses en quelques heures, pas en semaines.
Le rôle de l’ASN dans le “Feu tricolore”
Avec le temps, j’ai ajouté un niveau d’agrégation :
Adresse → ASN → Pool.
Si plusieurs IP d’un même ASN commencent à générer des erreurs, la priorité de toute la plage baisse.
En pratique, le système apprend à éviter les autoroutes problématiques.
Résultat
Après l’intégration de l’analyse ASN et du “Feu tricolore” :
- les 429 ont diminué plusieurs fois,
- le taux de succès a augmenté,
- les proxys sont utilisés plus efficacement,
- une partie des pools a été entièrement remplacée.
Résultat financier :
| Période | Dépenses |
|---|---|
| Avant | 68 $ |
| Après | 5,50 $ |
Pour la même charge.
Pourquoi l’analogie routière fonctionne
Un ASN, c’est une autoroute.
- Les IP sont les voitures.
- Les proxys sont les conducteurs.
- Le trafic est la marchandise.
On peut changer de voitures, mais si la route est saturée, on reste bloqué.
J’ai arrêté de me battre avec les voitures individuelles et j’ai commencé à choisir les routes.
Conclusion
Le point central est simple :
En 2025, lutter contre les blocages seulement au niveau IP n’a plus de sens.
Il faut travailler :
- avec les ASN,
- avec la réputation des réseaux,
- avec la dégradation dynamique,
- avec un contrôle qualité automatique.
Sinon, on brûle simplement son budget.
Ce que vous pouvez faire dès maintenant
Si vous faites du scraping :
- Commencez à loguer les ASN.
- Comparez le taux de succès par plages.
- Désactivez les réseaux problématiques en bloc.
- Automatisez la sélection.
- Ne faites pas confiance aux pools “bon marché” sans statistiques.
Cela se rentabilise très vite.
En guise de conclusion
Avant, je payais 68 $ pour des données instables. Aujourd’hui, 5,50 $ pour un résultat prévisible.
Tout ça pour un seul paramètre que j’ignorais : l’ASN.

