- Fonctionnement des filtres Wayback Machine
- Filtre Content changes
- Filtre Age
- Filtre First snap
- Filtre Last snap
- Filtre Keywords in content
- Language Filters
- Filtre Server Code Share
- Filtre Hieroglyphs (CJK)
- Filtre Redirects (30x)
- Filtre Error 403
- Filtre Website IDs
- Combiner les filtres Wayback
- Dépannage
- Conseils
Fonctionnement des filtres Wayback Machine
Ces filtres recherchent des domaines à partir des données de l’Internet Archive (Wayback Machine) : historique, contenu, langues, codes HTTP et autres paramètres archivés.
Important : ils reposent sur les données d’archive. Si Wayback Machine n’a pas exploré le domaine, les filtres ne s’appliquent pas.
Filtre Content changes
Content changes sélectionne les domaines selon le nombre de changements de contenu dans l’historique d’archive. Interface : min et max (≥ 0).
Un changement signifie que la page a varié de plus de 50 % par rapport à la version archivée précédente dans Wayback Machine.
Utile pour les domaines peu modifiés (0–3 changements). Beaucoup de changements peuvent indiquer des changements de propriétaire.
Utilisation
- Repérez Content changes dans le bloc Wayback
- Saisissez les bornes min et max
- Uniquement min, uniquement max, ou les deux
Exemples
1 : Mises à jour fréquentes (à partir de 50) — min 50, max vide.
2 : Domaines stables (0–5) — min : 0, max : 5.
Filtre Age
Age filtre par âge en années (données d’archive). Champs min et max (années, ≥ 0).
L’âge est compté depuis la première capture de contenu dans Wayback Machine.
Permet de trouver des domaines âgés.
Utilisation
- Age dans le bloc
- min et max en années
- Uniquement min, uniquement max, ou les deux
Exemples
1 : Domaines anciens (10+ ans) — min 10, max vide.
2 : Jeunes (0–2 ans) — min : 0, max : 2.
Filtre First snap
First snap par date de la première capture. Sélecteur de dates et boutons rapides.
Utilisation
- First snap
- Clic — calendrier ; plage de dates
- Ou Older than 2 years, Older than 5 years, Older than 10 years, Last year
Exemples
1 : Première indexation il y a plus de 10 ans — Older than 10 years.
2 : Première capture sur une année précise — plage dans le calendrier.
Filtre Last snap
Last snap par date de la dernière capture. Calendrier et boutons rapides.
Utilisation
- Last snap
- Calendrier ; plage
- Ou Last 7 days, Last 30 days, Last 60 days, This month, Last year
Exemples
1 : Dernière capture dans les 30 derniers jours — Last 30 days.
2 : Capture l’année précédente — Last year ou calendrier.
Filtre Keywords in content
Keywords in content recherche des mots-clés dans le contenu archivé. Champ texte, compteur Elements (max 20) ; dépassement → avertissement Maximum … elements allowed.
Utilisation
- Keywords in content
- Virgule = ET (tous les termes), barre verticale
|= OU (l’un suffit) - Surveillez le compteur Elements
Exemples
1 : L’un parmi plusieurs mots (OU) — shop | store | buy.
2 : Les deux mots (ET) — tech, news.
Language Filters
Language Filters par langues du contenu archivé, avec pourcentage minimum optionnel. Liste déroulante avec recherche, champ %, Add ; badges avec ×, Clear All. N’importe quelle condition de langue listée peut suffire.
Utilisation
- Language Filters
- Langue ; optionnel % min (0–100)
- Add ; × sur badge ; Clear All
Exemples
1 : Anglais sans seuil — English (en), Add.
2 : Au moins 50 % de russe — Russian (ru), 50 %, Add.
3 : Plusieurs langues — ex. English 30 %+, German 20 %+, French sans %.
Filtre Server Code Share
Server Code Share par part de codes HTTP spécifiques dans l’historique Wayback.
100 % de réponses « 200 » peut mettre en avant des domaines dont l’historique n’a pas connu d’erreurs serveur, de redirections ni de refus d’accès.
Utilisation
- Server Code Share
- min % (0–100)
- max % (0–100)
- Select Code — choisir le code HTTP (actif après saisie d’un pourcentage)
- Choisir dans la liste
- Clear efface le code
Codes HTTP disponibles
- 200 — OK
- 301 — Moved Permanently
- 302 — Found
- 307 — Temporary Redirect
- 308 — Permanent Redirect
- 400 — Bad Request
- 401 — Unauthorized
- 403 — Forbidden
- 404 — Not Found
- 500 — Internal Server Error
- 502 — Bad Gateway
- 503 — Service Unavailable
Select Code s’active dès que min % ou max % est renseigné. Clear réinitialise le code.
Exemples
1 : Au moins 80 % « 200 OK » — min % 80, Select Code, 200.
2 : 50–100 % d’erreurs « 404 » — min % 50, max % 100, code 404.
3 : N’importe quelle part de 301 — code 301, % vides.
Filtre Hieroglyphs (CJK)
Hieroglyphs (CJK) — domaines avec ou sans contenu CJK (chinois, japonais, coréen).
Si vous ne ciblez pas les domaines en langues asiatiques, exclure ce contenu est souvent pertinent — historiquement lié à des tactiques promotionnelles agressives.
Utilisation
- Hieroglyphs (CJK)
- Trois états :
- Unknown (icône interdit) — filtre désactivé
- Yes (coche) — uniquement avec CJK
- No (croix) — uniquement sans CJK
Détails
- Détecte les caractères CJK
- Motifs issus des données Wayback
Exemples
1 : Avec CJK — Yes.
2 : Sans CJK — No.
Filtre Redirects (30x)
Redirects (30x) — redirections (301, 302, 307, 308) dans l’historique Wayback vers d’autres domaines. Les redirections au sein du même domaine (ex. http→https) ne comptent pas.
Redirections vers d’autres domaines : black-hat SEO, changement de propriétaire, migration ou problème d’hébergement.
Utilisation
- Redirects (30x)
- Unknown, Yes (avec redirections inter-domaines uniquement), No (sans)
Détails
- 301, 302, 307, 308 dans l’historique
- Uniquement entre domaines distincts
Exemples
1 : Avec redirections — Yes.
2 : Sans — No.
Filtre Error 403
Error 403 — réponses HTTP 403 (Forbidden) dans l’historique Wayback ou non.
403 indique souvent un blocage volontaire du crawl Wayback — parfois lié au SEO abusif.
Utilisation
- Error 403
- Unknown, Yes (uniquement avec 403), No (uniquement sans)
Détails
- Détecte HTTP 403
Exemples
1 : Avec 403 — Yes.
2 : Sans 403 — No.
Filtre Website IDs
Website IDs recherche par identifiants d’analytique/widgets (ex. Google Analytics, Yandex Metrica) dans l’archive — utile pour un même propriétaire probable.
Utilisation
- Website IDs
- Saisir un ID (ex.
UA-123456789,GTM-XXXXX) - Add ou Entrée/espace
- Badges ; × retire un ; Clear All
Icône d’aide à côté du nom. Correspondance avec n’importe quel ID ; casse ignorée.
Détails
- IDs présents dans le contenu d’archive
- Plusieurs IDs = domaine correspondant à l’un d’eux
Exemples
1 : ID GA précis — UA-123456789.
2 : L’un parmi plusieurs — UA-123456789, GTM-XXXXX, 12345678.
3 : Même propriétaire — ajoutez l’ID d’un domaine pour en trouver d’autres avec le même ID.
Combiner les filtres Wayback
Tous peuvent être combinés aux autres filtres. Plusieurs filtres = logique ET — toutes les conditions doivent être vraies. Enregistrer les combinaisons.
Exemple
Objectif : Domaines anciens (10+ ans), ≥50 % de contenu anglais, pas de redirections, dernière capture dans les 30 derniers jours.
Interface : Age min 10 ; Language Filters — English (en) 50 % ; Redirects (30x) — No ; Last snap — Last 30 days.
Dépannage
« Maximum … elements allowed »
Pourquoi : Plus de 20 éléments dans Keywords in content ; avertissement rouge.
Que faire : Réduire jusqu’à compteur ≤ 20.
Aucun résultat
Pourquoi : Conditions trop strictes ou aucun domaine dans l’archive ne correspond.
Que faire : Assouplir ou désactiver les filtres progressivement.
First snap / Last snap
Que faire : Calendrier ou boutons rapides — format automatique.
Select Code inactif
Pourquoi : Dans Server Code Share, ni min % ni max % renseigné.
Que faire : Saisir au moins un pourcentage, puis Select Code.
Conseils
-
First snap / Last snap : boutons rapides (Older than 2/5/10 years, Last 7/30/60 days, This month, Last year).
-
Combiner les filtres (âge, langue, codes, redirections).
-
Keywords in content : virgule = ET,
|= OU. Limite Elements 20. -
Language Filters : % minimum pour cibler la langue.
-
Website IDs : ID connue pour trouver d’autres domaines avec la même ID.