Filtres Wayback Machine

Filtres Wayback Machine : changements de contenu, âge, dates de captures, mots-clés, langues, codes HTTP, CJK, redirections, 403, ID de site. Définir les conditions dans l’interface.

Mis à jour:
Langue:
Essayez gratuitement !
Utilisez des crédits bonus !

Fonctionnement des filtres Wayback Machine

Ces filtres recherchent des domaines à partir des données de l’Internet Archive (Wayback Machine) : historique, contenu, langues, codes HTTP et autres paramètres archivés.

Filtres Wayback Machine dans Karma.Domains

Important : ils reposent sur les données d’archive. Si Wayback Machine n’a pas exploré le domaine, les filtres ne s’appliquent pas.

Filtre Content changes

Content changes sélectionne les domaines selon le nombre de changements de contenu dans l’historique d’archive. Interface : min et max (≥ 0).

Un changement signifie que la page a varié de plus de 50 % par rapport à la version archivée précédente dans Wayback Machine.

Utile pour les domaines peu modifiés (0–3 changements). Beaucoup de changements peuvent indiquer des changements de propriétaire.

Utilisation

  1. Repérez Content changes dans le bloc Wayback
  2. Saisissez les bornes min et max
  3. Uniquement min, uniquement max, ou les deux

Exemples

1 : Mises à jour fréquentes (à partir de 50) — min 50, max vide.

2 : Domaines stables (0–5) — min : 0, max : 5.

Filtre Age

Age filtre par âge en années (données d’archive). Champs min et max (années, ≥ 0).

L’âge est compté depuis la première capture de contenu dans Wayback Machine.

Permet de trouver des domaines âgés.

Utilisation

  1. Age dans le bloc
  2. min et max en années
  3. Uniquement min, uniquement max, ou les deux

Exemples

1 : Domaines anciens (10+ ans) — min 10, max vide.

2 : Jeunes (0–2 ans) — min : 0, max : 2.

Filtre First snap

First snap par date de la première capture. Sélecteur de dates et boutons rapides.

Utilisation

  1. First snap
  2. Clic — calendrier ; plage de dates
  3. Ou Older than 2 years, Older than 5 years, Older than 10 years, Last year

Exemples

1 : Première indexation il y a plus de 10 ans — Older than 10 years.

2 : Première capture sur une année précise — plage dans le calendrier.

Filtre Last snap

Last snap par date de la dernière capture. Calendrier et boutons rapides.

Utilisation

  1. Last snap
  2. Calendrier ; plage
  3. Ou Last 7 days, Last 30 days, Last 60 days, This month, Last year

Exemples

1 : Dernière capture dans les 30 derniers jours — Last 30 days.

2 : Capture l’année précédente — Last year ou calendrier.

Filtre Keywords in content

Keywords in content recherche des mots-clés dans le contenu archivé. Champ texte, compteur Elements (max 20) ; dépassement → avertissement Maximum … elements allowed.

Utilisation

  1. Keywords in content
  2. Virgule = ET (tous les termes), barre verticale | = OU (l’un suffit)
  3. Surveillez le compteur Elements

Exemples

1 : L’un parmi plusieurs mots (OU) — shop | store | buy.

2 : Les deux mots (ET) — tech, news.

Language Filters

Language Filters par langues du contenu archivé, avec pourcentage minimum optionnel. Liste déroulante avec recherche, champ %, Add ; badges avec ×, Clear All. N’importe quelle condition de langue listée peut suffire.

Utilisation

  1. Language Filters
  2. Langue ; optionnel % min (0–100)
  3. Add ; × sur badge ; Clear All

Exemples

1 : Anglais sans seuil — English (en), Add.

2 : Au moins 50 % de russe — Russian (ru), 50 %, Add.

3 : Plusieurs langues — ex. English 30 %+, German 20 %+, French sans %.

Filtre Server Code Share

Server Code Share par part de codes HTTP spécifiques dans l’historique Wayback.

100 % de réponses « 200 » peut mettre en avant des domaines dont l’historique n’a pas connu d’erreurs serveur, de redirections ni de refus d’accès.

Utilisation

  1. Server Code Share
  2. min % (0–100)
  3. max % (0–100)
  4. Select Code — choisir le code HTTP (actif après saisie d’un pourcentage)
  5. Choisir dans la liste
  6. Clear efface le code

Codes HTTP disponibles

  • 200 — OK
  • 301 — Moved Permanently
  • 302 — Found
  • 307 — Temporary Redirect
  • 308 — Permanent Redirect
  • 400 — Bad Request
  • 401 — Unauthorized
  • 403 — Forbidden
  • 404 — Not Found
  • 500 — Internal Server Error
  • 502 — Bad Gateway
  • 503 — Service Unavailable

Select Code s’active dès que min % ou max % est renseigné. Clear réinitialise le code.

Exemples

1 : Au moins 80 % « 200 OK » — min % 80, Select Code, 200.

2 : 50–100 % d’erreurs « 404 » — min % 50, max % 100, code 404.

3 : N’importe quelle part de 301 — code 301, % vides.

Filtre Hieroglyphs (CJK)

Hieroglyphs (CJK) — domaines avec ou sans contenu CJK (chinois, japonais, coréen).

Si vous ne ciblez pas les domaines en langues asiatiques, exclure ce contenu est souvent pertinent — historiquement lié à des tactiques promotionnelles agressives.

Utilisation

  1. Hieroglyphs (CJK)
  2. Trois états :
    • Unknown (icône interdit) — filtre désactivé
    • Yes (coche) — uniquement avec CJK
    • No (croix) — uniquement sans CJK

Détails

  • Détecte les caractères CJK
  • Motifs issus des données Wayback

Exemples

1 : Avec CJK — Yes.

2 : Sans CJK — No.

Filtre Redirects (30x)

Redirects (30x) — redirections (301, 302, 307, 308) dans l’historique Wayback vers d’autres domaines. Les redirections au sein du même domaine (ex. http→https) ne comptent pas.

Redirections vers d’autres domaines : black-hat SEO, changement de propriétaire, migration ou problème d’hébergement.

Utilisation

  1. Redirects (30x)
  2. Unknown, Yes (avec redirections inter-domaines uniquement), No (sans)

Détails

  • 301, 302, 307, 308 dans l’historique
  • Uniquement entre domaines distincts

Exemples

1 : Avec redirections — Yes.

2 : Sans — No.

Filtre Error 403

Error 403 — réponses HTTP 403 (Forbidden) dans l’historique Wayback ou non.

403 indique souvent un blocage volontaire du crawl Wayback — parfois lié au SEO abusif.

Utilisation

  1. Error 403
  2. Unknown, Yes (uniquement avec 403), No (uniquement sans)

Détails

  • Détecte HTTP 403

Exemples

1 : Avec 403 — Yes.

2 : Sans 403 — No.

Filtre Website IDs

Website IDs recherche par identifiants d’analytique/widgets (ex. Google Analytics, Yandex Metrica) dans l’archive — utile pour un même propriétaire probable.

Utilisation

  1. Website IDs
  2. Saisir un ID (ex. UA-123456789, GTM-XXXXX)
  3. Add ou Entrée/espace
  4. Badges ; × retire un ; Clear All

Icône d’aide à côté du nom. Correspondance avec n’importe quel ID ; casse ignorée.

Détails

  • IDs présents dans le contenu d’archive
  • Plusieurs IDs = domaine correspondant à l’un d’eux

Exemples

1 : ID GA précis — UA-123456789.

2 : L’un parmi plusieurs — UA-123456789, GTM-XXXXX, 12345678.

3 : Même propriétaire — ajoutez l’ID d’un domaine pour en trouver d’autres avec le même ID.

Combiner les filtres Wayback

Tous peuvent être combinés aux autres filtres. Plusieurs filtres = logique ETtoutes les conditions doivent être vraies. Enregistrer les combinaisons.

Exemple

Objectif : Domaines anciens (10+ ans), ≥50 % de contenu anglais, pas de redirections, dernière capture dans les 30 derniers jours.

Interface : Age min 10 ; Language Filters — English (en) 50 % ; Redirects (30x)No ; Last snapLast 30 days.

Dépannage

« Maximum … elements allowed »

Pourquoi : Plus de 20 éléments dans Keywords in content ; avertissement rouge.

Que faire : Réduire jusqu’à compteur ≤ 20.

Aucun résultat

Pourquoi : Conditions trop strictes ou aucun domaine dans l’archive ne correspond.

Que faire : Assouplir ou désactiver les filtres progressivement.

First snap / Last snap

Que faire : Calendrier ou boutons rapides — format automatique.

Select Code inactif

Pourquoi : Dans Server Code Share, ni min % ni max % renseigné.

Que faire : Saisir au moins un pourcentage, puis Select Code.

Conseils

  1. First snap / Last snap : boutons rapides (Older than 2/5/10 years, Last 7/30/60 days, This month, Last year).

  2. Combiner les filtres (âge, langue, codes, redirections).

  3. Keywords in content : virgule = ET, | = OU. Limite Elements 20.

  4. Language Filters : % minimum pour cibler la langue.

  5. Website IDs : ID connue pour trouver d’autres domaines avec la même ID.

Other articles in this section "Filtres dans Karma.Domains"

All articles in this section

Essayez gratuitement !

Utilisez des crédits bonus !

Ouvrir la liste de domaines
+5