- Funcionamento dos filtros Wayback Machine
- Filtro Content changes
- Filtro Age
- Filtro First snap
- Filtro Last snap
- Filtro Keywords in content
- Language Filters
- Filtro Server Code Share
- Filtro Hieroglyphs (CJK)
- Filtro Redirects (30x)
- Filtro Error 403
- Filtro Website IDs
- Combinar filtros Wayback
- Resolução de problemas
- Dicas
Funcionamento dos filtros Wayback Machine
Estes filtros pesquisam domínios com base nos dados do Internet Archive (Wayback Machine): histórico, conteúdo, idiomas, códigos HTTP e outros parâmetros arquivados.
Importante: Dependem de dados de arquivo. Se a Wayback Machine não rastreou o domínio, estes filtros não coincidem.
Filtro Content changes
Content changes seleciona domínios pelo número de alterações de conteúdo no histórico do arquivo. Interface: min e max (≥ 0).
Uma alteração de conteúdo significa que a página variou mais de 50 % face à versão arquivada anterior na Wayback Machine.
Útil para domínios pouco alterados (0–3 alterações). Muitas alterações podem indicar mudança de titularidade.
Utilização
- Localize Content changes no bloco Wayback
- Introduza limites em min e max
- Só min, só max ou ambos
Exemplos
1: Atualizações frequentes (a partir de 50) — min 50, max vazio.
2: Domínios estáveis (0–5) — min: 0, max: 5.
Filtro Age
Age filtra por idade em anos (dados do arquivo). Campos min e max (anos, ≥ 0).
A idade conta-se a partir da primeira captura de conteúdo na Wayback Machine.
Pode usar para encontrar domínios antigos.
Utilização
- Age no bloco
- min e max em anos
- Só min, só max ou ambos
Exemplos
1: Domínios antigos (10+ anos) — min 10, max vazio.
2: Jovens (0–2 anos) — min: 0, max: 2.
Filtro First snap
First snap pela data da primeira captura no arquivo. Seletor de datas e botões rápidos.
Utilização
- First snap
- Clique — calendário; intervalo de datas
- Ou Older than 2 years, Older than 5 years, Older than 10 years, Last year
Exemplos
1: Primeira indexação há mais de 10 anos — Older than 10 years.
2: Primeira captura num ano específico — intervalo no calendário.
Filtro Last snap
Last snap pela data da última captura. Calendário e botões rápidos.
Utilização
- Last snap
- Calendário; intervalo
- Ou Last 7 days, Last 30 days, Last 60 days, This month, Last year
Exemplos
1: Última captura nos últimos 30 dias — Last 30 days.
2: Captura no ano anterior — Last year ou calendário.
Filtro Keywords in content
Keywords in content pesquisa palavras-chave no conteúdo arquivado. Campo de texto, contador Elements (máx. 20); se exceder, aviso Maximum … elements allowed.
Utilização
- Keywords in content
- Vírgula = E (todas as palavras), barra vertical
|= OU (qualquer) - Observe o contador Elements
Exemplos
1: Qualquer de várias palavras (OU) — shop | store | buy.
2: Ambas as palavras (E) — tech, news.
Language Filters
Language Filters por idiomas do conteúdo arquivado, com percentagem mínima opcional. Lista pesquisável, campo %, Add; distintivos com ×, Clear All. Basta qualquer condição de idioma listada.
Utilização
- Language Filters
- Idioma; opcional % mín. (0–100)
- Add; × no distintivo; Clear All
Exemplos
1: Inglês sem limiar — English (en), Add.
2: Pelo menos 50 % russo — Russian (ru), 50 %, Add.
3: Vários idiomas — p.ex. English 30 %+, German 20 %+, French sem %.
Filtro Server Code Share
Server Code Share pela proporção de códigos HTTP específicos no histórico Wayback.
100 % de respostas «200» pode destacar domínios cujo histórico não teve erros de servidor, redirecionamentos nem recusas de acesso.
Utilização
- Server Code Share
- min % (0–100)
- max % (0–100)
- Select Code — escolher código HTTP (ativo após percentagem)
- Escolher na lista
- Clear limpa o código
Códigos HTTP disponíveis
- 200 — OK
- 301 — Moved Permanently
- 302 — Found
- 307 — Temporary Redirect
- 308 — Permanent Redirect
- 400 — Bad Request
- 401 — Unauthorized
- 403 — Forbidden
- 404 — Not Found
- 500 — Internal Server Error
- 502 — Bad Gateway
- 503 — Service Unavailable
Select Code ativa com min % ou max %. Clear repõe o código.
Exemplos
1: Pelo menos 80 % «200 OK» — min % 80, Select Code, 200.
2: 50–100 % erros «404» — min % 50, max % 100, código 404.
3: Qualquer proporção de 301 — código 301, % vazios.
Filtro Hieroglyphs (CJK)
Hieroglyphs (CJK) — domínios com ou sem conteúdo CJK (chinês, japonês, coreano).
Se não procura domínios em línguas asiáticas, excluir esse conteúdo costuma ser sensato — historicamente associado a promoção agressiva.
Utilização
- Hieroglyphs (CJK)
- Três estados:
- Unknown (ícone proibido) — filtro desligado
- Yes (visto) — só com CJK
- No (cruz) — só sem CJK
Detalhes
- Deteta caracteres CJK
- Padrões dos dados Wayback
Exemplos
1: Com CJK — Yes.
2: Sem CJK — No.
Filtro Redirects (30x)
Redirects (30x) — redirecionamentos (301, 302, 307, 308) no histórico Wayback para outros domínios. Redirecionamentos no mesmo domínio (p.ex. http→https) não contam.
Redirecionamentos para outros domínios: SEO black-hat, mudança de titular, migração ou problema de alojamento.
Utilização
- Redirects (30x)
- Unknown, Yes (só com redirecionamentos entre domínios), No (só sem)
Detalhes
- 301, 302, 307, 308 no histórico
- Só entre domínios diferentes
Exemplos
1: Com redirecionamentos — Yes.
2: Sem — No.
Filtro Error 403
Error 403 — respostas HTTP 403 (Forbidden) no histórico Wayback ou não.
403 muitas vezes indica bloqueio ao crawl da Wayback — por vezes sinal de SEO duvidoso.
Utilização
- Error 403
- Unknown, Yes (só com 403), No (só sem)
Detalhes
- Deteta HTTP 403
Exemplos
1: Com 403 — Yes.
2: Sem 403 — No.
Filtro Website IDs
Website IDs pesquisa por IDs de analítica/widgets (p.ex. Google Analytics, Yandex Metrica) no arquivo — útil para o mesmo titular provável.
Utilização
- Website IDs
- Introduza ID (p.ex.
UA-123456789,GTM-XXXXX) - Add ou Enter/espaço
- Distintivos; × remove um; Clear All
Ícone de ajuda junto ao nome. Corresponde a qualquer ID; maiúsculas irrelevantes.
Detalhes
- IDs no conteúdo arquivado
- Vários IDs = domínio com pelo menos um ID
Exemplos
1: ID GA específico — UA-123456789.
2: Qualquer de vários — UA-123456789, GTM-XXXXX, 12345678.
3: Mesmo titular — adicione o ID de um domínio para encontrar outros com o mesmo ID.
Combinar filtros Wayback
Todos podem ser combinados com outros filtros. Vários filtros = E — todas as condições devem ser verdadeiras. Guardar combinações.
Exemplo
Objetivo: Domínios antigos (10+ anos), ≥50 % conteúdo inglês, sem redirecionamentos, última captura nos últimos 30 dias.
Interface: Age min 10; Language Filters — English (en) 50 %; Redirects (30x) — No; Last snap — Last 30 days.
Resolução de problemas
«Maximum … elements allowed»
Causa: Mais de 20 elementos em Keywords in content; aviso vermelho.
Solução: Reduzir até contador ≤ 20.
Sem resultados
Causa: Condições muito restritivas ou nenhum domínio no arquivo corresponde.
Solução: Relaxar ou desativar filtros passo a passo.
First snap / Last snap
Solução: Calendário ou botões rápidos — formato automático.
Select Code inativo
Causa: Em Server Code Share, nem min % nem max % preenchidos.
Solução: Introduza pelo menos uma percentagem; depois Select Code.
Dicas
-
First snap / Last snap: Botões rápidos (Older than 2/5/10 years, Last 7/30/60 days, This month, Last year).
-
Combine filtros (idade, idioma, códigos, redirecionamentos).
-
Keywords in content: vírgula = E,
|= OU. Limite Elements 20. -
Language Filters: % mínimo para afinar o idioma.
-
Website IDs: ID conhecida para encontrar outros domínios com a mesma ID.