Filtros Wayback Machine

Filtros Wayback Machine: alterações de conteúdo, idade, datas de capturas, palavras-chave, idiomas, códigos HTTP, CJK, redirecionamentos, 403, IDs de site. Como definir condições na interface.

Atualizado:
Linguagem:
Experimente gratuitamente!
Use créditos de bônus!

Funcionamento dos filtros Wayback Machine

Estes filtros pesquisam domínios com base nos dados do Internet Archive (Wayback Machine): histórico, conteúdo, idiomas, códigos HTTP e outros parâmetros arquivados.

Filtros Wayback Machine no Karma.Domains

Importante: Dependem de dados de arquivo. Se a Wayback Machine não rastreou o domínio, estes filtros não coincidem.

Filtro Content changes

Content changes seleciona domínios pelo número de alterações de conteúdo no histórico do arquivo. Interface: min e max (≥ 0).

Uma alteração de conteúdo significa que a página variou mais de 50 % face à versão arquivada anterior na Wayback Machine.

Útil para domínios pouco alterados (0–3 alterações). Muitas alterações podem indicar mudança de titularidade.

Utilização

  1. Localize Content changes no bloco Wayback
  2. Introduza limites em min e max
  3. min, só max ou ambos

Exemplos

1: Atualizações frequentes (a partir de 50) — min 50, max vazio.

2: Domínios estáveis (0–5) — min: 0, max: 5.

Filtro Age

Age filtra por idade em anos (dados do arquivo). Campos min e max (anos, ≥ 0).

A idade conta-se a partir da primeira captura de conteúdo na Wayback Machine.

Pode usar para encontrar domínios antigos.

Utilização

  1. Age no bloco
  2. min e max em anos
  3. min, só max ou ambos

Exemplos

1: Domínios antigos (10+ anos) — min 10, max vazio.

2: Jovens (0–2 anos) — min: 0, max: 2.

Filtro First snap

First snap pela data da primeira captura no arquivo. Seletor de datas e botões rápidos.

Utilização

  1. First snap
  2. Clique — calendário; intervalo de datas
  3. Ou Older than 2 years, Older than 5 years, Older than 10 years, Last year

Exemplos

1: Primeira indexação há mais de 10 anos — Older than 10 years.

2: Primeira captura num ano específico — intervalo no calendário.

Filtro Last snap

Last snap pela data da última captura. Calendário e botões rápidos.

Utilização

  1. Last snap
  2. Calendário; intervalo
  3. Ou Last 7 days, Last 30 days, Last 60 days, This month, Last year

Exemplos

1: Última captura nos últimos 30 dias — Last 30 days.

2: Captura no ano anterior — Last year ou calendário.

Filtro Keywords in content

Keywords in content pesquisa palavras-chave no conteúdo arquivado. Campo de texto, contador Elements (máx. 20); se exceder, aviso Maximum … elements allowed.

Utilização

  1. Keywords in content
  2. Vírgula = E (todas as palavras), barra vertical | = OU (qualquer)
  3. Observe o contador Elements

Exemplos

1: Qualquer de várias palavras (OU) — shop | store | buy.

2: Ambas as palavras (E) — tech, news.

Language Filters

Language Filters por idiomas do conteúdo arquivado, com percentagem mínima opcional. Lista pesquisável, campo %, Add; distintivos com ×, Clear All. Basta qualquer condição de idioma listada.

Utilização

  1. Language Filters
  2. Idioma; opcional % mín. (0–100)
  3. Add; × no distintivo; Clear All

Exemplos

1: Inglês sem limiar — English (en), Add.

2: Pelo menos 50 % russo — Russian (ru), 50 %, Add.

3: Vários idiomas — p.ex. English 30 %+, German 20 %+, French sem %.

Filtro Server Code Share

Server Code Share pela proporção de códigos HTTP específicos no histórico Wayback.

100 % de respostas «200» pode destacar domínios cujo histórico não teve erros de servidor, redirecionamentos nem recusas de acesso.

Utilização

  1. Server Code Share
  2. min % (0–100)
  3. max % (0–100)
  4. Select Code — escolher código HTTP (ativo após percentagem)
  5. Escolher na lista
  6. Clear limpa o código

Códigos HTTP disponíveis

  • 200 — OK
  • 301 — Moved Permanently
  • 302 — Found
  • 307 — Temporary Redirect
  • 308 — Permanent Redirect
  • 400 — Bad Request
  • 401 — Unauthorized
  • 403 — Forbidden
  • 404 — Not Found
  • 500 — Internal Server Error
  • 502 — Bad Gateway
  • 503 — Service Unavailable

Select Code ativa com min % ou max %. Clear repõe o código.

Exemplos

1: Pelo menos 80 % «200 OK» — min % 80, Select Code, 200.

2: 50–100 % erros «404» — min % 50, max % 100, código 404.

3: Qualquer proporção de 301 — código 301, % vazios.

Filtro Hieroglyphs (CJK)

Hieroglyphs (CJK) — domínios com ou sem conteúdo CJK (chinês, japonês, coreano).

Se não procura domínios em línguas asiáticas, excluir esse conteúdo costuma ser sensato — historicamente associado a promoção agressiva.

Utilização

  1. Hieroglyphs (CJK)
  2. Três estados:
    • Unknown (ícone proibido) — filtro desligado
    • Yes (visto) — só com CJK
    • No (cruz) — só sem CJK

Detalhes

  • Deteta caracteres CJK
  • Padrões dos dados Wayback

Exemplos

1: Com CJK — Yes.

2: Sem CJK — No.

Filtro Redirects (30x)

Redirects (30x) — redirecionamentos (301, 302, 307, 308) no histórico Wayback para outros domínios. Redirecionamentos no mesmo domínio (p.ex. http→https) não contam.

Redirecionamentos para outros domínios: SEO black-hat, mudança de titular, migração ou problema de alojamento.

Utilização

  1. Redirects (30x)
  2. Unknown, Yes (só com redirecionamentos entre domínios), No (só sem)

Detalhes

  • 301, 302, 307, 308 no histórico
  • Só entre domínios diferentes

Exemplos

1: Com redirecionamentos — Yes.

2: Sem — No.

Filtro Error 403

Error 403 — respostas HTTP 403 (Forbidden) no histórico Wayback ou não.

403 muitas vezes indica bloqueio ao crawl da Wayback — por vezes sinal de SEO duvidoso.

Utilização

  1. Error 403
  2. Unknown, Yes (só com 403), No (só sem)

Detalhes

  • Deteta HTTP 403

Exemplos

1: Com 403 — Yes.

2: Sem 403 — No.

Filtro Website IDs

Website IDs pesquisa por IDs de analítica/widgets (p.ex. Google Analytics, Yandex Metrica) no arquivo — útil para o mesmo titular provável.

Utilização

  1. Website IDs
  2. Introduza ID (p.ex. UA-123456789, GTM-XXXXX)
  3. Add ou Enter/espaço
  4. Distintivos; × remove um; Clear All

Ícone de ajuda junto ao nome. Corresponde a qualquer ID; maiúsculas irrelevantes.

Detalhes

  • IDs no conteúdo arquivado
  • Vários IDs = domínio com pelo menos um ID

Exemplos

1: ID GA específico — UA-123456789.

2: Qualquer de vários — UA-123456789, GTM-XXXXX, 12345678.

3: Mesmo titular — adicione o ID de um domínio para encontrar outros com o mesmo ID.

Combinar filtros Wayback

Todos podem ser combinados com outros filtros. Vários filtros = Etodas as condições devem ser verdadeiras. Guardar combinações.

Exemplo

Objetivo: Domínios antigos (10+ anos), ≥50 % conteúdo inglês, sem redirecionamentos, última captura nos últimos 30 dias.

Interface: Age min 10; Language Filters — English (en) 50 %; Redirects (30x)No; Last snapLast 30 days.

Resolução de problemas

«Maximum … elements allowed»

Causa: Mais de 20 elementos em Keywords in content; aviso vermelho.

Solução: Reduzir até contador ≤ 20.

Sem resultados

Causa: Condições muito restritivas ou nenhum domínio no arquivo corresponde.

Solução: Relaxar ou desativar filtros passo a passo.

First snap / Last snap

Solução: Calendário ou botões rápidos — formato automático.

Select Code inativo

Causa: Em Server Code Share, nem min % nem max % preenchidos.

Solução: Introduza pelo menos uma percentagem; depois Select Code.

Dicas

  1. First snap / Last snap: Botões rápidos (Older than 2/5/10 years, Last 7/30/60 days, This month, Last year).

  2. Combine filtros (idade, idioma, códigos, redirecionamentos).

  3. Keywords in content: vírgula = E, | = OU. Limite Elements 20.

  4. Language Filters: % mínimo para afinar o idioma.

  5. Website IDs: ID conhecida para encontrar outros domínios com a mesma ID.

Other articles in this section "Filtros no Karma.Domains"

All articles in this section

Experimente gratuitamente!

Use créditos de bônus!

Abrir lista de domínios
+5