ตัวกรอง Wayback Machine

ตัวกรอง Wayback Machine: การเปลี่ยนแปลงเนื้อหา อายุ วันที่สแนปช็อต คำสำคัญ ภาษา รหัส HTTP ตัวอักษร CJK การเปลี่ยนเส้นทาง 403 รหัสเว็บไซต์ วิธีตั้งเงื่อนไขในอินเทอร์เฟซ

อัปเดตแล้ว:
ภาษา:
ลองใช้ฟรี!
ใช้เครดิตโบนัส!

วิธีการทำงานของตัวกรอง Wayback Machine

ตัวกรองเหล่านี้ค้นหาโดเมนจากข้อมูล Internet Archive (Wayback Machine): ประวัติ เนื้อหา ภาษา รหัส HTTP และพารามิเตอร์ที่เก็บถาวรอื่นๆ

ตัวกรอง Wayback Machine ใน Karma.Domains

สำคัญ: ทั้งหมดอิงข้อมูลคลัง หาก Wayback Machine ไม่เคยรวบรวมโดเมนนั้น ตัวกรองจะไม่จับคู่ได้

ตัวกรอง Content changes

Content changes เลือกโดเมนตามจำนวนครั้งที่เนื้อหาเปลี่ยนในประวัติคลัง ในอินเทอร์เฟซมี min และ max (≥ 0)

การเปลี่ยนเนื้อหาหมายถึงหน้าเปลี่ยนมากกว่า 50% เทียบกับเวอร์ชันที่เก็บก่อนหน้าใน Wayback Machine

เหมาะกับโดเมนที่เปลี่ยนน้อย (0–3 ครั้ง) จำนวนมาก อาจบ่งชี้การเปลี่ยนเจ้าของ

วิธีใช้

  1. หา Content changes ในบล็อก Wayback
  2. ใส่ค่าขอบเขตใน min และ max
  3. กรอกเฉพาะ min เฉพาะ max หรือทั้งคู่

ตัวอย่าง

1: อัปเดตบ่อย (ตั้งแต่ 50) — min 50 max ว่าง

2: โดเมนนิ่ง (0–5) — min: 0 max: 5

ตัวกรอง Age

Age กรองตามอายุเป็นปี (ข้อมูลคลัง) ช่อง min และ max (ปี ≥ 0)

อายุนับจากสแนปช็อตเนื้อหาแรกใน Wayback Machine

ใช้ ค้นหาโดเมนอายุมาก ได้

วิธีใช้

  1. Age ในบล็อก
  2. min และ max เป็นปี
  3. เฉพาะ min เฉพาะ max หรือทั้งคู่

ตัวอย่าง

1: โดเมนเก่า (10+ ปี) — min 10 max ว่าง

2: โดเมนใหม่ (0–2 ปี) — min: 0 max: 2

ตัวกรอง First snap

First snap ตามวันที่สแนปช็อตแรกในคลัง ตัวเลือกวันที่และปุ่มลัด

วิธีใช้

  1. First snap
  2. คลิก — ปฏิทิน; เลือกช่วงวันที่
  3. หรือ Older than 2 years Older than 5 years Older than 10 years Last year

ตัวอย่าง

1: จัดทำดัชนีครั้งแรกมากกว่า 10 ปีที่แล้ว — Older than 10 years

2: สแนปช็อตแรกในปีใดปีหนึ่ง — เลือกช่วงในปฏิทิน

ตัวกรอง Last snap

Last snap ตามวันที่สแนปช็อตล่าสุด ปฏิทินและปุ่มลัด

วิธีใช้

  1. Last snap
  2. ปฏิทิน; ช่วงวันที่
  3. หรือ Last 7 days Last 30 days Last 60 days This month Last year

ตัวอย่าง

1: สแนปช็อตล่าสุดใน 30 วันที่ผ่านมา — Last 30 days

2: สแนปช็อตในปีก่อน — Last year หรือปฏิทิน

ตัวกรอง Keywords in content

Keywords in content ค้นหาคำสำคัญในเนื้อหาหน้าที่เก็บถาวร ช่องข้อความ ตัวนับ Elements (สูงสุด 20) หากเกินจะมีคำเตือน Maximum … elements allowed

วิธีใช้

  1. Keywords in content
  2. จุลภาค = และ (ทุกคำ) ขีดตั้ง | = หรือ (คำใดคำหนึ่ง)
  3. ดูตัวนับ Elements

ตัวอย่าง

1: คำใดคำหนึ่งจากหลายคำ — shop | store | buy

2: ทั้งสองคำ — tech, news

Language Filters

Language Filters ตามภาษาของเนื้อหาในคลัง มีเปอร์เซ็นต์ขั้นต่ำเป็นตัวเลือก รายการภาษาค้นหาได้ ช่อง % Add แบดจ์มี × Clear All เงื่อนไข ภาษาใดภาษาหนึ่ง ในรายการที่ระบุก็พอ

วิธีใช้

  1. Language Filters
  2. เลือกภาษา; ตั้งเปอร์เซ็นต์ขั้นต่ำได้ (0–100)
  3. Add; × บนแบดจ์; Clear All

ตัวอย่าง

1: เนื้อหาอังกฤษไม่กำหนดเกณฑ์ — English (en) Add

2: อย่างน้อย 50% รัสเซีย — Russian (ru) 50% Add

3: หลายภาษา — เช่น English 30%+ German 20%+ French ไม่ใส่ %

ตัวกรอง Server Code Share

Server Code Share ตามสัดส่วนรหัสสถานะ HTTP เฉพาะในประวัติ Wayback

การตอบกลับ «200» 100% อาจเน้นโดเมนที่ประวัติไม่มีข้อผิดพลาดเซิร์ฟเวอร์ การเปลี่ยนเส้นทาง หรือการปฏิเสธการเข้าถึง

วิธีใช้

  1. Server Code Share
  2. min % (0–100)
  3. max % (0–100)
  4. Select Code — เลือกรหัส HTTP (ใช้งานได้หลังใส่เปอร์เซ็นต์)
  5. เลือกจากรายการ
  6. Clear ล้างรหัสที่เลือก

รหัส HTTP ที่มี

  • 200 — OK
  • 301 — Moved Permanently
  • 302 — Found
  • 307 — Temporary Redirect
  • 308 — Permanent Redirect
  • 400 — Bad Request
  • 401 — Unauthorized
  • 403 — Forbidden
  • 404 — Not Found
  • 500 — Internal Server Error
  • 502 — Bad Gateway
  • 503 — Service Unavailable

Select Code เปิดใช้เมื่อมี min % หรือ max % Clear รีเซ็ตรหัส

ตัวอย่าง

1: อย่างน้อย 80% «200 OK» — min % 80 Select Code เลือก 200

2: 50–100% ข้อผิดพลาด «404» — min % 50 max % 100 รหัส 404

3: สัดส่วนใดๆ ของ 301 — รหัส 301 เปอร์เซ็นต์ว่าง

ตัวกรอง Hieroglyphs (CJK)

Hieroglyphs (CJK) — โดเมนที่มีหรือไม่มีเนื้อหา CJK (จีน ญี่ปุ่น เกาหลี)

หากไม่ได้มุ่งเป้าโดเมนภาษาเอเชีย การยกเว้นเนื้อหาดังกล่าวมักเป็นประโยชน์ — ในอดีตมักเชื่อมกับการโปรโมตแบบรุนแรง

วิธีใช้

  1. Hieroglyphs (CJK)
  2. สามสถานะ:
    • Unknown (ไอคอนห้าม) — ปิดตัวกรอง
    • Yes (ถูก) — เฉพาะที่มี CJK
    • No (กากบาท) — เฉพาะที่ไม่มี CJK

รายละเอียด

  • ตรวจหาอักขระ CJK
  • ใช้รูปแบบจากข้อมูล Wayback

ตัวอย่าง

1: มี CJK — Yes

2: ไม่มี CJK — No

ตัวกรอง Redirects (30x)

Redirects (30x) — การเปลี่ยนเส้นทาง (301 302 307 308) ในประวัติ Wayback ไปยัง โดเมนอื่น การเปลี่ยนเส้นทางภายในโดเมนเดียวกัน (เช่น http→https) ไม่นับ

การเปลี่ยนเส้นทางไปโดเมนอื่น: SEO แบบแบล็กแฮต การเปลี่ยนเจ้าของ การย้าย หรือปัญหาโฮสติ้ง

วิธีใช้

  1. Redirects (30x)
  2. Unknown Yes (เฉพาะที่มีระหว่างโดเมน) No (เฉพาะที่ไม่มี)

รายละเอียด

  • 301 302 307 308 ในประวัติ
  • เฉพาะข้ามโดเมนต่างกัน

ตัวอย่าง

1: มีการเปลี่ยนเส้นทาง — Yes

2: ไม่มี — No

ตัวกรอง Error 403

Error 403 — มีหรือไม่มี HTTP 403 (Forbidden) ในประวัติ Wayback

403 มักหมายถึงเจ้าของไซต์บล็อกการรวบรวมของ Wayback — บางครั้งเป็นสัญญาณ SEO ที่น่าสงสัย

วิธีใช้

  1. Error 403
  2. Unknown Yes (เฉพาะที่มี 403) No (เฉพาะที่ไม่มี)

รายละเอียด

  • ตรวจจับ HTTP 403

ตัวอย่าง

1: มี 403 — Yes

2: ไม่มี 403 — No

ตัวกรอง Website IDs

Website IDs ค้นหาตามรหัสวิเคราะห์/วิดเจ็ต (เช่น Google Analytics Yandex Metrica) ในคลัง — มีประโยชน์หากคาดว่าเป็นของเจ้าของเดียวกัน

วิธีใช้

  1. Website IDs
  2. ใส่รหัส (เช่น UA-123456789 GTM-XXXXX)
  3. Add หรือ Enter/เว้นวรรค
  4. แบดจ์; × ลบหนึ่งรายการ; Clear All

มีไอคอนช่วยเหลือข้างชื่อช่อง จับคู่ รหัสใดรหัสหนึ่ง ไม่สนตัวพิมพ์เล็กใหญ่

รายละเอียด

  • รหัสในเนื้อหาคลัง
  • หลายรหัส = โดเมนที่มี อย่างน้อยหนึ่ง รหัส

ตัวอย่าง

1: รหัส GA เฉพาะ — UA-123456789

2: หนึ่งในหลายรหัส — UA-123456789 GTM-XXXXX 12345678

3: เจ้าของเดียวกัน — เพิ่มรหัสจากโดเมนหนึ่งเพื่อหาโดเมนอื่นที่ใช้รหัสเดียวกัน

การรวมตัวกรอง Wayback

ทั้งหมดสามารถ รวมกับตัวกรองอื่น หลายตัวกรอง = ANDทุก เงื่อนไขต้องเป็นจริง ชุดที่ใช้บ่อย บันทึก ได้

ตัวอย่างรวม

เป้าหมาย: โดเมนเก่า (10+ ปี) อย่างน้อย 50% เนื้อหาอังกฤษ ไม่มีการเปลี่ยนเส้นทาง สแนปช็อตล่าสุดใน 30 วันที่ผ่านมา

อินเทอร์เฟซ: Age min 10; Language Filters — English (en) 50%; Redirects (30x)No; Last snapLast 30 days

แก้ปัญหา

«Maximum … elements allowed»

สาเหตุ: มากกว่า 20 องค์ประกอบใน Keywords in content คำเตือนสีแดง

แก้: ลบจนนับ ≤ 20

ไม่มีผลลัพธ์

สาเหตุ: เงื่อนไขเข้มเกินไปหรือไม่มีโดเมนในคลังที่ตรง

แก้: ผ่อนหรือปิดตัวกรองทีละขั้น

First snap / Last snap

แก้: ปฏิทินหรือปุ่มลัด — รูปแบบวันที่ตั้งอัตโนมัติ

Select Code ใช้ไม่ได้

สาเหตุ: ใน Server Code Share ไม่มี min % หรือ max %

แก้: ใส่อย่างน้อยหนึ่งเปอร์เซ็นต์ แล้วใช้ Select Code

เคล็ดลับ

  1. First snap / Last snap: ปุ่มลัด (Older than 2/5/10 years Last 7/30/60 days This month Last year)

  2. รวมตัวกรอง (อายุ ภาษา รหัส การเปลี่ยนเส้นทาง)

  3. Keywords in content: จุลภาค = และ | = หรือ ขีดจำกัด Elements 20

  4. Language Filters: เปอร์เซ็นต์ขั้นต่ำเพื่อกำหนดภาษาแคบลง

  5. Website IDs: รหัสวิเคราะห์ที่รู้แล้วเพื่อหาโดเมนอื่นที่ใช้รหัสเดียวกัน

Other articles in this section "ตัวกรองใน Karma.Domains"

All articles in this section

ลองใช้ฟรี!

ใช้เครดิตโบนัส!

เปิดรายการโดเมน
+5