- วิธีการทำงานของตัวกรอง Wayback Machine
- ตัวกรอง Content changes
- ตัวกรอง Age
- ตัวกรอง First snap
- ตัวกรอง Last snap
- ตัวกรอง Keywords in content
- Language Filters
- ตัวกรอง Server Code Share
- ตัวกรอง Hieroglyphs (CJK)
- ตัวกรอง Redirects (30x)
- ตัวกรอง Error 403
- ตัวกรอง Website IDs
- การรวมตัวกรอง Wayback
- แก้ปัญหา
- เคล็ดลับ
วิธีการทำงานของตัวกรอง Wayback Machine
ตัวกรองเหล่านี้ค้นหาโดเมนจากข้อมูล Internet Archive (Wayback Machine): ประวัติ เนื้อหา ภาษา รหัส HTTP และพารามิเตอร์ที่เก็บถาวรอื่นๆ
สำคัญ: ทั้งหมดอิงข้อมูลคลัง หาก Wayback Machine ไม่เคยรวบรวมโดเมนนั้น ตัวกรองจะไม่จับคู่ได้
ตัวกรอง Content changes
Content changes เลือกโดเมนตามจำนวนครั้งที่เนื้อหาเปลี่ยนในประวัติคลัง ในอินเทอร์เฟซมี min และ max (≥ 0)
การเปลี่ยนเนื้อหาหมายถึงหน้าเปลี่ยนมากกว่า 50% เทียบกับเวอร์ชันที่เก็บก่อนหน้าใน Wayback Machine
เหมาะกับโดเมนที่เปลี่ยนน้อย (0–3 ครั้ง) จำนวนมาก อาจบ่งชี้การเปลี่ยนเจ้าของ
วิธีใช้
- หา Content changes ในบล็อก Wayback
- ใส่ค่าขอบเขตใน min และ max
- กรอกเฉพาะ min เฉพาะ max หรือทั้งคู่
ตัวอย่าง
1: อัปเดตบ่อย (ตั้งแต่ 50) — min 50 max ว่าง
2: โดเมนนิ่ง (0–5) — min: 0 max: 5
ตัวกรอง Age
Age กรองตามอายุเป็นปี (ข้อมูลคลัง) ช่อง min และ max (ปี ≥ 0)
อายุนับจากสแนปช็อตเนื้อหาแรกใน Wayback Machine
ใช้ ค้นหาโดเมนอายุมาก ได้
วิธีใช้
- Age ในบล็อก
- min และ max เป็นปี
- เฉพาะ min เฉพาะ max หรือทั้งคู่
ตัวอย่าง
1: โดเมนเก่า (10+ ปี) — min 10 max ว่าง
2: โดเมนใหม่ (0–2 ปี) — min: 0 max: 2
ตัวกรอง First snap
First snap ตามวันที่สแนปช็อตแรกในคลัง ตัวเลือกวันที่และปุ่มลัด
วิธีใช้
- First snap
- คลิก — ปฏิทิน; เลือกช่วงวันที่
- หรือ Older than 2 years Older than 5 years Older than 10 years Last year
ตัวอย่าง
1: จัดทำดัชนีครั้งแรกมากกว่า 10 ปีที่แล้ว — Older than 10 years
2: สแนปช็อตแรกในปีใดปีหนึ่ง — เลือกช่วงในปฏิทิน
ตัวกรอง Last snap
Last snap ตามวันที่สแนปช็อตล่าสุด ปฏิทินและปุ่มลัด
วิธีใช้
- Last snap
- ปฏิทิน; ช่วงวันที่
- หรือ Last 7 days Last 30 days Last 60 days This month Last year
ตัวอย่าง
1: สแนปช็อตล่าสุดใน 30 วันที่ผ่านมา — Last 30 days
2: สแนปช็อตในปีก่อน — Last year หรือปฏิทิน
ตัวกรอง Keywords in content
Keywords in content ค้นหาคำสำคัญในเนื้อหาหน้าที่เก็บถาวร ช่องข้อความ ตัวนับ Elements (สูงสุด 20) หากเกินจะมีคำเตือน Maximum … elements allowed
วิธีใช้
- Keywords in content
- จุลภาค = และ (ทุกคำ) ขีดตั้ง
|= หรือ (คำใดคำหนึ่ง) - ดูตัวนับ Elements
ตัวอย่าง
1: คำใดคำหนึ่งจากหลายคำ — shop | store | buy
2: ทั้งสองคำ — tech, news
Language Filters
Language Filters ตามภาษาของเนื้อหาในคลัง มีเปอร์เซ็นต์ขั้นต่ำเป็นตัวเลือก รายการภาษาค้นหาได้ ช่อง % Add แบดจ์มี × Clear All เงื่อนไข ภาษาใดภาษาหนึ่ง ในรายการที่ระบุก็พอ
วิธีใช้
- Language Filters
- เลือกภาษา; ตั้งเปอร์เซ็นต์ขั้นต่ำได้ (0–100)
- Add; × บนแบดจ์; Clear All
ตัวอย่าง
1: เนื้อหาอังกฤษไม่กำหนดเกณฑ์ — English (en) Add
2: อย่างน้อย 50% รัสเซีย — Russian (ru) 50% Add
3: หลายภาษา — เช่น English 30%+ German 20%+ French ไม่ใส่ %
ตัวกรอง Server Code Share
Server Code Share ตามสัดส่วนรหัสสถานะ HTTP เฉพาะในประวัติ Wayback
การตอบกลับ «200» 100% อาจเน้นโดเมนที่ประวัติไม่มีข้อผิดพลาดเซิร์ฟเวอร์ การเปลี่ยนเส้นทาง หรือการปฏิเสธการเข้าถึง
วิธีใช้
- Server Code Share
- min % (0–100)
- max % (0–100)
- Select Code — เลือกรหัส HTTP (ใช้งานได้หลังใส่เปอร์เซ็นต์)
- เลือกจากรายการ
- Clear ล้างรหัสที่เลือก
รหัส HTTP ที่มี
- 200 — OK
- 301 — Moved Permanently
- 302 — Found
- 307 — Temporary Redirect
- 308 — Permanent Redirect
- 400 — Bad Request
- 401 — Unauthorized
- 403 — Forbidden
- 404 — Not Found
- 500 — Internal Server Error
- 502 — Bad Gateway
- 503 — Service Unavailable
Select Code เปิดใช้เมื่อมี min % หรือ max % Clear รีเซ็ตรหัส
ตัวอย่าง
1: อย่างน้อย 80% «200 OK» — min % 80 Select Code เลือก 200
2: 50–100% ข้อผิดพลาด «404» — min % 50 max % 100 รหัส 404
3: สัดส่วนใดๆ ของ 301 — รหัส 301 เปอร์เซ็นต์ว่าง
ตัวกรอง Hieroglyphs (CJK)
Hieroglyphs (CJK) — โดเมนที่มีหรือไม่มีเนื้อหา CJK (จีน ญี่ปุ่น เกาหลี)
หากไม่ได้มุ่งเป้าโดเมนภาษาเอเชีย การยกเว้นเนื้อหาดังกล่าวมักเป็นประโยชน์ — ในอดีตมักเชื่อมกับการโปรโมตแบบรุนแรง
วิธีใช้
- Hieroglyphs (CJK)
- สามสถานะ:
- Unknown (ไอคอนห้าม) — ปิดตัวกรอง
- Yes (ถูก) — เฉพาะที่มี CJK
- No (กากบาท) — เฉพาะที่ไม่มี CJK
รายละเอียด
- ตรวจหาอักขระ CJK
- ใช้รูปแบบจากข้อมูล Wayback
ตัวอย่าง
1: มี CJK — Yes
2: ไม่มี CJK — No
ตัวกรอง Redirects (30x)
Redirects (30x) — การเปลี่ยนเส้นทาง (301 302 307 308) ในประวัติ Wayback ไปยัง โดเมนอื่น การเปลี่ยนเส้นทางภายในโดเมนเดียวกัน (เช่น http→https) ไม่นับ
การเปลี่ยนเส้นทางไปโดเมนอื่น: SEO แบบแบล็กแฮต การเปลี่ยนเจ้าของ การย้าย หรือปัญหาโฮสติ้ง
วิธีใช้
- Redirects (30x)
- Unknown Yes (เฉพาะที่มีระหว่างโดเมน) No (เฉพาะที่ไม่มี)
รายละเอียด
- 301 302 307 308 ในประวัติ
- เฉพาะข้ามโดเมนต่างกัน
ตัวอย่าง
1: มีการเปลี่ยนเส้นทาง — Yes
2: ไม่มี — No
ตัวกรอง Error 403
Error 403 — มีหรือไม่มี HTTP 403 (Forbidden) ในประวัติ Wayback
403 มักหมายถึงเจ้าของไซต์บล็อกการรวบรวมของ Wayback — บางครั้งเป็นสัญญาณ SEO ที่น่าสงสัย
วิธีใช้
- Error 403
- Unknown Yes (เฉพาะที่มี 403) No (เฉพาะที่ไม่มี)
รายละเอียด
- ตรวจจับ HTTP 403
ตัวอย่าง
1: มี 403 — Yes
2: ไม่มี 403 — No
ตัวกรอง Website IDs
Website IDs ค้นหาตามรหัสวิเคราะห์/วิดเจ็ต (เช่น Google Analytics Yandex Metrica) ในคลัง — มีประโยชน์หากคาดว่าเป็นของเจ้าของเดียวกัน
วิธีใช้
- Website IDs
- ใส่รหัส (เช่น
UA-123456789GTM-XXXXX) - Add หรือ Enter/เว้นวรรค
- แบดจ์; × ลบหนึ่งรายการ; Clear All
มีไอคอนช่วยเหลือข้างชื่อช่อง จับคู่ รหัสใดรหัสหนึ่ง ไม่สนตัวพิมพ์เล็กใหญ่
รายละเอียด
- รหัสในเนื้อหาคลัง
- หลายรหัส = โดเมนที่มี อย่างน้อยหนึ่ง รหัส
ตัวอย่าง
1: รหัส GA เฉพาะ — UA-123456789
2: หนึ่งในหลายรหัส — UA-123456789 GTM-XXXXX 12345678
3: เจ้าของเดียวกัน — เพิ่มรหัสจากโดเมนหนึ่งเพื่อหาโดเมนอื่นที่ใช้รหัสเดียวกัน
การรวมตัวกรอง Wayback
ทั้งหมดสามารถ รวมกับตัวกรองอื่น หลายตัวกรอง = AND — ทุก เงื่อนไขต้องเป็นจริง ชุดที่ใช้บ่อย บันทึก ได้
ตัวอย่างรวม
เป้าหมาย: โดเมนเก่า (10+ ปี) อย่างน้อย 50% เนื้อหาอังกฤษ ไม่มีการเปลี่ยนเส้นทาง สแนปช็อตล่าสุดใน 30 วันที่ผ่านมา
อินเทอร์เฟซ: Age min 10; Language Filters — English (en) 50%; Redirects (30x) — No; Last snap — Last 30 days
แก้ปัญหา
«Maximum … elements allowed»
สาเหตุ: มากกว่า 20 องค์ประกอบใน Keywords in content คำเตือนสีแดง
แก้: ลบจนนับ ≤ 20
ไม่มีผลลัพธ์
สาเหตุ: เงื่อนไขเข้มเกินไปหรือไม่มีโดเมนในคลังที่ตรง
แก้: ผ่อนหรือปิดตัวกรองทีละขั้น
First snap / Last snap
แก้: ปฏิทินหรือปุ่มลัด — รูปแบบวันที่ตั้งอัตโนมัติ
Select Code ใช้ไม่ได้
สาเหตุ: ใน Server Code Share ไม่มี min % หรือ max %
แก้: ใส่อย่างน้อยหนึ่งเปอร์เซ็นต์ แล้วใช้ Select Code
เคล็ดลับ
-
First snap / Last snap: ปุ่มลัด (Older than 2/5/10 years Last 7/30/60 days This month Last year)
-
รวมตัวกรอง (อายุ ภาษา รหัส การเปลี่ยนเส้นทาง)
-
Keywords in content: จุลภาค = และ
|= หรือ ขีดจำกัด Elements 20 -
Language Filters: เปอร์เซ็นต์ขั้นต่ำเพื่อกำหนดภาษาแคบลง
-
Website IDs: รหัสวิเคราะห์ที่รู้แล้วเพื่อหาโดเมนอื่นที่ใช้รหัสเดียวกัน