วันก่อนเราเพิ่งต่อฟอร์มรับสมาชิกกับแผนผังเว็บ (sitemap) ขึ้นเว็บตัวเอง ทุกอย่างดูเรียบร้อย หน้าเปิดได้ ลิงก์ครบ แต่พอลองเช็กจริง กลับเจอว่า Google หา sitemap เราไม่เจอ เพราะมันไปวางผิดที่ ส่วนจุดมาตรฐานที่ Google ชอบไปดูก็ดันโดนล็อกไว้
พอเปิดไฟล์ robots ดูต่อ ก็เจอของที่ไม่เคยสังเกต ระบบตั้งค่าบล็อกบอทของ AI ไว้ให้อัตโนมัติ ทั้ง GPTBot (ของ ChatGPT), ClaudeBot, Google-Extended ผ่านบรรทัดสั้น ๆ ที่เรียกว่า Content-Signal เขียนว่า search=yes, ai-train=no แปลเป็นภาษาคนคือ ให้เอาไปทำผลค้นหาได้ แต่ห้ามเอาไปเทรน AI
ตรงนี้แหละที่สะดุด เพราะมันแปลว่า "ใครได้อ่านเว็บเรา" ถูกตัดสินไปแล้วตั้งแต่ก่อนเราจะรู้ตัว live ไม่ได้แปลว่าถูกค้นเจอ และยุคนี้ "ถูกเจอ" ก็ไม่ได้มีแค่ Google อีกต่อไป
เล่าก่อนว่าเราเป็นใคร เราสร้าง product ด้วย AI ผู้ช่วยแทบทุกวัน ส่วนใหญ่ทำคนเดียว ทุกขั้นข้างล่างนี้คือสิ่งที่ลงมือทำเองจริงกับเว็บตัวเอง ไม่ใช่ทฤษฎี
ขั้นที่ 1Google เห็น sitemap เราไหม
sitemap คือแผนที่บอก Google ว่าเว็บเรามีหน้าอะไรบ้าง พอ Google หาแผนที่ไม่เจอ ก็ต้องเดาเอง บางหน้าเลยไม่ถูกเก็บ
ทำ เปิด ชื่อเว็บคุณ/sitemap.xml ดูว่าขึ้นหน้า XML ไหม จากนั้นเข้า Google Search Console เมนู Sitemaps ใส่ sitemap.xml แล้วกด Submit
ยืนยัน สถานะจะค่อย ๆ ขึ้นเป็น Success ถ้าเพิ่งส่งแล้วขึ้น "Couldn't fetch" อย่าเพิ่งตกใจ มันปกติ รอ Google ไปดึงก่อน
ขั้นที่ 2robots ปล่อยหรือบล็อกใคร
ไฟล์ robots คือป้ายหน้าบ้านบอกบอทว่าเข้าได้ไหม เดี๋ยวนี้มันมีอีกชั้นคือ Content-Signal แยกย่อยว่าให้ค้นหา ให้ป้อนเข้า AI หรือให้เทรน AI ได้หรือไม่ ถ้าใช้โฮสต์ที่ตั้งให้อัตโนมัติ บางทีก็บล็อกบอท AI ให้โดยที่เราไม่ได้สั่ง
ทำ เปิด ชื่อเว็บคุณ/robots.txt อ่านเอง มองหาบรรทัด Content-Signal กับรายชื่อบอทที่ขึ้น Disallow แล้วตัดสินใจ อยากให้ ChatGPT หรือ Claude อ้างเว็บเราได้ก็เปิดให้บอทพวกนั้นเข้า ไม่อยากให้เอาไปเทรนก็คงค่า ai-train=no ไว้ สองเรื่องนี้แยกกัน
ยืนยัน รู้ชัดว่าใครเข้าได้บ้าง เพราะเราตั้งใจ ไม่ใช่เพราะปล่อยตาม default
ขั้นที่ 3เพิ่ม llms.txt
robots บอกแค่เข้าได้หรือไม่ได้ แต่ไม่ได้บอกว่าเนื้อหาสำคัญอยู่ไหน llms.txt คือไฟล์สั้น ๆ ที่เราเขียนเองวางไว้หน้าแรก บอก AI ว่าหน้าหลักของเรามีอะไร อ่านตรงไหนก่อน
ทำ สร้างไฟล์ llms.txt วางที่ราก เขียนแบบ markdown ง่าย ๆ ชื่อเว็บ หนึ่งบรรทัดบอกว่าเราทำอะไร แล้วลิสต์ลิงก์หน้าสำคัญพร้อมคำอธิบายสั้น เท่านี้พอสำหรับเริ่ม
ยืนยัน เปิด ชื่อเว็บคุณ/llms.txt แล้วเห็นไฟล์ ก็ใช้ได้
ขั้นที่ 4ทำแต่ละหน้าให้ถูกอ้างได้
AI ตอบคำถามคนโดยหยิบ "ท่อน" ที่ชัดจากเว็บไปอ้าง ถ้าหน้าเราเป็นพรืดยาวไม่มีหัวข้อ ก็หยิบไปอ้างยาก
ทำ ใส่หัวข้อย่อยที่ชัด มีสารบัญในหน้ายาว มีกล่องสรุปสั้นต้นหน้า แล้วใส่ schema markup บอกว่านี่คือบทความ ใครเขียน วันไหน
ยืนยัน แต่ละหัวข้อกลายเป็นชิ้นที่ลิงก์ตรงและถูกอ้างเดี่ยว ๆ ได้
ขั้นที่ 5ตรวจซ้ำว่าเห็นเราจริง
ค้น site:ชื่อเว็บคุณ ใน Google ดูว่าขึ้นกี่หน้า กลับมาดู GSC ว่า sitemap ขึ้น Success และเก็บหน้าครบ แล้วลองถาม ChatGPT หรือ Claude เรื่องที่เราเขียน ดูว่ามันรู้จักเว็บเราไหม
เครื่องมือที่ใช้ได้จริง
ส่วนใหญ่ฟรีและทำคนเดียวไหว พวกนี้คือตัวที่เราใช้เองจริง ไม่ใช่ลิสต์ยาว ๆ ให้ดูเยอะ
- Google Search Console ส่ง sitemap ดูว่า Google เก็บกี่หน้า เช็กว่าหน้าไหน index แล้ว
- คำสั่งค้น site:ชื่อเว็บ ดูเร็ว ๆ ว่ามีกี่หน้าโผล่ในผลค้นหา
- เปิดไฟล์ robots.txt และ llms.txt ของตัวเอง อ่าน default ที่โฮสต์ตั้งให้ ก่อนตัดสินใจ
- เครื่องมือหาคำค้น เช่น Google Keyword Planner (ฟรี) ดูว่าคนค้นด้วยคำไหนจริง ก่อนตั้งหัวข้อ
- ตัวตรวจ structured data วางลิงก์หน้าเราเข้าไป ดูว่าเครื่องอ่าน schema markup ออกไหม
สรุปchecklist บ่ายเดียว
- เปิด /sitemap.xml ได้ และส่งใน GSC แล้ว
- อ่าน /robots.txt รู้ว่าปล่อยหรือบล็อกใคร เพราะตั้งใจ ไม่ใช่ default
- มี /llms.txt บอกหน้าหลัก
- ทุกหน้ามีหัวข้อชัด มีสรุปต้นหน้า และมี schema markup
- ค้น site: แล้วเจอ และลองถาม AI แล้วมันรู้จักเรา
🔒 ขอเก็บไว้รับ checklist เต็ม
หลักการอยู่ตรงนี้แล้ว ฟรี คือ live ไม่ได้แปลว่าถูกค้นเจอ ไปเปิดดูของจริงทีละไฟล์ อย่าเดาว่าคนอื่นเห็นเรา
สิ่งที่เรายังไม่ได้ใส่ในโพสต์นี้คือเวอร์ชันอัตโนมัติ คือวิธีทำให้ /sitemap.xml และ llms.txt ออกมาถูกที่ระดับ edge ทันทีทุกหน้าโดยไม่ต้องแก้ทีละไฟล์ กับ checklist ตรวจ AI-visibility แบบเต็มที่รันซ้ำได้ นั่นคือความต่างระหว่างทำครั้งเดียว กับระบบที่ดูแลตัวเองได้
🔒 รับ checklist เต็ม → เวอร์ชันอัตโนมัติที่ edge + ใบตรวจ AI-visibility ที่รันซ้ำได้ หลักการอยู่ข้างบนนี้ฟรีแล้ว ส่วนวิธีที่เอาไปวางระบบได้คือเวอร์ชันที่เก็บไว้
ทั้งหมดนี้เราลงมือเองได้ทุกขั้น ไม่ต้องรอให้ใครมาทำให้ก่อน เริ่มได้ในบ่ายเดียว หัวใจมันมีประโยคเดียว อย่าเดาว่าคนอื่นเห็นเรา ไปเปิดดูของจริงทีละไฟล์ เริ่มจากขั้นที่ 1 วันนี้ก็พอ
ปล่อยให้ Claude อ้างเราได้ แต่ไม่ให้ใครเอาไปเทรนฟรี · อีกด้านของ visibility คือเลือกว่าใคร "เข้ามาอ่าน" เราได้
ไม่ใช่ทุกการกระทำที่ต้องรอคน โมเดล 3 ระดับสำหรับการตัดสินใจร่วมกับ AI · เมื่อ AI ลงมือแล้ว ใครเป็นเจ้าของการตัดสิน
เอา AI เข้า Discord โดยไม่เปิดช่องให้ใครสั่งมันแทนคุณ · ด่าน access ที่กระตุ้นให้ AI เริ่มทำงาน
ทำเว็บให้ AI agent ใช้งานได้ ทำ 8 ปฏิเสธ 3 · อีกด้านของการถูก AI ค้นเจอ คือทำให้ agent ใช้งานได้จริง