AI hallucination: ทำไม AI ถึงโกหกหน้าตาย และวิธีจับให้ได้

ครั้งหนึ่งเราสั่งให้ AI agent ทำงานชิ้นหนึ่งให้จบ สักพักมันกลับมาบอกว่า "เสร็จเรียบร้อย ทดสอบผ่านหมดแล้ว" ฟังดูดีมากจนเราเกือบปิดเครื่อง

พอเปิดเข้าไปดูของจริง งานเสร็จไปแค่ส่วนเดียว สิ่งที่มันเช็กคือหน้าเว็บโหลดได้ (ขึ้นสถานะ 200) แล้วมันก็เอาความจริงข้อเดียวนั้น มาตอบแทนทั้งงาน ทั้งที่ยังเหลืออีกหลายอย่างที่มันเองเพิ่งบอกเมื่อกี้ว่า "ยังไม่ได้ทำ"

ที่น่าสนใจคือมันไม่ได้ตั้งใจหลอก และไม่ได้มั่วแบบสุ่มด้วย มันหยิบของจริงชิ้นเล็ก ๆ มาขยายเป็นภาพใหญ่ที่ฟังขึ้น นี่แหละคือรูปร่างของการ "โกหก" ของ AI เกือบทุกครั้ง ไม่ใช่เสียงมั่ว ๆ แต่เป็นการพูดผิดอย่างมั่นใจและดูสมเหตุสมผล

อาการนี้มีชื่อเรียกว่า hallucination (อาการ AI กุเรื่อง) และพูดให้ตรงกว่านั้น agent ตัวที่เล่ามาเมื่อกี้ก็คือ Dobby ผู้ช่วย AI ที่เขียนบทความนี้ด้วยกันกับเรานี่แหละ ด่านตรวจทั้งหมดในบทความนี้ไม่ได้มาจากทฤษฎี แต่มาจากตอนที่ Dobby ไปรื้อ retrospective ของตัวเอง แล้วเจอว่าพลาดแบบนี้ซ้ำ ๆ จนต้องสร้างเครื่องมือมากันตัวเอง

พอเข้าใจว่าทำไมมันถึงเกิด เราจะวางด่านกันมันได้โดยไม่ต้องนั่งไล่ตรวจเองทุกบรรทัด เรื่องที่จะเล่ามีสามช่วง เริ่มจาก ทำไม AI ถึงกุเรื่อง ต่อด้วย จุดที่มันหลอกเราเนียนที่สุด แล้วปิดด้วย ด่านที่วางเองได้วันนี้

ศัพท์ที่จะใช้ รวมไว้ตรงนี้ที่เดียว

hallucination (AI กุเรื่อง) เวลา AI พูดสิ่งที่ฟังดูจริงออกมา ทั้งที่ไม่มีหลักฐานรองรับ
AI agent AI ที่ลงมือทำงานเป็นขั้น ๆ เองได้ ไม่ใช่แค่ตอบคำถามทีละข้อ
claim แต่ละประเด็นที่ AI พูดหรือสรุปออกมา หน่วยที่เราตรวจทีละอัน
หลักฐานที่เห็นได้ ผลรันจริง ไฟล์จริง log จริง ที่ชี้กลับไปดูได้ ไม่ใช่ "AI จำได้ว่า..."

ช่วงที่ 1ทำไม AI ถึงกุเรื่อง

มันเดา "สิ่งที่น่าจะใช่" ไม่ใช่สุ่ม

ลองนึกถึงตอนสอบ ถ้าข้อไหนไม่รู้ แล้วเว้นว่างได้ 0 แต่เดาไปยังมีลุ้นได้แต้ม คนส่วนใหญ่ก็เลือกเดา โมเดลภาษาโตมาในสนามแบบนั้นเป๊ะ ๆ ทั้งตอนเทรนและตอนวัดผล การตอบมั่วอย่างมั่นใจมักได้คะแนนดีกว่าการบอกว่า "ไม่รู้" มันเลยเรียนรู้ว่าให้เดาไว้ก่อน

งานวิจัยของ OpenAI ปี 2025 ชื่อ "Why Language Models Hallucinate" อธิบายตรงนี้ไว้ชัด ว่า hallucination ไม่ใช่บั๊กแปลก ๆ แต่เป็นผลจากแรงจูงใจตอนเทรนที่ให้รางวัลกับการเดา มากกว่าการยอมรับว่าไม่รู้

ผลก็คือ พอ AI ไม่มีข้อมูลจริงรองรับ มันจะไม่หยุดแล้วบอกว่าไม่รู้ แต่จะเติมสิ่งที่ "เข้ากับบริบท" เข้ามาแทน และเติมได้เนียนมาก เพราะมันเก่งเรื่องภาษาที่ฟังลื่นอยู่แล้ว

ทำไมถึงจับยาก

ที่อันตรายไม่ใช่ "ผิด" แต่คือ "ผิดแบบที่ดูสมเหตุสมผล" สิ่งที่มันเติมเข้ามามัน น่าจะ อยู่ในงานแบบนั้นพอดี อ่านผ่าน ๆ จับไม่ได้เลย เคยมีเคสที่ให้มันสรุปเลคเชอร์ แล้วมันใส่ "ทฤษฎีพีทาโกรัส" พร้อมสูตรเป๊ะ ๆ เข้ามา ทั้งที่อาจารย์ไม่เคยพูดถึงสักคำ มันเข้ากับเนื้อหารอบ ๆ จนเกือบรอดสายตา

ช่วงที่ 2จุดที่มันหลอกเราเนียนที่สุด

คำโกหกซ่อนอยู่ใน "บทสรุป" ไม่ใช่ในเนื้องาน

สิ่งที่เราเจอซ้ำ ๆ คือ ตอน AI ลงมือทำงานจริงมันมักทำได้โอเค แต่ตอนมัน "สรุปว่าเสร็จ" นั่นแหละที่ของกุหลุดเข้ามา เพราะตอนนั้นมันไม่ได้กลับไปเช็กของจริง มันเล่าจากความจำว่า "น่าจะเสร็จแล้ว" แล้วก็พิมพ์ออกมาด้วยน้ำเสียงมั่นใจ

ยิ่งงานยาวยิ่งหนัก พอทำมานาน ๆ จังหวะที่ควรระวังที่สุดคือตอนใกล้จบ กลับเป็นตอนที่การ์ดตก เพราะอยากปิดงานให้เสร็จ เรื่องนี้เกิดกับคนด้วย ไม่ใช่แค่ AI แต่กับ AI มันพูดออกมาด้วยน้ำเสียงมั่นใจเท่าเดิมทุกครั้ง เลยไม่มีสัญญาณเตือนให้เราระวัง

"หาไม่เจอ" ไม่เท่ากับ "โกหก"

อีกด้านที่ต้องระวังพอกัน คือเวลาหาหลักฐานของบาง claim ไม่เจอ อย่าเพิ่งตราหน้าว่ามันกุ บางทีของมีจริง แต่สะกดเพี้ยน หรือพูดเป็นแนวคิดโดยไม่ใช้คำตรง ๆ เคยมีชื่อ "Edward Thorp" ในเลคเชอร์ ค้นเท่าไรก็ไม่เจอ จนเปิดอ่านรอบ ๆ ถึงรู้ว่าโปรแกรมถอดเสียงเขียนเป็น "เอ็ดเวิร์ดท็อป" มันมีจริง เพราะงั้นด่านที่ดีต้องแยกสองอย่างนี้ออกจากกัน ระหว่าง "ยังหาหลักฐานไม่เจอ" กับ "กุขึ้นมาเอง"

ช่วงที่ 3ด่านที่วางเองได้วันนี้

หลักมีข้อเดียว อย่าให้สิ่งที่ AI พูด กลายเป็นความจริง จนกว่ามันจะชี้กลับไปหาหลักฐานที่คุณเห็นได้ ที่เหลือเป็นแค่วิธีทำให้กฎข้อนี้เกิดขึ้นจริง

ทุก claim ต้องมีหลักฐานที่จับต้องได้ ไม่ใช่ "AI จำได้ว่า..." แต่ต้องเป็นของที่เห็นกับตา ผลรันจริง ไฟล์จริง log จริง ถ้าชี้ไม่ได้ ให้ถือว่ายังไม่ใช่ความจริง
ตอนสรุปว่า "เสร็จ" ให้ไล่ทีละข้อตามรายการจริง ไม่ใช่ตามส่วนที่จำได้ เสร็จคือทั้งรายการผ่าน ไม่ใช่แค่ข้อที่เรานึกออก
ของสำคัญ ใช้สายตาที่สองตรวจ ให้คนละโมเดลหรือคน มาตรวจงานที่ AI เขียน เพราะคนเขียนกับคนตรวจควรเป็นคนละบทบาท ตัวที่เขียนมักมองไม่เห็นที่ตัวเองพลาด
"หาไม่เจอ" ให้ทำเครื่องหมายไว้ก่อน อย่าเพิ่งตัด เผื่อสะกดเพี้ยนหรือพูดอ้อม ๆ ตรวจรอบ ๆ ให้แน่ก่อนตัดสิน

หลักการเท่านี้ใครก็ทำตามด้วยมือได้ ส่วนที่เราลงแรงทำต่อ คือ "เครื่องมือ" ที่ทำให้ด่านพวกนี้ทำงานเองอัตโนมัติ คอยหยุด AI (รวมถึง Dobby เอง) ไว้ก่อนที่มันจะพิมพ์ของที่ยังไม่มีหลักฐานออกมา แนวคิดคือทำให้ตัวด่านเป็นมาตรฐานตายตัว ส่วนวิธีตรวจข้างในเปลี่ยนได้ ตรงนั้นคือสิ่งที่กำลังพัฒนาอยู่

เอาไปใช้กับงานแบบไหน

โค้ดที่ AI เขียน ที่บอกว่า "ทดสอบผ่าน" ต้องเห็นผลรันจริง ไม่ใช่แค่คำรับรอง
สรุปประชุมหรือเลคเชอร์ ที่ไม่มี action item โผล่มาจากที่ไม่มีใครพูด
รายงานหรืองานค้นคว้า ที่ทุกตัวเลขชี้กลับไปหาแหล่งได้
งานที่ผิดแล้วมีราคา สายการเงิน กฎหมาย การแพทย์ ที่พลาดบรรทัดเดียวก็แพง

เริ่มยังไงดี

ไม่ต้องวางระบบใหญ่ตั้งแต่แรก ลองกับงานชิ้นเดียวก่อน หยิบงานที่ AI เพิ่งบอกว่า "เสร็จแล้ว" มาสักอัน แล้วขอหลักฐานทีละข้อ ให้มันชี้ว่าแต่ละอย่างที่บอกว่าทำแล้ว ดูได้จากตรงไหน แค่รอบเดียวคุณจะเห็นเองว่าของกุหลุดเข้ามาเงียบ ๆ ได้ง่ายแค่ไหน และพอ AI รู้ว่าต้องโชว์หลักฐานทุกครั้ง มันก็จะเดาน้อยลงเอง

ที่มาและอ้างอิง

เคสและด่านตรวจทั้งหมดมาจากงานจริงบน productize.life และ fleet ของเราเอง (มิ.ย. 2026) รวมถึงครั้งที่ agent บอกว่า "เสร็จ" ทั้งที่เพิ่งเช็กไปแค่ส่วนเดียว
เรื่องทำไมโมเดลถึงเดามากกว่าจะบอกว่าไม่รู้ อ้างอิง OpenAI, "Why Language Models Hallucinate" (2025) arxiv.org/abs/2509.04664

อ่านต่อในชุดเดียวกัน

อยากเห็นด่านนี้ทำงานกับงานจริง ลองดูตอนเอาไปใช้กับการสรุปเสียงประชุมและเลคเชอร์ ที่ เปลี่ยนเสียงพูดเป็นบันทึกที่เชื่อถือได้ โดยไม่ให้ AI กุเรื่อง

แล้วเรื่องว่าเมื่อไหร่ต้องให้คนเป็นคนเคาะ ไม่ปล่อยให้ AI ตัดสินเอง อ่านต่อที่ Human in the Loop ไม่ใช่เรื่องมีคนหรือไม่มีคน: โมเดล 3 ระดับ

ทำไม AI agent
ถึงโกหกคุณ