เวลามีคนบอกว่ากำลังใช้ AI agent อยู่ ลองถามต่อว่าใช้ยังไง ส่วนใหญ่จะเล่าว่าเปิด ChatGPT พิมพ์ถาม แล้วก็อปคำตอบไปวางในงาน นั่นเป็นการใช้ AI ที่ดีและมีประโยชน์จริง แต่มันคือ chatbot ยังไม่ใช่ agent และเส้นที่คั่นสองคำนี้ไม่ใช่เรื่องศัพท์เท่ ๆ มันเปลี่ยนวิธีที่คุณคิดกับงานทั้งงาน
เราเขียนบล็อกเรื่องการสร้าง AI agent มาสามสิบกว่าตอน แต่พอมีคนที่เพิ่งเริ่มจากการแชทมาอ่าน เขาสะดุดตั้งแต่คำแรก เพราะไม่เคยมีใครบอกก่อนว่า agent ต่างจากแชทตรงไหน บทความนี้คือจุดตั้งต้นนั้น อ่านจบแล้วคุณจะแยกออกว่าอะไรคือ chatbot อะไรคือ agent และรู้ว่าถ้าอยากขยับจากคนใช้ ไปเป็นคนสร้าง ต้องมองหาอะไรต่อ
ช่วงที่ 1chatbot ตอบ agent ลงมือ
ลองนึกภาพงานง่าย ๆ อย่าง "สรุปอีเมลที่ยังไม่ได้อ่านวันนี้ แล้วร่างตอบกลับอันที่ด่วน" ถ้าใช้ chatbot คุณต้องเป็นคนก็อปอีเมลทีละฉบับไปวาง อ่านคำตอบ แล้วก็อปกลับมาส่งเอง โมเดลตอบเก่ง แต่มือที่ขยับทุกขั้นคือมือคุณ
ส่วน agent รับเป้าหมายเดียวนั้นไปแล้วเดินเอง เปิดกล่องอีเมล อ่านที่ยังไม่ได้อ่าน คัดอันด่วน ร่างคำตอบ แล้วเอามาให้คุณเคาะก่อนส่ง ความต่างไม่ได้อยู่ที่โมเดลฉลากว่า มันอยู่ที่ใครเป็นคนเดินงาน chatbot รอคุณป้อนทีละขั้น agent รับเป้าหมายแล้วแตกขั้นเอง
นี่คือเหตุผลที่โมเดลตัวเดียวกันเป็นได้ทั้งสองแบบ ChatGPT ตอนถามตอบคือ chatbot แต่พอมันวางแผนหลายขั้น เรียกเครื่องมือ และทำต่อเนื่องเองได้ มันก็ทำหน้าที่เป็น agent ตัวโมเดลไม่เปลี่ยน สิ่งที่เปลี่ยนคือชั้นที่ห่อรอบมันอยู่
ช่วงที่ 2เส้นแบ่งสามข้อที่ทำให้เป็น agent
ถ้าอยากดูเร็ว ๆ ว่าสิ่งที่ตรงหน้าเป็น chatbot หรือ agent ให้ดูสามข้อนี้ ขาดข้อใดข้อหนึ่งมันก็ยังเป็นแค่แชทที่ฉลาด
- ทำเองหลายขั้น รับเป้าหมายเดียวแล้วแตกเป็นขั้นย่อย ทำไล่ไปเองจนจบ ไม่ใช่รอคำสั่งใหม่ทุกครั้ง
- จำสิ่งที่ทำไปแล้ว รู้ว่าเมื่อกี้ทำอะไรไปแล้ว ผลเป็นยังไง ไม่ใช่เริ่มจากศูนย์ทุกข้อความ
- ลงมือกับของจริงผ่านเครื่องมือ ไม่ได้แค่พิมพ์ข้อความตอบ แต่เปิดไฟล์ ยิง API ส่งข้อความได้จริง
| chatbot | AI agent | |
|---|---|---|
| จำนวนขั้นต่อคำสั่ง | หนึ่งขั้น ถาม-ตอบ | หลายขั้น วางแผนเอง |
| ความจำ | ลืมเมื่อปิดหน้าต่าง | จำบริบทข้ามขั้นได้ |
| ลงมือกับงานจริง | แค่ให้ข้อความ | ใช้เครื่องมือทำเอง |
| ใครเดินงาน | คุณป้อนทุกขั้น | agent เดินเอง คุณคุมทิศ |
สังเกตว่าทั้งสามข้อไม่ได้พูดถึงว่าโมเดลไหนเก่งกว่ากันเลย เพราะความเป็น agent ไม่ได้อยู่ที่โมเดล มันอยู่ที่สิ่งที่เราสร้างห่อรอบโมเดลไว้
ช่วงที่ 3ทำไม demo ในคลิปถึงยังไม่ใช่ของจริง
พอเข้าใจว่า agent เดินงานเองได้ คนมักไปเห็นคลิปที่พิมพ์ประโยคเดียวแล้ว AI สร้างเว็บทั้งเว็บให้ดูจบใน 3 นาที แล้วคิดว่าของจริงก็ง่ายแบบนั้น ตรงนี้คือจุดที่ต้องระวัง สิ่งที่เห็นในคลิปคือ demo และ demo คือส่วนที่ง่ายที่สุด ใคร ๆ ก็ทำได้
เพราะ demo สมมติว่าทุกอย่างเป็นไปตามแผน ถามครั้งเดียว ตอบครั้งเดียว จบในคลิป แต่พอเอา agent ตัวเดียวกันไปรันจริงทุกวัน มันเริ่มลืมสิ่งที่เพิ่งทำไปเมื่อวาน เริ่มเติมข้อมูลที่ไม่มีใครบอกแล้วพูดออกมาอย่างมั่นใจ เริ่มลงมือทำสิ่งที่ไม่ควรทำ พอเปิดสองงานพร้อมกันก็ทำงานทับกันเอง
ระยะจาก demo ที่รันโชว์สนุก ไปถึง agent ที่ใช้งานจริงแล้วไม่พัง คือระยะที่งานส่วนใหญ่ซ่อนอยู่ และมันคือเหตุผลที่บล็อกนี้มีตั้งสามสิบกว่าตอน
ช่วงที่ 4"ชั้น" ที่ทำให้ agent ไม่พัง
ทุกอาการที่เล่าไปเมื่อกี้ ลืม กุเรื่อง ทำเกินสั่ง ทำงานทับกัน แต่ละอย่างแก้ด้วยส่วนประกอบคนละชิ้น เราเรียกส่วนประกอบพวกนี้ว่า ชั้น เพราะมันวางซ้อนกันเหมือนชั้นของตึก แต่ละชั้นรับหน้าที่คนละอย่าง
ตัวอย่างให้เห็นภาพ ชั้นความจำกันไม่ให้มันลืม ชั้นรั้วกันไม่ให้มันทำเกินขอบเขตหรือทำข้อมูลรั่ว ชั้นการพิสูจน์ผลกันไม่ให้มันบอกว่า "เสร็จแล้ว" ทั้งที่ยังผิด ขาดชั้นไหนไป agent ก็พังในแบบของชั้นนั้น ไม่ใช่พังมั่ว ๆ
คุณไม่ต้องสร้างครบทุกชั้นตั้งแต่วันแรก และไม่ต้องจำชื่อทุกชั้นตอนนี้ ขอแค่รู้ว่า agent ที่ใช้งานจริงคือโมเดลบวกกับชั้นพวกนี้ ไม่ใช่โมเดลเปล่า ๆ แค่เข้าใจตรงนี้ คุณก็มองคลิป demo ออกแล้วว่ามันโชว์แค่ชั้นบนสุด
สรุปอยากขยับจากคนใช้ ไปเป็นคนสร้าง เริ่มตรงไหน
ทวนสั้น ๆ chatbot ตอบทีละคำถาม agent รับเป้าหมายแล้วเดินเองหลายขั้น จำได้ และลงมือกับงานจริงผ่านเครื่องมือ ส่วนสิ่งที่ทำให้ agent ใช้งานได้จริงไม่พัง คือชั้นที่ประกอบขึ้นรอบโมเดล ไม่ใช่ตัวโมเดลอย่างเดียว
ถ้าอ่านมาถึงตรงนี้แล้วอยากรู้ว่าชั้นทั้งหมดมีอะไรบ้าง ตอนต่อไปคือแผนที่เต็ม 7 ชั้นที่แยก agent ระดับใช้งานจริงออกจาก demo เขียนไว้ให้ตามอ่านทีละชั้นได้ตามปัญหาที่คุณเจอ ไม่ต้องอ่านรวดเดียวทั้งหมด
อ่านต่อในซีรีส์
ภาพรวมทั้งหมด: สถาปัตยกรรม AI agent 7 ชั้นที่รอด production
ชั้นเครื่องมือกับทักษะ: skill ของ Claude คืออะไร
- เส้นแบ่ง demo กับ production และทั้ง 7 ชั้น มาจากงานจริงที่เราเขียนแยกเป็นตอน รวมไว้ที่ บทความสถาปัตยกรรม AI agent
- นิยาม agent ที่วางแผนและเรียกเครื่องมือเองหลายขั้น เทียบกับ workflow แบบขั้นตอนตายตัว: Anthropic, Building Effective Agents
- AGENTS.md มาตรฐานไฟล์กติกาสำหรับ agent: agents.md