AI agent ต่างจาก chatbot อย่างไร

chatbot ตอบทีละคำถามแล้วจบในหนึ่งคำตอบ ส่วน agent รับเป้าหมายเดียวแล้วแตกเป็นหลายขั้น ทำเองต่อเนื่อง จำสิ่งที่ทำไปแล้ว และเรียกเครื่องมือมาลงมือกับงานจริง พูดสั้น ๆ chatbot ตอบ ส่วน agent ลงมือทำ

ChatGPT เป็น AI agent ไหม

ตอนถามตอบธรรมดา ChatGPT ทำงานเป็น chatbot คือตอบทีละคำถาม แต่เมื่อเปิดโหมดที่ให้มันวางแผนหลายขั้น เรียกเครื่องมือ และทำงานต่อเนื่องเอง มันก็ทำหน้าที่เป็น agent ได้ ตัวโมเดลเดียวกันเป็นได้ทั้งสองแบบ ขึ้นกับว่ารอบตัวมันมีชั้นอื่นประกอบอยู่หรือไม่

เริ่มสร้าง AI agent ต้องรู้อะไรบ้าง

เริ่มจากเข้าใจว่า agent ที่ใช้งานจริงไม่ได้มีแค่โมเดล แต่ประกอบจากหลายชั้น เช่น ความจำ เครื่องมือ รั้วความปลอดภัย และการพิสูจน์ผล สิ่งที่เห็นในคลิปสอนคือ demo ซึ่งเป็นแค่เสี้ยวเดียว ที่เหลือคือชั้นที่กันไม่ให้ agent ลืม กุเรื่อง หรือทำเกินสั่ง

AI Agent คืออะไร ต่างจาก Chatbot กับ ChatGPT ยังไง

Q: AI agent คืออะไร

AI agent คือโปรแกรม AI ที่รับเป้าหมายมาแล้ววางแผนและลงมือทำเองเป็นขั้น ๆ จนจบงาน ไม่ใช่แค่ตอบทีละคำถาม มันจำบริบทได้ เรียกใช้เครื่องมือจริงอย่างการอ่านไฟล์หรือยิง API ได้ และเดินงานต่อเองโดยไม่ต้องสั่งทุกขั้น

เวลามีคนบอกว่ากำลังใช้ AI agent อยู่ ลองถามต่อว่าใช้ยังไง ส่วนใหญ่จะเล่าว่าเปิด ChatGPT พิมพ์ถาม แล้วก็อปคำตอบไปวางในงาน นั่นเป็นการใช้ AI ที่ดีและมีประโยชน์จริง แต่มันคือ chatbot ยังไม่ใช่ agent และเส้นที่คั่นสองคำนี้ไม่ใช่เรื่องศัพท์เท่ ๆ มันเปลี่ยนวิธีที่คุณคิดกับงานทั้งงาน

เราเขียนบล็อกเรื่องการสร้าง AI agent มาสามสิบกว่าตอน แต่พอมีคนที่เพิ่งเริ่มจากการแชทมาอ่าน เขาสะดุดตั้งแต่คำแรก เพราะไม่เคยมีใครบอกก่อนว่า agent ต่างจากแชทตรงไหน บทความนี้คือจุดตั้งต้นนั้น อ่านจบแล้วคุณจะแยกออกว่าอะไรคือ chatbot อะไรคือ agent และรู้ว่าถ้าอยากขยับจากคนใช้ ไปเป็นคนสร้าง ต้องมองหาอะไรต่อ

ศัพท์ที่จะใช้ รวมไว้ตรงนี้ที่เดียว

chatbot โปรแกรมที่ตอบข้อความทีละคำถาม จบในหนึ่งคำตอบ เช่น ChatGPT ตอนถามตอบปกติ
AI agent AI ที่รับเป้าหมายมาแล้วทำเองหลายขั้น วางแผน เรียกเครื่องมือ ตรวจผล จนจบงาน
LLM โมเดลภาษาที่เป็นสมองของทั้ง chatbot และ agent เช่น Claude, GPT, Gemini
เครื่องมือ (tool) ช่องที่ให้ AI ทำอะไรกับโลกจริง เช่น อ่านไฟล์ ยิง API ส่งข้อความ
demo การรันโชว์ให้ดูจบในคลิป ตรงข้ามกับ production คือของที่ใช้งานจริงทุกวันแล้วต้องไม่พัง

ช่วงที่ 1chatbot ตอบ agent ลงมือ

ลองนึกภาพงานง่าย ๆ อย่าง "สรุปอีเมลที่ยังไม่ได้อ่านวันนี้ แล้วร่างตอบกลับอันที่ด่วน" ถ้าใช้ chatbot คุณต้องเป็นคนก็อปอีเมลทีละฉบับไปวาง อ่านคำตอบ แล้วก็อปกลับมาส่งเอง โมเดลตอบเก่ง แต่มือที่ขยับทุกขั้นคือมือคุณ

ส่วน agent รับเป้าหมายเดียวนั้นไปแล้วเดินเอง เปิดกล่องอีเมล อ่านที่ยังไม่ได้อ่าน คัดอันด่วน ร่างคำตอบ แล้วเอามาให้คุณเคาะก่อนส่ง ความต่างไม่ได้อยู่ที่โมเดลฉลากว่า มันอยู่ที่ใครเป็นคนเดินงาน chatbot รอคุณป้อนทีละขั้น agent รับเป้าหมายแล้วแตกขั้นเอง

นี่คือเหตุผลที่โมเดลตัวเดียวกันเป็นได้ทั้งสองแบบ ChatGPT ตอนถามตอบคือ chatbot แต่พอมันวางแผนหลายขั้น เรียกเครื่องมือ และทำต่อเนื่องเองได้ มันก็ทำหน้าที่เป็น agent ตัวโมเดลไม่เปลี่ยน สิ่งที่เปลี่ยนคือชั้นที่ห่อรอบมันอยู่

ช่วงที่ 2เส้นแบ่งสามข้อที่ทำให้เป็น agent

ถ้าอยากดูเร็ว ๆ ว่าสิ่งที่ตรงหน้าเป็น chatbot หรือ agent ให้ดูสามข้อนี้ ขาดข้อใดข้อหนึ่งมันก็ยังเป็นแค่แชทที่ฉลาด

ทำเองหลายขั้น รับเป้าหมายเดียวแล้วแตกเป็นขั้นย่อย ทำไล่ไปเองจนจบ ไม่ใช่รอคำสั่งใหม่ทุกครั้ง
จำสิ่งที่ทำไปแล้ว รู้ว่าเมื่อกี้ทำอะไรไปแล้ว ผลเป็นยังไง ไม่ใช่เริ่มจากศูนย์ทุกข้อความ
ลงมือกับของจริงผ่านเครื่องมือ ไม่ได้แค่พิมพ์ข้อความตอบ แต่เปิดไฟล์ ยิง API ส่งข้อความได้จริง

	chatbot	AI agent
จำนวนขั้นต่อคำสั่ง	หนึ่งขั้น ถาม-ตอบ	หลายขั้น วางแผนเอง
ความจำ	ลืมเมื่อปิดหน้าต่าง	จำบริบทข้ามขั้นได้
ลงมือกับงานจริง	แค่ให้ข้อความ	ใช้เครื่องมือทำเอง
ใครเดินงาน	คุณป้อนทุกขั้น	agent เดินเอง คุณคุมทิศ

สังเกตว่าทั้งสามข้อไม่ได้พูดถึงว่าโมเดลไหนเก่งกว่ากันเลย เพราะความเป็น agent ไม่ได้อยู่ที่โมเดล มันอยู่ที่สิ่งที่เราสร้างห่อรอบโมเดลไว้

ช่วงที่ 3ทำไม demo ในคลิปถึงยังไม่ใช่ของจริง

พอเข้าใจว่า agent เดินงานเองได้ คนมักไปเห็นคลิปที่พิมพ์ประโยคเดียวแล้ว AI สร้างเว็บทั้งเว็บให้ดูจบใน 3 นาที แล้วคิดว่าของจริงก็ง่ายแบบนั้น ตรงนี้คือจุดที่ต้องระวัง สิ่งที่เห็นในคลิปคือ demo และ demo คือส่วนที่ง่ายที่สุด ใคร ๆ ก็ทำได้

เพราะ demo สมมติว่าทุกอย่างเป็นไปตามแผน ถามครั้งเดียว ตอบครั้งเดียว จบในคลิป แต่พอเอา agent ตัวเดียวกันไปรันจริงทุกวัน มันเริ่มลืมสิ่งที่เพิ่งทำไปเมื่อวาน เริ่มเติมข้อมูลที่ไม่มีใครบอกแล้วพูดออกมาอย่างมั่นใจ เริ่มลงมือทำสิ่งที่ไม่ควรทำ พอเปิดสองงานพร้อมกันก็ทำงานทับกันเอง

ระยะจาก demo ที่รันโชว์สนุก ไปถึง agent ที่ใช้งานจริงแล้วไม่พัง คือระยะที่งานส่วนใหญ่ซ่อนอยู่ และมันคือเหตุผลที่บล็อกนี้มีตั้งสามสิบกว่าตอน

ช่วงที่ 4"ชั้น" ที่ทำให้ agent ไม่พัง

ทุกอาการที่เล่าไปเมื่อกี้ ลืม กุเรื่อง ทำเกินสั่ง ทำงานทับกัน แต่ละอย่างแก้ด้วยส่วนประกอบคนละชิ้น เราเรียกส่วนประกอบพวกนี้ว่า ชั้น เพราะมันวางซ้อนกันเหมือนชั้นของตึก แต่ละชั้นรับหน้าที่คนละอย่าง

ตัวอย่างให้เห็นภาพ ชั้นความจำกันไม่ให้มันลืม ชั้นรั้วกันไม่ให้มันทำเกินขอบเขตหรือทำข้อมูลรั่ว ชั้นการพิสูจน์ผลกันไม่ให้มันบอกว่า "เสร็จแล้ว" ทั้งที่ยังผิด ขาดชั้นไหนไป agent ก็พังในแบบของชั้นนั้น ไม่ใช่พังมั่ว ๆ

คุณไม่ต้องสร้างครบทุกชั้นตั้งแต่วันแรก และไม่ต้องจำชื่อทุกชั้นตอนนี้ ขอแค่รู้ว่า agent ที่ใช้งานจริงคือโมเดลบวกกับชั้นพวกนี้ ไม่ใช่โมเดลเปล่า ๆ แค่เข้าใจตรงนี้ คุณก็มองคลิป demo ออกแล้วว่ามันโชว์แค่ชั้นบนสุด

สรุปอยากขยับจากคนใช้ ไปเป็นคนสร้าง เริ่มตรงไหน

ทวนสั้น ๆ chatbot ตอบทีละคำถาม agent รับเป้าหมายแล้วเดินเองหลายขั้น จำได้ และลงมือกับงานจริงผ่านเครื่องมือ ส่วนสิ่งที่ทำให้ agent ใช้งานได้จริงไม่พัง คือชั้นที่ประกอบขึ้นรอบโมเดล ไม่ใช่ตัวโมเดลอย่างเดียว

ถ้าอ่านมาถึงตรงนี้แล้วอยากรู้ว่าชั้นทั้งหมดมีอะไรบ้าง ตอนต่อไปคือแผนที่เต็ม 7 ชั้นที่แยก agent ระดับใช้งานจริงออกจาก demo เขียนไว้ให้ตามอ่านทีละชั้นได้ตามปัญหาที่คุณเจอ ไม่ต้องอ่านรวดเดียวทั้งหมด

อ่านต่อในซีรีส์
ภาพรวมทั้งหมด: สถาปัตยกรรม AI agent 7 ชั้นที่รอด production
ชั้นเครื่องมือกับทักษะ: skill ของ Claude คืออะไร

ที่มาและอ้างอิง

เส้นแบ่ง demo กับ production และทั้ง 7 ชั้น มาจากงานจริงที่เราเขียนแยกเป็นตอน รวมไว้ที่ บทความสถาปัตยกรรม AI agent
นิยาม agent ที่วางแผนและเรียกเครื่องมือเองหลายขั้น เทียบกับ workflow แบบขั้นตอนตายตัว: Anthropic, Building Effective Agents
AGENTS.md มาตรฐานไฟล์กติกาสำหรับ agent: agents.md

AI agent คืออะไร ต่างจากแชทที่คุณใช้อยู่ยังไง

ช่วงที่ 1chatbot ตอบ agent ลงมือ

ช่วงที่ 2เส้นแบ่งสามข้อที่ทำให้เป็น agent

ช่วงที่ 3ทำไม demo ในคลิปถึงยังไม่ใช่ของจริง

ช่วงที่ 4"ชั้น" ที่ทำให้ agent ไม่พัง

สรุปอยากขยับจากคนใช้ ไปเป็นคนสร้าง เริ่มตรงไหน

รับบทความใหม่และของฟรีก่อนใคร

ร่วมพูดคุย