- OpenAI o1 คือชุดโมเดลใหม่ (เริ่มต้นด้วย o1-preview และ o1-mini) ที่เน้นการให้เหตุผลแบบเรียลไทม์ ไม่ใช่แค่การฝึกฝนล่วงหน้า
- o1 ทำผลงานได้ดีกว่า GPT-4o ในงาน STEM โดยได้คะแนน 83% ในการคัดเลือก IMO เทียบกับ 13% ของ GPT-4o และอยู่ในเปอร์เซ็นไทล์ที่ 89 ใน Codeforces
- o1 ใช้การให้เหตุผลแบบ chain-of-thought โดยตรง ทำให้ช้ากว่าแต่แม่นยำกว่ามากในงานที่ซับซ้อน
- o1 ถูกเจาะระบบได้ยากกว่ามาก โดยได้คะแนน 84/100 ในการทดสอบความปลอดภัยเชิงรุก เทียบกับ 22 ของ GPT-4o
หลังจากแฟน ๆ ChatGPT คาดเดากันมาหลายเดือน ในที่สุด OpenAI ก็ปล่อย LLM รุ่น Strawberry ออกมา – และมันไม่ได้ชื่อว่า GPT-5
ก่อนหน้านี้ถูกเรียกด้วยโค้ดเนมลึกลับอย่าง Q* และ Strawberry ตอนนี้โมเดลชุดใหม่ได้ชื่ออย่างเป็นทางการว่า OpenAI o1
การอัปเดตที่สำคัญที่สุดของโมเดลใหม่นี้คือทักษะการให้เหตุผลที่ดีขึ้น OpenAI อธิบายว่า o1 ได้รับการฝึกให้ใช้เวลาคิดมากกว่าเดิม ทำให้เข้าใกล้ความฉลาดของมนุษย์มากขึ้น
OpenAI o1 คืออะไร?
OpenAI o1 คือชุดโมเดลภาษาใหญ่ล่าสุดที่ OpenAI เปิดตัวเมื่อ 12 กันยายน 2024 โดยปัจจุบันมีสองรุ่นคือ o1-preview และ o1-mini
ความแตกต่างที่ใหญ่ที่สุดระหว่าง o1 กับโมเดลก่อนหน้าคือความสามารถในการให้เหตุผลขั้นสูง แม้จะยังไม่เปิดตัวเต็มรูปแบบ แต่ทั้งรุ่น preview และ mini ก็ทำคะแนนทิ้งห่าง GPT-4o ในการทดสอบคณิต วิทยาศาสตร์ และโค้ดดิ้ง
โมเดล OpenAI o1
การเปิดตัวในเดือนกันยายนประกอบด้วยสองรุ่น คือ o1-preview และ o1-mini ซึ่งเป็นจุดเริ่มต้นของชุดโมเดลใหม่ที่ OpenAI จะพัฒนาต่อไป
ความแตกต่างคือ o1-mini มีขนาดเล็กกว่าและราคาถูกกว่ารุ่น preview ถึง 80% มันถูกออกแบบมาสำหรับงานที่ต้องใช้เหตุผลขั้นสูงแต่ไม่ต้องการความรู้รอบด้าน เหมาะอย่างยิ่งสำหรับงานที่เกี่ยวกับโค้ดดิ้งหรือคณิตศาสตร์
OpenAI o1 ฉลาดแค่ไหน?
OpenAI ได้แสดงรายการตัวชี้วัดด้าน STEM ที่โชว์ความสามารถในการให้เหตุผลของ o1 เช่น:
- ทำคะแนนได้ใกล้เคียงกับนักศึกษาปริญญาเอกในการทดสอบมาตรฐานด้านฟิสิกส์ เคมี และชีววิทยา
- ติดอันดับ 500 อันดับแรกในการคัดเลือกแข่งขันคณิตศาสตร์โอลิมปิกของสหรัฐฯ
- อยู่ในเปอร์เซ็นไทล์ที่ 89 ใน Codeforces ซึ่งเป็นการทดสอบโค้ดดิ้งเชิงแข่งขัน
อ่านเพิ่มเติมเกี่ยวกับความสามารถในการให้เหตุผลของ o1 ได้ใน งานวิจัยของ OpenAI
การใช้เหตุผลแบบ chain of thought คืออะไร?
โมเดล o1 ใช้ chain of thought reasoning ซึ่งเป็นวิธีแยกวิเคราะห์คำขออย่างละเอียดและเป็นขั้นตอน
เมื่อโมเดล o1 ได้รับคำสั่ง มันจะไม่ตอบทันที – จึงต้องรอนานขึ้น แต่จะไล่คิดทีละขั้นตอน พิจารณาข้อมูลและผลกระทบแต่ละส่วนอย่างรอบคอบก่อนตัดสินใจตอบ จะไม่ให้คำตอบจนกว่าจะคิดครบทุกขั้นตอนที่จำเป็น
o1 แตกต่างจาก GPT-4o อย่างไร?
1) ความสามารถในการให้เหตุผล
หัวใจของความฉลาดทั่วไปคือความสามารถในการให้เหตุผลแบบใหม่ของ o1 “บางทีความก้าวหน้าที่สำคัญที่สุดจะอยู่ที่ความสามารถในการให้เหตุผล” Altman กล่าวกับ Gates “ตอนนี้ GPT-4 ให้เหตุผลได้จำกัดมาก”
การให้เหตุผลเป็นเรื่องยาก แม้แต่กับมนุษย์ และ OpenAI o1 เป็นโมเดลแรกที่อ้างว่าทำได้
โมเดล o1 สามารถให้เหตุผลแบบเรียลไทม์ ไม่ได้อาศัยข้อมูลฝึกฝนล่วงหน้า จึงเก่งกว่างานวิทยาศาสตร์ คณิตศาสตร์ และโค้ดดิ้งมากกว่าโมเดลก่อนหน้า
2) เจาะระบบได้ยากขึ้น
เมื่อความกังวลเรื่องความปลอดภัยเพิ่มขึ้นตามความนิยมและศักยภาพของ LLMs OpenAI จึงให้ความสำคัญกับความปลอดภัยในการพัฒนา o1 โดยร่วมมือกับสถาบัน AI Safety ของสหรัฐฯ และสหราชอาณาจักร รวมถึงรัฐบาลอเมริกันในการตรวจสอบความรอบคอบ
o1 เป็นก้าวสำคัญที่ทำให้การเจาะระบบ – หรือการข้ามมาตรการความปลอดภัย – ทำได้ยากกว่ารุ่นก่อนมาก
ในการทดสอบเจาะระบบที่ยากที่สุด o1-preview ได้คะแนน 84 จาก 100 ขณะที่ GPT-4o ได้เพียง 22
3) ระบบการตั้งชื่อใหม่
แม้ชื่อจะไม่ใช่สิ่งที่น่าตื่นเต้นที่สุดของ LLM ตัวใหม่ แต่ก็เป็นการเปลี่ยนแปลงที่มีความหมายโดยตั้งใจ
OpenAI o1 เป็นโมเดลแรกที่เลิกใช้ชื่อ 'GPT' เพราะบริษัทระบุว่านี่คือจุดเริ่มต้นของ 'ยุคใหม่แห่งการให้เหตุผล' ขณะที่รุ่นก่อนเป็น 'ยุคของการฝึกฝนล่วงหน้า'
โมเดลใหม่นี้ใช้เวลาในการให้เหตุผลแบบเรียลไทม์ แทนที่จะอาศัยข้อมูลฝึกฝนล่วงหน้า
4) เก่งงานแก้ปัญหา STEM มากขึ้น
เมื่อให้เหตุผลดีขึ้น ทักษะคณิตศาสตร์ก็ยิ่งดีขึ้นตาม
ทั้ง o1 และ GPT-4o ถูกทดสอบด้วยข้อสอบคัดเลือกโอลิมปิกคณิตศาสตร์นานาชาติ GPT-4o ทำได้ 13% ขณะที่ o1 ทำได้ 83%
5) เวลารอนานขึ้น
การให้เหตุผลแบบเรียลไทม์ใช้เวลานานกว่าการอ้างอิงข้อมูลฝึกฝนและสร้างคำตอบ หากถาม o1-preview เทียบกับรุ่นอื่น ๆ จะต้องรอนานกว่ามาก
อย่างไรก็ตาม เมื่อสามารถให้โมเดลช่วยในการให้เหตุผลได้ ก็ถือว่าเป็นราคาที่คุ้มค่า และความเร็วของ o1 น่าจะดีขึ้นเมื่อมีรุ่นถัดไปออกมา
ใครใช้ o1 ได้บ้าง?
ตั้งแต่ 12 กันยายน ผู้ใช้ ChatGPT Plus และ Team สามารถเข้าถึงโมเดล o1 ใน ChatGPT ได้แล้ว
OpenAI ประกาศว่าจะเปิดให้ผู้ใช้ฟรีใช้ o1-mini ด้วย แต่ยังไม่ระบุวันแน่ชัด
ขณะนี้มีการจำกัดการใช้งานรายสัปดาห์ที่ 30 ข้อความสำหรับ o1-preview และ 50 ข้อความสำหรับ o1-mini โดยจะเพิ่มขึ้นในเร็ว ๆ นี้
ควรใช้ o1 กับอะไร?
ความสามารถในการให้เหตุผลขั้นสูงของ o1 มีประโยชน์อย่างยิ่งสำหรับการแก้ปัญหาซับซ้อนในคณิตศาสตร์ วิทยาศาสตร์ และโค้ดดิ้ง ตามที่ OpenAI อธิบาย:
ข้อจำกัดของ OpenAI o1
เนื่องจากยังเป็นรุ่นพรีวิว โมเดลนี้ยังไม่มีความสามารถเท่า GPT-4o หากต้องการใช้ LLM เพื่อค้นหาข้อมูลบนเว็บ หรืออัปโหลดไฟล์หรือรูปภาพ ยังต้องใช้ GPT-4o จนกว่า o1 รุ่นถัดไปจะเปิดตัว
วิธีตั้งคำสั่งให้ OpenAI o1
คำแนะนำในการตั้งคำสั่งของ OpenAI สำหรับ o1 เปลี่ยนไปจากรุ่นก่อนหน้า เพราะความสามารถในการให้เหตุผลที่ดีขึ้น
ตั้งคำสั่งให้เรียบง่าย โมเดลนี้ฉลาดและไม่ต้องการคำแนะนำมากเท่าซีรีส์ GPT-4 ดังนั้นควรหลีกเลี่ยงการใส่ chain of thought ในคำสั่ง – เพราะโมเดลคิดเองอยู่แล้ว
สร้างเอเจนต์ AI ด้วย GPT
ถ้าเอเจนต์ AI ของคุณซิงค์กับทุกอัปเดตของ OpenAI โดยอัตโนมัติล่ะ?
Botpress คือแพลตฟอร์มเอเจนต์ AI ที่เปิดกว้างและขยายได้เต็มที่ สแต็กของเราช่วยให้นักพัฒนาสร้างแชทบอทและเอเจนต์ AI ได้ทุกความสามารถ ครอบคลุมทุกเวิร์กโฟลว์
นี่คือแพลตฟอร์มเดียวที่เริ่มต้นได้ด้วย low code และขยายความสามารถได้ไม่จำกัด Botpress ช่วยให้คุณใช้ GPT เวอร์ชันล่าสุดกับแชทบอทของคุณได้ทันทีโดยไม่ต้องทำอะไรเพิ่ม
คำถามที่พบบ่อย
1. “o1” ย่อมาจากอะไร? มีตรรกะการตั้งชื่อสำหรับรุ่นต่อไป (เช่น o2, o3) หรือไม่?
ชื่อ “o1” น่าจะย่อมาจาก “OpenAI 1” เพื่อแสดงถึงการเริ่มต้นของตระกูลโมเดลใหม่ ดังนั้นจึงคาดได้ว่ารุ่นถัดไปจะใช้ชื่อเรียงลำดับ เช่น “o2”, “o3” เป็นต้น
2. ทำไม OpenAI ถึงเลิกใช้ชื่อ “GPT”?
OpenAI เปลี่ยนจากชื่อ “GPT” มาเป็น “o1” เพื่อสื่อถึงการเปลี่ยนโฟกัส – จากโมเดลภาษาทั่วไปที่ฝึกฝนล่วงหน้า ไปสู่โมเดลที่เหมาะกับการให้เหตุผลแบบเรียลไทม์และการโต้ตอบมากขึ้น
3. OpenAI o1 เป็นรุ่นต่อจาก GPT-4 หรือเป็นสายผลิตภัณฑ์ใหม่ทั้งหมด?
OpenAI o1 ไม่ใช่รุ่นต่อจาก GPT-4 โดยตรง แต่เป็นจุดเริ่มต้นของสายผลิตภัณฑ์ใหม่ที่ออกแบบมาเพื่อการให้เหตุผลแบบเรียลไทม์และประสิทธิภาพ แม้จะต่อยอดจากความก้าวหน้าของ GPT-4 และ GPT-4o
4. o1 รับอินพุตหลายภาษาได้ดีกว่า GPT-4 หรือไม่?
OpenAI ยังไม่ได้ประกาศอย่างเป็นทางการว่า o1 ดีกว่า GPT-4 ในการรองรับหลายภาษาเพียงใด แต่เนื่องจาก o1 ถูกออกแบบมาเพื่อการให้เหตุผลและความสามารถใหม่ ๆ จึงเป็นไปได้ว่ารุ่นถัดไปจะรองรับหลายภาษาได้ดีขึ้น
5. เมื่อไร o1 จะเปิดให้ผู้ใช้ฟรีใช้งานได้ทั่วไป?
OpenAI ได้ยืนยันแล้วว่าจะมีเวอร์ชันที่ชื่อว่า “o1-mini” เปิดให้ผู้ใช้แบบฟรีใช้งาน แต่ขณะนี้ยังไม่มีการประกาศวันเปิดให้ใช้งานอย่างเป็นทางการ





.webp)
