- OpenAI o1 là dòng mô hình mới (bắt đầu với o1-preview và o1-mini) tập trung vào suy luận thời gian thực, không chỉ đơn thuần là huấn luyện trước.
- o1 vượt trội hơn GPT-4o ở các nhiệm vụ STEM, đạt 83% trong vòng loại IMO so với 13% của GPT-4o, và xếp ở phân vị thứ 89 trên Codeforces.
- o1 sử dụng suy luận chuỗi ý nghĩ một cách tự nhiên, khiến nó chậm hơn nhưng chính xác hơn nhiều ở các nhiệm vụ phức tạp.
- o1 khó bị vượt rào hơn nhiều, đạt 84/100 trong các bài kiểm tra an toàn đối kháng so với 22 của GPT-4o.
Sau nhiều tháng đồn đoán từ cộng đồng ChatGPT, bản phát hành LLM Strawberry mới nhất của OpenAI đã ra mắt – và nó không có tên là GPT-5.
Trước đây được gọi bằng những mật danh bí ẩn như Q* và Strawberry, dòng mô hình mới nhất cuối cùng đã được đặt tên là OpenAI o1.
Cập nhật lớn nhất ở mô hình mới của OpenAI là khả năng suy luận được nâng cao. OpenAI giải thích rằng o1 đã được huấn luyện để dành nhiều thời gian suy nghĩ hơn các mô hình trước, đưa nó tiến gần hơn đến trí thông minh con người.
OpenAI o1 là gì?
OpenAI o1 là dòng mô hình ngôn ngữ lớn mới nhất được OpenAI phát hành vào ngày 12 tháng 9 năm 2024, hiện gồm hai mô hình: o1-preview và o1-mini.
Khác biệt lớn nhất giữa o1 và các mô hình trước của công ty là khả năng suy luận vượt trội. Dù chưa phát hành đầy đủ, các bản preview và mini đã vượt xa GPT-4o trong các bài kiểm tra toán, khoa học và lập trình.
Các mô hình OpenAI o1
Bản phát hành tháng 9 gồm hai mô hình, o1-preview và o1-mini. Đây là những mô hình đầu tiên trong loạt sản phẩm sẽ tiếp tục được ra mắt khi OpenAI hoàn thiện LLM mới của mình.
Khác biệt là gì? o1-mini nhỏ hơn và rẻ hơn bản preview 80%. Nó được thiết kế cho các nhiệm vụ cần suy luận nâng cao, nhưng không đòi hỏi kiến thức rộng. Rất phù hợp cho các tác vụ liên quan đến lập trình hoặc toán học.
OpenAI o1 thông minh đến mức nào?
OpenAI đã công bố một loạt các chuẩn đánh giá STEM để thể hiện khả năng suy luận của o1, bao gồm:
- Hiệu suất tương đương với nghiên cứu sinh tiến sĩ trong các bài kiểm tra vật lý, hóa học và sinh học.
- Nằm trong top 500 thí sinh tại vòng loại Olympic Toán học Hoa Kỳ.
- Xếp ở phân vị thứ 89 trên Codeforces, một bài kiểm tra lập trình cạnh tranh.
Bạn có thể đọc thêm về khả năng suy luận của o1 trong báo cáo nghiên cứu của OpenAI.
Lý luận chuỗi suy nghĩ là gì?
Các mô hình o1 sử dụng suy luận chuỗi ý nghĩ, một cách phân tích yêu cầu dài hơn và kỹ lưỡng hơn.
Nếu mô hình o1 nhận được một đề bài, nó sẽ không trả lời ngay – vì vậy thời gian chờ sẽ lâu hơn. Thay vào đó, nó sẽ suy nghĩ qua từng bước, cân nhắc kỹ từng thông tin và tác động của chúng trước khi quyết định bước tiếp theo. Nó chỉ đưa ra câu trả lời sau khi đã suy nghĩ hết toàn bộ các bước cần thiết.
o1 khác gì so với GPT-4o?
1) Khả năng suy luận
Trọng tâm của trí thông minh tổng quát là khả năng suy luận mới của o1. “Có lẽ tiến bộ quan trọng nhất sẽ nằm ở khả năng suy luận,” Altman chia sẻ với Gates. “Hiện tại, GPT-4 chỉ có thể suy luận ở mức rất hạn chế.”
Suy luận vốn rất khó, ngay cả với con người. Và OpenAI o1 là mô hình đầu tiên tuyên bố làm được điều này.
Các mô hình o1 có thể suy luận theo thời gian thực, thay vì chỉ dựa vào dữ liệu huấn luyện trước. Đó là lý do mô hình mới này làm tốt hơn ở các nhiệm vụ khoa học, toán học và lập trình so với các mô hình trước của OpenAI.
2) Khó vượt rào hơn
Khi các LLM ngày càng phổ biến và mạnh mẽ, vấn đề an toàn trở thành trọng tâm phát triển của OpenAI. Công ty đã hợp tác với Viện An toàn AI của Mỹ và Anh trong quá trình phát triển dòng o1, cũng như phối hợp với chính phủ Mỹ để đảm bảo quy trình kiểm tra nghiêm ngặt.
Là một bước tiến lớn, dòng o1 khó bị jailbreak – tức là vượt qua các biện pháp an toàn – hơn các mô hình trước.
Trong một trong những bài kiểm tra vượt rào khó nhất, o1-preview đạt 84/100 điểm, trong khi GPT-4o chỉ đạt 22 điểm.
3) Quy ước đặt tên mới
Dù tên gọi không phải là điểm thú vị nhất của LLM mới từ OpenAI, nhưng đây là thay đổi có chủ đích và mang ý nghĩa.
OpenAI o1 là mô hình đầu tiên bỏ tên 'GPT', vì công ty cho rằng đây là giai đoạn đầu của một 'kỷ nguyên suy luận' mới, trong khi các mô hình trước thuộc về 'kỷ nguyên huấn luyện trước'.
Mô hình mới dành thời gian suy luận theo thời gian thực, thay vì chỉ dựa vào dữ liệu huấn luyện trước.
4) Giải quyết vấn đề STEM tốt hơn
Khả năng suy luận tốt hơn đồng nghĩa với kỹ năng toán học tốt hơn.
Cả o1 và GPT-4o đều được yêu cầu làm bài thi vòng loại Olympic Toán học Quốc tế. GPT-4o giải được 13% bài, còn o1 giải được 83%.
5) Thời gian chờ lâu hơn
Suy luận theo thời gian thực mất nhiều thời gian hơn so với chỉ tham chiếu dữ liệu huấn luyện và tạo phản hồi. Nếu bạn hỏi OpenAI o1-preview so với các mô hình khác, bạn sẽ phải chờ lâu hơn đáng kể.
Tuy nhiên, với khả năng thực hiện suy luận bên ngoài, đây là cái giá nhỏ phải trả. Tốc độ của các mô hình o1 có thể sẽ được cải thiện khi các mô hình tiếp theo trong dòng này ra mắt.
Ai có thể sử dụng o1?
Từ ngày 12 tháng 9, người dùng ChatGPT Plus và Team đã có thể truy cập các mô hình o1 trong ChatGPT.
OpenAI thông báo sẽ cung cấp o1-mini cho người dùng miễn phí, nhưng chưa xác định ngày cụ thể.
Hiện tại, giới hạn tin nhắn hàng tuần là 30 cho o1-preview và 50 cho o1-mini, nhưng sẽ sớm được tăng lên.
Nên dùng o1 cho việc gì?
Khả năng suy luận nâng cao của o1 đặc biệt hữu ích để giải quyết các vấn đề phức tạp về toán học, khoa học và lập trình. Như OpenAI giải thích:
Hạn chế của OpenAI o1
Vì là bản preview, mô hình này chưa có đầy đủ tính năng như GPT-4o. Nếu bạn muốn dùng LLM để duyệt web lấy thông tin, hoặc tải lên tệp hay hình ảnh, bạn nên tiếp tục dùng GPT-4o cho đến khi các phiên bản sau của o1 được phát hành.
Cách đặt lệnh cho OpenAI o1
Các gợi ý đặt lệnh của OpenAI đã thay đổi cho o1 so với các mô hình trước, do khả năng suy luận nâng cao.
Giữ cho lệnh của bạn đơn giản. Đây là mô hình thông minh, không cần nhiều hướng dẫn như dòng GPT-4. Nghĩa là bạn nên tránh nhập chuỗi ý nghĩ – mô hình đã tự suy luận bên trong rồi.
Xây dựng AI agent sử dụng GPT
Điều gì sẽ xảy ra nếu AI agent của bạn tự động đồng bộ với mọi cập nhật từ OpenAI?
Botpress là nền tảng AI agent hoàn toàn mở và có thể mở rộng. Bộ công cụ của chúng tôi cho phép lập trình viên xây dựng chatbot và AI agent với bất kỳ tính năng nào, cho mọi quy trình công việc.
Nền tảng duy nhất cho phép thiết lập từ ít mã đến khả năng tùy biến và mở rộng không giới hạn, Botpress giúp bạn tự động tận dụng sức mạnh của phiên bản GPT mới nhất cho chatbot – không cần tốn công sức.
Bắt đầu xây dựng ngay hôm nay. Miễn phí.
Câu hỏi thường gặp
1. “o1” có ý nghĩa gì? Có quy tắc đặt tên cho các mô hình tương lai (ví dụ: o2, o3) không?
Tên “o1” có thể là viết tắt của “OpenAI 1”, đánh dấu sự khởi đầu của một dòng mô hình mới. Dựa vào đó, có thể kỳ vọng các phiên bản tiếp theo sẽ được đặt tên tuần tự như “o2”, “o3”, v.v.
2. Vì sao OpenAI không còn dùng quy ước đặt tên “GPT”?
OpenAI chuyển từ quy ước đặt tên “GPT” sang “o1” để thể hiện sự thay đổi trọng tâm – từ các mô hình ngôn ngữ huấn luyện trước sang các mô hình tối ưu hóa cho suy luận thời gian thực và khả năng tương tác.
3. OpenAI o1 có phải là bản kế nhiệm của GPT-4 hay là một dòng sản phẩm hoàn toàn mới?
OpenAI o1 không phải là bản kế nhiệm trực tiếp của GPT-4 mà là khởi đầu cho một dòng sản phẩm mới tập trung vào suy luận thời gian thực và hiệu quả, dù vẫn dựa trên những tiến bộ từ GPT-4 và GPT-4o.
4. o1 có xử lý đầu vào đa ngôn ngữ tốt hơn GPT-4 không?
OpenAI chưa công bố chính thức về khả năng đa ngôn ngữ của o1 so với GPT-4, nhưng vì o1 được tối ưu hóa cho suy luận và các tính năng mới, các phiên bản sau có thể sẽ xử lý đa ngôn ngữ hiệu quả hơn nữa.
5. Khi nào o1 sẽ được cung cấp cho người dùng miễn phí?
OpenAI đã xác nhận rằng một phiên bản có tên “o1-mini” sẽ được phát hành cho người dùng miễn phí, nhưng hiện tại vẫn chưa có ngày công bố chính thức về thời điểm phát hành rộng rãi.





.webp)
