- Chain-of-thought prompting hướng dẫn mô hình AI suy luận từng bước, giúp giải quyết các nhiệm vụ phức tạp chính xác hơn so với chỉ dự đoán từ tiếp theo.
- Nó phù hợp nhất cho các vấn đề nhiều bước, như toán học, câu đố logic hoặc quy trình tuần tự, nhưng không cần thiết cho các câu hỏi đơn giản hoặc một bước.
- Prompt chaining khác với chain-of-thought prompting ở chỗ nó chia nhỏ nhiệm vụ thành nhiều prompt riêng biệt, trong khi chain-of-thought giữ mọi thứ trong một luồng hỏi-đáp.
Nếu bạn từng dùng chatbot GPT như ChatGPT, hẳn bạn đã nhận thấy chất lượng phản hồi rất đa dạng.
Đôi khi nó trả về đúng thứ bạn cần. Nhưng cũng có lúc bạn nghi ngờ rằng sự 'thông minh' của AI chỉ là giả vờ.
Bạn có thể nâng cao hiệu quả sử dụng ChatGPT bằng cách cải thiện cách đặt câu lệnh. Phương pháp chain-of-thought khuyến khích tác nhân LLM suy luận từng bước trước khi tạo ra câu trả lời.
Các mô hình AI và tính năng mới đang bắt đầu tích hợp suy luận chuỗi trực tiếp, giúp mô hình tự động suy luận qua từng bước mà không cần nhắc nhở thêm.
Chain-of-thought prompting là gì?
Nhắc nhở suy luận chuỗi là một kỹ thuật xây dựng prompt trong AI, hướng dẫn mô hình phân tích các nhiệm vụ phức tạp bằng cách suy luận từng bước trước khi trả lời.
Bạn cũng có thể nghe đến thuật ngữ ‘suy luận chuỗi’. Đây là quá trình mà mô hình thực hiện từng bước để lý giải nhiệm vụ được giao.
Các mô hình OpenAI o1 không cần nhắc nhở theo chuỗi ý nghĩ, vì chúng đã có sẵn khả năng suy luận chuỗi ý nghĩ. Tuy nhiên, bạn vẫn có thể sử dụng nhắc nhở chuỗi ý nghĩ với bất kỳ chatbot nào dùng LLM.
Suy luận chuỗi hoạt động như thế nào?
Suy luận theo chuỗi ý nghĩ là việc chia nhỏ một vấn đề thành các bước logic nhỏ hơn để chatbot AI giải quyết tuần tự.
Đầu tiên, AI xác định các phần chính của vấn đề. Sau đó, nó xử lý từng phần theo trình tự, cân nhắc mối liên hệ giữa các bước. Mỗi bước dựa trên kết quả của bước trước, giúp AI tiến dần đến kết luận hợp lý.
Ví dụ về chain-of-thought prompting
Câu nhắc 'dâu tây' nổi tiếng
ChatGPT và các LLM khác đều có những điểm yếu đã được ghi nhận. Một trong số đó là không thể xác định chính xác có bao nhiêu chữ 'R' trong từ ‘strawberry’. (Có lẽ đây là lý do nổi tiếng đằng sau tên mã của các mô hình o1: Strawberry.)
ChatGPT-4o không sử dụng phương pháp suy luận theo chuỗi ý nghĩ. Thay vào đó, nó tham chiếu dữ liệu huấn luyện và tạo ra phản hồi dựa trên xác suất từ ngữ tiếp theo. Dù nghe có vẻ hợp lý phần lớn thời gian, thực chất nó chỉ đang bắt chước ngôn ngữ con người – chứ không phải suy luận hay nghiên cứu.
Khi bạn hỏi ChatGPT-4o câu hỏi nổi tiếng về quả dâu tây, nó không thể đưa ra câu trả lời đúng:

Tuy nhiên, bạn có thể sử dụng kỹ thuật nhắc chuỗi suy nghĩ để giúp chatbot sử dụng LLM đưa ra câu trả lời chính xác:

Phiên bản mới nhất của ChatGPT, được vận hành bởi OpenAI o1-preview, là LLM lớn đầu tiên sử dụng suy luận chuỗi mà không cần bất kỳ prompt bổ sung nào.
Nó giải đúng ngay lần đầu, vì đã được hướng dẫn tự động làm theo quy trình giống như prompt ChatGPT-4o thứ hai ở trên. Điểm khác biệt duy nhất là nó thực hiện quy trình này mà không cần nhắc nhở thêm.

Toán học
Nếu bạn hỏi một phiên bản ChatGPT cũ hơn một câu toán trong sách giáo khoa tiểu học, nó không phải lúc nào cũng trả lời đúng.
Các bài toán nhiều bước đòi hỏi phải suy luận, điều mà các LLM trước đây chưa làm được. Bạn có thể phân tích từng bước, nhưng nếu không biết các bước đúng, LLM cũng không giúp được.
ChatGPT-4o có thể suy luận ra đáp án cho câu hỏi bằng cách phân tích từng bước trong vấn đề:

AI Agents kết nối với Hubspot
Để thấy ứng dụng thực tế, hãy lấy ví dụ một tác nhân AI dùng LLM đã được tích hợp vào Hubspot. Nhóm bán hàng sử dụng tác nhân này để xử lý các khách hàng tiềm năng mới thu thập từ nhiều kênh.
Kịch bản
Một nhân viên bán hàng gửi một khách hàng tiềm năng mới cho AI agent và yêu cầu đăng ký vào Hubspot và gửi email tiếp cận đầu tiên, nhưng không điền nếu khách hàng đó làm việc tại công ty đã là khách hàng tiềm năng.

LLM không có lý luận chuỗi suy nghĩ
Agent AI sử dụng LLM ghi nhận khách hàng tiềm năng và gửi email mà không kiểm tra xem công ty đã là khách hàng tiềm năng chưa, bỏ qua điều kiện quan trọng.
LLM với suy luận theo chuỗi ý nghĩ
Tác nhân AI sử dụng LLM sẽ kiểm tra xem công ty đã là khách hàng tiềm năng chưa trước khi thực hiện hành động. Nếu đã là khách hàng tiềm năng, nó sẽ bỏ qua bước đăng ký và gửi email; nếu chưa, nó sẽ đăng ký lead và gửi email, làm đúng theo hướng dẫn của nhân viên kinh doanh.
Khi nào nên sử dụng chain of thought prompting?
Chuỗi gợi ý suy nghĩ phù hợp nhất trong các tình huống cần suy luận từng bước.
Những nhiệm vụ phù hợp nhất là các tác vụ cần suy luận logic, bài toán toán học, quy trình tuần tự, hoặc bất kỳ tình huống nào cần trả lời nhiều bước.
Nhưng khoan đã: lý luận nghe có vẻ tuyệt vời – tại sao không dùng nó mọi lúc?
Câu hỏi hay. Không phải tất cả các câu hỏi đều cần đến suy luận. Ví dụ:
- Các câu hỏi thực tế đơn giản, như ‘Thủ đô của Canada là gì?’
- Các bài toán một bước, như ‘145 + 37 là bao nhiêu?’
- Các nhiệm vụ tạo nội dung, như "Viết một email lịch sự gồm 3 câu hỏi đồng nghiệp liệu họ đã hoàn thành dự án của mình chưa."
Prompting thay đổi vs prompting chuỗi suy nghĩ
Dù tên gọi gần giống nhau, prompt chaining và chain-of-thought prompting là hai chiến lược nhắc nhở khác nhau để cải thiện kết quả tạo sinh của AI.
Nhắc nhở theo chuỗi suy nghĩ (Chain-of-thought prompting)
Với chain-of-thought prompting, người dùng hướng dẫn AI giải thích lý do đằng sau câu trả lời trong một phản hồi duy nhất. Điều này khiến AI trình bày từng bước giải quyết vấn đề, nhưng chỉ cần một lần hỏi và trả lời.
Ví dụ, một nhắc chuỗi suy nghĩ có thể thực hiện trong một tin nhắn:
"Một nhóm nhân sự cần xem xét 5 đánh giá hiệu suất nhân viên. Mỗi đánh giá mất 30 phút và cần 15 phút chuẩn bị trước. Đánh giá cấp cao cần thêm 10 phút mỗi cái. Tổng thời gian để hoàn thành 5 đánh giá cấp cao và 25 đánh giá cấp thấp là bao lâu? Hãy phân tích lý do từng bước."
Chuỗi lệnh nhắc
Với chuỗi nhắc, nhiệm vụ được chia thành các bước riêng biệt với nhiều nhắc, mỗi nhắc dựa trên kết quả trước đó. Điều này giúp cấu trúc và dẫn dắt AI qua một nhiệm vụ phức tạp có thể cần lý luận.
Nhắc đầu tiên có thể như sau:
Lệnh nhắc 1: Xác định những thách thức chính mà một công ty có thể gặp phải khi chuyển sang làm việc từ xa.
Kết quả:
- Khoảng cách giao tiếp
- Duy trì năng suất
- Hạ tầng công nghệ
- Gắn kết nhân viên
Các nhắc tiếp theo có thể đi sâu hơn vào các khái niệm này. Ví dụ:
Đề bài 2: Hãy cho tôi biết một công ty có thể tìm giải pháp cho các khoảng trống giao tiếp khi chuyển sang làm việc từ xa như thế nào.
Sau vòng kết quả tiếp theo, mắt xích tiếp theo có thể là:
Đề bài 3: Những thách thức phổ biến mà các công ty gặp phải khi áp dụng các giải pháp này là gì?
Vì vậy, dù hai kỹ thuật này tương tự, chúng tiếp cận khác nhau để khai thác nội dung chuyên sâu và phù hợp nhất từ các công cụ AI sinh.
Nhắc nhở theo chuỗi suy nghĩ trên Botpress
Người dùng Botpress đã quen với một tính năng sử dụng phương pháp suy luận chuỗi ý nghĩ.
Autonomous Node ra mắt vào tháng 7 năm 2024 trên Botpress, nền tảng xây dựng các tác nhân AI. Autonomous Node có khả năng tự động hóa quy trình nhiều bước và tự đưa ra quyết định.
Bạn có thể tạo một Autonomous Node và thiết lập mục tiêu chỉ với một dòng mô tả, ví dụ: 'Nhiệm vụ của bạn là tạo ra các khách hàng tiềm năng chất lượng. Tạo lead trong Salesforce khi người dùng thể hiện ý định mua hàng.'
Agent AI bạn xây dựng bằng Autonomous Node này sẽ thực hiện nhiều hành động khác nhau để đạt mục tiêu, độc lập với các quy trình do con người thiết kế. Nó cũng có thể chuyển đổi giữa các LLM khác nhau khi cần, tự quyết định ưu tiên tốc độ hay sức mạnh.
Xây dựng agent tự động tùy chỉnh
Botpress là nền tảng tác nhân AI duy nhất cho phép bạn xây dựng các tác nhân thực sự tự động.
Botpress Studio mở và linh hoạt cho phép ứng dụng đa dạng trong nhiều lĩnh vực, từ nhân sự đến tạo khách hàng tiềm năng. Thư viện tích hợp sẵn và hướng dẫn chi tiết giúp người dùng dễ dàng xây dựng tác nhân AI từ đầu.
Bắt đầu xây dựng ngay hôm nay. Miễn phí.
Hoặc liên hệ với đội ngũ kinh doanh của chúng tôi.
Câu hỏi thường gặp
1. Suy luận chuỗi ý nghĩ chỉ hữu ích cho mô hình AI, hay cũng phản ánh cách con người giải quyết vấn đề?
Nhắc nhở theo chuỗi suy nghĩ hữu ích cho cả mô hình AI lẫn con người, vì nó mô phỏng cách chúng ta giải quyết vấn đề phức tạp bằng cách suy luận từng bước.
2. Lý luận chuỗi suy nghĩ khác gì so với chỉ đơn giản “nghĩ từng bước một”?
Dù "nghĩ từng bước" là một cách tiếp cận chung, suy luận chuỗi là phương pháp có cấu trúc và chủ động hơn, khuyến khích mô hình AI trình bày rõ các bước suy luận trung gian thay vì nhảy ngay đến kết luận.
3. Tại sao một số LLM không mặc định sử dụng phương pháp suy luận theo chuỗi suy nghĩ?
Một số LLM, đặc biệt là các mô hình cũ hơn hoặc nhỏ hơn, không mặc định sử dụng phương pháp suy luận chuỗi vì chưa được tinh chỉnh để tạo ra các kết quả nhiều bước mà chỉ tập trung dự đoán đáp án dựa trên mẫu dữ liệu huấn luyện.
4. Liệu chain-of-thought prompting có phải là một dạng “huấn luyện” mô hình trong quá trình suy luận không?
Không, nhắc nhở theo chuỗi suy nghĩ không phải là một hình thức huấn luyện; nó không thay đổi trọng số hoặc kiến thức của mô hình. Thay vào đó, nó hướng dẫn hành vi đầu ra của mô hình trong quá trình suy luận bằng cách khuyến khích lập luận có cấu trúc thông qua prompt.
5. Liệu chain-of-thought prompting luôn cải thiện độ chính xác không?
Nhắc nhở theo chuỗi suy nghĩ không phải lúc nào cũng tăng độ chính xác. Nó thường hữu ích với các nhiệm vụ cần suy luận nhiều bước, nhưng với nhiệm vụ đơn giản thì có thể làm phức tạp hóa và giảm hiệu quả.





.webp)
