- GPT-4o أسرع مرتين ويكلف نصف السعر مقارنةً بـ GPT-4 Turbo، مما يخفض بشكل كبير الأسعار ويسرّع أوقات الاستجابة لروبوتات الدردشة الذكية.
- يتيح النموذج الجديد إمكانيات متعددة الوسائط متقدمة، بما في ذلك الصوت والفيديو والترجمة الفورية والرؤية، ما يفتح آفاقاً جديدة لاستخدامات مبتكرة لروبوتات الدردشة تتجاوز النص فقط.
- التحسينات في كفاءة الترميز، خاصة للغات غير اللاتينية، تعني توفيراً كبيراً في التكاليف عند نشر روبوتات الدردشة على مستوى العالم.
- تحسينات السرعة تعزز تجربة المستخدم بشكل مباشر، حيث تقلل من أوقات الانتظار التي غالباً ما تزعج مستخدمي روبوتات الدردشة.
ضعف السرعة ونصف التكلفة – ماذا يعني GPT-4o لروبوتات الدردشة الذكية؟
بعد إعلانهم الغامض، أطلقت OpenAI أحدث إصدار من نموذجها الرئيسي: GPT-4o.
لم يحصل النموذج الجديد فقط على تحديثات لافتة في القدرات متعددة الوسائط، بل أصبح أسرع وأرخص من GPT-4 Turbo. وبينما تركز وسائل الإعلام على إمكانيات الفيديو والصوت الجديدة لنموذج ChatGPT الرئيسي، فإن التكلفة والسرعة الجديدتين لهما تأثير كبير أيضاً على من يستخدم GPT لتشغيل تطبيقاتهم.

قال باتريك هاميلين، قائد فريق هندسة البرمجيات في Botpress: "توفر 4o له القدرة على تحسين تجربة البناء والاستخدام بشكل كبير. التأثير أوسع مما نتصور."
فلنستعرض كيف سيغير النموذج الجديد عالم روبوتات الدردشة الذكية.
قدرات النموذج
يأتي النموذج الرئيسي الجديد مع قائمة مثيرة من التحديثات والميزات الجديدة: قدرات صوت وفيديو محسنة، ترجمة فورية، قدرات لغوية طبيعية أكثر. يمكنه تحليل الصور، وفهم مجموعة أوسع من المدخلات الصوتية، وتقديم المساعدة في التلخيص، وتسهيل الترجمة الفورية، وإنشاء الرسوم البيانية. يمكن للمستخدمين رفع ملفات وإجراء محادثة صوتية مباشرة. كما يتوفر أيضاً كتطبيق سطح مكتب.
في سلسلة فيديوهات الإطلاق، استعرض موظفو OpenAI (وشركاؤهم مثل سلمان خان من أكاديمية خان) النسخة الأحدث من GPT وهي تجهز مستخدماً لمقابلة عمل، وتغني، وتتعرف على المشاعر البشرية من تعابير الوجه، وتحل معادلات رياضية مكتوبة، وتتفاعل حتى مع نموذج ChatGPT-4o آخر.
أظهر الإطلاق واقعاً جديداً حيث أصبح بإمكان نموذج الذكاء الاصطناعي تحليل ما هو مكتوب في دفتر طفلك والرد عليه. يمكنه شرح مفهوم جمع الكسور لأول مرة، وتغيير الأسلوب والاستراتيجية بناءً على فهم الطفل – يمكن أن يتجاوز دور روبوت الدردشة ليصبح معلماً شخصياً.

ماذا يعني GPT-4o لروبوتات الدردشة المعتمدة على النماذج اللغوية الكبيرة؟
تحصل روبوتات الدردشة الذكية التي تعمل بالنماذج اللغوية الكبيرة على تحديث في كل مرة تقوم فيها شركات مثل OpenAI بتحديث نماذجها. إذا كان وكيل LLM متصلاً بمنصة بناء روبوتات مثل Botpress، فإنه يحصل على جميع مزايا أحدث نموذج GPT في روبوت الدردشة الخاص به.
مع إصدار GPT-4o، يمكن لروبوتات الدردشة الذكية الآن اختيار العمل على النموذج المتقدم، مما يغير من قدراتها وتكلفتها وسرعتها. النموذج الجديد يوفر حدود استخدام أعلى بمقدار 5 مرات مقارنة بـ GPT-4 Turbo، مع إمكانية معالجة حتى 10 ملايين رمز في الدقيقة.
بالنسبة للروبوتات التي تستخدم تكاملات صوتية مثل Twilio على Botpress، ظهرت آفاق جديدة للتفاعل الصوتي. لم تعد روبوتات الدردشة مقيدة بمعالجة الصوت التقليدية، بل أصبحت أقرب لمحاكاة التفاعل البشري.
وربما الأهم هو انخفاض التكلفة للمستخدمين المدفوعين. تشغيل روبوت دردشة بقدرات مماثلة بنصف التكلفة يمكن أن يزيد بشكل كبير من إمكانية الوصول والقدرة على تحمل التكاليف عالمياً. ولا يدفع مستخدمو Botpress أي تكاليف إضافية للذكاء الاصطناعي على روبوتاتهم – لذا تذهب هذه الوفورات مباشرة إلى صانعي الروبوتات.
ومن جانب المستخدم، يعني GPT-4o تجربة أفضل بكثير. لا أحد يحب الانتظار. أوقات الاستجابة الأقصر تعني رضا أعلى لمستخدمي روبوتات الدردشة الذكية.

المستخدمون يحبون السرعة
أحد المبادئ الأساسية لاعتماد روبوتات الدردشة هو تحسين تجربة المستخدم. وما الذي يحسن تجربة المستخدم أكثر من تقليل أوقات الانتظار؟
قال هاميلين: "ستكون تجربة أفضل بالتأكيد. آخر ما تريده هو الانتظار على أحدهم."
البشر يكرهون الانتظار. حتى في عام 2003، وجدت دراسة أن الناس كانوا على استعداد للانتظار حوالي ثانيتين فقط لتحميل صفحة ويب. ومن المؤكد أن صبرنا لم يزد منذ ذلك الحين.
الجميع يكره الانتظار
هناك العديد من نصائح تجربة المستخدم لتقليل الإحساس بالانتظار. غالباً لا يمكننا تسريع الأحداث فعلياً، لذا نركز على جعل المستخدمين يشعرون بأن الوقت يمر أسرع. التغذية البصرية الراجعة، مثل صورة شريط التحميل، موجودة لتقليل الإحساس بالانتظار.
في قصة مشهورة عن أوقات انتظار المصاعد، كان مبنى قديم في نيويورك يتلقى الكثير من الشكاوى. كان السكان ينتظرون دقيقة إلى دقيقتين لوصول المصعد. لم يكن بالإمكان ترقية المصعد إلى نموذج أحدث وكان السكان يهددون بفسخ عقودهم.
اكتشف موظف جديد مدرب في علم النفس أن المشكلة الحقيقية لم تكن في الدقيقتين المفقودتين – بل في الملل. اقترح تركيب مرايا ليتمكن السكان من النظر إلى أنفسهم أو إلى الآخرين أثناء الانتظار. توقفت الشكاوى عن المصعد، وأصبح من الشائع الآن رؤية مرايا في بهو المصاعد.
بدلاً من اللجوء إلى حلول سطحية لتحسين تجربة المستخدم – مثل التغذية البصرية الراجعة – قامت OpenAI بتحسين التجربة من مصدرها. السرعة عنصر أساسي في تجربة المستخدم، ولا توجد حيلة تضاهي رضا التفاعل الفعال.
توفير للجميع
أصبح تشغيل التطبيقات باستخدام هذا النموذج الجديد من الذكاء الاصطناعي أقل تكلفة فجأة. أقل بكثير.
تشغيل روبوت دردشة ذكي على نطاق واسع قد يكون مكلفاً. النموذج اللغوي الكبير الذي يعتمد عليه الروبوت يحدد كم ستدفع مقابل كل تفاعل مستخدم على نطاق أوسع (على الأقل في Botpress، حيث نطابق الإنفاق على الذكاء الاصطناعي مع تكلفة النموذج اللغوي الكبير بنسبة 1:1).
وهذا التوفير لا يقتصر فقط على المطورين الذين يستخدمون واجهة البرمجة. ChatGPT-4o هو أحدث إصدار مجاني من النموذج اللغوي الكبير، إلى جانب GPT-3.5. يمكن للمستخدمين المجانيين استخدام تطبيق ChatGPT دون أي تكلفة.
ترميز أفضل للرموز
إذا كنت تتفاعل مع النموذج بلغة لا تستخدم الأبجدية اللاتينية، فإن GPT-4o يقلل من تكاليف واجهة البرمجة بشكل أكبر.

يأتي النموذج الجديد مع حدود استخدام محسنة. يوفر قفزة كبيرة في كفاءة الترميز، تتركز بشكل أساسي في بعض اللغات غير الإنجليزية.
يتطلب نموذج الترميز الجديد عدداً أقل من الرموز لمعالجة النص المُدخل. وهو أكثر كفاءة بكثير للغات اللوغوغرافية (أي اللغات التي تستخدم الرموز والشخصيات بدلاً من الحروف الفردية).
تتركز هذه الفوائد بشكل أساسي في اللغات التي لا تستخدم الأبجدية اللاتينية. وقد تم تقدير التخفيضات في التكاليف كما يلي:
- اللغات الهندية مثل الهندية والتاميلية والغوجاراتية تحقق تقليصاً في عدد الرموز بمعدل 2.9 – 4.4 مرة
- اللغة العربية تحقق تقليصاً في عدد الرموز بمعدل يقارب مرتين
- اللغات الآسيوية الشرقية مثل الصينية واليابانية والفيتنامية تحقق تقليصاً في عدد الرموز بمعدل 1.4 – 1.7 مرة
سد الفجوة الرقمية في الذكاء الاصطناعي
جلب العصر الرقمي معه امتداداً للفجوة الاقتصادية القديمة والمعروفة – الفجوة الرقمية. فكما أن الوصول إلى الثروة والبنية التحتية القوية يقتصر على بعض الفئات، كذلك هو الحال مع الوصول إلى الذكاء الاصطناعي والفرص والفوائد المصاحبة له.
شرح روبرت أوب، المدير الرقمي في برنامج الأمم المتحدة الإنمائي (UNDP)، أن وجود منصات الذكاء الاصطناعي يمكن أن يكون له تأثير كبير على مؤشرات التنمية لدولة بأكملها:

من خلال خفض تكلفة GPT-4o إلى النصف وتقديم فئة مجانية، تتخذ OpenAI خطوة حاسمة نحو معالجة إحدى أكبر مشكلات الذكاء الاصطناعي – ومواجهة عدم المساواة التي تشغل بال صناع السياسات والاقتصاديين بشكل مباشر.
خطوة العلاقات العامة الإيجابية للذكاء الاصطناعي الكبير أصبحت أكثر ضرورة مما قد يظنه المتحمسون. مع تزايد حضور الذكاء الاصطناعي في حياتنا اليومية، بدأ المؤيدون والمتشككون على حد سواء يتساءلون كيف يمكننا استخدام الذكاء الاصطناعي "للخير".

وفقاً للدكتور في الذكاء الاصطناعي والمعلم لويس بوشار، فإن توسيع إمكانية الوصول إلى الذكاء الاصطناعي هو الطريقة لتحقيق ذلك بالضبط: "إتاحة الذكاء الاصطناعي للجميع هي إحدى الطرق، إن لم تكن الأفضل، لاستخدام الذكاء الاصطناعي للخير." ما منطقه؟ إذا لم نتمكن من التحكم الكامل في الآثار الإيجابية والسلبية لتقنية الذكاء الاصطناعي – على الأقل في بداياتها – يمكننا بدلاً من ذلك ضمان وصول الجميع إلى فوائدها المحتملة.
إمكانات متعددة الوسائط موسعة
الطريقة الشائعة للتفاعل مع روبوت الدردشة الخاص بالأعمال هي عبر النص، لكن القدرات متعددة الوسائط المحسنة في نموذج الذكاء الاصطناعي الجديد من OpenAI تشير إلى أن هذا قد يتغير مستقبلاً.
من المرجح أن نشهد خلال العام القادم موجة من المطورين يطرحون تطبيقات جديدة تستفيد من إمكانيات الصوت والرؤية والفيديو التي أصبحت متاحة حديثاً.
على سبيل المثال، يمكن لروبوتات الدردشة المدعومة بـ GPT أن تكون قادرة على:
- طلب صورة من العميل للمنتج الذي يعيده لتحديد المنتج والتأكد من عدم تلفه
- تقديم ترجمة صوتية فورية أثناء المحادثة تأخذ في الاعتبار اللهجات الإقليمية
- تحديد ما إذا كانت شريحتك مطهية من خلال صورة لها في المقلاة
- العمل كدليل سياحي شخصي مجاني، يقدم سياقاً تاريخياً بناءً على صورة لكاتدرائية قديمة، ويقدم ترجمة فورية، وجولة صوتية مخصصة تتيح التواصل وطرح الأسئلة
- تشغيل تطبيق لتعلم اللغات يستمع إلى مدخلات صوتية، ويقدم ملاحظات حول النطق بناءً على فيديو لحركة فمك، أو يعلم لغة الإشارة من خلال الصور والفيديو
- تقديم دعم للصحة النفسية غير العاجلة من خلال الجمع بين قدرته على تفسير الصوت والفيديو، مما يسمح بجلسات علاجية منخفضة التكلفة
مع نماذج الذكاء الاصطناعي القادرة على تفسير الصور والصوت، يتوسع فهمنا لكيفية خدمة النماذج اللغوية الكبيرة لنا بسرعة.
تعدد الوسائط يعني زيادة الوصول
لقد رأينا بالفعل ميزات الوسائط المتعددة المحسنة تُستخدم لتحقيق منفعة اجتماعية. مثال مثالي هو شراكة OpenAI مع Be My Eyes.
Be My Eyes هي شركة ناشئة دنماركية تربط المستخدمين ضعاف البصر بمتطوعين مبصرين. عندما يحتاج المستخدم إلى مساعدة – مثل اختيار المنتجات المعلبة الصحيحة في السوبرماركت أو تحديد لون قميص – يربطه التطبيق بمتطوع مبصر حول العالم عبر الفيديو من خلال الهاتف الذكي.

يمكن لقدرة الرؤية الجديدة لدى OpenAI أن توفر تجربة أكثر فائدة لمستخدمي Be My Eyes. بدلاً من الاعتماد على متطوع بشري لتفسير صورة أو فيديو في الوقت الفعلي، يمكن للمستخدمين المكفوفين إرسال صورة أو فيديو إلى أجهزتهم ليقوم النموذج بالرد عليهم بمعلومات صوتية.
تعمل OpenAI وBe My Eyes، كشريكين موثوقين الآن، على تمهيد الطريق لمزيد من الاستقلالية للأشخاص المكفوفين قانونياً حول العالم. يوضح مايكل باكلي، الرئيس التنفيذي لـ Be My Eyes، تأثير ذلك:

سيتم إطلاق الخدمة الجديدة قريباً، في صيف 2024، لأول مرة. قام المستخدمون الأوائل باختبار ميزات الرؤية والفيديو والصوت الجديدة وحصلت على تقييمات إيجابية للغاية. وبينما تثير آثار الذكاء الاصطناعي قلق المتشككين، فإن هذه الشراكة دليل واضح على الآثار الإيجابية التي يمكن أن تحققها. فهم المنفعة الاجتماعية المصاحبة للذكاء الاصطناعي المتقدم خطوة أساسية في علاقاته العامة.
كيف سنقيّم نماذج الذكاء الاصطناعي اللغوية الكبيرة في المستقبل؟
مع استمرار المنافسين في سباق نحو تقديم النماذج اللغوية الأرخص والأسرع، يبرز السؤال: كيف سنقيّم نماذج الذكاء الاصطناعي في المستقبل؟
في مرحلة ما مستقبلاً، سيصل كبار مطوري النماذج اللغوية الكبيرة (على الأرجح OpenAI وGoogle) إلى مرحلة استقرار في سرعة النماذج وتكلفة الوصول إليها. وعندما نصل إلى هذا الاستقرار في التكلفة والسرعة، كيف سنحدد النموذج الرائد في السوق؟
ما الذي سيصبح علامة العصر الجديدة؟ سواء كانت الشخصيات المتاحة في نموذج الذكاء الاصطناعي الخاص بك، أو قدرات تحسين الفيديو، أو الميزات المتاحة للمستخدمين المجانيين، أو مقاييس جديدة كلياً تتجاوز فهمنا الحالي، فإن الجيل القادم من النماذج اللغوية الكبيرة بات قريباً جداً.
روبوتات الدردشة الذكية أصبحت أسهل
ماذا لو كان روبوت الدردشة الذكي الخاص بك يتزامن تلقائياً مع كل تحديث لـ GPT؟
توفر Botpress حلول روبوتات دردشة ذكية قابلة للتخصيص منذ عام 2017، حيث تمنح المطورين الأدوات اللازمة لبناء روبوتات دردشة بسهولة باستخدام أحدث النماذج اللغوية الكبيرة. يمكن تدريب روبوتات Botpress على مصادر معرفة مخصصة – مثل موقعك الإلكتروني أو كتالوج منتجاتك – وتتكامل بسلاسة مع أنظمة الأعمال.
كونها المنصة الوحيدة التي تتراوح من إعداد بدون كود إلى تخصيص وتوسعة غير محدودة، تتيح لك Botpress الحصول تلقائياً على قوة أحدث إصدار من GPT في روبوت الدردشة الخاص بك – دون أي جهد.
ابدأ البناء اليوم. إنها مجانية.
الأسئلة الشائعة
1. كيف يمكنني تحويل روبوت الدردشة الحالي الخاص بي إلى GPT-4o في Botpress؟
لتحويل روبوت الدردشة الحالي الخاص بك إلى GPT-4o في Botpress، انتقل إلى Botpress Studio، ثم إلى إعدادات النموذج اللغوي لمساعدك، واختر GPT-4o من قائمة النماذج المتاحة. يتم تطبيق التغيير فوراً دون الحاجة إلى تعديل الكود.
2. هل هناك متطلبات مسبقة لاستخدام GPT-4o ضمن منصة Botpress (مثل SDKs أو إصدارات API)؟
لا، لا توجد متطلبات مسبقة لاستخدام GPT-4o في Botpress. تدير المنصة جميع حزم SDK وتحديثات API والاعتمادات الخلفية تلقائياً، وكل ما عليك فعله هو اختيار GPT-4o في الإعدادات لتفعيله.
3. هل يمكن تخصيص أو ضبط GPT-4o ليناسب حالات استخدام أعمال محددة عبر Botpress؟
بينما لا يمكن ضبط GPT-4o بالطريقة التقليدية داخل Botpress، يمكنك تخصيص ردوده وسلوكه باستخدام هندسة التعليمات، منطق سير العمل، قواعد المعرفة، والمتغيرات. هذا يسمح لـ GPT-4o بالتصرف بشكل سياقي حسب احتياجات عملك دون إعادة تدريب النموذج.
4. هل توجد قيود على استخدام الميزات متعددة الوسائط (الصوت، الرؤية) ضمن سير عمل Botpress؟
نعم، تدعم Botpress حالياً ميزات الصوت من خلال تكاملات مثل Twilio أو Dialogflow Voice Gateway، لكن القدرات متعددة الوسائط مثل معالجة الصور أو الفيديوهات ليست مدعومة بالكامل بعد. إدخال البيانات عبر الرؤية لا يزال قيد الدراسة أو يتطلب حلولاً بديلة.
5. هل هناك تكاليف خفية لاستخدام الميزات المتقدمة في GPT-4o مثل الترجمة الفورية أو إدخال الرؤية؟
لا، لا توجد تكاليف خفية لاستخدام ميزات GPT-4o المتقدمة في Botpress. سرعة GPT-4o وكفاءته مشمولة ضمن خطتك الحالية في Botpress، وتتحمل Botpress تكاليف النماذج اللغوية – لذا لن يتحمل المستخدمون أي رسوم إضافية مقابل استخدام تحسينات GPT-4o.





.webp)
