- Ang GPT-4o ay dalawang beses na mas mabilis at kalahati ang presyo ng GPT-4 Turbo, kaya mas mababa ang halaga at mas mabilis ang tugon ng mga AI chatbot.
- Nagbibigay-daan ang bagong modelo sa advanced na multimodal na kakayahan—kabilang ang boses, video, real-time na pagsasalin, at vision—na nagbubukas ng mga bagong gamit ng chatbot lampas sa text.
- Ang mas episyenteng tokenization, lalo na para sa mga wikang hindi Romano ang alpabeto, ay nagdudulot ng malaking pagtitipid sa gastos para sa pandaigdigang deployment ng chatbot.
- Direktang pinapabuti ng bilis ang karanasan ng gumagamit, binabawasan ang oras ng paghihintay na kadalasang nakakainis sa mga gumagamit ng chatbot.
Dalawang beses na mas mabilis at kalahati ang presyo – ano ang ibig sabihin ng GPT-4o para sa AI chatbots?
Matapos ang kanilang misteryosong anunsyo, inilunsad ng OpenAI ang pinakabagong bersyon ng kanilang pangunahing modelo: GPT-4o.
Ang pinakabagong modelo ay hindi lang basta pinaganda sa multimodal na kakayahan. Mas mabilis at mas mura ito kaysa GPT-4 Turbo. Habang abala ang mainstream media sa video at voice features ng bagong flagship model para sa ChatGPT, ang bagong presyo at bilis ay kasinghalaga para sa mga gumagamit ng GPT sa kanilang apps.

“Ang pagkakaroon ng 4o ay may kakayahang lubos na pagandahin ang karanasan ng parehong gumagawa at gumagamit,” sabi ni Patrick Hamelin, isang software engineer lead sa Botpress. “Mas malawak ang epekto nito kaysa sa iniisip natin.”
Kaya tara, alamin natin kung paano babaguhin ng bagong model ang AI chatbots.
Kakayahan ng Model
Ang bagong flagship model ay may kasamang kapana-panabik na listahan ng mga update at bagong tampok: pinahusay na kakayahan sa boses at video, real-time na pagsasalin, mas natural na pagproseso ng wika. Kaya nitong suriin ang mga larawan, umintindi ng mas maraming uri ng audio input, tumulong sa pagbubuod, magpadali ng real-time na pagsasalin, at gumawa ng mga tsart. Maaaring mag-upload ng file ang mga user at makipag-usap nang boses-sa-boses. May desktop app din ito.
Sa kanilang serye ng mga launch video, ipinakita ng mga empleyado ng OpenAI (at mga katuwang tulad ni Sal Khan ng Khan Academy) ang pinakabagong bersyon ng GPT na naghahanda ng user para sa job interview, kumakanta, kumikilala ng emosyon ng tao sa pamamagitan ng ekspresyon ng mukha, nagsosolve ng math equation sa sulat, at nakikipag-ugnayan pa sa isa pang ChatGPT-4o.
Ipinakita ng paglulunsad ang bagong realidad kung saan kayang suriin ng AI model ang sulat sa kuwaderno ng iyong anak at makasagot dito. Maaari nitong ipaliwanag ang konsepto ng pagdaragdag ng mga fraction sa unang pagkakataon, at baguhin ang paraan ng pagtuturo batay sa pag-unawa ng bata—mula chatbot, nagiging personal na guro na ito.

Ano ang ibig sabihin ng GPT-4o para sa LLM Chatbots?
Ang mga AI chatbot na tumatakbo sa LLM ay nakakatanggap ng update tuwing ina-update ng mga kumpanya tulad ng OpenAI ang kanilang mga modelo. Kung ang isang LLM agent ay nakakonekta sa isang bot-building platform tulad ng Botpress, natatanggap nila ang lahat ng benepisyo ng pinakabagong GPT model sa sarili nilang chatbot.
Sa paglabas ng GPT-4o, maaaring pumili ang mga AI chatbot na gumamit ng advanced na model, na nagbabago sa kanilang kakayahan, presyo, at bilis. Ang bagong model ay may 5x na mas mataas na rate limit kaysa GPT-4 Turbo, na kayang magproseso ng hanggang 10 milyong token bawat minuto.
Para sa mga bot na gumagamit ng audio integration gaya ng Twilio sa Botpress, may bagong mundo ng voice-powered na interaksyon. Sa halip na limitado sa lumang paraan ng audio processing, mas napapalapit na ang mga chatbot sa paggaya ng totoong usapan ng tao.
Marahil ang pinakamahalaga ay ang mas mababang gastos para sa mga nagbabayad. Ang pagpapatakbo ng chatbot na kasing-galing pero kalahati ang presyo ay maaaring magpataas ng access at affordability sa buong mundo. At walang dagdag na gastos sa AI ang mga Botpress user sa kanilang mga bot – kaya ang pagtitipid ay diretso sa mga gumagawa.
At para sa mga gumagamit, mas maganda ang karanasan dahil sa GPT-4o. Walang gustong maghintay. Mas maikling oras ng tugon, mas mataas ang kasiyahan ng mga gumagamit ng AI chatbot.

Mahilig ang mga gumagamit sa bilis
Isang mahalagang prinsipyo sa paggamit ng chatbot ay ang pagpapabuti ng karanasan ng user. At ano ang mas nagpapabuti ng karanasan kundi ang pagbawas ng oras ng paghihintay?
“Mas magiging maganda ang karanasan, sigurado,” sabi ni Hamelin. “Ayaw mong maghintay sa iba.”
Ayaw ng tao ang naghihintay. Noong 2003 pa lang, isang pag-aaral ang nakatuklas na handa lang maghintay ang mga tao ng halos 2 segundo para mag-load ang web page. Hindi naman siguro nadagdagan ang pasensya natin mula noon.
At ayaw ng lahat ang paghihintay
Maraming UX tips para mapababa ang pakiramdam ng paghihintay. Madalas hindi natin mapapabilis ang aktwal na bilis ng mga pangyayari, kaya't tumutuon tayo sa pagpapadama na mas mabilis ang paglipas ng oras. Ang visual feedback, tulad ng larawan ng loading bar, ay ginagamit para paikliin ang pakiramdam ng paghihintay.
Sa isang kilalang kuwento tungkol sa paghihintay sa elevator, isang lumang gusali sa New York ang binabaha ng reklamo. Kailangan maghintay ng 1-2 minuto ang mga residente bago dumating ang elevator. Hindi kayang i-upgrade ng gusali ang elevator at nagbabantang umalis ang mga residente.
Isang bagong empleyado na may kaalaman sa sikolohiya ang nakaalam na ang tunay na problema ay hindi ang dalawang minutong nawalang oras—kundi ang pagkabagot. Iminungkahi niyang maglagay ng mga salamin para may mapagmasdan ang sarili o ibang tao habang naghihintay. Tumigil ang mga reklamo tungkol sa elevator, at ngayon, karaniwan nang makakita ng mga salamin sa mga lobby ng elevator.
Sa halip na mag-shortcut para mapaganda ang karanasan ng user—tulad ng visual feedback—pinahusay ng OpenAI ang karanasan mismo sa pinagmulan. Mahalaga ang bilis sa karanasan ng user, at walang kapantay ang kasiyahan ng mabilis at epektibong interaksyon.
Tipid Para sa Lahat
Sa paggamit ng bagong AI model na ito, biglang naging mas mura ang pagpapatakbo ng mga aplikasyon. Mas mura—malaking tipid talaga.
Ang pagpapatakbo ng AI chatbot sa malakihang antas ay maaaring magastos. Ang LLM na nagpapatakbo sa iyong bot ang magtatakda kung magkano ang babayaran mo sa bawat interaksyon ng user sa mas malaking saklaw (lalo na sa Botpress, kung saan tinutumbasan namin ang AI spend 1:1 sa LLM costs).
At hindi lang ito para sa mga developer na gumagamit ng API. Ang ChatGPT-4o ang pinakabagong libreng bersyon ng LLM, kasama ang GPT-3.5. Maaaring gamitin ng mga libreng user ang ChatGPT app nang walang bayad.
Mas mahusay na pagtutokenisa
Kung gagamitin mo ang model sa wikang hindi gumagamit ng Roman alphabet, mas lalo pang binabawasan ng GPT-4o ang iyong API costs.

Ang bagong modelo ay may mas pinahusay na usage limits. Malaki ang pagbuti ng tokenization efficiency, lalo na sa ilang hindi-Ingles na wika.
Ang bagong tokenization model ay nangangailangan ng mas kaunting token para iproseso ang input na teksto. Mas episyente ito para sa mga logographic na wika (ibig sabihin, mga wikang gumagamit ng simbolo at karakter sa halip na mga letra).
Karamihan sa mga benepisyong ito ay nakatuon sa mga wikang hindi gumagamit ng Roman alphabet. Ang pagtitipid ay tinatayang ganito:
- Ang mga wikang Indian, gaya ng Hindi, Tamil, o Gujarati, ay may 2.9 – 4.4x na pagbawas sa tokens
- Ang Arabic ay may halos 2x na pagbawas sa tokens
- Ang mga wikang East Asian tulad ng Chinese, Japanese, at Vietnamese ay may 1.4 – 1.7x na pagbawas sa tokens
Pagsasara ng digital divide sa AI
Dala ng digital era ang pagpapalawak ng matagal nang agwat sa yaman – ang digital divide. Tulad ng eksklusibo ang access sa yaman at matibay na imprastraktura sa ilang populasyon, ganoon din ang access sa AI at mga oportunidad at benepisyong kasama nito.
Ipinaliwanag ni Robert Opp, Chief Digital Officer ng United Nations Development Programme (UNDP), na ang presensya ng AI platforms ay maaaring magpabago o magpabagsak ng mga sukatan ng pag-unlad ng isang buong bansa:

Sa pamamagitan ng pagpapababa ng presyo ng GPT-4o at pagpapakilala ng libreng tier, gumagawa ang OpenAI ng mahalagang hakbang para solusyunan ang isa sa pinakamalaking problema sa AI – at direktang tinutugunan ang hindi pagkakapantay-pantay na iniisip ng mga gumagawa ng patakaran at ekonomista.
Mas mahalaga ang isang positibong hakbang sa PR para sa malalaking AI kaysa sa iniisip ng marami. Habang mas nagiging bahagi ng araw-araw ang AI, parehong tagasuporta at nagdududa ang nagtatanong kung paano natin magagamit ang AI ‘para sa kabutihan’.

Ayon kay Louis Bouchard, isang AI PhD at guro, ang pagpapalawak ng access sa AI ang paraan para magawa natin ito: “Ang gawing abot-kaya ang AI ay isa sa pinakamainam, kung hindi man ang pinakamahusay, na paraan para magamit ang AI ‘para sa kabutihan.’” Ang dahilan niya? Kung hindi natin ganap na makokontrol ang mabuti at masamang epekto ng AI — lalo na sa simula — mas mainam na tiyakin nating pantay-pantay ang access sa mga benepisyo nito.
Mas pinalawak na potensyal ng multimodal
Karaniwan, text ang paraan ng pakikipag-ugnayan sa chatbot ng negosyo, pero dahil sa mas pinahusay na multimodal na kakayahan ng bagong AI model ng OpenAI, maaaring magbago ito sa hinaharap.
Sa darating na taon, malamang na makakita tayo ng maraming developer na maglalabas ng mga bagong application na lubos na gagamit ng bagong bukas na kakayahan sa audio, biswal, at video.
Halimbawa, maaaring magawa ng GPT-powered chatbots ang mga sumusunod:
- Hingin sa customer ang larawan ng item na kanilang ibinabalik para matukoy ang produkto at matiyak na hindi ito sira
- Magbigay ng pagsasalin ng audio nang real time sa usapan na isinasaalang-alang ang mga diyalektong rehiyonal
- Alamin kung luto na ang steak mo gamit ang larawan nito habang nasa kawali
- Gumaganap bilang libreng personal na tour guide, nagbibigay ng kasaysayang konteksto batay sa larawan ng lumang katedral, nagbibigay ng salin sa totoong oras, at nag-aalok ng pasadyang voice tour na may dalawang-daan na komunikasyon at tanungan.
- Paganahin ang isang app sa pagkatuto ng wika na nakikinig sa audio input, maaaring magbigay ng puna sa pagbigkas batay sa video ng galaw ng iyong bibig, o magturo ng sign language gamit ang mga larawan at video
- Magbigay ng hindi agarang suporta sa mental wellness sa pamamagitan ng pagsasama ng kakayahan nitong mag-interpret ng audio at video, kaya mas mura ang talk therapy
Dahil sa mga AI model na kayang umintindi ng larawan at tunog, mabilis na lumalawak ang pag-unawa natin kung paano makakatulong ang LLMs sa atin.
Ibig sabihin ng multimodality ay mas madaling ma-access ng lahat
Nakita na natin ang pinahusay na multimodal features na ginagamit para sa kabutihang panlipunan. Isang perpektong halimbawa ay ang pakikipagtulungan ng OpenAI sa Be My Eyes.
Ang Be My Eyes ay isang Danish start-up na nag-uugnay sa mga may kapansanan sa paningin sa mga volunteer na nakakakita. Kapag kailangan ng tulong ng user—tulad ng pagpili ng tamang de-latang pagkain sa supermarket o pagtukoy ng kulay ng t-shirt—kinokonekta sila ng app sa volunteer mula sa iba’t ibang panig ng mundo sa pamamagitan ng video gamit ang smartphone.

Maaaring magbigay ang bagong vision ability ng OpenAI ng mas kapaki-pakinabang na karanasan para sa mga gumagamit ng Be My Eyes. Sa halip na umasa sa boluntaryong tao para magbasa ng larawan o video nang live, maaaring ipadala ng mga bulag na gumagamit ang larawan o video sa kanilang device at sasagutin ito ng modelo gamit ang audio na impormasyon.
Ang OpenAI at Be My Eyes, na ngayon ay pinagkakatiwalaang magkasosyo, ay nagbubukas ng mas malayang pamumuhay para sa mga legal na bulag sa buong mundo. Ipinaliwanag ni Be My Eyes CEO Michael Buckley ang epekto nito:

Ang bagong serbisyo ay ilulunsad na sa tag-init ng 2024, sa unang pagkakataon. Ang mga early access user ay nag-beta test ng bagong vision, video, at audio features na may magagandang feedback. Bagama’t may pangamba ang ilan sa epekto ng AI, malinaw na senyales ang partnership na ito ng positibong epekto nito. Ang pag-unawa sa kabutihang panlipunan na dulot ng advanced na AI ay mahalagang hakbang para sa PR nito.
Paano natin huhusgahan ang mga susunod na LLM model?
Habang patuloy ang kumpetisyon sa pagpapamura at pagpapabilis ng LLM, lumilitaw ang tanong: paano natin huhusgahan ang mga AI model sa hinaharap?
Sa hinaharap, maaaring umabot sa hangganan ang mga pangunahing gumagawa ng LLM (malamang OpenAI at Google) sa bilis ng pagpapatakbo ng kanilang mga modelo at kung gaano kababa ang gastos ng access. Kapag naging matatag na ang presyo at bilis, paano natin pipiliin ang pinaka-nangungunang modelo sa merkado?
Ano ang magiging bagong palatandaan ng panahon? Maging ito man ay mga personalidad ng iyong AI model, kakayahan sa pagpapaganda ng video, mga tampok para sa libreng user, o mga bagong sukatan na lampas sa kasalukuyang kaalaman, paparating na ang susunod na henerasyon ng LLMs.
Madaling Gumawa ng AI Chatbot
Paano kung awtomatikong sumabay ang iyong AI chatbot sa bawat update ng GPT?
Nagbibigay ang Botpress ng nako-customize na mga solusyon sa AI chatbot mula pa noong 2017, binibigyan ang mga developer ng mga kasangkapan para madaling makabuo ng mga chatbot gamit ang pinakabagong LLM. Maaaring sanayin ang mga chatbot ng Botpress sa mga pinagmumulan ng kaalaman – tulad ng iyong website o katalogo ng produkto – at madaling isama sa mga sistema ng negosyo.
Ang tanging plataporma na mula walang-kodigo hanggang walang katapusang pagpapasadya at pagpapalawak, hinahayaan ka ng Botpress na awtomatikong makuha ang kapangyarihan ng pinakabagong bersyon ng GPT para sa iyong chatbot – walang hirap na kailangan.
Simulan ang paggawa ngayon. Libre ito.
FAQs
1. Paano ko ililipat ang kasalukuyan kong chatbot sa GPT-4o sa Botpress?
Para ilipat ang iyong chatbot sa GPT-4o sa Botpress, pumunta sa Botpress Studio, hanapin ang LLM settings ng iyong assistant, at piliin ang GPT-4o mula sa listahan ng mga modelong available. Agad na magbabago ito at hindi na kailangan ng pagbabago sa code.
2. Mayroon bang mga kinakailangan bago magamit ang GPT-4o sa loob ng Botpress platform (halimbawa, SDKs, bersyon ng API)?
Hindi, walang kinakailangang paunang kondisyon sa paggamit ng GPT-4o sa Botpress. Awtomatikong pinamamahalaan ng platform ang lahat ng SDK, update sa API, at mga kinakailangang backend, kaya piliin mo lang ang GPT-4o sa settings para i-activate ito.
3. Maaari bang iangkop o i-customize ang GPT-4o para sa partikular na gamit ng negosyo sa pamamagitan ng Botpress?
Bagaman hindi maaaring i-fine-tune ang GPT-4o sa tradisyonal na paraan sa loob ng Botpress, maaari mong i-customize ang mga sagot at kilos nito gamit ang prompt engineering, workflow logic, knowledge base, at mga variable. Sa ganitong paraan, makakaangkop ang GPT-4o sa pangangailangan ng iyong negosyo nang hindi nire-retrain ang modelo.
4. Mayroon bang mga limitasyon sa paggamit ng mga multimodal na kakayahan (boses, biswal) sa mga workflow ng Botpress?
Oo, kasalukuyang sinusuportahan ng Botpress ang voice features sa pamamagitan ng mga integration tulad ng Twilio o Dialogflow Voice Gateway, pero hindi pa ganap na sinusuportahan ang multimodal na kakayahan tulad ng pagproseso ng larawan o video. Ang vision-based input ay pinag-aaralan pa o nangangailangan ng alternatibong paraan.
5. Mayroon bang mga nakatagong gastos sa paggamit ng mga advanced na tampok ng GPT-4o tulad ng real-time na pagsasalin o vision input?
Hindi, walang nakatagong gastos sa paggamit ng mga advanced na tampok ng GPT-4o sa Botpress. Kasama na sa iyong kasalukuyang plano sa Botpress ang bilis at episyensiya ng GPT-4o, at sagot ng Botpress ang LLM na gastos—kaya walang dagdag na bayad ang mga gumagamit para sa mga pagpapahusay ng GPT-4o.





.webp)
