Temui model-model

Jumlah permintaan yang diproses oleh model
Data dari 90 hari yang lalu
Purata bilangan token yang diproses sesaat oleh setiap model
Data dari 90 hari yang lalu
Purata kos setiap model untuk semua permintaan dalam tempoh 90 hari
Data dari 90 hari yang lalu
Data dari 90 hari yang lalu
Permintaan
Jumlah keseluruhan permintaan individu yang dihantar ke LLM tertentu dari Botpress.
Kelajuan
Purata token sesaat yang dijana oleh LLM tertentu apabila permintaan dibuat dari Botpress.
Kos
Purata kos (USD) untuk 1,000 permintaan yang dibuat ke LLM individu dari Botpress.
model_kedua
model_pertama
xx token
Jumlah semua token yang diproses dalam 90 hari terakhir di Botpress.
jumlah
purata_token_keluaran_per_saat
$kos_purata

Soalan Lazim

Apakah itu permintaan?
Permintaan merujuk kepada satu interaksi yang dihantar ke model bahasa besar (LLM) dari Botpress. Ia merangkumi data input, parameter konfigurasi, dan sebarang konteks berkaitan yang diperlukan untuk model memproses permintaan dan memberikan respons. Setiap permintaan mewakili satu panggilan ke LLM, seperti menjana teks, menjawab soalan, atau melaksanakan tugas lain.

Data dalam carta di atas menunjukkan bilangan permintaan individu yang dibuat ke setiap LLM yang digunakan oleh pengguna dari Botpress.
Apa maksud kelajuan?
Kelajuan merujuk kepada purata bilangan token yang dijana oleh LLM setiap saat semasa memproses permintaan. Token ialah unit teks, seperti perkataan atau sebahagian perkataan, yang dibaca atau dihasilkan oleh model. Ukuran ini menunjukkan prestasi output model, iaitu seberapa pantas ia boleh memberikan respons.

Data dalam carta di atas menunjukkan purata jumlah token yang dijana oleh model setiap saat apabila diminta daripada Botpress.
Apa maksud kos?
Kos merujuk kepada purata harga dalam dolar AS untuk memproses 1,000 permintaan ke LLM tertentu dari Botpress. Metrik ini membantu menunjukkan perbelanjaan relatif menggunakan model berbeza, memberikan gambaran tentang kecekapan kos apabila mengendalikan jumlah permintaan yang besar.

Satu perbualan mungkin mengandungi beberapa permintaan. Anda boleh menggunakan data dalam carta di atas untuk menganggarkan, berdasarkan sifat perbualan anda, perbelanjaan AI bulanan anda.
Seberapa kerap data di halaman ini dikemas kini?
Walaupun maklumat penggunaan LLM di Botpress dikumpul secara masa nyata, carta di halaman ini dikemas kini setiap 48 jam.