Permintaan adalah satu interaksi yang dikirim ke model bahasa besar (LLM) dari Botpress. Ini mencakup data input, parameter konfigurasi, dan konteks relevan yang dibutuhkan model untuk memproses permintaan dan memberikan respons. Setiap permintaan mewakili satu panggilan ke LLM, seperti menghasilkan teks, menjawab pertanyaan, atau melakukan tugas lainnya.
Data pada grafik di atas menunjukkan jumlah permintaan individu yang dikirim ke setiap LLM oleh pengguna dari Botpress.
Apa yang dimaksud dengan kecepatan?
Kecepatan mengacu pada rata-rata jumlah token yang dihasilkan oleh LLM per detik saat memproses permintaan. Token adalah satuan teks, seperti kata atau bagian dari kata, yang dibaca atau dihasilkan oleh model. Pengukuran ini mencerminkan performa keluaran model, menunjukkan seberapa cepat model dapat memberikan respons.
Data pada grafik di atas menunjukkan rata-rata total jumlah token yang dihasilkan model per detik saat diakses dari Botpress.
Apa yang dimaksud dengan biaya?
Biaya adalah rata-rata harga dalam dolar AS untuk memproses 1.000 permintaan ke LLM tertentu dari Botpress. Biaya ini membantu memperlihatkan biaya relatif penggunaan berbagai model, memberikan gambaran tentang efisiensi biaya saat menangani volume permintaan yang besar.
Satu percakapan bisa terdiri dari beberapa permintaan. Anda dapat menggunakan data pada grafik di atas untuk memperkirakan, berdasarkan jenis percakapan Anda, pengeluaran AI bulanan Anda.
Seberapa sering data di halaman ini diperbarui?
Meskipun informasi penggunaan LLM di Botpress dikumpulkan secara real-time, grafik di halaman ini diperbarui setiap 48 jam.