Google mengungkapkan gemini 2.5 flash, 'model berpikir yang paling hemat biaya'

Otak-tunnel-gettyimages-1725500027 — Yuichiro Chino/Getty Images

Hanya beberapa minggu setelah meluncurkan Gemini 2.5 Pro, Google menjadi model kinerja terbaik berikutnya.

Pada hari Kamis, perusahaan merilis “versi awal” dari Gemini 2.5 Flash dalam pratinjau di Gemini API, AI Studio, dan Vertex AI. Model ini memiliki cutoff pengetahuan Januari 2025. Ini dapat mengambil teks, gambar, video, dan petunjuk audio, dan memiliki jendela konteks satu juta token.

Juga: Gemini Pro 2.5 adalah asisten pengkodean yang sangat mampu – dan ancaman besar bagi chatgpt

Google mengatakan versi baru berkembang di Flash 2.0 dengan penalaran yang lebih baik, tetapi “tanpa mengorbankan kecepatan atau biayanya yang terkenal.” Model penalaran menghabiskan lebih banyak waktu “berpikir” – atau menafsirkan kueri – sebelum merespons, yang menghasilkan output yang lebih menyeluruh dan langsung yang, idealnya, menyelaraskan lebih baik dengan kebutuhan pengguna, dibandingkan dengan model sebelumnya yang memprioritaskan kecepatan. Model bahwa alasan juga lebih siap untuk secara akurat memberikan masalah atau tugas multi-langkah.

“Gemini 2.5 Flash berkinerja sangat kuat pada petunjuk keras di Chatbot Arena, kedua hanya untuk 2,5 Pro,” Google mencatat dalam pengumuman.

Mengacu pada model baru sebagai yang paling hemat biaya, Google mencatat bahwa 2.5 flash “memungkinkan pengembang untuk mengonfigurasi jumlah pemikiran yang dilakukannya untuk memaksimalkan kinerja.” Ini memberi pengembang “anggaran berpikir,” atau kekuatan untuk membayar alasan hanya ketika mereka sangat membutuhkannya. Dengan alasan, harga output melonjak dari 60 sen per satu juta token menjadi $ 3,50.

Tangkapan layar oleh Radhika Rajkumar/Zdnet

Jika pengembang tidak memberikan model anggaran, itu menentukan kebutuhan pemikiran kueri itu sendiri dengan mengevaluasi permintaan kompleksitas. Misalnya, itu akan mengidentifikasi petunjuk dengan kebutuhan penalaran minimal – seperti “Berapa banyak negara bagian di AS?” -Secara terpisah dari masalah matematika multi-langkah. Google mencatat bahwa untuk mereplikasi flash 2.0 latensi dan biaya, pengembang harus menetapkan anggaran ke 0.

Juga: Cara Mencoba Generator Video VEO 2 AI Google – dan apa yang dapat Anda lakukan dengannya

Gemini 2.5 Flash mencetak 12% pada Ujian Terakhir Kemanusiaan (HLE), tolok ukur alternatif baru untuk tes industri yang telah menjadi terlalu mudah untuk model yang berkembang pesat. Skor ini mengungguli model pesaing, termasuk Claude 3.7 Sonnet dan Deepseek R1, tetapi tidak Openai yang baru saja diluncurkan O4-Mini, yang datang pada 14% pada tes.

Anda dapat mencoba Gemini 2.5 Flash dalam pratinjau melalui Gemini API di Google AI Studio dan Vertex AI.

Ingin lebih banyak cerita tentang AI? Daftar inovasibuletin mingguan kami.