Pada DevDay 2024, OpenAI mengumumkan beberapa alat pengembang baru, yang memungkinkan mereka membuat aplikasi AI tingkat lanjut dengan lebih mudah. Seperti yang diharapkan, perusahaan tidak mengumumkan model baru apa pun selama acara tersebut.

OpenAI membuat empat pengumuman besar untuk pengembang. Pertama, ia mengumumkan beta publik untuk API waktu nyatayang akan memungkinkan pengembang membangun pengalaman multi-mode latensi rendah di aplikasi mereka. Hal ini akan memungkinkan pengembang untuk membangun aplikasi yang mirip dengan Mode Suara Tingkat Lanjut ChatGPT dengan percakapan ucapan-ke-ucapan alami menggunakan enam suara yang telah ditetapkan sebelumnya. Bagi pengembang yang tidak membutuhkan manfaat latensi rendah dari Realtime API, OpenAI juga mengumumkan input dan output audio di Chat Completion API.

Token input teks API realtime akan berharga $5 per 1 juta dan $20 per 1 juta token output. Input audio akan dikenakan biaya $100 per 1 juta token, dan output akan menjadi $200 per 1 juta token. Jadi, biayanya sekitar $0,06 per menit untuk input audio dan $0,24 per menit untuk output audio.

Kedua, OpenAI mengumumkan penyempurnaan visual pada GPT-4omemungkinkan pengembang untuk menyempurnakan model menggunakan gambar bersama dengan teks. Ini akan berguna dalam skenario seperti peningkatan fungsi pencarian visual, peningkatan deteksi objek untuk kendaraan otonom, analisis gambar medis yang akurat, dan banyak lagi. Penyempurnaan visi kini tersedia untuk semua pengembang menggunakan kutipan model GPT-4o terbaru, ‘gpt-4o-2024-08-06’ pada tingkat penerapan berbayar. OpenAI juga menawarkan 1 juta token pelatihan per hari secara gratis hingga 31 Oktober 2024, untuk menyempurnakan GPT-4o dengan gambar. Setelah itu, pelatihan penyesuaian akan menelan biaya $25 per 1 juta token, dan inferensi akan menelan biaya $3,75 per 1 juta token masukan dan $15 per 1 juta token keluaran.

Ketiga, OpenAI akhirnya menyusul Google dan Anthropic dengan yang baru Dukungan Caching Instan yang memungkinkan pengembang mengurangi biaya dan latensi. Dengan menggunakan Caching Prompt, pengembang bisa mendapatkan diskon 50% dan waktu pemrosesan lebih cepat. Selain itu, pengembang tidak perlu melakukan apa pun untuk mengaktifkan Caching Prompt, karena ini secara otomatis diterapkan pada versi terbaru GPT-4o, GPT-4o mini, o1-preview dan o1-mini, serta versi yang disempurnakan dari model-model tersebut.

Keempat, OpenAI mengumumkan yang baru Rangkaian Penyempurnaan Model yang akan memungkinkan pengembang untuk menyempurnakan model yang lebih kecil menggunakan keluaran dari model batas yang lebih besar. Hal ini akan memungkinkan mereka untuk mencocokkan kinerja model-model canggih pada tugas-tugas tertentu dengan biaya yang jauh lebih rendah. Sebelumnya, penyempurnaan model melibatkan proses besar dan beberapa alat yang tidak terhubung. Dengan rangkaian Model Distilasi baru, OpenAI kini menawarkan seluruh jalur distilasi langsung dalam platformnya.

Distilasi Model sekarang tersedia untuk semua pengembang. OpenAI menawarkan 2 juta token pelatihan gratis per hari di GPT-4o mini dan 1 juta token pelatihan gratis per hari di GPT-4o hingga 31 Oktober. Setelah itu, biaya pelatihan dan menjalankan model yang disempurnakan akan sama dengan harga penyesuaian standar OpenAI saat ini.

Dengan menyederhanakan alur kerja dan mengurangi biaya, OpenAI memudahkan pengembang untuk berinovasi dan mendorong batasan dari apa yang mungkin dilakukan dengan AI.



Sumber