Geekbench mengeluarkan aplikasi penilaian kecerdasan buatan

Benchmarking stalwarts Primate Labs pada hari Khamis mengeluarkan Geekbench AI 1.0. Aplikasi ini, yang kini tersedia untuk Android, Linux, MacOS, dan Windows, mengaplikasikan prinsip-prinsip Geekbench ke dalam pembelajaran mesin, pembelajaran mendalam, dan beban kerja kecerdasan buatan lainnya, dalam usaha untuk menormalkan penilaian prestasi di seluruh platform. Ia merupakan pengganti kepada Geekbench ML (pembelajaran mesin), yang diumumkan pada tahun 2021 dan kini berada pada versi 0.6.

“[B]aru-baru ini, syarikat-syarikat telah berkumpul untuk menggunakan istilah 'kecerdasan buatan' dalam jenis-jenis beban kerja ini (dan dalam pemasaran berkaitan mereka),” kata Primate Labs mengenai perubahan nama. “Untuk memastikan bahawa setiap orang, dari jurutera hingga peminat prestasi, memahami apa yang dilakukan oleh penanda aras ini dan bagaimana ia berfungsi, kami rasa sudah tiba masanya untuk membuat pembaharuan.”

Minggu ini, pengeluar ChatGPT OpenAI mengumumkan versi baru model kecerdasan buatannya. SWE-bench Verified adalah satu tawaran 'disahkan manusia' yang menggunakan pengesahan manusia untuk menentukan keberkesanan model dalam menyelesaikan "masalah dunia nyata."