Jason Hiner/ZDNET

Semasa WWDC 2024, Apple memperkenalkan platform Apple Intelligence, yang membawa kecerdasan buatan (AI) dan pembelajaran mesin ke hadapan. Platform ini menggunakan bahasa yang besar dan model generatif untuk mengendalikan teks, imej dan tindakan dalam apl.

Inisiatif ini menyepadukan keupayaan AI lanjutan merentas ekosistem Apple untuk mengubah interaksi peranti. Walau bagaimanapun, pengguna iPhone dan iPad semasa mungkin perlu meningkatkan peranti mereka untuk memanfaatkan sepenuhnya faedah ini.

Dalam artikel sebelum ini, saya mencadangkan beberapa langkah penting untuk Apple kekal berdaya saing dalam perlumbaan AI. Mari lihat bagaimana pengumuman Apple memenuhi cadangan ini dan di mana terdapat ruang untuk penambahbaikan.

Perkara yang akan dibawa oleh Apple Intelligence kepada platform sistem pengendalian syarikat

AI pada peranti dan dalam awan

Apple Intelligence membawakan model generatif yang berkuasa ke iPhone, iPad dan Mac. Keupayaan pada peranti memerlukan cip A17 Pro, mengehadkannya kepada pengguna iPhone 15 Pro dan Pro Max untuk keselamatan dan privasi yang dipertingkatkan. Begitu juga, hanya iPad dengan cip siri M (seperti iPad Air dan iPad Pro terbaharu) dan Mac yang menjalankan Apple Silicon akan serasi. Ramai pengguna dengan peranti lama atau model bukan Pro akan terlepas ciri lanjutan ini.

Untuk tugasan yang lebih mencabar, Apple memperkenalkan Private Cloud Compute (PCC), sebuah sistem risikan awan terobosan yang direka untuk pemprosesan AI peribadi. PCC memanjangkan keselamatan dan privasi peneraju industri peranti Apple ke dalam awan, memastikan data pengguna peribadi yang dihantar ke PCC tidak boleh diakses oleh sesiapa selain pengguna — malah Apple. Dibina dengan Apple Silicon tersuai dan sistem pengendalian keras yang direka untuk privasi, PCC mewakili lonjakan generasi dalam keselamatan pengiraan AI awan.

Dari segi infrastruktur AI, Apple juga memperkenalkannya Model Asas, termasuk ~3 bilion parameter model bahasa pada peranti dan model berasaskan pelayan yang lebih besar yang dijalankan pada pelayan Apple Silicon dalam pusat data syarikat. Model ini diperhalusi untuk tugas khusus dan dioptimumkan untuk kelajuan dan kecekapan.

Bilik untuk Penambahbaikan: Apple gagal dalam kepimpinan infrastruktur AI dengan tidak mengumumkan perkakas pelayan dipercepatkan AI di bahagian tepi, yang akan membenarkan peranti kurang berkemampuan, seperti iPhone 15 asas dan model yang disokong iOS 18 yang lebih awal, menggunakan ciri Apple Intelligence yang lebih maju. Walaupun model AI hibrid dengan pada peranti dan PCC adalah satu langkah ke arah yang betul, peranti rangkaian tepi dipercepat AI tidak disebut untuk meningkatkan prestasi dan mengurangkan kependaman. Apple biasanya tidak telus tentang menggunakan sumber dalam pusat datanya, jadi ia mungkin merancang untuk menggunakan peralatan ini di pinggir tanpa mendedahkan perkara khusus. Manakala senarai pendek Prinsip AI Bertanggungjawab yang syarikat telah didokumenkan di sini adalah permulaan yang baik, AI pendedahan etika kenyataan mengikut apa yang Adobe lakukan akan meningkatkan lagi kepercayaan dan ketelusan.

Merangkul penyedia AI pihak ketiga

Apple telah memasukkan jari kakinya ke dalam penyepaduan ChatGPT, menunjukkan kesediaan untuk menyepadukan perkhidmatan pihak ketiga dan bekerjasama dengan berbilang penyedia AI. Semasa ucaptama, Apple berkata ia akan bekerjasama untuk membenarkan model bahasa besar (LLM) pihak ketiga sebagai tambahan kepada OpenAI ChatGPT (percuma, Plus, dan mungkin Enterprise) tetapi tidak menamakan model tersebut. Model berpotensi termasuk Microsoft Copilot, Google Gemini, Meta Llama 3, Amazon Titan dan Hugging Face, antara lain.

Ruang untuk penambahbaikan: Walaupun hasrat Apple untuk menjadi LLM-agnostik adalah petanda positif untuk strategi AI syarikat, saya mengharapkan penggunaan platform pihak ketiga yang lebih luas, terutamanya kesihatan, kewangan dan pendidikan, dengan penyepaduan AI. Walau bagaimanapun, anjakan ini perlu disertakan dengan pembangun yang menerima SiriKit baharu, Niat Apl, ML Teras, Cipta ML dan API lain. Penyepaduan yang lebih mendalam dengan pembekal AI khusus boleh meningkatkan fungsi dan serba boleh Apple Intelligence dengan ketara.

Pemberitahuan pintar dan alatan menulis

Pemberitahuan pintar dalam sistem pengendalian Apple akan memanfaatkan LLM pada peranti untuk menyaring bunyi dan memastikan bahawa hanya makluman yang paling penting sahaja yang dapat mengatasinya. Ini adalah sebahagian daripada Fokus Kurangkan Gangguan baharu, yang menunjukkan butiran penting pengguna untuk setiap pemberitahuan. Alat penulisan seluruh sistem boleh menulis, membaca pruf dan meringkaskan teks untuk pengguna, daripada mesej ringkas kepada catatan blog yang panjang, dengan ciri Tulis Semula menyediakan berbilang versi teks berdasarkan khalayak yang dimaksudkan.

Ruang untuk penambahbaikan: Membina Fokus Kurangkan Gangguan, pembangunan lanjut dalam ciri bantuan proaktif yang menjangka keperluan pengguna berdasarkan tingkah laku dan konteks masa lalu akan bermanfaat.

Penjanaan imej AI dan Genmoji

Apple telah membuka dunia kemungkinan kreatif dengan menyepadukan API Taman Permainan Imej ke dalam semua aplikasi. Pengguna boleh mencipta imej yang dijana AI dalam tiga gaya: Lakaran, Animasi dan Realisme. Bayangkan mencipta dan berkongsi imej ini secara langsung dalam Mesej atau Halaman — ia adalah pengubah permainan. Dalam Nota, alat Image Wand baharu boleh menjana imej berdasarkan kandungan halaman semasa. Genmoji membenarkan pengguna mencipta emoji tersuai, menambahkan sentuhan yang diperibadikan pada komunikasi.

Ruang untuk penambahbaikan: Menyediakan kawalan yang lebih terperinci dan pilihan penyesuaian untuk imej yang dijana dan Genmoji, seperti gaya dan atribut penalaan halus, boleh memenuhi pilihan pengguna yang lebih khusus. Selain itu, melaksanakan ciri yang mencadangkan peningkatan imej atau penciptaan emoji berdasarkan aktiviti dan konteks pengguna boleh menyelaraskan lagi proses kreatif.

Siri dipertingkatkan dan automasi tugas

Siri, pembantu suara yang kami kenali dan bertolak ansur, akhirnya mendapat peningkatan yang sangat diperlukan. Dengan pemprosesan bahasa semula jadi (NLP), Siri boleh memahami pengguna walaupun mereka gagap dan mengekalkan konteks perbualan, menjadikan interaksi lebih lancar dan intuitif. Anda kini boleh menaip permintaan kepada Siri, ciri yang pasti akan menjadi hit dalam persekitaran yang bising. Penampilan baharu Siri, dengan lilitan cahaya di sekeliling tepi skrin apabila diketuk, menambah sentuhan moden.

Kesedaran kontekstual Siri yang dipertingkatkan membolehkan Siri mengendalikan tugas seperti mencari foto tertentu, memainkan podcast dan mendapatkan semula fail yang dikongsi berdasarkan arahan pengguna. Pembantu boleh menarik maklumat lesen memandu daripada foto dan memasukkannya ke dalam borang. Dalam Foto, AI boleh menggunakan NLP untuk mencari foto atau klip video tertentu dan mengalih keluar objek yang mengganggu dengan alat Bersihkan yang baharu.

Ciri Kurangkan Gangguan baharu memastikan bahawa hanya pemberitahuan yang paling penting diterima berdasarkan aktiviti anda. Pada iPad, pengoptimuman tulisan tangan (Skrip Pintar) dan keupayaan tafsiran matematik memudahkan untuk menulis persamaan dengan Pensil Apple dan menyelesaikannya dengan apl Kalkulator. Dalam Nota, Tongkat Imej mengubah lakaran kasar kepada imej yang digilap dan anda boleh merakam serta menyalin audio dengan ringkasan teks yang dijana oleh Apple Intelligence. Alat pembersihan mengalih keluar objek yang tidak diingini dalam Foto dan Carian dalam Video membantu mencari coretan tertentu.

Apple Intelligence juga melakukan tindakan dalam apl bagi pihak pengguna. Ia boleh membuka Foto dan menunjukkan imej kumpulan tertentu berdasarkan permintaan. Dalam Mel, mesej keutamaan diserlahkan dengan ringkasan untuk cerapan pantas. Nota pengguna boleh merakam, menyalin dan meringkaskan audio, mencipta transkrip ringkasan panggilan dengan pemberitahuan automatik kepada peserta.

Ruang untuk penambahbaikan: Walaupun Apple telah mencapai kemajuan yang ketara, kemas kini masa hadapan boleh meningkatkan lagi keupayaan Siri, mengautomasikan tugas yang lebih kompleks dan menyediakan pemperibadian yang lebih mendalam merentas ekosistem Apple.

Keupayaan AI merentas produk Apple

Akhir sekali, meningkatkan keupayaan AI merentas semua produk Apple, termasuk Siri, Apple Music, Apple News, Health, Fitness+, TV dan HomeKit, merupakan cadangan utama. Walaupun ciri AI Apple disepadukan merentas peranti, peningkatan khusus untuk perkhidmatan seperti Apple Music dan HomeKit adalah terhad, sekurang-kurangnya seperti yang dinyatakan dalam ucaptama WWDC.

Ruang untuk penambahbaikan: Kami juga tidak mendengar apa-apa tentang HomePod atau Apple TV dengan Apple Intelligence, walaupun kedua-dua produk ini tidak mempunyai kuasa pengiraan untuk melaksanakan AI generatif pada peranti. Begitu juga, tiada menyebut tentang keupayaan AI baharu dalam WatchOS. Walaupun peranti ini mungkin boleh menggunakan beberapa keupayaan awan Apple Intelligence, ini tidak dikemukakan dalam ucaptama. Selain itu, dengan cip M2nya, Vision Pro cukup berkuasa untuk mengendalikan ciri Apple Intelligence pada peranti. Namun, ucaptama tidak membincangkan perkara yang akan datang kepada peranti itu secara khusus.

Kisah pemaju

Pada WWDC 2024, Apple menggandakan usaha memperkasakan pembangun dengan alatan dan API yang mereka perlukan untuk membuka kunci potensi penuh Apple Intelligence melalui barisan sesi pembangun yang luasmenonjolkan komitmen Apple untuk memupuk ekosistem pembangunan AI yang bertenaga.

Sesi ini akan menawarkan penyelaman mendalam untuk mengoptimumkan dan melaksanakan model pembelajaran mesin pada iOS, iPadOS dan MacOS. Matlamatnya adalah untuk melengkapkan pembangun dengan pengetahuan untuk memanfaatkan keupayaan AI canggih Apple.

Salah satu ciri yang menonjol ialah, sudah tentu, Siri yang dipertingkatkan. Pembangun akan belajar cara mengintegrasikan apl mereka dengan SiriKit, menggunakan NLP yang dipertingkatkan untuk mencipta interaksi pengguna yang lebih lancar dan intuitif. Niat Apl juga akan menjadi tumpuan utama, membolehkan pembangun membawa ciri teras apl mereka terus kepada pengguna melalui Siri dan perkhidmatan sistem lain.

Dengan Apple Silicon mengetuai pertuduhan, sesi akan memberi panduan tentang mengoptimumkan pembelajaran mesin dan model AI khusus untuk cip berkuasa ini. Kandungan ini termasuk menggunakan model dengan Core ML dan menyokong inferens ML masa nyata pada CPU. Kemas kini untuk Mencipta ML juga akan diliputi, memfokuskan pada model latihan dengan lebih cekap dan berkesan.

Satu lagi sorotan utama ialah alatan penulisan baharu Apple, yang boleh membaca pruf, meringkaskan dan menulis semula teks. Pembangun akan ditunjukkan cara untuk memasukkan alat ini ke dalam apl mereka, menawarkan pengguna ciri manipulasi teks lanjutan.

Potensi kreatif Genmoji juga akan diterokai, dengan sesi tentang cara menjana emoji tersuai untuk meningkatkan penglibatan dan pemperibadian pengguna.

Apple menolak sempadan prestasi dengan sesi untuk mempercepatkan tugasan pembelajaran mesin menggunakan Metal, rangka kerja grafik Apple. Pembangun juga akan menemui keupayaan baharu dalam rangka kerja Swift dan Vision, yang penting untuk menyepadukan ciri pengecaman imej lanjutan.

Akhirnya, API Terjemahan baharu akan didedahkan. Ia akan membantu pembangun membina apl yang menterjemah teks dan pertuturan dengan lancar, menjadikan aplikasi lebih inklusif dan boleh diakses.

Dengan melengkapkan pembangun dengan sumber ini, Apple memastikan bahawa potensi Apple Intelligence dapat direalisasikan sepenuhnya merentasi ekosistemnya, memacu inovasi dan meningkatkan pengalaman pengguna.

Adakah Apple pergi cukup jauh dengan peningkatan AI?

Walaupun pengumuman yang menarik, masih terdapat beberapa jurang. Apple memperkenalkan API dan peningkatan baharu, dan sesi pembangun akan datang akan menyediakan alatan, rangka kerja dan latihan yang diperlukan. Walau bagaimanapun, terdapat peluang yang terlepas untuk integrasi pihak ketiga yang lebih luas, terutamanya dalam bidang utama seperti kesihatan dan kewangan. Selepas pembangun menendang tayar pada Apple Intelligence musim luruh ini, penyepaduan ini mungkin dijangka kemudian, keluaran selepas iOS 18.

Walaupun peningkatan merentas perkhidmatan Apple seperti Apple Music, News, Health, Fitness+ dan HomeKit tersirat, ia tidak diliputi secara meluas. Kami menjangkakan butiran ini akan muncul dengan iOS 18 beta kemudian.

Pengumuman WWDC 2024 Apple sejajar dengan beberapa cadangan utama tetapi gagal dalam penyepaduan pihak ketiga yang lebih luas, bantuan proaktif dan amalan AI beretika. Walau bagaimanapun, sesi pembangun meluas yang dirancang untuk persidangan itu menunjukkan bahawa Apple serius untuk melengkapkan pembangun dengan alat dan pengetahuan yang mereka perlukan untuk menggunakan keupayaan AI baharu ini.

Menangani jurang yang tinggal boleh meningkatkan kedudukan daya saing Apple dalam perlumbaan AI, menyediakan ekosistem AI yang lebih teguh dan mengutamakan pengguna. Dengan terus berinovasi dan menambah baik dalam bidang ini, Apple boleh menetapkan penanda aras baharu dan menerajui masa depan teknologi dipacu AI.



Sumber