Model besar "merampingkan" ke dalam ponsel, iPhone berikutnya akan datang?

Gelombang "model besar end-to-side" akan datang. Raksasa chip seperti Huawei dan Qualcomm sedang menjajaki penanaman model AI besar di sisi perangkat, memungkinkan ponsel untuk mewujudkan evolusi spesies generasi baru.

Dibandingkan dengan aplikasi AI seperti ChatGPT dan Midjourney, yang mengandalkan server cloud untuk menyediakan layanan, model besar sisi akhir berfokus untuk mewujudkan kecerdasan secara lokal. Keuntungannya adalah dapat melindungi privasi dengan lebih baik, dan pada saat yang sama, ponsel dapat menjadi asisten pintar pribadi pengguna melalui pembelajaran, dan tidak perlu khawatir tentang downtime server cloud dan masalah lainnya.

Namun dengan kondisi teknis yang ada, performa ponsel masih jauh dari cukup untuk mendukung pengoperasian model berukuran besar. Solusi teknis arus utama dalam industri ini adalah "melangsingkan" model besar melalui pemangkasan, kuantisasi, dan penyulingan, serta mengurangi konsumsi sumber daya dan energi yang diperlukan dengan alasan mengurangi akurasi sesedikit mungkin.

Qualcomm telah mulai mengembangkan chip untuk model besar sisi ujung. Ini menunjukkan bahwa terminal seluler yang menerapkan model AI akan datang kepada kami.

Pabrikan ponsel memimpin model besar ke terminal seluler

Model besar AI bergegas dari cloud ke terminal pintar.

Pada tanggal 4 Agustus, pada Huawei Developer Conference 2023, Huawei merilis HarmonyOS 4. Dibandingkan dengan sistem operasi generasi sebelumnya, perubahan yang paling signifikan adalah kemampuan model besar AI dibangun ke lapisan bawah sistem. Huawei membuka awal model AI yang pindah ke "sisi terminal pintar".

Saat ini, layanan yang disediakan oleh aplikasi AI seperti ChatGPT dan Midjourney pada dasarnya diselesaikan melalui server cloud. Mengambil ChatGPT sebagai contoh, model besar dan sumber daya komputasi di belakangnya disimpan di server jarak jauh Pengguna berinteraksi dengan server secara real time, dan teks input diproses oleh server untuk mendapatkan respons. Keuntungan dari ini adalah dapat memastikan pengoperasian model yang efisien dan stabil, karena server biasanya dilengkapi dengan sumber daya komputasi yang kuat dan dapat diperluas kapan saja untuk mengakomodasi beban tinggi.

Sekarang, logika pendukung baru telah muncul. Huawei sedang mencoba memperkenalkan model skala besar ke terminal, yang berarti bahwa semua tugas yang disebutkan di atas dapat dilakukan secara lokal.Sistem ponsel itu sendiri memiliki kemampuan AI tertentu, dan tidak perlu mengakses layanan cloud AI untuk mencapai peningkatan cerdas .

Yu Chengdong, direktur eksekutif Huawei dan CEO Terminal BG, memperkenalkan bahwa HarmonyOS 4 didukung oleh model Huawei Pangu, dan berharap dapat menghadirkan revolusi pengalaman AI baru dari interaksi terminal pintar, efisiensi produktivitas tingkat tinggi, dan layanan yang dipersonalisasi kepada pengguna .

HarmonyOS 4 memperkenalkan megamodel AI

Kemampuan AI dari HarmonyOS 4 saat ini diwujudkan terutama oleh asisten pintar Huawei "Xiaoyi". Setelah model besar terhubung, Xiaoyi memperluas input berbagai bentuk seperti teks, gambar, dan dokumen berdasarkan interaksi suara, dan kemampuan pemahaman bahasa alami ditingkatkan. Xiaoyi juga dapat terhubung ke berbagai layanan dan skenario sesuai dengan instruksi, seperti mengekstraksi teks dari gambar secara otomatis, menghasilkan berbagai jenis konten email komersial atau menghasilkan gambar, dll.

Perubahan yang lebih penting adalah bahwa Xiaoyi memiliki kemampuan untuk mengingat dan belajar.Seiring terus digunakan, ia akan menjadi semakin sadar akan "tuannya", mampu dengan cerdas memberikan rencana seperti rencana perjalanan dan aktivitas, dan menyadarinya sesuai dengan kebiasaan pengguna Rekomendasi yang dipersonalisasi. Huawei mengungkapkan bahwa kemampuan baru Xiaoyi ini akan memulai pengalaman uji publik pada akhir Agustus.

Dengan membangun model AI ke lapisan bawah sistem ponsel, Huawei berharap dapat meningkatkan kecerdasan ponsel secara keseluruhan. Meskipun fungsi Xiaoyi yang disebutkan di atas tidak "canggih", untuk mewujudkannya, pengguna sering kali perlu memanggil ChatGPT, Midjourney, dan banyak aplikasi lain pada saat yang bersamaan untuk menyelesaikannya. Ketika ponsel itu sendiri memiliki kemampuan AI, itu seperti asisten yang lebih serbaguna, memberikan layanan yang komprehensif.

Sebelum rilis HarmonyOS 4, Huawei sebenarnya telah mencoba menghubungkan model besar AI ke terminal seluler. Pada bulan Maret tahun ini, Huawei merilis ponsel P60. Fungsi pencarian gambar pintar bawaan didasarkan pada teknologi model besar multi-modal. Dengan mengecilkan model di sisi ponsel, operasi model bahasa alami di ponsel samping terwujud.

Huawei bukanlah perusahaan pertama yang memperkenalkan model AI ke dalam perangkat. Pada Konferensi Kecerdasan Buatan Dunia 2023, Qualcomm mendemonstrasikan praktik pengoperasian model skala besar memasuki sisi akhir, menjalankan Difusi Stabil model AI generatif pada ponsel yang dilengkapi dengan Snapdragon 8 generasi kedua, dan menjalankan 20 langkah penalaran dalam 15 detik , dan gambar 512x512 piksel dihasilkan, dan efek gambar tidak jauh berbeda dari tingkat pemrosesan cloud.

Selama Shanghai MWC 2023, CEO Honor Zhao Ming juga mengatakan bahwa Honor akan mempromosikan penerapan model besar sisi ujung di sisi smartphone untuk mencapai interaksi natural multi-modal, pengenalan maksud yang tepat, dan layanan loop tertutup untuk tugas-tugas kompleks.

Yang juga menarik perhatian adalah Apple Sebulan yang lalu, Apple terungkap secara diam-diam mengembangkan "Apple GPT", yang merupakan alat kecerdasan buatan berdasarkan kerangka kerja Ajax yang dikembangkan sendiri oleh Apple. Meskipun detail spesifiknya belum diungkapkan, secara umum industri berspekulasi bahwa Apple kemungkinan akan menambahkan model besar di tingkat sistem untuk meningkatkan kecerdasan asisten suara Siri, sehingga Siri dapat melepas topi " keterbelakangan mental buatan".

Hype atau Revolusi Baru?

Tidak jarang produsen ponsel berfokus pada model besar, tetapi mengapa mereka mengambil rute "perangkat ke sisi"? Lagi pula, kemampuan interaksi dan pembangkitan Huawei Xiaoyi juga dapat disediakan melalui server cloud, dan tampaknya biayanya lebih ekonomis dan teknologinya lebih mudah diimplementasikan.

Apakah ini hype atau apakah benar-benar perlu menempatkan model besar AI ke dalam terminal seluler pintar? Mengenai masalah ini, Yu Chengdong dan Zhao Ming menyebutkan dua kata kunci: keamanan privasi dan personalisasi.

Yu Chengdong menekankan bahwa Huawei mengadvokasi bahwa prinsip pertama dari semua inovasi pengalaman AI dan desain pemandangan adalah keamanan dan perlindungan privasi, untuk menciptakan AI yang lebih bertanggung jawab, dan berjanji bahwa konten yang dihasilkan oleh AI akan ditandai.

Dibandingkan dengan memproses data di cloud, keuntungan yang paling jelas dari sisi smart terminal adalah privasi dan keamanan. Sebelumnya, ChatGPT telah berulang kali terlibat dalam badai kebocoran data. Pada bulan Maret tahun ini, Samsung mengeluarkan larangan penggunaan ChatGPT secara internal. Alasannya, karyawan semikonduktor diduga membocorkan rahasia perusahaan dengan menggunakan ChatGPT; Dalam hal menggunakan dan membocorkan data privasi pribadi, jumlah klaimnya sama tingginya sebesar 3 miliar dolar AS.

Saat pemrosesan data berada di sisi akhir, data pribadi pengguna tidak akan diunggah ke server cloud, yang sangat mengurangi risiko kebocoran privasi. Ini juga memberikan prasyarat bagi asisten AI ponsel untuk benar-benar menjadi penjaga kehidupan - hanya jika privasi dijamin, pengguna akan merasa lega untuk menyerahkan data ke AI untuk dipelajari.

Dalam pemahaman Zhao Ming, misi model AI sisi akhir adalah untuk lebih memahami pengguna, "mengetahui jam berapa saya pergi tidur dan apa yang saya suka makan dapat menyelesaikan kebutuhan mendesak saya, yang setara dengan memiliki kemampuan untuk mendapatkan wawasan ke dalam kebutuhan saya. "Untuk melakukan ini, AI perlu dilatih berdasarkan data dan kebiasaan pribadi pengguna. Nantinya, smartphone diharapkan akan menjadi asisten serba bisa, atau sekretaris robot pribadi, yang dapat membantu pengguna dengan katering, pemesanan , konsultasi, hiburan, Office, dan persyaratan multi-skenario lainnya.

Sebaliknya, baik ChatGPT dan aplikasi AI arus utama lainnya adalah produk standar, dan sulit untuk memiliki kemampuan asisten pribadi tanpa modifikasi, tidak memahami pengguna, tetapi hanya menanggapi instruksi masukan pengguna. Ponsel pribadi sudah menjadi perangkat pintar pribadi pribadi.Jika model AI yang memahami bahasa manusia dapat berjalan di ponsel, niscaya tingkat kecerdasannya akan sangat meningkat.

Selain itu, aplikasi yang mengandalkan cloud juga tidak stabil. Misalnya, karena alasan jaringan atau server, kecepatan respons cloud dapat melambat, atau bahkan crash sama sekali. Ini telah terjadi berkali-kali di ChatGPT, dan besar yang dilokalkan model akan sangat melemah Ketergantungan pada cloud, untuk menghindari "cloud lag".

Berdasarkan karakteristik di atas, "revolusi perangkat-ke-sisi" dari model-model besar telah menunjukkan potensi, dan bahkan diharapkan ponsel yang telah mengalami hambatan pengembangan selama bertahun-tahun akan mengalami evolusi spesies menarik lainnya, seperti halnya munculnya smartphone layar besar dan rilis iPhone.

Tapi ada masalah yang jelas bagi model besar untuk menunjukkan kekuatannya pada ponsel: Bisakah chip ponsel menahannya? Karena model besar sering berisi puluhan miliar atau ratusan miliar parameter, dan memerlukan pelatihan tingkat astronomi dan menghabiskan daya komputasi yang besar, kinerja chip ponsel yang ada jelas tidak dapat memenuhi persyaratan.

Dalam hal ini, solusi arus utama dalam industri ini adalah "miniaturisasi model".

Sederhananya, ketika struktur jaringan model ditentukan, model "diperampingkan" dengan alasan mengurangi akurasi sesedikit mungkin, sehingga mengurangi konsumsi sumber daya dan energi yang diperlukan. Proses ini biasanya memiliki tiga langkah, memotong parameter dalam model yang berdampak sangat kecil pada akurasi, yang disebut "pemangkasan"; menggunakan tipe data presisi rendah untuk penalaran, yang disebut "kuantisasi" dalam jargon; dan dari model kompleks , untuk mengekstraksi model yang serupa tetapi lebih sederhana, yang dengan jelas disebut "distilasi". Tujuan utamanya adalah untuk mengurangi ukuran model.

Di sisi lain, produsen chip seperti Qualcomm juga menyebarkan dan mengembangkan chip khusus untuk sisi akhir model besar AI. Sebelumnya, platform seluler 5G Qualcomm Snapdragon 8 Gen2 mengintegrasikan prosesor Hexagon khusus AI untuk pertama kalinya, menggunakan sistem catu daya khusus yang independen, mendukung penalaran micro-slicing, presisi INT4, dan akselerasi jaringan Transformer, dll., sambil memberikan kinerja yang lebih tinggi. Mengurangi konsumsi energi dan penggunaan memori.

Model besar sisi ujung memulai generasi baru revolusi terminal pintar. IDC memperkirakan bahwa pada tahun 2026, hampir 50% prosesor peralatan terminal di pasar China akan memiliki teknologi mesin AI. Perubahan besar lain yang dibawa AI ke kehidupan teknologi manusia mungkin muncul.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)