Большая модель «худеет» в мобильный телефон, грядет ли следующий iPhone?

Question

![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-6849153aa7-dd1a6f-1c6801) Грядет волна «крупных моделей встык». Гиганты чипов, такие как Huawei и Qualcomm, изучают возможность имплантации больших моделей ИИ на стороне устройства, что позволит мобильным телефонам реализовать эволюцию нового поколения видов.По сравнению с приложениями ИИ, такими как ChatGPT и Midjourney, которые полагаются на облачные серверы для предоставления услуг, конечная крупная модель фокусируется на реализации интеллекта локально. Его преимущество в том, что он может лучше защитить конфиденциальность, и в то же время мобильный телефон может стать личным умным помощником пользователя посредством обучения, и вам не нужно беспокоиться о простое облачного сервера и других проблемах.Однако в существующих технических условиях производительность мобильных телефонов далеко не достаточна для обеспечения работы крупных моделей. Основное техническое решение в отрасли состоит в том, чтобы «уменьшить» большую модель посредством обрезки, квантования и дистилляции, а также сократить требуемые ресурсы и потребление энергии с целью как можно меньшего снижения точности.Qualcomm начала разработку чипов для конечных больших моделей. Это указывает на то, что к нам приходят мобильные терминалы, использующие модели ИИ.## Производители мобильных телефонов выводят большие модели на мобильные терминалыБольшие модели ИИ мчатся из облака в смарт-терминал.4 августа на конференции разработчиков Huawei 2023 года компания Huawei представила HarmonyOS 4. По сравнению с предыдущими поколениями операционных систем ее наиболее значительным изменением является то, что она встроила возможности больших моделей искусственного интеллекта в нижний уровень системы. Huawei открывает прелюдию к переходу модели ИИ на «сторону интеллектуального терминала».В настоящее время услуги, предоставляемые приложениями ИИ, такими как ChatGPT и Midjourney, в основном выполняются через облачные серверы. Возьмем в качестве примера ChatGPT: большая модель и вычислительные ресурсы, стоящие за ней, хранятся на удаленном сервере, пользователи взаимодействуют с сервером в режиме реального времени, а вводимый текст обрабатывается сервером для получения ответа. Преимущество этого в том, что он может обеспечить эффективную и стабильную работу модели, поскольку сервер, как правило, оснащен мощными вычислительными ресурсами и может быть расширен в любое время для обеспечения высоких нагрузок.Теперь появилась новая поддерживающая логика. Huawei пытается внедрить крупномасштабные модели в терминалы, что означает, что все вышеупомянутые задачи могут выполняться локально.Сама система мобильного телефона имеет определенные возможности ИИ, и ей не требуется доступ к облачным сервисам ИИ для достижения интеллектуальных обновлений. .Юй Чэндун, исполнительный директор Huawei и генеральный директор Terminal BG, сообщил, что HarmonyOS 4 поддерживается моделью Huawei Pangu и надеется предоставить пользователям совершенно новую революцию в области искусственного интеллекта: взаимодействие с интеллектуальным терминалом, высокую производительность и персонализированные услуги. .![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4b82f4e1d1-dd1a6f-1c6801) HarmonyOS 4 представляет мегамодели с искусственным интеллектомВозможности искусственного интеллекта HarmonyOS 4 в настоящее время в основном воплощаются в умном помощнике Huawei «Xiaoyi». После подключения большой модели Xiaoyi расширяет ввод различных форм, таких как текст, изображения и документы, на основе голосового взаимодействия, а способность понимать естественный язык улучшается. Xiaoyi также может подключаться к различным службам и сценариям в соответствии с инструкциями, например, автоматически извлекать текст из изображений, создавать различные типы коммерческого содержимого электронной почты или создавать изображения и т. д.Более важным изменением является то, что Сяойи обладает способностью запоминать и учиться.По мере того, как он продолжает использоваться, он будет все больше и больше осознавать «хозяина», способного разумно давать планы, такие как планы путешествий и деятельности, и реализовывать их. в соответствии с привычками пользователей Персональные рекомендации. Huawei сообщила, что эти новые возможности Xiaoyi начнут публичное тестирование в конце августа.Встраивая модель ИИ в нижний уровень системы мобильного телефона, Huawei надеется улучшить общий интеллект мобильного телефона. Хотя вышеупомянутые функции Xiaoyi не являются «продвинутыми», для их реализации пользователям часто требуется одновременно вызывать ChatGPT, Midjourney и многие другие приложения для завершения. Когда сам мобильный телефон имеет возможности искусственного интеллекта, он становится более универсальным помощником, предоставляющим комплексные услуги.Перед выпуском HarmonyOS 4 компания Huawei действительно пыталась подключить большие модели ИИ к мобильным терминалам. В марте этого года Huawei выпустила мобильный телефон P60.Встроенная функция интеллектуального поиска изображений основана на мультимодальной технологии больших моделей.Путем миниатюризации модели на стороне мобильного телефона, работа модели на естественном языке на мобильном телефоне сторона реализуется.Huawei — не первая компания, внедрившая модели искусственного интеллекта в устройства. На Всемирной конференции по искусственному интеллекту 2023 года компания Qualcomm продемонстрировала практику работы крупномасштабных моделей, выходящих на конечную сторону, запуская генеративную модель искусственного интеллекта Stable Diffusion на мобильном телефоне, оснащенном Snapdragon 8 второго поколения, и выполняя 20 шагов рассуждений. в течение 15 секунд, и создается изображение размером 512x512 пикселей, а эффект изображения существенно не отличается от уровня облачной обработки.Во время выставки MWC 2023 в Шанхае генеральный директор Honor Чжао Мин также заявил, что Honor будет продвигать развертывание конечных крупных моделей на стороне смартфона для достижения многомодального естественного взаимодействия, точного распознавания намерений и услуг с обратной связью для сложных задач.Также внимание привлекает Apple: месяц назад выяснилось, что Apple тайно разрабатывает «Apple GPT», инструмент искусственного интеллекта, основанный на собственной разработке Apple Ajax framework. Хотя конкретные детали еще не разглашаются, в отрасли обычно предполагают, что Apple, вероятно, добавит большую модель на системном уровне, чтобы улучшить интеллект голосового помощника Siri, чтобы Siri могла снять шляпу « искусственная умственная отсталость».## Хайп или новая революция?Производители мобильных телефонов нередко сосредотачиваются на больших моделях, но почему они выбирают путь «от устройства к стороне»? В конце концов, возможности взаимодействия и генерации Huawei Xiaoyi также могут быть обеспечены через облачные серверы, и кажется, что стоимость более экономична, а технология проще в реализации.Это ажиотаж или действительно необходимо помещать большие модели ИИ в умные мобильные терминалы? По этому вопросу и Ю Чэндун, и Чжао Мин упомянули два ключевых слова: безопасность конфиденциальности и персонализация.Юй Чэндун подчеркнул, что Huawei выступает за то, чтобы первым принципом всех инноваций в области ИИ и дизайна сцены была безопасность и защита конфиденциальности, чтобы создать более ответственный ИИ, и обещает, что контент, созданный ИИ, будет помечен.По сравнению с обработкой данных в облаке наиболее очевидным преимуществом интеллектуального терминала является конфиденциальность и безопасность. Ранее ChatGPT неоднократно попадал в штормы утечки данных. В марте этого года компания Samsung ввела запрет на использование ChatGPT внутри компании. Причина заключалась в том, что сотрудники полупроводника подозревались в утечке секретов компании с помощью ChatGPT. как 3 миллиарда долларов США.Когда обработка данных происходит на конечной стороне, личные данные пользователя не будут загружаться на облачный сервер, что значительно снижает риск утечки конфиденциальной информации. Это также является необходимым условием для того, чтобы ИИ-помощник мобильного телефона действительно стал спасателем — только когда конфиденциальность гарантирована, пользователи будут чувствовать облегчение, передавая данные ИИ для обучения.В понимании Чжао Мина миссия конечной модели искусственного интеллекта состоит в том, чтобы лучше понимать пользователей: «знание того, во сколько я ложусь спать и что я люблю есть, может решить мои насущные потребности, что эквивалентно способности получить представление в мои потребности». Для этого ИИ нужно обучать на основе личных данных и привычек пользователя. В конце концов, смартфон, как мы надеемся, станет универсальным помощником или персональным роботом-секретарем, способным помочь пользователям с питанием, бронированием , консалтинг, развлечения, офис и другие требования к нескольким сценариям.Напротив, как ChatGPT, так и другие основные приложения ИИ являются стандартизированными продуктами, и трудно иметь возможность личного помощника без модификации.Он не понимает пользователя, а только отвечает на вводимые пользователем инструкции. Личный мобильный телефон уже является личным личным смарт-устройством.Если модель ИИ, которая понимает человеческий язык, сможет работать на мобильном телефоне, степень интеллекта, несомненно, значительно повысится.Кроме того, приложения, которые полагаются на облако, также нестабильны.Например, из-за сетевых или серверных причин скорость отклика облака может замедляться или даже вообще падать.Это случалось много раз на ChatGPT, и локализованном большом модель будет сильно ослаблена Зависимость от облака, чтобы избежать "облачного лага".Исходя из вышеперечисленных характеристик, «революция устройств в сторону» больших моделей показала потенциал, и есть даже надежда, что мобильные телефоны, которые долгие годы находились в узком месте разработки, претерпят очередную захватывающую видовую эволюцию, как и появление смартфонов с большим экраном и выпуск iPhone.Но есть очевидная проблема для большой модели, чтобы показать свою силу на мобильном телефоне: сможет ли чип мобильного телефона выдержать это? Поскольку большие модели часто содержат десятки миллиардов или сотни миллиардов параметров, требуют обучения астрономического уровня и потребляют огромную вычислительную мощность, производительность существующих чипов мобильных телефонов явно не может удовлетворить требованиям.В связи с этим в настоящее время основным решением в отрасли является «миниатюризация моделей».Проще говоря, когда структура сети модели определена, модель «уменьшается» с целью как можно меньшего снижения точности, тем самым уменьшая требуемые ресурсы и потребление энергии. Этот процесс обычно состоит из трех этапов: удаление из модели параметров, которые очень мало влияют на точность, что называется «обрезкой»; использование типов данных с более низкой точностью для рассуждений, что на жаргоне называется «квантованием»; и из сложные модели, для извлечения аналогичной, но более простой модели, которая ярко называется «дистилляция». Конечная цель — уменьшить размер модели.С другой стороны, производители чипов, такие как Qualcomm, также внедряют и разрабатывают специализированные чипы для конечной стороны больших моделей ИИ. Ранее мобильная платформа Qualcomm 5G Snapdragon 8 Gen2 впервые интегрировала процессор Hexagon, предназначенный для искусственного интеллекта, используя независимую выделенную систему питания, поддерживая рассуждения о микросрезах, точность INT4 и сетевое ускорение Transformer и т. д., обеспечивая при этом более высокую производительность. Уменьшите потребление энергии и использование памяти.Большая торцевая модель запускает революцию в интеллектуальном терминале нового поколения. IDC прогнозирует, что к 2026 году почти 50% процессоров терминального оборудования на китайском рынке будут оснащены технологией AI Engine. Может появиться еще одно большое изменение, которое ИИ привносит в технологическую жизнь человека.