Mô hình lớn "thu gọn" vào di động, iPhone tiếp theo sắp ra mắt?

Một làn sóng "mô hình lớn từ đầu đến cuối" đang đến. Những gã khổng lồ về chip như Huawei và Qualcomm đang khám phá việc cấy ghép các mô hình AI lớn vào thiết bị, cho phép điện thoại di động nhận ra sự tiến hóa của một thế hệ loài mới.

So với các ứng dụng AI như ChatGPT và MidjTHER, dựa vào các máy chủ đám mây để cung cấp dịch vụ, mô hình lớn phía cuối tập trung vào việc hiện thực hóa trí thông minh cục bộ. Ưu điểm của nó là có thể bảo vệ quyền riêng tư tốt hơn, đồng thời, điện thoại di động có thể trở thành trợ lý thông minh cá nhân của người dùng thông qua việc học và không cần phải lo lắng về thời gian ngừng hoạt động của máy chủ đám mây và các vấn đề khác.

Tuy nhiên, trong các điều kiện kỹ thuật hiện có, hiệu suất của điện thoại di động còn lâu mới đủ để hỗ trợ hoạt động của các mẫu máy lớn. Giải pháp kỹ thuật chủ đạo trong ngành là "thu nhỏ" mô hình lớn thông qua cắt tỉa, lượng tử hóa và chưng cất, đồng thời giảm mức tiêu thụ tài nguyên và năng lượng mà nó yêu cầu với tiền đề giảm độ chính xác càng ít càng tốt.

Qualcomm đã bắt đầu phát triển chip cho các mẫu máy lớn. Điều này cho thấy rằng các thiết bị đầu cuối di động triển khai các mô hình AI đang đến với chúng ta.

Các nhà sản xuất điện thoại di động dẫn mô hình lớn đến thiết bị đầu cuối di động

Các mô hình AI lớn đang chuyển từ đám mây sang thiết bị đầu cuối thông minh.

Vào ngày 4 tháng 8, tại Hội nghị các nhà phát triển Huawei 2023, Huawei đã phát hành HarmonyOS 4. So với các thế hệ hệ điều hành trước, thay đổi quan trọng nhất của nó là tích hợp các khả năng mô hình lớn AI vào lớp dưới cùng của hệ thống. Huawei đang mở đầu cho mô hình AI chuyển sang "phía thiết bị đầu cuối thông minh".

Hiện tại, các dịch vụ do ứng dụng AI cung cấp như ChatGPT, Midjourney về cơ bản đã hoàn thiện thông qua máy chủ đám mây. Lấy ChatGPT làm ví dụ, mô hình lớn và tài nguyên máy tính đằng sau nó được lưu trữ trên một máy chủ từ xa.Người dùng tương tác với máy chủ trong thời gian thực và văn bản đầu vào được máy chủ xử lý để nhận phản hồi. Ưu điểm của điều này là nó có thể đảm bảo mô hình hoạt động hiệu quả và ổn định, bởi vì máy chủ thường được trang bị tài nguyên máy tính mạnh mẽ và có thể mở rộng bất cứ lúc nào để đáp ứng tải cao.

Bây giờ, logic hỗ trợ mới đã xuất hiện. Huawei đang cố gắng đưa các mô hình quy mô lớn vào thiết bị đầu cuối, điều đó có nghĩa là tất cả các tác vụ nêu trên có thể được thực hiện cục bộ. .

Yu Chengdong, giám đốc điều hành của Huawei và CEO của Terminal BG, đã giới thiệu rằng HarmonyOS 4 được hỗ trợ bởi mô hình Pangu của Huawei và hy vọng sẽ mang đến cho người dùng một cuộc cách mạng trải nghiệm AI hoàn toàn mới về tương tác thiết bị đầu cuối thông minh, hiệu suất năng suất cao và các dịch vụ được cá nhân hóa .

HarmonyOS 4 giới thiệu siêu mô hình AI

Khả năng AI của HarmonyOS 4 hiện chủ yếu được thể hiện bởi trợ lý thông minh "Xiaoyi" của Huawei. Sau khi mô hình lớn được kết nối, Xiaoyi mở rộng đầu vào của nhiều dạng khác nhau như văn bản, hình ảnh và tài liệu trên cơ sở tương tác bằng giọng nói và khả năng hiểu ngôn ngữ tự nhiên được cải thiện. Xiaoyi cũng có thể kết nối với nhiều dịch vụ và kịch bản theo hướng dẫn, chẳng hạn như tự động trích xuất văn bản từ hình ảnh, tạo nhiều loại nội dung email thương mại hoặc tạo hình ảnh, v.v.

Thay đổi quan trọng hơn là Xiaoyi có khả năng ghi nhớ và học hỏi, khi tiếp tục được sử dụng, nó sẽ ngày càng hiểu rõ hơn về "chủ nhân", có thể đưa ra các kế hoạch như kế hoạch du lịch và hoạt động một cách thông minh và hiện thực hóa nó theo thói quen người dùng.Đề xuất được cá nhân hóa. Huawei tiết lộ rằng những khả năng mới này của Xiaoyi sẽ bắt đầu trải nghiệm thử nghiệm công khai vào cuối tháng 8.

Bằng cách xây dựng mô hình AI vào lớp dưới cùng của hệ thống điện thoại di động, Huawei hy vọng sẽ cải thiện trí thông minh tổng thể của điện thoại di động. Mặc dù các chức năng nói trên của Xiaoyi không phải là "cao cấp" nhưng để hiện thực hóa chúng, người dùng thường phải gọi cùng lúc ChatGPT, Midjourney và nhiều ứng dụng khác mới có thể hoàn thành. Khi bản thân điện thoại di động có khả năng AI, nó giống như một trợ lý đa năng hơn, cung cấp các dịch vụ toàn diện.

Trước khi phát hành HarmonyOS 4, Huawei đã thực sự cố gắng kết nối các mô hình AI lớn với thiết bị đầu cuối di động. Vào tháng 3 năm nay, Huawei đã phát hành điện thoại di động P60. Chức năng tìm kiếm hình ảnh thông minh tích hợp dựa trên công nghệ mô hình lớn đa phương thức. Bằng cách thu nhỏ mô hình ở phía điện thoại di động, hoạt động mô hình ngôn ngữ tự nhiên trên điện thoại di động bên được thực hiện.

Huawei không phải là công ty đầu tiên đưa mô hình AI vào thiết bị. Tại Hội nghị Trí tuệ Nhân tạo Thế giới năm 2023, Qualcomm đã trình diễn thực tiễn hoạt động của các mô hình quy mô lớn đi vào giai đoạn cuối, chạy mô hình AI tổng quát Khuếch tán ổn định trên điện thoại di động được trang bị Snapdragon 8 thế hệ thứ hai và thực hiện 20 bước suy luận trong vòng 15 giây và hình ảnh 512x512 pixel được tạo và hiệu ứng hình ảnh không khác biệt đáng kể so với mức xử lý của đám mây.

Tại MWC 2023 ở Thượng Hải, Giám đốc điều hành Zhao Ming của Honor cũng cho biết Honor sẽ thúc đẩy việc triển khai các mẫu điện thoại thông minh cỡ lớn phía cuối để đạt được khả năng tương tác tự nhiên đa phương thức, nhận dạng ý định chính xác và các dịch vụ vòng kín cho các tác vụ phức tạp.

Cũng thu hút sự chú ý là Apple, một tháng trước, Apple được tiết lộ là đang bí mật phát triển "Apple GPT", một công cụ trí tuệ nhân tạo dựa trên khung Ajax do Apple tự phát triển. Mặc dù các chi tiết cụ thể vẫn chưa được tiết lộ, nhưng người ta thường suy đoán trong ngành rằng Apple có thể sẽ bổ sung một mô hình lớn ở cấp hệ thống để cải thiện trí thông minh của trợ lý giọng nói Siri, để Siri có thể cất cánh " chậm phát triển trí tuệ nhân tạo".

Cường điệu hay Cuộc cách mạng mới?

Không có gì lạ khi các nhà sản xuất điện thoại di động tập trung vào các mô hình lớn, nhưng tại sao họ lại đi theo con đường "thiết bị sang một bên"? Rốt cuộc, khả năng tương tác và tạo của Huawei Xiaoyi cũng có thể được cung cấp thông qua các máy chủ đám mây và có vẻ như chi phí tiết kiệm hơn và công nghệ dễ triển khai hơn.

Đó có phải là một sự cường điệu hay thực sự cần thiết để đưa các mô hình lớn AI vào thiết bị đầu cuối di động thông minh? Về vấn đề này, cả Yu Chengdong và Zhao Ming đều đề cập đến hai từ khóa: bảo mật quyền riêng tư và cá nhân hóa.

Yu Chengdong nhấn mạnh rằng Huawei ủng hộ rằng nguyên tắc đầu tiên của tất cả đổi mới trải nghiệm AI và thiết kế cảnh là bảo mật và bảo vệ quyền riêng tư, để tạo ra một AI có trách nhiệm hơn và hứa rằng nội dung do AI tạo ra sẽ được đánh dấu.

So với việc xử lý dữ liệu trên đám mây, lợi thế rõ ràng nhất của phía thiết bị đầu cuối thông minh là quyền riêng tư và bảo mật. Trước đây, ChatGPT đã nhiều lần dính vào các cơn bão rò rỉ dữ liệu. Vào tháng 3 năm nay, Samsung đã ban hành lệnh cấm sử dụng ChatGPT trong nội bộ, lý do là nhân viên bán dẫn bị nghi ngờ làm rò rỉ bí mật công ty bằng cách sử dụng ChatGPT; trong trường hợp sử dụng và rò rỉ dữ liệu riêng tư cá nhân, số tiền khiếu nại cao như như 3 tỷ đô la Mỹ.

Khi xử lý dữ liệu ở phía cuối, dữ liệu cá nhân của người dùng sẽ không được tải lên máy chủ đám mây, giúp giảm đáng kể nguy cơ rò rỉ quyền riêng tư. Đây cũng là điều kiện tiên quyết để trợ lý AI trên điện thoại di động thực sự trở thành người quản lý cuộc sống - chỉ khi quyền riêng tư được đảm bảo, người dùng mới yên tâm giao dữ liệu cho AI học hỏi.

Theo cách hiểu của Zhao Ming, nhiệm vụ của mô hình AI đầu cuối là hiểu rõ hơn về người dùng, "biết tôi đi ngủ lúc mấy giờ và tôi thích ăn gì có thể giải quyết nhu cầu tức thời của tôi, tương đương với việc có khả năng hiểu rõ hơn thành nhu cầu của mình". Để làm được điều này, AI cần được đào tạo dựa trên dữ liệu cá nhân và thói quen của người dùng. Cuối cùng, hy vọng điện thoại thông minh sẽ trở thành một trợ lý toàn diện, hoặc một thư ký rô-bốt cá nhân, có thể giúp người dùng phục vụ ăn uống, đặt chỗ , tư vấn, giải trí, Văn phòng và các yêu cầu đa kịch bản khác.

Ngược lại, cả ChatGPT và các ứng dụng AI chính thống khác đều là sản phẩm được tiêu chuẩn hóa, khó có khả năng trợ lý cá nhân mà không cần sửa đổi, nó không hiểu người dùng mà chỉ phản hồi hướng dẫn nhập liệu của người dùng. Điện thoại di động cá nhân đã là một thiết bị thông minh cá nhân riêng tư, nếu mô hình AI hiểu được ngôn ngữ con người có thể chạy trên điện thoại di động thì mức độ thông minh chắc chắn sẽ được cải thiện rất nhiều.

Ngoài ra, các ứng dụng dựa trên đám mây cũng không ổn định. Ví dụ: do lý do mạng hoặc máy chủ, tốc độ phản hồi của đám mây có thể chậm lại hoặc thậm chí bị sập hoàn toàn. Điều này đã xảy ra nhiều lần trên ChatGPT và phần lớn cục bộ mô hình sẽ yếu đi rất nhiều. Dựa vào đám mây, để tránh "độ trễ của đám mây".

Dựa trên những đặc điểm trên, "cuộc cách mạng từ thiết bị sang thiết bị" của các mẫu máy lớn đã cho thấy tiềm năng và thậm chí người ta còn hy vọng rằng những chiếc điện thoại di động đã bị tắc nghẽn trong nhiều năm phát triển sẽ trải qua một cuộc tiến hóa loài thú vị khác, giống như sự xuất hiện của điện thoại thông minh màn hình lớn và việc phát hành iPhone.

Nhưng có một vấn đề rõ ràng để mô hình lớn thể hiện sức mạnh của mình trên điện thoại di động: Chip điện thoại di động có thể chịu được không? Do các mô hình lớn thường chứa hàng chục tỷ hoặc hàng trăm tỷ tham số, đồng thời yêu cầu đào tạo ở cấp độ thiên văn và tiêu thụ năng lượng tính toán khổng lồ, nên hiệu suất của các chip điện thoại di động hiện có rõ ràng là không thể đáp ứng yêu cầu.

Về vấn đề này, giải pháp chủ đạo hiện nay trong ngành là "thu nhỏ mô hình".

Nói một cách đơn giản, khi cấu trúc mạng mô hình được xác định, mô hình sẽ được “thu gọn” với tiền đề giảm độ chính xác càng ít càng tốt, do đó giảm mức tiêu thụ tài nguyên và năng lượng mà nó yêu cầu. Quá trình này thường có ba bước, loại bỏ các tham số trong mô hình có tác động rất nhỏ đến độ chính xác, được gọi là "cắt tỉa"; sử dụng các loại dữ liệu có độ chính xác thấp hơn để suy luận, được gọi là "lượng tử hóa" trong biệt ngữ; và từ các mô hình phức tạp , để trích xuất một mô hình tương tự nhưng đơn giản hơn, được gọi một cách sinh động là "chưng cất". Mục tiêu cuối cùng là giảm kích thước của mô hình.

Mặt khác, các nhà sản xuất chip như Qualcomm cũng đang triển khai và phát triển các chip chuyên dụng cho phần cuối của các mô hình AI lớn. Trước đó, nền tảng di động 5G Snapdragon 8 Gen2 của Qualcomm lần đầu tiên tích hợp bộ xử lý Hexagon dành riêng cho AI, sử dụng hệ thống cung cấp năng lượng chuyên dụng độc lập, hỗ trợ lý luận cắt vi mô, độ chính xác INT4 và tăng tốc mạng Transformer, v.v., đồng thời mang lại hiệu suất cao hơn. Giảm tiêu thụ năng lượng và sử dụng bộ nhớ.

Mô hình lớn phía cuối đang tạo ra một thế hệ mới của cuộc cách mạng thiết bị đầu cuối thông minh. IDC dự đoán rằng đến năm 2026, gần 50% bộ xử lý thiết bị đầu cuối tại thị trường Trung Quốc sẽ có công nghệ động cơ AI. Một sự thay đổi lớn lao khác mà AI mang lại cho đời sống công nghệ của con người có thể xuất hiện.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)