Arm Lumex: Новата CSS платформа за изкуствен интелект на устройството

  • Arm съчетава процесор C1 със SME2, ​​графичен процесор Mali G1 и софтуерен стек за ускоряване на изкуствения интелект на устройството.
  • До 5 пъти по-бърза производителност на изкуствения интелект на процесора и XNUMX пъти по-бързо проследяване на лъчите на графичния процесор в сравнение с предишното поколение.
  • 3nm готови дизайни, гъвкав C1-DSU клъстер и поддръжка за Android 16 и KleidiAI.
  • Целево внедряване до 3.000 милиарда устройства с конфигурируема от партньори интеграция.

Представяме ви Arm Lumex и неговата CSS платформа за изкуствен интелект

Ръката е направила крачката и представя ЛУМЕКС, най-амбициозната ѝ платформа за изчислителна подсистема (CSS) до момента, проектирана да задвижва Изкуствен интелект на самото устройство както на мобилни телефони от висок клас, така и на компютри от ново поколение.

Предложението съчетава хардуерни и софтуерни блокове Готов за интегриране в SoC: нов Процесор Arm C1 със SME2, Графичен процесор Mali G1, взаимосвързаност и оптимизиран стек за разработка, за да се осигурят преживявания като Превод в реално време, повече контекстуални асистенти y игри с напреднала графика без постоянно да разчитате на облака.

Какво е Lumex и какви промени прави в сравнение с други платформи?

Отвъд набор от свободни IP адреси, Lumex е 3nm референтна подсистема които производителите могат да приемат такива, каквито са, или конфигуриране за измерване, намалявайки времето за интеграция и осигурявайки производителност от първия силиций.

Arm също дебютира обновена номенклатура за своите блокове: семейството на процесорите се премества в C1C1-Ултра, C1-Премиум, C1-Про и C1-Нано) и графичния процесор към Мали G1 (G1-Ultra, G1-Premium и G1-Pro), с МСП2 като чудесно предимство за ускоряване на изкуствения интелект на процесора.

Arm Lumex интегрира процесор C1, Mali G1 и графичен процесор SME2

Процесор Arm C1: архитектура, SME2 и скок в производителността

Клъстерът Ръка C1 Изграден е на Armv9.3 и може да се мащабира до 14 ядра, с поддръжка за LPDDR6 (запазване на съвместимост с LPDDR5X). Взаимната връзка C1-DSU координира ядрата под споделен L3 кеш и добавя подобрения в ефективността спрямо предишното поколение.

на Инструкции за SME2 са задължителни в C1-Ултра и C1-Премиум и по избор в C1-Pro и C1-Nano, което позволява повишена производителност при натоварвания с изкуствен интелект върху процесора, без разходите за преместване на данни към други ускорители.

Според Arm, клъстер C1 с SME2 предлага до 5 пъти по-висока производителност на изкуствен интелект, намалява на латентност на гласа до 4,7 пъти и ускорява аудио генериране 2,8 пъти в сравнение с предишното поколение.

Отвъд изкуствения интелект, новата архитектура носи и 15% средно подобрение при ежедневна употреба, до 30% при взискателни товари и върхове на 45% в многоядрени процесори, подпомогнато от оптимизации от предния край, прогнозиране и прозорци за изпълнение извън реда.

Архитектура на Arm Lumex с C1 клъстер и DSU

Mali G1 GPU: Повече подобрения в проследяването на лъчите и изкуствения интелект

La Мали G1-Ултра въведи а устройство за проследяване на лъчи от следващо поколение (RTUv2) и обещания два пъти по-висока производителност при проследяване на лъчи в сравнение с предишния, заедно с a 20% повече графична производителност y 9% по-малко енергия на кадър.

В AI/ML, графичният процесор добавя FP16 пътища за умножение на матрици и постига... до 20% повече изводи, подобрявайки задачи като разпознаване на реч, семантична сегментация o подобряване на изображението в сравнение с предишното поколение.

Семейството е допълнено с G1-Премиум (6–9 ядра, без проследяване на лъчите) и G1-Pro (1–5 ядра), в мащабируема архитектура, която удвоява вътрешни мрежови и кеш зони за намаляване на задръстванията и увеличаване на пропускателната способност.

Софтуер и екосистема: KleidiAI и поддръжка на framework

Платформата придружава хардуера със стек, предназначен за разработчиците, от който да се възползват. МСП2 и Мали Г1 без никакви съществени промени в приложенията ви: KleidiAI интегрира с ExecuTorch (PyTorch), ONNX Runtime и Google LiteRTСред другите.

Ръката също работи с Android 16, Linux и подобни двигатели Единство и нереално така че оптимизациите на изкуствения интелект и графиката да пристигнат по начин, Автоматика към съвместими игри и приложения.

Lumex CSS за 3nm SoCs: Интеграция и телеметрия

CSS пакетът включва физически дизайни, готови за 3 nm в основните възли, с вече валидирани профили на мощност/производителност/площ, които съкращава времето за пускане на пазара и минимизира рисковете при залепването на лентата.

Са добавени телеметрични инструменти и a референтна платформа за да се улесни настройката по модел, както и гъвкавостта на C1-DSU да се адаптират клъстери и ускорители към всеки сегмент.

Приемане: цели и целеви устройства

Arm планира да внедри тази технология в 3.000 милиона устройства през целия цикъл, с общ изчислителен капацитет на ИИ, надвишаващ 10.000 милиарда ТОП между всички тях, оставяйки партньорите свобода на интеграция в зависимост от продукта.

На практика ще видим Мобилни телефони с Android с по-бързи локални функции на изкуствения интелект, портативен Процесори, базирани на Arm, които използват SME2 и обновени графични процесори, както и дизайни, които дават приоритет производителност o ползи в зависимост от пазара.

С Lumex, Arm се опитва да ускори скока до... Полезен, личен и нисколатентен изкуствен интелект на устройството, разчитайки на C1 CPU със SME2, ​​​​Mali G1 GPU и 3nm CSS база; комбинация, която има за цел да по-добро представяне y по-малко потребление без да се жертва гъвкавостта, която производителите изискват.

Ядра на Arm C1
Свързана статия:
Arm C1: Това са новите ядра, които повишават производителността и изкуствения интелект.