Новото семейство на Ядра на Arm C1 бележи голяма промяна в екосистемата на мобилните и ултрапреносимите устройства, замествайки познатия Cortex с по-ясен фокус върху устойчива производителност и ефективност. Това поколение идва с Платформа Lumex и с очевидна цел: да се ускори изкуственият интелект на самото устройство, без да се прави компромис с батерията или температурата.
Освен промяната на името, предложението съчетава Архитектура Armv9.3-A, дълбоко препроектиране на подсистемата памет и значително подобрение на възможностите за матрични изчисления. Резултатът е широко разпространени подобрения в производителността с по-ниска консумация на енергия, както и пътна карта, предназначена за смартфони, таблети, лаптопи и носими устройства.
Архитектура и нови функции на ядрата Arm C1

Серията C1 е организирана в четири варианта: C1-Ултра (максимална производителност), C1-Премиум (висока производителност на по-малка площ), C1-Pro (баланс) и C1-Нано (максимална ефективност). Всеки производител може да комбинира тези блокове в хетерогенни клъстери, за да създаде SoCs, адаптирани към различни диапазони и приложения, с конфигурации от до 14 ядра.
Arm е променил както предния, така и задния край, включително подобрения в прогнозирането, кешовете и изпълнението извън реда. Благодарение на новата взаимовръзка и по-ефективния (интензивен за данни) споделен кеш, SLC клетки), платформата предлага средно увеличение от близо 15% при ежедневна употреба, което се мащабира до +30% за взискателни товари и достигат върхове до 45% в многоядрени процесори.
Поддръжката на паметта се развива с LPDDR6 за намаляване на консумацията на енергия и латентността, като същевременно се запазва съвместимостта с LPDDR5X при скорости до 9600 MT/s. Тази база памет, заедно с препроектирането на клъстера, подсилва устойчивата производителност и реакция при термично натоварване.
C1-Ultra: таванът на производителността
Като първокласно ядро, C1-Ултра Той е насочен към водещи SoC-та и задачи с голямо търсене, като например компютърна фотография, големи AI модели или мобилни AAA игри. В сравнение с Cortex-X925, Arm говори за... +25% в единична нишка, цифра, която помага за мащабиране на общата производителност, когато се комбинира с повече ядра в клъстера.
Фронт-ендът подобрява пропускателната способност на L1 на инструкциите и точност на прогнозиране, докато бек-ендът увеличава прозореца за изпълнение извън реда с около 25%, достигайки около 2.000 инструкции едновременно. Освен това, капацитетът на данните L1 се удвоява до 128 KB, а скоростта на четене на L1 се увеличава с приблизително 33%.
C1-Premium: висока производителност на по-малка площ
За първокласни устройства, които не се нуждаят от абсолютния максимум, C1-Премиум поддържа архитектура, много близка до Ultra, но с 35% намаление на площтаПроектиран е да балансира производителността и цената, улеснявайки по-компактните дизайни, без да се жертват значителни цифри.
C1-Pro: Баланс и многоядрени мускули
В централния сегмент, C1-Pro замества Cortex‑A725 с +11% ефективност при същата консумация и с подобрения в ефективността, които достигат до 26% по-малко енергия при същата производителностВ игрите, Arm посочва печалби от около + 16% в този клас ядра.
Ключовете са в по-мощния фронт-енд (усъвършенствано статично предсказване и Много по-голям BTB) и бекенд с по-голяма честотна лента в L1D и по-ниска латентност в L2, когато прогнозата е правилна. Предсказващият механизъм е настроен и за ускоряване на реакцията в реални сценарии.
C1-Nano: ефективността е преди всичко
За леки задачи и изключителни икономии, C1-Нано увеличава ефективността с около 26% в сравнение с предшественика си (запазвайки областта практически непокътната, ~+2% спрямо A520). Етапите на прогнозиране и извличане са разделени, за да се доведат инструкциите до L1 по-рано и да се намали чакането за неуспешни прогнози.
Освен това, векторна обработка, устройствата се изключват, когато конвейерът заседне и трафикът между L3 и DRAM се намалява (средно около 21% и до 39% при определени натоварвания), което облекчава консумацията и подобрява реакцията.
C1-DSU: Гъвкави клъстери и по-ниска консумация
Новата C1-DSU оркестрира връзката на ядрата под споделен L3 кеш и преодолява празнината с останалата част от SoC (RAM, GPU и др.). В сравнение с предишни версии, дизайнът намалява типичната консумация на енергия на системата с около един 11% и влиянието на паметта с ~7%, разчитайки на режими като например L3 Бърза дрямка за да се сведат до минимум загубите, когато не се използват.
Друг ключов елемент е интеграцията на Ускорители на МСП2 като елементи, външни за ядрото: в C1-Ultra и C1-Premium тяхното присъствие е задължително, докато в C1-Pro и C1-Nano Това е по избор в зависимост от дизайна на производителя. Всяко ядро в клъстера може да има достъп до тях, когато са налични, което позволява много разнообразни комбинации (напр. 2× C1‑Ultra + 6× C1‑Pro с един или два SME2 ускорителя или по-скромни комбинации, смесващи Pro и Nano).
Платформата Lumex включва и ново поколение графични процесори. Въпреки че фокусът на тази новина е върху централните процесори, Мали G1 придружено от ~20% подобрения в графичната производителност, удвоява пропускателната способност на проследяването на лъчите и намалява разходите за енергия на кадър с около 9%, като по този начин подсилва комбинацията за игри, използващи предимно графични процесори, и натоварвания с изкуствен интелект.
SME2 и ролята на централния процесор в изкуствения интелект

Големият скок в изкуствения интелект идва с SME2 (Разширение на мащабируема матрица 2), което ускорява матрични умножения, мулти-предикати и нови типове данни (включително компактни прецизности като 2b/4b) и се координира със SVE2 за разширена векторизация. В агрегирани числа, Arm говори за средни подобрения от 3,7 пъти с спад на потреблението близо до един 27%.
В практически случаи компанията е показала намаляване на латентността на 4,7 пъти по-бързо разпознаване на реч (Whisper Base), 2,4–2,8x ускорения в текст към реч и големи увеличения в генерирането на токени за LLM (напр. Gemma 3), които са близки до × 5Работата на процесора избягва прехвърлянията към други ускорители, което намалява времето за изчакване и осигурява бърза реакция.
При малки или интерактивни натоварвания, процесорът отново заема централно място: с МСП2Много ежедневни задачи (локално подобряване на изображението, сегментиране, класификация, ефекти на камерата или аудио) се изпълняват по-бързо, с по-малко режийни разходи и без да се натоварва мрежата. Когато търсенето се увеличи, графичният процесор (GPU) или външният NPU могат да продължат да поемат контрола, но процесорът вече не е пречка.
Предлага се и софтуерна поддръжка: има интеграция в Линукс и Андроид 16, оптимизирани инструменти и библиотеки (KleidiAI) и съвместимост с двигатели като Unity и Unreal EngineТова ще улесни бързото внедряване на тези подобрения от приложенията и игрите с появата на първите търговски SoCs.
Платформата CSS на Lumex сглобява всички части (C1 процесор, Mali G1 графичен процесор, взаимовръзка и памет) с готови за производство дизайни 3 Нм, хардуерна телеметрия и Съвместимост на системата за ръце с LPDDR6. Това позволява на партньорите да ускорят своите мобилни и лаптопни проекти с мащабируеми клъстери с до 14 ядра и възможности за изкуствен интелект на устройството.
Arm C1 комбинира устойчиво представяне, производителност и истински тласък за изкуствен интелект върху процесорите благодарение на SME2; те предлагат гъвкавостта на C1-DSU за адаптиране на клъстери към всяка продуктова гама и представляват солидна основа за следващата вълна мобилни и преносими SoC, които се стремят да балансират мощност, автономност и възможности за изкуствен интелект, без винаги да зависят от облака.