SiFive захранва изкуствен интелект с X160, X180, X280 Gen 2, X390 Gen 2 и XM Gen 2

  • Ново семейство SiFive Intelligence Gen 2: X160/X180 за периферно управление, X280/X390 за разширено векторно управление и XM с матричен енджин.
  • Поддръжка на формати RVA23, RVV 1.0 и BF16/MXFP8/MXFP4; VCIX/SSCI интерфейси за свързване на копроцесори с директен достъп до регистрите.
  • X390 Gen 2 се мащабира до 4 кохерентни ядра с до 1 TB/s; XM Gen 2 постига 64 TFLOPS FP8 на клъстер и надвишава 4 PFLOPS в мултиклъстерна среда.
  • IP-тата вече са лицензируеми; първите чипове, базирани на тях, са планирани за второто тримесечие на 2026 г.

Семейство SiFive Intelligence Gen 2

Новата партида IP адреси от SiFive Пристига със здрава основа и с призванието да обхване всичко: от Интернет на нещата и роботика до сърцето на центрове за данниКомпанията представя второто поколение на своето семейство Intelligence с пет ключови елемента: X160 Gen 2, X180 Gen 2, X280 Gen 2, X390 Gen 2 и XM Gen 2, всички от които са базирани на RISC-V архитектурата и са фокусирани върху съвременни AI работни натоварвания.

Не е случайно, че тази актуализация беше обявена в справочен форум като например AI Infra среща на върхаПазарът се насочва към по-конфигурируеми, мащабируеми и ефективни решения, а SiFive реагира чрез интегриране скаларни, векторни и матрични двигатели в рамките на една стратегия. Освен това фирмата се стреми да намали времето и разходите за проектиране с добре свързани IP блокове и нови интерфейси на копроцесора оптимизиран за ускоряване на развитието.

Какво предлага второто поколение SiFive Intelligence

В тази част SiFive усъвършенства формулата си, като комбинира гъвкавост и производителност на ват. Семейството Intelligence Gen 2 консолидира хетерогенен изчислителен подход, който интегрира мощни скаларни ядра с RVV 1.0 вектори и, в случая на XM, двигател матрица собствени, всички със стратегия за паметта, предназначена да свие честотната лента и да намали пречките.

Компанията поддържа своята дизайнерска философия модулна и добавя два пътя за свързване на ускорителя: разширението на интерфейса на векторния копроцесор (VCIX) и интерфейсът на скаларния копроцесор (SSCI). Тези интерфейси позволяват на ускорителите директен достъп Регистри на процесора, опростяване на софтуера, намаляване на латентността и подобряване на ефективността на данните при интегриране на външни копроцесори или специализирани двигатели.

На фона на прогнозите, че според Deloitte, очакват растеж на 20% AI натоварване във всички технологични области и до 78% в периферните изчисленияХодът на SiFive е много логичен. Целта е да се предложат готови за лиценз части, които позволяват на производителите на оригинално оборудване (OEM) и доставчиците на облачни услуги да изграждат... AI платформи модулен и ориентиран към бъдещето.

В допълнение към хардуера, компанията прави важна стъпка и в софтуерната екосистема: за да ускори времето за пускане на пазара, SiFive... публикуване като отворен код неговата SiFive Kernel Library. Тази инициатива допълва дизайна на VCIX/SSCI интерфейсите и има за цел разработването на AI стекове по-бързо и по-евтино.

X160 и X180 Gen 2: Ефективност за Edge и IoT

Новите X160 поколение 2 (32 бита) и X180 поколение 2 (64-битови) са предназначени за сценарии с ограничена мощност и пространство, като например IoT устройства, дронове y автономна роботикаТе споделят поддръжка на 128-битови векторни регистри и 64-битов път за данни, което им позволява да работят ефективно. числови формати популярни в изкуствения интелект, като например INT8 и BF16.

По отношение на мащабирането, и двете могат да бъдат групирани в клъстери с до четири ядра, постигайки много атрактивен баланс между производителност и потребление. Този подход позволява адаптиране на мощността към всеки случай на употреба, без да се жертва енергийна ефективност че ръбът изисква.

Фактът, че те интегрират 128-битови вектори в този „лек“ диапазон, разкрива намерението на SiFive: да вземат изчислението на Наистина полезен изкуствен интелект до сензори, контролери и роботи, работещи с батерии или ограничени топлинни бюджети, без да се намаляват разходите или силициева повърхност.

За приложения, които трябва да обработват машинно зрение, класификация на сигнали или интелигентен контрол, тези ядра предлагат точно правилния набор от векторни възможности с щедър (64-битов) път за данни и поддръжка за типове с намалена точност които правят разлика в заключението.

X280 Gen 2: Зряла, оптимизирана за ръбовете векторизация

Поредицата X280 вече произхожда от първо поколение с много добро приемане в AI/ML, а прегледът X280 поколение 2 удвоява усилията си на ръба с микроархитектура на 8 етапа, двойно излъчване, по ред и суперскаларно. Това ядро ​​е многоядрено и е настроено за AI/ML изчисления на границата с широки векторни разширения, проектирани да РВВ 1.0 и техните собствени Разширения на SiFive Intelligence.

По-конкретно, X280 Gen 2 предлага векторна обработка с 512-битов VLEN и 256-битова DLEN, конфигурация, която позволява ефективно паралелизиране на типични операции с визуални, аудио и леки модели. Тази векторна ширина, заедно със специфични за SiFive разширения, ускорява критични ядра които маркират производителността на реални приложения.

Друга ключова промяна е опростяването на йерархията на паметта: слоят памет е премахнат. L3 кеш в полза на a Споделено ниво 2 до 1 MB на клъстер. С това решение SiFive се стреми да намали латентността и сложността, залагайки на по-голям и по-гъвкав L2 кеш, който е от особена полза натоварване на инференциални изводи със средни работни комплекти.

На ниво ISA, новата пратка приема RVA23, който въвежда вградена поддръжка за нововъзникващи формати в ИИ, като например BF16, MXFP8 y MXFP4Последният наскоро беше избран от OpenAI за разпределението на модели с отворено тегло, което подчертава важността на предлагането на компактни типове данни с добра прецизност в мащабни изводи.

Със своите многоядрени възможности и периферна ориентация, X280 Gen 2 се вписва в мобилни, инфраструктура и автомобилната индустрия, области, където първото му поколение вече е триумфирало. За тези, които трябва да комбинират ниски латентности с ограничен профил на потребление, това е много солидна основа за вградени приложения на IA.

X390 Gen 2: Когато всеки вектор е от значение

За сценарии, които изискват повече векторна мощ, X390 поколение 2 Това прави забележителен скок напред от оригиналния X280: с едно ядро ​​той вече осигурява... 4× подобрение при векторни изчисления благодарение на удвояване на дължината на вектора и добавяне две векторни АЛУ работещи паралелно.

Архитектурно, това е и дизайн на 8 етапа, двойно излъчване, по ред и суперскаларно, но тук те са включени две векторни единици с 1024-битова VLEN и 512-битова DLEN. Резултатът е платформа, която драстично ускорява интензивните операции в ширина на вектора, отваряйки вратата към по-взискателни модели и ядра.

X390 Gen 2 е мащабируем до кохерентни 4-ядрени комплексии по избор може да включва интерфейса VCIX да се свържат тясно с проектирани от клиента ускорители на изкуствен интелект или други копроцесори. Тази близост намалява комуникационните разходи и улеснява интегрирането външни двигатели без ненужни софтуерни „такси“.

В четириядрените конфигурации, SiFive говори за достигане до 1 TB/s ефективна честотна лента, цифра, която поставя X390 Gen 2 като идеален кандидат да действа и като двете Блок за управление на ускорителя (ACU) да действа като автономен двигател с изкуствен интелект. Тази гъвкавост позволява изграждането на всичко - от хибридни ускорителни стекове до чисти тръбопроводи на изкуствен интелект върху RISC‑V.

Не е случайно, че дизайните X280 и X390 са намерили своето място в големи технологични проекти: те вече са били използвани в приложения от компании като... Google за своите TPU-та, където симбиозата между контрол, предварителна/последваща обработка и рязко ускорение е ключова за производителността на производство.

XM Gen 2: Матричният блок, който се мащабира до центъра за данни

Поредицата XM Gen 2 представлява „мастния блок“ за леки тренировъчни натоварвания и мащабни изводи: интегра Четириядрен X390 Gen 2 до двигател на матрично изчисление Разработено от SiFive. Тази комбинация позволява високоефективна по отношение на паметта смесена скаларно-векторно-матрична обработка.

Всеки клъстер XM Gen 2 може да предоставя до 64 TFLOPS в FP8 на 2 GHz, а дизайнът е предназначен за подреждане в конфигурации мултиклъстерен които заедно надвишават 4 PFLOPSТози модулен подход улеснява изграждането на персонализирани ускорители за центрове за данни с различни профили на потребление и производителност.

SiFive също така подчертава, че XM Gen 2 е силно настроен за LLM и поддържа традицията на компанията за производителност на ват. Тясната интеграция на трите изчислителни домейна (скаларен, векторен и матричен) позволява използването на честотна лента на паметта много ефективни и минимизират излишните копия и премествания на данни.

За екипи, които се нуждаят от основа, върху която да изградят персонализирани ускорители, XM Gen 2 действа като... план Готови за лицензиране: Блоковете X390 Gen 2 осигуряват мощно векторизиране и контрол, докато матричният енджин мащабира пропускателната способност, където е необходимо. Плътност на MAC.

VCIX и SSCI интерфейси: ускорение без триене

Пристигането на VCIX (Разширение на интерфейса на векторния копроцесор) и SSCI (Scalar Coprocessor Interface) е една от отличителните черти на това поколение. И двата интерфейса позволяват на ускорителите и копроцесорите директен достъп до Регистри на процесора, което намалява middleware stack-а, намалява латентностите и подобрява цялостното използване на подсистема памет.

На практика това се изразява в по-малко време за свързване и повече полезно време за изчисления: екипите могат да прикачат векторни или специализирани ускорители, без да преоткриват колелото, с... стабилни протоколи и оптимизиран път на данните. В комбинация с отварянето на Библиотека на ядрото SiFive, триенето за достигане до функционални прототипи намалява значително.

За товари с фази на предварителна обработка, планиране и последваща обработка (напр. тръбопроводи от визия и заключение), тази директна връзка с регистрите значително опростява оркестрацията. RISC-V ядрата могат да управляват потока прецизно, като същевременно делегират „тежката работа“ на копроцесори които работят с възможно най-ниската санкция.

Приемане на RVA23 и подкрепа за нововъзникващи формати

SiFive привежда своите IP адреси в съответствие със спецификацията RVA23, ключ към бъдещето на RISC-V софтуера, ориентиран към изкуствен интелект. Тази стъпка позволява типове данни като BF16, MXFP8 y MXFP4, нещо особено ценно, когато пазарът се движи към смесени точности и динамика.

Поддръжката на MXFP4 не е прищявка: тя е избрана от OpenAI за разпределението на модели с отворено тегло, така че директното ускорение към този формат намалява конверсиите и Затруднения в съвременните внедрявания. При мащабно извеждане, всеки цикъл и всеки байт са от значение.

съвместимост с РВВ 1.0 на X280 и разширението VLEN/DLEN на X390 гарантират, че библиотеките, компилаторите и рамки може лесно да натовари хардуера. Това ускорява приемането в екосистеми, където циклите на валидиране и поддръжка на софтуер обикновено са най- скъпо.

Производителност, памет и практическа мащабируемост

Трансверсално предимство на семейството Intelligence Gen 2 е начинът, по който то управлява честотна лента и движение на данни. Преконфигурацията на кеша в X280 Gen 2 (сбогом L3, здравей на споделения L2 до 1 MB) и комбинацията от Двойни векторни АЛУ В X390 Gen 2 те позволяват поддържането на високи скорости, без да се достигат ранни насищания.

Данните до 1 TB / s В четири конфигурации на X390 Gen 2 това добре илюстрира амбицията на дизайна: не е достатъчно да има много FLOPS, ако не се захранват ефективно. В XM Gen 2, векторно-матричната интеграция и мултиклъстерната топология подсилват тази идея, като минимизират преходите и... междинни копия.

За инженерните екипи това се превръща в решения, които се мащабират „чисто“: можете да започнете с малки клъстери за POCs и да се разраснат към мултиклъстерни внедрявания, без да се налага преосмисляне на цялата архитектура на данните и съгласуваност.

Случаи на употреба: от сензор до център за данни

В периферията, X160/X180 Gen 2 позволява прилагането на изкуствен интелект в интелигентни сензори, управление на полета на дронове и мобилни роботи, където енергийните бюджети и единичните разходи са критични. Поддръжката на INT8 и BF16, заедно със 128-битови векторни регистри, ускорява навивки, филтри и визуални ядра с голяма ефективност.

Една стъпка напред, X280 Gen 2 се вписва в шлюзове и вградени системи които изискват по-голяма векторна плътност, независимо дали за анализи в реално време, предварителна обработка на данни в 5G/6G мрежи или разширени функции в автомобилната индустрия. Фокусът му е върху РВВ 1.0 и споделеният L2 кеш проправя пътя за конвейери за извод с ниска латентност.

В диапазона на висока производителност, X390 Gen 2 се поддава на ролята на мозъка на външни ускорители (ACU) или директно като самостоятелен векторен двигател, с предимството на ясен път за добавяне на копроцесори чрез VCIXТова улеснява създаването на хибридни решения, където контролът и тежките изчисления съществуват едновременно в по- ефикасен.

И накрая, XM Gen 2 слага черешката на тортата за мащабни товари, където... TFLOPS на ват и лекота на мащабиране. Тъй като е „фино настроен“ за LLM, той е особено привлекателен за извод за големи модели и за определени фази на лека тренировка или фина настройка в центрове за данни.

Наличност и пътна карта

SiFive потвърди, че всички тези IP адреси са вече на разположение за лицензиране, което позволява на партньорите незабавно да започнат интеграцията си. По отношение на търговските продукти, първите чипове, базирани на тези интелектуални собственици, се очакват през второ тримесечие на 2026 г., разумен хоризонт за сложни проекти с сертификати и изчерпателно валидиране.

Този времеви прозорец съответства на очакваното нарастващо търсене на периферни и център за даннии дава на екипите пространство да усъвършенстват софтуерните си пакети, като надграждат върху Библиотека на ядрото SiFive и в стандартизацията на интерфейсите, предложена от марката.

Обобщение на спецификациите и ключовите характеристики

За да поставим всяка част на мястото ѝ, си струва да си припомним най-отличителните черти на семейството. X160/X180 Gen 2 е насочен към... ниска консумация с умерено векторизиране; X280 Gen 2 подсилва предимството с RVV 1.0 и споделен L2; X390 Gen 2 увеличава ширината на вектора и паралелизъм; и XM Gen 2 добавя собствен матричен енджин, проектиран за LLM и мащабиране на множество клъстери.

  • X160/X180 поколение 232/64-битови, 128-битови векторни регистри, 64-битов път за данни, поддръжка на INT8 и BF16, клъстери от 4, фокус върху IoT/робототика производителност максимум.
  • X280 поколение 28-степенна, с двоен проблем, подредена по ред, суперскаларна; VLEN 512/DLEN 256; RVV 1.0 + SiFive Intelligence Extensions; йерархия с Споделено ниво 2 до 1 MB на клъстер.
  • X390 поколение 28-степенен, с двойно издаване, по ред, суперскаларен; двоен векторен ALU; VLEN 1024/DLEN 512; мащабируем до 4 кохерентни ядра; Опционален VCIX; до 1 TB/s в 4-ядрена конфигурация.
  • XM Gen 24 × X390 Gen 2 + матричен двигател SiFive; до 64 TFLOPS FP8 при 2 GHz на клъстер; мащабируем нагоре 4 PFLOPS в мултиклъстерна система; силно настроен за LLM и висока производителност на ват.

Защо е важно сега: софтуер, стандарти и екосистема

Съобщенията за хардуер са уместни, когато са придружени от солиден софтуер и стандарти. Приемането на RVA23, изричната поддръжка за формати като MXFP8/MXFP4/BF16 и пускането на Библиотека на ядрото SiFive Те подкрепят предложението, за да могат библиотеките и рамките да се възползват от него безпроблемно.

Ангажиментът за ясни интерфейси (VCIX и SSCI) също така намалява „рисковия фактор“ за тези, които планират да се интегрират собствени ускорителиВ епоха, в която диференциацията се обуславя от специфични ядра и собствени модели, наличието на чист път до записите и пътища за данни Ниската латентност е от решаващо значение.

добавен към предварително сцепление в секторите като автомобилна, инфраструктура и мобилни устройства, след като вече са навлезли в екосистемата на големи компании като GoogleSiFive изпраща сигнал, че RISC‑V вече не е просто алтернатива, а зряла платформа за работни натоварвания. Производствен изкуствен интелект.

Всичко това, освен това, се случва, когато доставчиците търсят технологична автономност, устойчиви разходи и гъвкавост на... лицензиранеМодулната рецепта на Intelligence Gen 2 отговаря на това желание да се изгради точно това, което е необходимо, нито повече, нито по-малко, и да се мащабира, когато бизнесът има нужда от това. изискват.

Въпреки че всеки случай на употреба ще има своя собствена блокова схема, съгласуваността на дизайна между X160/X180, X280, X390 и XM позволява комбиниране на части без „изненади“ и с очевиден път към оптимизация. производителност/консумацияТази последователност отваря вратата към по-кратки цикли на разработка и по-малко преработка.

Като цяло, семейството Intelligence Gen 2 покрива целия диапазон с лекота: от сензор който изисква основен изкуствен интелект до нивото на стелажа, който изисква мащабируеми PFLOPS, преминаващи през шлюзове и контролери, които оркестрират ускорители външен. Това е ход, съответстващ на тенденцията в индустрията към хетерогенни и композируеми архитектури.

За всеки, който иска да изгради модерна платформа за изкуствен интелект, тук има градивни елементи, които съчетават... зряла векторизация, мощни матрични изчисления и софтуерна екосистема, която не започва от нулата. Добавете към това тласъка от нововъзникващите стандарти и прогнозата за растеж в периферията, и съгласуваността на частите е доста... смисъл.

SiFive предлага RISC‑V AI хардуер, който изглежда практичен и добре обмислен: конфигурируеми там, където трябва да бъде, ефективно в това, което е важно, и с все по-солиден мост към софтуера. С вече налични лицензи и планирани за 2026 г. първи силициеви внедрявания, това е предложение с потенциал да изгради днешните платформи за сутрин.

Какво е RISC-V RVA23?
Свързана статия:
RISC-V RVA23: Всичко за профила, който променя процесорите