На пазар, пълен със затворени интелигентни високоговорители, най-накрая се появява алтернатива, която поставя контрола в ръцете на потребителя: асистент с изкуствен интелект, който разбира и се самопоправя. Ето как е представен Ubo Pod Developer Edition (DE), отворено устройство на Raspberry Pi 4 или 5, което комбинира глас, компютърно зрение и сензори. в модулно шаси, което не изисква собствени услуги за работа.
Идеята не се ограничава само до питане за времето или пускане на музика. Ubo Pod комбинира микрофони, високоговорители, цветен екран, камера, сензори за околната среда и инфрачервена система (излъчвател и приемник). За да разговаряте с езикови модели, да интерпретирате това, което вижда, и дори да управлявате оборудването в хола с глас. Вие избирате дали да използвате облачен изкуствен интелект или всичко да се случва локално, като се дава приоритет на поверителността. А ако обичате да експериментирате, средата е проектирана за експериментиране с глас, зрение и инструменти, без да се налага да се борите с основната система.
Какво е Ubo Pod Developer Edition и каква е неговата цел?
Изданието за разработчици е ядрото на проекта. Тяхната амбиция е да заменят „черните кутии“ като Echo или Nest с асистент, който може да се сглобява и одитира, използвайки отворен хардуер и безплатен софтуер.Освободени от ограниченията на затворените услуги. Със същото оборудване активирате автоматично разпознаване на реч (STT), синтез на реч (TTS), езикови и визуални модели (LLM/VLM), извикване на инструменти и активиращи тригери за различни сценарии.
Хубавото му е, че не изисква програмиране. Включва графичен интерфейс на вградения си екран и WebUI за конфигуриране без докосване на код.така че можете да избирате доставчици на изкуствен интелект, да настройвате опции и да активирате функции директно от вашето устройство или браузър.
Отворът преминава през целия дизайн. Както приложението Ubo, така и хардуерът са пуснати под отворени лицензи и публични хранилища.включително печатни платки и механични файлове. Ако искате да одитирате, модифицирате или допринасяте, системата е „на видно място“, нещо необичайно за този тип домашен асистент.
Дизайн и хардуер: модулен, разширяем и ремонтопригоден
Шасито е компактно и проектирано за дълготрайна употреба. Размерите му са 130 × 99 × 52 мм, тежи около 340 грама и е проектиран да побере Raspberry Pi 4 или Raspberry Pi 5.с активно управление на температурата за поддържане на стабилна производителност по време на дълги сесии.
Предната част е снабдена с 1,54-инчов цветен IPS дисплей с резолюция 240 x 240 пиксела. Въпреки че не е голям, той ви позволява да преглеждате състояния, менюта и малък интегриран графичен потребителски интерфейс. да правите корекции или да консултирате информация на място, без да се налага да отидете до компютъра.
Точно до него е разположена 5-мегапикселова камера, която осигурява входни данни от компютърно зрение. Вариантът Ubo Pro 4 може да използва официалните камери на Raspberry Pi V1 и V2.В допълнение, Ubo Pro 5 добавя съвместимост с Camera Module 3, разширявайки опциите за заснемане и фокусиране.
Аудио секцията е предназначена за естествени разговори. Разполага с двойни стерео микрофони със запис до 48 kHz и стерео високоговорители с възпроизвеждане до 48 kHz с много ниски изкривявания (<0,1% THD). В документацията се споменава 1 W на канал, а също и 2 W на високоговорител; във всеки случай системата е проектирана за ясен глас в настолен компютър или хол.
Ако предпочитате да изпращате звука към друго оборудване, има линеен изход, базиран на кодека WM8960. Той доставя 40 mW при 16 Ω, разпознава поставяне на жак, декларира THD от -75 dB при 20 mW и постига 90 dB SNR с товар от 16 Ω.Това осигурява гъвкавост за саундбари, усилватели или активни високоговорители.
За физическо управление на оборудването, предният панел има малка клавиатура. Има 7 силиконови бутона с меко докосване и специален бутон за захранване., достатъчно за работа с менюта или за бърз достъп до функции.
„Визуалната“ част е подсилена с пръстен от светлина. Включва 27 адресируеми RGB светодиода (SK6812, съвместим с NeoPixel)идеален за показване на статуси, анимации или обратна връзка по време на разговори.
По отношение на свързаността, той наследява най-добрите характеристики на Raspberry Pi. Предлага гигабитов Ethernet, WiFi 5, Bluetooth 5.0, два USB 3.0 порта и два USB 2.0 порта. от самия SBC, с достатъчно място за външни периферни устройства или ускорители.
Една от отличителните характеристики на дома е инфрачервеното лъчение. Включва IR приемник с обхват до 5 метра (TSOP75238) и четири мощни 940 nm IR излъчвателя (VSMB10940) с практически всепосочен модел, което му позволява да се учи и да препраща команди към телевизори, саундбари или климатици.
Сензорите за околната среда също са напълно оборудвани стандартно. Включва температурен сензор PCT2075 (точност ±1 °C между -25 °C и +100 °C) и сензор за околна светлина VEML7700., способен да измерва от 0 до 120 килолукса с фина резолюция от 0,0036 lx/ct.
Що се отнася до паметта, базовият пакет включва картата, готова за зареждане. Включена е 32GB microSD карта, на която е предварително инсталирана операционната система.така че можете да започнете да го използвате веднага щом го включите.
Ако направите скока към по-високия модел, има награда. Ubo Pro 5 добавя M.2 PCIe слот за NVMe SSD дискове или за монтиране на AI ускорител.Това е много полезно за изпълнение на взискателни локални модели или за съхраняване на спомени и бази знания, без да се притеснявате за пространството.
- 1,54-инчов IPS дисплей (240×240) за вграден интерфейс и състояния
- 5 MP камера и официална поддръжка на камерата на Raspberry Pi (в зависимост от модела)
- Двоен микрофон + стерео високоговорители оптимизиран за глас
- ИЧ прием/предаване за универсален контрол на хола
- Сензори за температура и светлина с прецизност и широк диапазон
Осезаема поверителност и контрол на данните
Отвъд намеренията има и физически мерки. Камерата може да бъде покрита със завеса за поверителност. Така че е безшумен, когато не ви е нужен. А микрофоните имат хардуерен превключвател за изключване на звука, което ви позволява да ги заглушите, без да разчитате единствено на софтуер.
Софтуерната архитектура подкрепя тази философия. Можете да работите изцяло локално или да разчитате на облачни услуги.настройване на баланса между удобство и поверителност, за да отговаря на всяка ситуация. Ако не искате аудио или изображения да напускат мрежата ви, можете да я конфигурирате да работи локално.
Софтуер с отворен код, WebUI и съвместимост с над 50 доставчици на AI
Базовата система работи на Raspberry Pi OS и приложението Ubo. Приложението е написано на Python и публикувано в GitHub.Следователно, не е необходимо да купувате устройството, за да го изпробвате: можете да го инсталирате на Raspberry Pi 4 или 5, който вече имате.
Съвместимостта на услугите е широка и разнообразна. Ubo Pod поддържа над 50 доставчици за разпознаване на реч, TTS, памет, зрение и LLM, с опции както за облак, така и за локално ползване, които могат да бъдат избрани от екрана или уеб интерфейса.
Ако предпочитате сами да избирате всеки модел, можете да го направите. Възможно е да се насочат крайни точки на популярни API-та като Gemini, ChatGPT или Claude.или използвайте Ollama, за да стартирате LLM локално, намалявайки латентността и съхранявайки данните вътрешно.
За да разширите възможностите, без да усложнявате нещата, има API, предназначен за разработчици. Системата предоставя gRPC API, който ви позволява да създавате модули или интеграции само с няколко реда код., което улеснява добавянето на функции, съобразени с всеки проект.
Разговорният слой не спира с отговаряне с текст. Поддръжка на извикване на инструменти и различните механизми за активиране Те ви позволяват да извършвате верижни действия, да четете сензори, да показвате данни на екрана или да осветявате LED пръстена в зависимост от състоянието.
Компютърно зрение и инфрачервени лъчи: домът под вашия глас
Вградената камера и поддръжката на официални модули позволяват на устройството да „вижда“. Може да разпознава кодове, символи, жестове и обектиотваряне на вратата към сценарии като четене на код на екрана, откриване на сигнал за потвърждение или описание на сцена, за да ви даде контекст.
Универсалното инфрачервено управление е друг чудесен съюзник в ежедневието. Можете да го научите на команди от любимото си дистанционно управление, за да може да ги възпроизвежда. или директно му помолете с глас да изпраща сигнали към телевизора, саундбара или климатика.
Лесен за употреба... и готов за експериментиране
Въпреки че DE е за технически профили, не изисква да програмирате. Стартира функционално и можете просто да го конфигурирате от WebUI Няма нужда да пишете код, ако не ви се иска. Включете го, настройте няколко неща и работи.
Ако обичате да повдигате капака, теренът е идеален. Модулният хардуер и отвореният софтуер ви позволяват да сменяте части и да добавяте M.2 памет в Pro 5 Или опитайте AI ускорители. И ако не искате да усложнявате нещата, просто се придържате към това, което е налично.
Модели, основни спецификации и разлики
Семейството се върти около Raspberry Pi 4 или 5, с два основни варианта. Ubo Pro 4 и Ubo Pro 5 споделят една и съща основа (1,54” 240×240 IPS екран, 5 MP камера, двоен микрофон и високоговорител, IR, сензори, LED пръстен, 7-бутонна клавиатура)но те се различават по някои точки.
- Официални камериPro 4 поддържа модули Raspberry Pi V1 и V2; Pro 5 добавя поддръжка за модул Camera 3.
- Съхранение и ускорениеPro 5 интегрира M.2 PCIe слот за NVMe SSD дискове или AI ускорители.
- ConectividadИ двата наследяват Gigabit Ethernet, WiFi 5, Bluetooth 5.0, 2×USB 3.0 и 2×USB 2.0.
- ЗвукWM8960 стерео високоговорители и линеен изход с разпознаване на жакове.
- Система: 32GB microSD предварително инсталирана за безпроблемно стартиране.
Цени, наличност и реалности на краудфъндинга
Проектът е в Kickstarter с цел финансиране от 25 000 долара. Наградите започват от $109 за Ubo Pro 4 и $129 за Ubo Pro 5Моля, обърнете внимание, че никой от тях не включва Raspberry Pi в кутията и доставката е отделна.
Както винаги при краудфъндинга, е разумно да бъдете предпазливи. Подкрепата не е същото като покупката: подкрепата на проект не гарантира изпълнението му.Прегледайте информацията, претеглете рисковете и решете доколко си струва да се включите.
Можете да разгледате кампанията на официалния уебсайт. Въведете Kickstarter за Ubo Pod за да видите подробности, нива и срокове преди участие.
Статус на проекта и съобщение от създателя
Според организатора му, два дни след стартирането на кампанията, тя вече е била постигната с 40% от целта. Той моли за последен тласък и благодари на всички, че споделиха новината.особено сред техническите профили, които са ентусиазирани от отворен и хакерски асистент.
В подобни кампании има една необичайна подробност: Малка партида е произведена предварително и има налични количества, готови за изпращане до първите спонсори., което отразява годините работа върху хардуера и софтуера, стоящи зад предложението.
Целта на създателя е кристално ясна. Даване на възможност на разработчиците да изградят безпроблемни гласови, зрителни и сензорни изживяванияи да се противопоставят на затворени системи, които според тях не зачитат достатъчно потребителя или правото му на ремонт или избор на услуги.
По отношение на видимостта, екипът иска идеи. Те са наясно с платените маркетингови агенции, но засега се фокусират върху общността и рекламата от уста на уста.търсене на по-органичен растеж.
Настройка и работен процес (без да се превръща в урок)
Устройството е проектирано да премине от нула до полезно състояние за кратко време. Уеб интерфейсът ви насочва при избора на доставчици на изкуствен интелект (глас, текст, зрение, памет) и в основната конфигурация, екранният графичен потребителски интерфейс позволява бързи настройки, без да се напуска компютъра.
Ако искате да го пробвате, преди да инвестирате в хардуер, няма проблем. Приложението Ubo може да се инсталира на Raspberry Pi 4 или 5 безжична система.така че можете да проверите съвместимостта, производителността и дали екосистемата ви подхожда.
За сценарии, изискващи максимална поверителност, има място за маневриране. Можете да изберете локални или локални опции, така че аудиото и видеото да не напускат мрежата виИ ако имате нужда от допълнителна мощност или специфични бизнес модели, имате на разположение доставчици на облачни услуги и възможност да посочите API като Gemini, ChatGPT или Claude.
Налични са казуси и демонстрации
Вече има примери от реалния свят, които показват какво може да направи. Memo, гласовият асистент за бележки, поддържа паметта и контекста в разговора, идеален за записване на напомняния или идеи, без да губите нишката.
Във зрението, то отива отвъд „виждането“. Можете да генерирате изображения от гласови команди и да описвате снимки, използвайки VLM-и., с резултати, които ще зависят от избраните модели и доставчици, но с готова инфраструктура.
За хола, инфрачервеното осветление свети ярко. Напълно приемливо е да ги помолите да сменят канала, да увеличат звука или да изключат телевизора.при условие че устройството ви получава инфрачервени команди. А ако го комбинирате със сензори за светлина и температура, е лесно да създавате прости контекстуални автоматизации.
Причини да изберете отворен асистент
Приложените асистенти са много удобни, но имат такси. С Ubo Pod вие решавате кои услуги използвате, къде се обработват вашите данни и можете да проверявате кода., което за мнозина е от решаващо значение дали да използват инструмент или да „бъдат използвани“ от него.
Освен това, хардуерът не е запоен върху патентована платка. Разчитайки на Raspberry Pi, е възможно да се надграждат, ремонтират или използват повторно компоненти.Това е ценно, когато предстои планирано остаряване и искате да удължите живота на вашите устройства.
Ограничения и нюанси, които трябва да се вземат предвид
Не всичко е перфектно и е важно да се осъзнава това. Няма награда, която да включва Raspberry PiТака че, когато обмисляте покупката си, трябва да вземете предвид цената и наличността им. А при аудиото ще видите цифри като 1W на канал и също 2W на високоговорител; ако максималната сила на звука е критична, най-добре е да вземете предвид контекста (бюро или малка стая) или да използвате линейния изход с външни високоговорители.
Това е жив проект, който се развива. Списъкът с доставчици, функциите и локалната производителност зависят от общността, зависимостите и дали изграждате Pi 4 или 5.Положителната страна е, че бидейки отворен, винаги можеш да се адаптираш и усъвършенстваш с течение на времето.
Това е алтернатива, която осигурява контрол, поверителност и възможности за персонализиране, без да се жертва полезността. Асистент с изкуствен интелект, зрение, сензори и инфрачервени лъчи, модулен хардуер и съвместимост с повече от 50 услуги който се финансира чрез краудфъндинг с достъпни входни цени и радикално отворен подход.