Tachyum - процессоры Prodigy

Tachyum анонсировала универсальные процессоры Prodigy: 128 ядер с частотой 5,7 ГГц, которые втрое быстрее AMD EPYC 7763 и NVIDIA H100.

Словацкая компания Tachyum официально представила серверные процессоры Prodigy, над которыми она трудилась несколько лет.

Официальный сайт компании — https://www.tachyum.com/

О компании Tachyum

Tachyum преобразует экономику искусственного интеллекта, высокопроизводительных вычислений, рабочих нагрузок в общедоступных и частных облаках с помощью Prodigy, первого в мире универсального процессора. Prodigy объединяет функциональность центрального процессора, GPGPU и TPU в одном процессоре, который обеспечивает лучшую в отрасли производительность, стоимость и энергоэффективность как для специализированных, так и для универсальных вычислений.

Когда гипермасштабируемые центры обработки данных оснащены Prodigy, все приложения искусственного интеллекта, HPC и общего назначения могут запускаться в одной инфраструктуре, что экономит компаниям миллиарды долларов на оборудовании, занимаемой площади и эксплуатационных расходах. Поскольку выбросы в глобальных центрах обработки данных вносят свой вклад в изменение климата и потребляют более четырех процентов электроэнергии в мире (по прогнозам, к 2030 году этот показатель составит 10 процентов), универсальный процессор Prodigy со сверхнизким энергопотреблением является потенциальным прорывом в удовлетворении потребности мира в вычислениях при меньших экологических затратах.

Prodigy, находящийся сейчас на завершающей стадии тестирования и интеграции перед серийным производством, внедряется в виде прототипа быстро растущей клиентской базой, а большое количество заказов на поставку сигнализирует о вероятном IPO в конце 2024 года. Офисы Tachyum расположены в Соединенных Штатах и Словакии.

Процессоры и экосреда Tachyum

По словам создателей, это первые в мире по-настоящему универсальные чипы, которые способны одновременно заменить CPU, GPU и TPU. Более того, Tachyum заявляет, что её процессоры не только быстрее всех остальных, но и дешевле и энергоэффективнее.

Универсальность Prodigy заключается в том числе в возможности запускать бинарные файлы, собранные для архитектур x86-64, Arm и RISC-V в дополнение к нативным для данной 64-бит ISA приложениям. Tachyum говорит, что её чипы подойдут для задач ИИ и HPC, а также будут привлекательными для гиперскейлеров. Тестовые образцы компания начнёт рассылать уже в этом году. Кроме того, компания предлагает IP-блоки TPU для инференс-систем IoT/Edge.

Изображения: Tachyum

Старшая в семействе новых 5-нм CPU, которое включает восемь устройств, модель имеет 128 унифицированных ядер, работающих на частоте 5,7 ГГц. По предварительным данным, у каждого ядра есть по 64 Кбайт L1-кеша для данных и инструкций, а также 128 Мбайт L2+L3. В деталях об архитектуре и микроархитектуре новинок пока не рассказывается, но упоминается внеочередное исполнение и возможность выполнения до четырёх инструкций за такт, а также поддержка виртуализации и расширенных RAS-функций. У каждого ядра есть два 1024-бит векторных блока и один 4096-бит матричный блок.

FPGA-эмулятор Tachyum Prodigy

Процессор снабжён 16-ю контроллерами памяти с поддержкой модулей DDR5-7200 суммарным объёмом до 8 Тбайт. При этом есть возможность создавать двух- и четырёхпроцессорные системы. Связь с внешним миром обеспечивают 32 контроллера PCIe, которые суммарно дают 64 линии PCIe 5.0. TDP для данной модели не указывается, но компания говорит о возможности использования воздушного и жидкостного охлаждения.

Базовые характеристики впечатляют, но ещё более удивительными выглядят заявления разработчиков о производительности будущего флагмана. В SPECrate 2017 Int он примерно вчетверо быстрее Xeon Platinum 8380 и втрое быстрее EPYC 7763, старших моделей процессоров Intel и AMD текущего поколения. Более того, компания обещает, что FP64-производительность новинок будет втрое больше, чем у грядущих ускорителей NVIDIA H100, то есть составит порядка 180 Тфлопс.

А в FP8-вычислениях производительность будет выше, чем у H100, сразу в шесть раз — 24 Пфлопс! При этом новинки, со слов Tachyum, будут энергоэффективнее всех этих чипов. Для Prodigy заявлена поддержка форматов FP64, FP32, TF32, BF16, INT8, FP8 и некоего TAI, а также работа с т.н. разреженными (sparsed) вычислениями, которые важны для ИИ-нагрузок. Правда, пока что анонс можно назвать «бумажным», поскольку детальные характеристики чипов компания не предоставила, ограничившись лишь рассказами о том, как они хороши.

Тем не менее, о прогрессе разработки Tachyum докладывает регулярно. На текущий момент компания предлагает разработчикам аппаратный эмулятор на базе FPGA — всего 8 ядер Prodigy, но с возможностью масштабирования до 64 ядер. Этот эмулятор компания сама использует для отладки ПО. Она уже адаптировала ядро Linux и базовое окружение, UEFI, KVM/QEMU, GCC, а также успешно сделала порт FreeBSD для своей архитектуры.

По состоянию на конец 2023 года

28 ноября 2023 г. — Tachyum® объявила, что завершила разработку программного стека для универсального процессора Prodigy® и теперь вступила в фазу альфа-тестирования в рамках подготовки к производству и распространению чипов, запланированных на следующий год.

Инженеры-программисты Tachyum упорно трудились, чтобы раскрыть весь потенциал Prodigy, разработав богатую экосистему приложений, системного программного обеспечения, фреймворков и библиотек, которые портированы для работы на аппаратном обеспечении Prodigy. Как только программный пакет завершит тестирование и будет работать на FPGA, компания сможет полностью перейти к внедрению универсального процессора в производство.

Дистрибутив программного обеспечения Prodigy представляет собой полностью интегрированный программный стек и пакет, готовый к развертыванию “как есть”. Он доступен в виде единого предустановленного образа для первых пользователей и заказчиков Tachyum. Приложения были протестированы на работоспособность «из коробки», чтобы клиенты могли сразу же приступить к использованию. Если пользователи столкнутся с какими-либо проблемами во время развертывания, программное обеспечение можно быстро и легко восстановить в исходном виде.

В состав дистрибутива программного обеспечения в рамках альфа-тестирования включены:

Системное программное обеспечение, включающее UEFI, Linux, SE-Linux, FreeBSD, KVM, XEN, GCC, LLVM, TensorFlow и PyTorch. Из UEFI (Unified Extensible Firmware Interface), интерфейса следующего поколения между операционными системами и встроенным программным обеспечением платформы, клиенты могут выбрать Linux, SE-Linux, FreeBSD, KVM, Xen и другие. Промежуточное программное обеспечение, такое как контейнеры и т.д. Такие приложения, как базы данных, веб-серверы, серверы электронной почты и многое другое. Программное обеспечение для искусственного интеллекта и HPC. Готовая бинарная совместимость с x86, ARM и RISC-V благодаря динамическому двоичному переводу .Демонстрационные приложения и тесты приложений.

Будучи универсальным процессором, обеспечивающим лучшую в отрасли производительность для любых рабочих нагрузок, серверы центров обработки данных на базе Prodigy могут плавно и динамически переключаться между вычислительными областями (такими как AI/ML, HPC) с единой однородной архитектурой. Устраняя необходимость в дорогостоящем выделенном оборудовании для искусственного интеллекта и резко увеличивая загрузку серверов, Prodigy значительно сокращает капитальные и эксплуатационные затраты, обеспечивая беспрецедентную производительность, мощность и экономичность центра обработки данных. Prodigy объединяет 192 высокопроизводительных 64-разрядных вычислительных ядра, разработанных по индивидуальному заказу, что обеспечивает в 4,5 раза производительность самых производительных процессоров x86 для облачных рабочих нагрузок, в 3 раза производительность самого производительного графического процессора для HPC и в 6 раз — для приложений искусственного интеллекта.

“Мы с самого начала поняли, что если хотим произвести революцию в центре обработки данных, выпустив самый маленький, быстрый и экологичный в мире чип общего назначения, то необходимо создать стек, способный обрабатывать весь спектр программного обеспечения, которое будет на нем работать”. “По мере того, как наш универсальный процессорный чип приближается к стадии готовности к производству, мы гордимся тем, что разработали обширный портфель программного обеспечения, готового к запуску непосредственно на Prodigy. Его доступность для альфа-тестирования является огромным шагом на пути к революционизированию центра обработки данных ”

— сказал доктор Радослав Данилак, основатель и генеральный директор Tachyum.

Ниже для просмотра доступно видео, демонстрирующее альфа-версию дистрибутива программного обеспечения Tachyum Prodigy.

Prodigy Software Distribution Package

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *