Израильский стартап NeuReality представил специализированный чип NR1, призванный решить проблему неэффективного использования графических ускорителей (GPU) при работе с искусственным интеллектом. Современные GPU для задач ИИ стали значительно мощнее, однако центральные процессоры (CPU) и сетевые адаптеры (NIC) в серверах зачастую не поспевают за ними. По оценкам, из-за этого GPU в таких системах сегодня используются лишь на 30-50% своего потенциала.
NR1 позиционируется как «мозг» ИИ-инференса: он берет на себя всю координацию процессов между GPU, CPU и сетью, значительно ускоряя обработку данных. При этом чип совместим с любыми ускорителями — будь то NVIDIA, AMD или специализированные решения. NeuReality утверждает, что использование NR1 позволяет загружать GPU почти на 100%. В тестах компании производительность генеративной модели на одном GPU выросла в 6,5 раза по сравнению с классической серверной архитектурой на базе x86, при равном энергопотреблении.
Это может быть особенно актуально для:
Также NeuReality предоставляет SDK и Kubernetes-инструментарий для DevOps и MLOps-команд — удобный старт для интеграции в игровые студии и облачные сервисы. В условиях, когда ИИ все активнее проникает в геймдев, от генерации контента до продвинутой аналитики поведения игроков, снижение затрат и ускорение вычислений становится ключевым фактором. Модель NR1 отражает тренд на дезагрегацию серверных систем — выделение ИИ-вычислений в отдельный, более эффективный контур.
Это особенно актуально для студий, работающих с генеративным ИИ, мультимодальными моделями, обработкой изображений (в том числе для фотореалистичной графики), озвучкой и машинным обучением на больших объемах игровых данных. Появление NR1 указывает на растущую потребность рынка в специализированных решениях для эффективного управления ресурсами при выполнении сложных ИИ-задач, особенно в условиях масштабирования.