Новости Железо и технологии NVIDIA анонсировала нейросеть NVLM 1.0, которая способна анализировать и интерпретировать изображения

NVIDIA анонсировала нейросеть NVLM 1.0, которая способна анализировать и интерпретировать изображения

Arkadiy Andrienko

19 сентября 2024, 12:41

Читать в полной версии

NVIDIA представила свою новейшую мультимодальную языковую модель NVLM 1.0, которая не только отлично справляется с визуальными задачами, но и может интерпретировать картинки и рукописный текст. В тестах NVLM 1.0 превзошла GPT-4o по распознаванию текста на изображениях, продемонстрировав выдающиеся результаты в математике, лишь немного уступив Claude 3.5. Модель также может пояснять смысл мемов и прочих комичных ситуаций, изображенных на картинках или описанных текстом.

Компания выпустила три версии модели: NVLM-D, NVLM-X и NVLM-H. NVLM-D использует предобученный энкодер для изображений и потребления меньшего количества ресурсов графического адаптера, NVLM-X оптимизирована для работы с изображениями в высоком разрешении, а NVLM-H сочетает черты обеих предыдущих моделей.

Для более подробной информации и доступа к коду модели можно перейти на сайт NVIDIA и GitHub.

🍑 Marvel Rivals потеряла 85% игроков меньше чем за год

PC Новости Железо и технологии NVIDIA нейросети

Об авторе

Arkadiy Andrienko

Автор статей и новостей

Как технический журналист VGTimes, я с одинаковым удовольствием обсуждаю новейшие графические процессоры и углубляюсь в тонкости классических RPG. Начиная с 2018 года пишу об играх и оборудовании, мой опыт работы в области звукорежиссуры позволил мне хорошо разбираться в нюансах аудиотехнологий, и я всегда нахожусь в поиске чего-то нового в области игрового оборудования. Когда я не пишу о технологиях, то, скорее всего, я исследую постапокалиптические пустоши в Fallout, управляю колонией в RimWorld или командую армиями в Hearts of Iron IV. Для меня игры — это больше, чем просто хобби — это страсть, которая подпитывает мой творческий потенциал и поддерживает связь с постоянно развивающимся миром технологий.

Комментарии2

Оставить комментарий

MrProRock(33RU)

1 год

Потыкаться было бы любопытно, но только какой толк от кода🤷‍♂️для обычного юзверя.

Ответить

БиллиБоб

1 год

Уж лучше пользоваться нейронкой, которая твои ресурсы жрать не будет.

Ответить