Новости Железо и технологии Исследование показало, где ИИ выполняет задачи наравне с человеком

Исследование показало, где ИИ выполняет задачи наравне с человеком

Arkadiy Andrienko
Читать в полной версии

В OpenAI провели масштабное исследование, чтобы оценить, насколько хорошо современные нейросети справляются с реальными рабочими задачами и результаты показывают, что искусственный интеллект уже сейчас может выполнять часть функций на уровне опытных сотрудников в нескольких десятках профессий.

Эксперимент под названием GDPval включал в себя 220 заданий в контексте 44 различных специальностей, при этом специалисты в данных направления сами оценивали, насколько качественно модели ИИ справляются с работой, которую они выполняют ежедневно. Среди таких профессий оказались риелторы, юристы, инженеры, разработчики программного обеспечения, фармацевты и финансовые консультанты.

Как выяснилось, лучше всего нейросети проявляют себя там, где задачи носят рутинный и четко сформулированный характер, так искусственный интеллект уже может готовить маркетинговые материалы, анализировать данные по рынку, помогать в составлении первичных юридических документов или обрабатывать медицинские снимки. Любопытно, что в этом своеобразном соревновании моделей лидером стал не продукт OpenAI, первое место по оценкам экспертов заняла модель Claude Opus 4.1 от компании Anthropic, а уже следом за ней расположился GPT-5.

Более продвинутая версия GPT-5 в 40% случаев создавала материалы, которые эксперты признавали равными или даже превосходящими работу человека, при этом предыдущее поколение GPT-4o, достигало такого результата лишь в 13,7% заданий. В OpenAI подчеркивают, что речь не идет о полном замещении людей, а о роли ИИ в качестве поддержке сотрудников, где машина способна быстрее и дешевле выполнять некоторые повторяющиеся задачи, освобождая время специалистов для более сложных дел.

Основной проблемой, сдерживающей повсеместное внедрение, остаются так называемые «галлюцинации» ИИ — случаи, когда нейросеть выдает недостоверную или выдуманную информацию, что заметно в длинных и сложных проектах, где без человеческого контроля пока не обойтись. Пока ясно одно: ИИ перестал быть просто игрушкой и превратился в инструмент, который меняет может стать подспорьем для человека во многих профессиональных областях.

🎩 Новая Mafia уже в разработке
    Об авторе
    Комментарии4
    Оставить комментарий
    14 часов
    На кладбище-то уже пора ползти за ненадобностью или ещё можно подождать?
    Ответить
    13 часов
    Аналитик в США заявил недавно , что скоро начнутся массовые сокращения среди белых воротничков. Из заменит ИИ.
    Ответить
    13 часов
    Там уже сказал Маск вроде или кто-то — мол идите учиться на электриков, штукатуров и других рабочих — нам их много надо будет чтобы строить дата-центры для ИИ. Программисты не нужны.
    Ответить
    13 часов
    Ну да там аналитик тоже сказал , что обычные профессии останутся их не сократят, а вот кто за ПК работает тех нафиг.
    Ответить