В OpenAI провели масштабное исследование, чтобы оценить, насколько хорошо современные нейросети справляются с реальными рабочими задачами и результаты показывают, что искусственный интеллект уже сейчас может выполнять часть функций на уровне опытных сотрудников в нескольких десятках профессий.
Эксперимент под названием GDPval включал в себя 220 заданий в контексте 44 различных специальностей, при этом специалисты в данных направления сами оценивали, насколько качественно модели ИИ справляются с работой, которую они выполняют ежедневно. Среди таких профессий оказались риелторы, юристы, инженеры, разработчики программного обеспечения, фармацевты и финансовые консультанты.
Как выяснилось, лучше всего нейросети проявляют себя там, где задачи носят рутинный и четко сформулированный характер, так искусственный интеллект уже может готовить маркетинговые материалы, анализировать данные по рынку, помогать в составлении первичных юридических документов или обрабатывать медицинские снимки. Любопытно, что в этом своеобразном соревновании моделей лидером стал не продукт OpenAI, первое место по оценкам экспертов заняла модель Claude Opus 4.1 от компании Anthropic, а уже следом за ней расположился GPT-5.
Более продвинутая версия GPT-5 в 40% случаев создавала материалы, которые эксперты признавали равными или даже превосходящими работу человека, при этом предыдущее поколение GPT-4o, достигало такого результата лишь в 13,7% заданий. В OpenAI подчеркивают, что речь не идет о полном замещении людей, а о роли ИИ в качестве поддержке сотрудников, где машина способна быстрее и дешевле выполнять некоторые повторяющиеся задачи, освобождая время специалистов для более сложных дел.
Основной проблемой, сдерживающей повсеместное внедрение, остаются так называемые «галлюцинации» ИИ — случаи, когда нейросеть выдает недостоверную или выдуманную информацию, что заметно в длинных и сложных проектах, где без человеческого контроля пока не обойтись. Пока ясно одно: ИИ перестал быть просто игрушкой и превратился в инструмент, который меняет может стать подспорьем для человека во многих профессиональных областях.