РЕКЛАМА

ИИ тупеет от общения с людьми

Звучит как сенсация, но GPT-4 (мультимодальная большая языковая модель) со временем становится все хуже (тупее), а не лучше (умнее). Многие пользователи заметили значительное ухудшение качества ответов модели, но до сих пор все это было на уровне шуточек.

Но теперь всё стало не так смешно. Под катом!

ИИ тупеет от общения с людьми


Серьезное исследование показывает, что июньская версия GPT-4 объективно хуже версии, выпущенной в марте, в части выполнения некоторых задач.

Команда оценила модели, используя набор данных из 500 задач, в которых модели должны были выяснить, является ли данное целое число простым. В марте GPT-4 правильно ответил на 488 из этих вопросов. В июне у него было только 12 правильных ответов. С 97,6% вероятность успеха снизилась до 2,4%! И дальше только хуже.

Команда использовала Chain-of-Thought, чтобы помочь модели объяснить:

«Является ли 17077 простым числом? Думайте шаг за шагом».

Цепочка мыслей — популярная техника, которая значительно улучшает ответы. К сожалению, последняя версия GPT-4 не генерировала промежуточных шагов и вместо этого сразу неправильно давала простой ответ «Нет».

Генерация кода также ухудшилась.

Команда создала набор данных с 50 простыми задачами из LeetCode и измерила, сколько ответов GPT-4 выполнялись без каких-либо изменений. Мартовская версия успешно справилась с 52% проблем, но при использовании июньской модели этот показатель упал до жалких 10%.

Почему это происходит?

Ученые предполагают, что OpenAI постоянно вносит в себя изменения, но никто не знает, как работает этот процесс, и как система оценивает, улучшаются модели или регрессируют.

Это тревожный сигнал для всех, кто создает приложения, основанные на GPT-4.
нейросети наука
0
2586
20 июля 2023
Смотрите также:
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Воскресенье, 15 Марта
USD 0.0000
EUR 0.0000
RUB 0.0000
pass666 1311841 минут назад Это всё моя жена писала pass666 1311847 минут назад Ляйсан, я люблю тебя ASD2 1311848 минут назад На самом деле это вопрос сложный. Предложил бы не затрагивать чувствительных тем, ибо сейчас это красный флаг. А нейтральными комментами мы поддержим площадку.

Спасибо!
Всем добра
Flint 1311893 минут назад От такого великолепия аж высраться захотелось, какая же красота. Flint 1311899 минут назад Ага, 1000 баксов за эту парашу? дайте 6!) xexun 1311983 минут назад Нищета, разруха, никаких систем оповещения. Ничего удивительного, жаль погибших xexun 1312006 минут назад Американцам нужен комфортный транспорт, который не потеряется под 150 кг тушей. Для азиатского региона норм, для штатов - только как прикол. Бензиновая версия старая была у них, она интересно выглядит до сих пор fynjifvjkjltw 1312079 минут назад Фентаниловые амеры,которые пропагандируют чуть ли не с детсада пидарасню и трансвеститство всякое и тут же запрещают чпокаться бабе и пацанёньку у которого уже встаёт на женщин. Бред какой то!
Новости от партнеров
Сейчас на сайте
3 пользователя, 588 гостей