РЕКЛАМА

ИИ тупеет от общения с людьми

Звучит как сенсация, но GPT-4 (мультимодальная большая языковая модель) со временем становится все хуже (тупее), а не лучше (умнее). Многие пользователи заметили значительное ухудшение качества ответов модели, но до сих пор все это было на уровне шуточек.

Но теперь всё стало не так смешно. Под катом!

ИИ тупеет от общения с людьми


Серьезное исследование показывает, что июньская версия GPT-4 объективно хуже версии, выпущенной в марте, в части выполнения некоторых задач.

Команда оценила модели, используя набор данных из 500 задач, в которых модели должны были выяснить, является ли данное целое число простым. В марте GPT-4 правильно ответил на 488 из этих вопросов. В июне у него было только 12 правильных ответов. С 97,6% вероятность успеха снизилась до 2,4%! И дальше только хуже.

Команда использовала Chain-of-Thought, чтобы помочь модели объяснить:

«Является ли 17077 простым числом? Думайте шаг за шагом».

Цепочка мыслей — популярная техника, которая значительно улучшает ответы. К сожалению, последняя версия GPT-4 не генерировала промежуточных шагов и вместо этого сразу неправильно давала простой ответ «Нет».

Генерация кода также ухудшилась.

Команда создала набор данных с 50 простыми задачами из LeetCode и измерила, сколько ответов GPT-4 выполнялись без каких-либо изменений. Мартовская версия успешно справилась с 52% проблем, но при использовании июньской модели этот показатель упал до жалких 10%.

Почему это происходит?

Ученые предполагают, что OpenAI постоянно вносит в себя изменения, но никто не знает, как работает этот процесс, и как система оценивает, улучшаются модели или регрессируют.

Это тревожный сигнал для всех, кто создает приложения, основанные на GPT-4.
нейросети наука
0
2339
20 июля 2023
Смотрите также:
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Понедельник, 24 Марта
USD 0.0000
EUR 0.0000
RUB 0.0000
pass666 798896 минут назад Это всё моя жена писала pass666 798902 минут назад Ляйсан, я люблю тебя ASD2 798903 минут назад На самом деле это вопрос сложный. Предложил бы не затрагивать чувствительных тем, ибо сейчас это красный флаг. А нейтральными комментами мы поддержим площадку.

Спасибо!
Всем добра
Flint 798947 минут назад От такого великолепия аж высраться захотелось, какая же красота. Flint 798954 минут назад Ага, 1000 баксов за эту парашу? дайте 6!) xexun 799038 минут назад Нищета, разруха, никаких систем оповещения. Ничего удивительного, жаль погибших xexun 799061 минут назад Американцам нужен комфортный транспорт, который не потеряется под 150 кг тушей. Для азиатского региона норм, для штатов - только как прикол. Бензиновая версия старая была у них, она интересно выглядит до сих пор fynjifvjkjltw 799134 минут назад Фентаниловые амеры,которые пропагандируют чуть ли не с детсада пидарасню и трансвеститство всякое и тут же запрещают чпокаться бабе и пацанёньку у которого уже встаёт на женщин. Бред какой то!
Новости от партнеров
Сейчас на сайте
0 пользователей, 526 гостей