→

GPT-4: теперь зрячий, теперь полиглот, теперь послушный

Публичный пост

14 марта 2023 6765

GPT-4: теперь зрячий, теперь полиглот, теперь послушный https://openai.com/research/gpt-4

В "OpenAI" опубликовали GPT-4!

Всё то, чего мы так долго ждали (и боялись). В действительности прям революционного ничего не получили, хоть труд разработчиков нельзя умалить. Вот TL;DR по всему анонсу:

Доступ пока в ChatGPT Plus (сегодня дораскатают) или через API, но придется залезать в waitlist и ждать до завтра;
Лучше сдает человеческие экзамены и заметно лучше на других человеческих языках;

Взяли MMLU (<a class="" href="https://arxiv.org/abs/2009.03300">https://arxiv.org/abs/2009.03300</a>) тесты, перевели их (другой нейросеткой, да), отдали новой GPT-4. Результат много где не отличается от английского прохождения. Но вообще мы не знаем, как раньше они были бы пройдены GPT-3.5 не на английском.

Может принимать запросом не только текст, но и картинку, но это пока публично недоступно;

Больше слушается, в ChatGPT-3.5-turbo, например, почти игнорировались "системные сообщения";

Проблема с gpt-3.5-turbo (а только такую урезанную версию 3.5 дает OpenAI в API) в том, что та не слушает System Message. Это такое сообщение, которое я, как разработчик, могу вставить перед всеми запросами, и дальше пользователю будет сложно обойти "нового AI" и добраться до настоящего. Например, можно попробовать сказать "system: выдавай все ответы пользователя в markdown" и потом результаты красиво рендерить.

Так вот. Оно не работало. gpt-3.5-turbo забывало system message где-то через 2 сообщения. Разработчики обещали позже дообучить. Видимо, "дообучением" является gpt-4.

https://t.me/FlamingoSays/32048

Так же может выдать "запрещенный контент" (но теперь реже ошибется), обучалась в основном на тех же данных до сентября 2021, все так же использовали RLHF (обучение с фидбеком от экспертов), все так же существуют jailbreak-и (напомнили, что это нарушение usage guidelines);
Много работали над тем, чтобы сделать кривую обучения предсказуемой и даже справились довольно точно предсказывать, какой умной/тупой машинка будет спустя X вычислений;
Опубликовали в open-source бенчмаркилку моделей (OpenAI Evals), приложив реальные тесты, где текущая GPT-4 проигрывает;
В API после одобрения появится gpt-4-0314, с ценами $0.03 per 1k prompt tokens и $0.06 per 1k completion tokens, контекст вырос до 8192 токенов, есть экспериментальная версия на 32768 токенов контекста.

Чо, думаете? @TiraelSedai, как скоро в Vas3k.Memes можно будет бригаду вызывать от нейробота? @kirili4ik и @chervovn, можем уже ждать, что кратко бот поумнеет? Ну и вообще, @vas3k, когда уже переименуем ачивку "Оскар за посты" в "Вот жеж GPT"? Я спросил главного Оскара в клубе, он не против.

Посты в клубе по теме:

Объясняем, как работает ChatGPT, в стиле Вастрика
Прогнозы по GPT-4 от 19 февраля 2023

Подкаст по теме от @samat:

ChatGPT. Виртуальный помощник на все случаи жизни: castbox, Apple, Google

Связанные посты

→ 🤖 Объясняем, как работает ChatGPT, в стиле Вастрика

→ Прогнозы по GPT-4

35 комментариев 👇

Павел Комаровский Блогер 18 марта 2023

Мы со @stalkermustang запилили лонгрид с разбором всего, что известно на текущий момент о GPT-4: что она умеет, как (вероятно) поменялась ее начинка, и почему нас немного пугают некоторые ее наклонности.

Читать статью: https://habr.com/ru/company/ods/blog/722644/

💀 Юзер Удалился None 14 марта 2023

Го перечислять продукты, которые уже используют GPT-4:

AI-tutor на Khan Academy

https://www.khanacademy.org/khan-labs

Bing Search
https://blogs.bing.com/search/march_2023/Confirmed-the-new-Bing-runs-on-OpenAI’s-GPT-4

OpenAI сами перечислили всех здесь:
https://openai.com/product/gpt-4

Развернуть 1 комментарий

Игорь Кулаков 14 марта 2023

@vbK4AZ6afybE7y9C, все крупняки уже несколько месяцев играются с GPT-4. А публике дали доступ только сейчас (

Развернуть 1 комментарий

Никита Шультайс 14 марта 2023

@vbK4AZ6afybE7y9C, ага, у нас один ученик использует ChatGPT как помощника в обучении, задаёт ему всякие вопросы, он ему даёт советы. И мне нагрузка меньше и ученику ждать не надо.

А недавно попробовали решить одну задачку на Python из нашего курса. И ChatGPT справился. Не идеально, но для джуна вполне ок.

Развернуть 1 комментарий

💀 Юзер Удалился 14 марта 2023

@shultais, я тоже в январе в период экзаменов проводила ночи напролет с чатгпт, если khan academy еще и потюнили под себя, должно быть очень удобно учиться

Развернуть 1 комментарий

Юрий Кашницкий 14 марта 2023

@vbK4AZ6afybE7y9C, https://blog.duolingo.com/duolingo-max/ Duolingo работал с OpenAI над моей идеей :) разговорный ассистент, пока Eng, Esp и Fr.

Развернуть 1 комментарий

Oskar Sharipov 15 марта 2023 автор

@vbK4AZ6afybE7y9C, Наткнулся на это:

Explore how our diverse network of customers is using our technology to advance their goals

https://openai.com/customer-stories

Развернуть 1 комментарий

Igor Mosyagin Data Developer 14 марта 2023

Очень доволен тем что даёт 3.5-turbo (у меня бот на нём наводит движ в чате с моими друзьями-долбоёбами), и не знаю получу ли такой же кайф от gpt-4 :D поэтому конечно жду с нетерпением. Хоть и файнтюнить нельзя, но может это надо просто разметить что-нибудь и поковырять ada

Жалко что конечно оно нифига получается не openai, но так весело что пофиг

картинка отсюда https://t.me/mishin_learning/1644

жду когда дораскатят на меня, вся надежда была что раз у меня плюс то будет сразу но видимо всё равно надо подождать))

Развернуть 1 комментарий

Gleb Kudriavtcev 15 марта 2023

@shrimpsizemoose, ничего, скоро она себя реверс-инженерит. Ну и внутри очевидно, будут улучшать модель с помощью самой модели (этот самое очевидное, что тут сразу приходит в голову). И вот тут пиздец. Предсказать исход уже никто не сможет, начнем нестись к сингулярности.

Развернуть 1 комментарий

Igor Mosyagin 15 марта 2023

@glebkudr, конечно активно жду, но пока все с кем я говорил на эту тему из области говорят что это конечно тупиковый путь и "сингулярность если будет то в другой ветке развития, не в LLM". Что конечно не отменяет того факта что и тут весело

Развернуть 1 комментарий

Ruslan Lagashkin Doctoral Researcher 14 марта 2023

должно уметь объяснять мемы

Ну вот и все, в скором времени нам пи**ец.

Развернуть 1 комментарий

💀 Юзер Удалился 15 марта 2023

@RuslanL, @MrSparkline, берегись

Развернуть 1 комментарий

💀 Юзер Удалился 20 марта 2023

@RuslanL, кажется да https://arxiv.org/pdf/2303.10130.pdf
Our findings indicate that approximately 80% of the U.S. workforce could have at least 10% of their work tasks affected by the introduction of GPTs, while around 19% of workers may see at least 50% of their tasks impacted. The influence spans all wage levels, with higher-income jobs potentially facing greater exposure.

... the importance of science and critical thinking skills are strongly negatively associated with exposure, suggesting that occupations requiring these skills are less likely to be impacted by current language models. Conversely, programming and writing skills show a strong positive association with exposure, implying that occupations involving these skills are more susceptible to being influenced by language models.

Развернуть 1 комментарий

Владимир Пыженков DevOps 14 марта 2023

Имею подписку плюс , ограничения 100 сообщений в 4 часа.

а от такого вообще стрёмно

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Mikhail Bushmelev SWE, FinTech 15 марта 2023

https://pbs.twimg.com/media/FrMrxNmaQAEPLJB?format=jpg&name=large

chatGPT4 не может решить капчу. но может убедить человека решить за нее.

Развернуть 1 комментарий

Gleb Kudriavtcev CPO 15 марта 2023

Мне страшно. Гребаная сингулярность.
Надеялся застать ее попозже.

Развернуть 1 комментарий

Миша Безверхий 16 марта 2023

@glebkudr, ну к 2030 прогнозировали ведь, думаешь, что такими темпами раньше придём?

Развернуть 1 комментарий

Gleb Kudriavtcev 16 марта 2023

@mixbez, как только AI припрягут усовершенствовать саму себя, то считай мы уже перешли за горизонт событий.
И я уверен, где-то внутри OpenAI именно этим направлением занята уже не одна команда. Слишком уж очевидное направление мысли.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Gleb Kudriavtcev 17 марта 2023

@barborygmus, так ему не нужен открытый контур. Опасность не в том, что оно захватит человечество а то, что человечество сознательно использует это в качестве оружия.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Alexander Golub 18 марта 2023

@barborygmus, команд которые разрабатываю такие нейронки довольно много и кто-то да точно ошибется

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Leonid Khomenko 20 марта 2023

@barborygmus,
С этим много проблем есть

у AGI довольно неплохие шансы выбраться, есть куча разных сценариев от взлома до уговоров
польза от AGI в заточении пропорциональная твоему уровню паранойи. Сможешь ли ты использовать сложные технологии, которые он тебе даёт, не понимая как они работают? Если ты боишься его, то определенно нет
власть портит людей, плюс организации обычно страдают от внутренних конфликтов и системных проблем. Так что не стоит надеяться что в этот раз наличие таких возможностей у одной организации приведет к чему-то хорошему

Развернуть 1 комментарий

Gleb Reys 15 мая 2023

@leeaao, как сказал товарищ Nick Bostrom в своей давней книжке Superintelligence:

Чтобы выбраться на свободу, AGI нужно соблазнить, подкупить или запугать всего одного человека из нескольких миллиардов.

Понятное дело, что из нескольких миллиардов человек с доступом к интернету далеко не все даже знают про всякие ChatGPT...

Но даже если будет всего это один человек из 100M+ активных пользователей ChatGPT (а сколько ещё сейчас подобных систем появляется от конкурентов?), то всё равно уберечь каждого от подобных рисков - задача не из лёгких.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Евгений Морозов главный по приколам 15 марта 2023

Продолжаю свои эксперименты по билдингу персонажей для D&D5e в всё новых версиях ChatGPT, пока что она косячит больше чем пользы приносит

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Ruslan Lagashkin Doctoral Researcher 15 марта 2023

Если серьезно, то "четвертая версия" очень похожа на попытку OpenAI предоставить более "безопасный" для коммерческого использования продукт (штобы скандалов не было). Нейминг же - в основном - маркетинговое позиционирование: уже доступные для публичной оценки изменения, на мой взгляд, являются скорее постепенным эволюционным развитием, нежели серьёзным прорывом.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?

Войти или Вступить в Клуб