А вы пробовали вынуть ИИ из розетки? Реакция на реакции на открытое письмо

Публичный пост

17 апреля 2023 9442

Nadya Petrova

Три месяца я тусуюсь в Оксфорде среди AI safety ресёрчеров и работаю над тем, чтобы результаты в этой области появлялись ещё быстрее. Я сапдейтилась про риски от AI полтора года назад и хочу рассказать, как мной ощущаются последние три недели, когда весь интернет заговорил про (не)безопасность ИИ.

Что случилось: открытое письмо с призывом к AI лабораториям приостановить разработки моделей сильнее GPT-4, которое подписали Маск, Возняк, Харари и ещё 25000 людей (FWIW, включая меня).

Я хочу пройтись по списку распространённых реакций, которые я наблюдаю, и сказать что-то про каждую из них. Если что, ⚡️ — это реакции, которые я слышу, а 🐱 — мои ответы на них.

⚡️ Создателей письма не волнует никакая безопасность, реальный мотив совершенно корыстный — желание Маска и других компаний сократить разрыв в гонке с OpenAI (лидерами рынка и создателями GPT-4).

🐱 Я знаю, кто готовил это письмо, а неделю назад была в гостях у одного из фаундеров Future of Life Institute. Это вообще не те люди, которые участвуют в гонке и финансово мотивированы догнать OpenAI. Это люди, которые много лет работают над тем, как сделать сильный ИИ хотя бы базово безопасным. И очень переживают, что у нас не очень много шансов успеть решить эту задачу до его появления.

Мотивы же Маска неисповедимы, но вообще неважны в этом разговоре. Вопрос AI рисков объективен и никак от них не зависит. Единственное, почему мы о них говорим — это так называемая “сила сигнала”. Появление письма — сигнал, на основе которого люди апдейтятся на тему опасности ИИ. Типа, письмо вообще означает, что умные люди обеспокоены и нужно обновлять своё мнение, или оно вообще по другим причинам появилось? Финансовую мотивацию тут очень легко увидеть. Поэтому мне хочется обратить ваше внимание: его создавали люди, которые много лет занимаются безопасностью ИИ, и его подписало — помимо Маска и потенциальных конкурентов OpenAI — огромное количество уважаемых людей типа AI профессоров лучших университетов мира. Первые тысячи — те, кто про это думал раньше и был всерьёз обеспокоен.

⚡️ Под письмом нет ни одной подписи людей из OpenAI. Если бы люди, которые подписывают письмо, сами бы сделали конкурентоспособный продукт, они бы ничего не подписывали, а загребали бы прибыль!

🐱 Если выбирать, что должно вызывать больше доверия по умолчанию, то уж наверное это мнения финансово не мотивированных людей. Под письмом огромное число подписей от ресёрчеров из академии, которые никогда не планировали делать конкурентоспособный продукт. Очевидно, у лидеров рынка есть очень сильный финансовый инсентив не тормозить в гонке, тогда как у большого количества подписавших никакого подобного инсентива нет.

⚡️ Ну хорошо, хорошо, кто-то обеспокоен. Но куча других AI экспертов считает, что всё ок! Само по себе то, что какие-то эксперты что-то считают, ничего не означает.

🐱 Ето так. Точнее, эксперты более-менее сходятся в том, что AGI (Artificial General Intelligence) возможен. И все согласны, что не решена задача AI alignment — то есть как ставить AI задачи и ограничения, чтобы система делала то, что мы хотим, а всякую дичь не делала. Отличаются мнения про то, когда AGI появится и что по этому поводу нужно делать.

Есть три преобладающих взгляда:

🟢 Мы стремительно приближаемся к созданию AGI, осталось 3-30 лет (на Метакулусе, одном из популярных рынков предсказаний, медиана 2026 год, а 75 перцентиль — 2030). Если не решить задачу алайнмента, человечество с высокой вероятностью (средняя оценка AI safety ресёрчеров — 30%) может исчезнуть или попасть в антиутопию — это называется экзистенциальные риски, или X-риски. Нужно как можно больше успеть подумать про алайнмент до того, как мы попадём в точку невозврата, чтобы максимизировать наши шансы на выживание. Для этого полезно притормозить, чтобы оттянуть появление AGI, и привлечь в решение алайнмента больше ресурсов.

🟣 Согласны с предыдущей группой про сроки и масштаб опасности, но считают, что решать алайнмент можно только когда мы уже создадим AGI или ну-вот-почти-AGI. Ведь сейчас мы не знаем, как будет выглядеть эта система, и поэтому много исследований носят теоретический характер.

В этой группе находится Сэм Альтман — CEO OpenAI. Он также считает, что чем раньше появится AGI, тем выше вероятность так называемого slow takeoff сценария. Что это такое? Это сценарий появления AGI, который не fast takeoff :) А fast takeoff — это когда между появлением AGI уровня человека до становления его сверхумной системой, которая лучше всех людей во всём, проходит, условно, меньше суток. В этой ситуации AI почти мгновенно может получить контроль над миром, сделав за первые часы необходимые самоулучшения и саморепликации... Соответственно, slow takeoff сценарий выглядит безопаснее и контролируемее, а у нас уже будет, что конкретно исследовать.

🔵 А эти ребята считают, что AGI появится очень нескоро (упрёмся в ограничения по количеству данных или по количеству compute, не придумаем новых архитектур и т.д.) и/или что X-риски пренебрежимо малы и системы будут aligned по умолчанию. Если про таймлайны появления AGI я готова слушать аргументы и поэтому ставлю не 90% на ближайшие 20 лет, а скорее 70%, то про отсутствие X-рисков я их готова слушать — и не слышу :) Кажется, люди с этими убеждениями просто пренебрегают вопросом, а не посидели-подумали и аргументированно решили, что X-рисков нет. Люди с длинными таймлайнами, по крайней мере в моей выборке, тоже чаще всего забыли сапдейтиться, а не имеют устойчивую позицию.

Я нахожусь в группе 1. Подавляющее большинство AI safety ресёрчеров находятся в группе 1 и не согласны с подходом OpenAI (который как раз выглядит подозрительно удобным для лидера рынка, если уж возвращаться к мета-аргументам). Слишком много маловероятных допущений для слишком высоких рисков.

⚡️ Проблемы с AI — это проблемы того, как люди пользуются AI. Надо регулировать не разработку мощных моделей, а поведение людей.

🐱 Часть рисков, действительно, связана с тем, как пользоваться AI.

Например, это рост возможностей у стрёмных агентов. Если нейронка умнее людей — то есть лучше добивается поставленных целей, чем люди — то она и в стрёмных задачах даст им большое преимущество. Ещё более убедительная пропаганда, ловкие скам схемы, неочевидные способы причинения страданий и т.д.

Или агенты не стрёмные, но не продумали всех социальных последствий: переавтоматизация и потеря рабочих мест, кризис доверия из-за того, что фотографии/видео вообще перестали быть свидетельством изображённых событий, невозможность проверить авторство и понять, с ботом ли ты общаешься…

Но даже при том, насколько эти риски неприятные, уничтожение человечества или попадание в антиутопию, на мой взгляд, неприятнее. И это произойдёт скорее всего не потому, что злобный психопат попросит нейронку всех убить и она его послушает, а потому, что люди попросят нейронку сделать что-то хорошее, но её функция полезности не будет включать в себя пару важных нюансов… Вероятность, что AGI уничтожит человечество, сейчас оценивается экспертами от 2% до >90%. И ребят, даже 2% — это на минуточку сомнительная радость, если речь про риск вымирания всего человечества.

⚡️ Предложение остановить прогресс не может работать. Даже если часть лабораторий прислушаются к этому, то как раз менее этичные продолжат работу и сократят отрыв за это время. В итоге мы просто подарим Китаю и другим опасным агентам время.

🐱 Друзья, письмо не предлагает вводить запрет на AI разработки — это действительно было бы малореализуемо. И даже не предлагает запрещать делать большие модели. Оно предлагает запретить тренировку моделей мощнее, чем GPT-4. У Китая нет моделей такого уровня и за 6 месяцев не появится, у них нет на это ресурсов (в первую очередь GPU). Письмо не предлагает запретить лабораториям через полгода иметь более продвинутые модели, чем они имеют сейчас, пусть разрабатывают на здоровье, покуда это не что-то слишком мощное (как GPT-4).

Предложение остановить прогресс в смысле “мы в мире договорились, что не тренируем модели мощнее GPT-4 и это контролируется” — может быть реализовано. Нет никакого правила свыше, почему координация этого уровня невозможна. Ядерные испытания, например, уже 20+ лет никто кроме КНДР не проводит. А сильный AI намного опаснее для всех, чем появление ядерного оружия у любой ещё одной страны.

⚡️ Но глупо надеяться, что кто-то сейчас имплементирует это решение и будет вводить запреты?

🐱 Ну, да) Зато мы сделали запрос на решение проблемы заметным. О ней услышали и начали говорить. Подвижки начнутся, в правительствах станет больше AI policy людей, думающих про риски, область получит больше ресурсов. Письмо не преследовало цель продавить конкретное решение. Основная цель — чтобы у вопроса появилась видимость — достигнута. За год в AI safety я прошла путь от маргинала в глазах знакомых до того, что всем ужасно интересно про это поговорить. В целом, не так-то и важно осмыслять сейчас конкретное предложенное решение — важно, чтобы про существование проблемы стали думать на всех уровнях.

⚡️ Хмм, по ходу что-то важное, раз столько разумных людей беспокоится. Хочу узнать больше!

🐱 Уиии!

Я не стала писать свой интродакшн в AI safety или распространённые аргументы, помогающие развить интуицию, почему X-риски вероятны и нельзя будет просто выключить систему из розетки. Мне кажется, хорошие интро материалы уже есть!

После письма появилось как минимум две большие обзорные и задорные статьи на русском для неподготовленной публики — покороче и подлиннее.

На английском есть классные короткие видосы Роберта Майлза, например:
🟢 Intro to AI Safety (оч рекомендую)
🟢 10 Reasons to Ignore AI Safety
🟢 Why Would AI Want to do Bad Things?

А для тех, кто хочет закопаться глубже, есть подборка материалов от 80,000 Hours и бесплатный Кэмбриджевский курс статей AGI Safety Fundamentals, который считается одной из лучших точек входа в область.

Это был перепост из моего блога.

Связанные посты

Кто побеждает в борьбе за технологии и что изменилось в AI с приходом опенсорса

Вопрос: Расскажите, как используете Generative AI в работе и не только

AI Alignment — Как быстро въехать в свежий движ по самой интересной теме нашего времени

216 комментариев 👇

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Gleb Markin Project/Product Manager 20 апреля 2023

Ничё не понял но доложил куда следует

Развернуть 1 комментарий

Александр Гершевич DevOps 17 апреля 2023

Мало фактологии, много мифических страхов.
Я согласен в целом с топикастером, касательно некоего беспокойства вокруг Ии, я его разделяю, но мне совсем не нравится отсутствие какой-то объективной информации по пунктам, а не только "он захватит мир просто потому что".
Ты пишешь о рисках, но не говоришь каких. Риск "ну он будет хитрее!" не риск, а страх.

Развернуть 1 комментарий

Leonid Khomenko 20 апреля 2023

@momai, у Нади в конце статьи есть ссылка на видео ответом на этот вопрос.

Там довольно быстро по порядку изложены базовые идеи.

Развернуть 1 комментарий

Александр Гершевич 20 апреля 2023

@leeaao, на самом деле, там так же как и в статье описаны некие страхи, как постулаты и натягиваются на реальность. А именно:

поиск идеально оптимального решения поставленной задачи включает риск. "Сделает скрепки из всего мира"
мы его не можем выключить, он очень хитрый

Любое решение, в любой области, включает риски. С тем же успехом я могу рассказывать, что надо лечь и не двигаться, иначе есть риск навредить.
Да с чего вы вообще взяли что его нельзя выключить? Ну есть такой страх, ещё фантасты описывали.

По сути оба пункта напрямую говорят не о рисках, а о страхе "оно хитрее!" Основанное ни на чём. У меня нож режет оптимальнее чем палец, но что-то я не слышу криков с требованиями остановить производство ножей, ведь мы не можем просчитать все риски его использования.

Развернуть 1 комментарий

Leonid Khomenko 20 апреля 2023

@momai, ну а чем можно обосновать такой риск, если у нас не было раньше релевантного опыта?

Люди логически разложили, почему это может быть опасно, дали примеры которые они считают похожими и свои оценки вероятности опасности. Этого не достаточно?

Развернуть 1 комментарий

Nadya Petrova 20 апреля 2023 автор

@momai, Но моя статья совсем не ставила цели дать объективную информацию по пунктам :) Как я написала в конце поста, этих материалов имхо уже достаточно существует. Мне лично хотелось прокомментировать реакции на письмо и написать мета-аргументы (и да, они по определению более рукомахательны).
То, что статья привлекла внимание, не обязывает её быть исчерпывающим источником по теме) Хочется объективной хардкорной инфы — стоит почитать AGI Safety Fundamentals, рили

Развернуть 1 комментарий

Nikolay Yankovsky Product Lead 18 апреля 2023

@nadyapetrova сорри, что веду себя как проджект менеджер, но что за три месяца удалось сделать / понять?

Развернуть 1 комментарий

Sergei Tikhomirov Protocol Research Engineer 17 апреля 2023

Прочитал заголовок и ждал ответ на вопрос, почему же нельзя вынуть ИИ из розетки... Так если в двух словах, почему?

Развернуть 1 комментарий

Nadya Petrova 17 апреля 2023 автор

@SergeiTikhomirov, это называется shutdown problem, и в двух словах проблема в том, что если тебя выключат, ты не достигнешь своей цели. А ИИ — это штука, которая просто хочет достигать своей цели. Очень умный ИИ — штука, которая умеет очень круто достигать своих целей, и она способна предвидеть такой простой сценарий провала, что его захотят выключить. И догадается сделать что-то, чтобы человек не смог или не захотел его выключать. Здесь варианты от хитростей и манипуляций, чтобы люди долго не знали, что ты делаешь жесть, до угроз и физических ограничений, до саморепликаций и многих других способов решить эту проблему, которые нам даже не приходят в голову, потому что мы не такие умные.

Развернуть 1 комментарий

Sergei Tikhomirov 17 апреля 2023

@nadyapetrova, сорри, если я задаю вопросы, на который много раз отвечено в 101-материалах, но всё же: разве ИИ это в конечном итоге не груда кремния в дата-центрах? Сам по себе миллиард видеокарт не может же погубить человечество. То есть предполагается, что люди дадут ИИ контроль над критически важными физическими ресурсами без human in the loop?

Или ответ - что human in the loop будет, но ИИ им проманипулирует? Для манипуляций нужно какое-никакое пространство для самовыражения; условно, текст в свободной форме, а не CLI с чётко заданной формой ответа. Зачем давать ИИ возможность "свободно" самовыражаться, если в этом есть опасность?

Развернуть 1 комментарий

Egor Suvorov 17 апреля 2023

@SergeiTikhomirov, как я понимаю, беспилотным автомобилям уже давно дают. Или банилкам в условных Cloudfare/Google/банках/кто-там-ещё.

Развернуть 1 комментарий

Sergei Tikhomirov 17 апреля 2023

@yeputons, fair point. Но всё равно, не совсем очевиден шаг от "ИИ рулит теслами, и они иногда залетают под грузовики" до "все теслы мира по команде злого ИИ автономно паркуются под мостами-телеграфами-телефонами и взрывают свои батареи".

Развернуть 1 комментарий

Женя 17 апреля 2023

@SergeiTikhomirov, первое что приходит на ум - социальная инженерия, приводящая к неконтролируемым последствиям.

В моей любимой серии Черного Зеркала онлайн шантажист использует компромат на людей и заставляет их сотрудничать с целью ограбления банка. При этом самого его ни разу не показывают, он дает команды исключительно по почте и смс. Вот начал писать коммент и сообразил что эфемерность может быть частью сюжета и намеком на то, что он может быть AI, который таким образом эксплуатирует уязвимость мясного пространства

Не знаю правда или нет, но пропагандистские материалы утверждали что вирус Stuxnet, который поразил иранские центрифуги был пронесен на флэшке и воткнут в систему, которая не была подключена к интернету. Возможно сотрудником, о котором БИГДАТА узнала что он гей, курит траву и читает Салмана Рудши. Нейросеть готова была отфайнтюнить эти данные обратно, если бы он только согласился выполнить несложное задание..

Развернуть 1 комментарий

Борис Филиппов 17 апреля 2023

@SergeiTikhomirov, Да - хочется аргументированного ответа почему вообще сверхинтеллект может предполагать власть. Смотря на то как у людей организована власть, скорее убеждаешься в обратном - и непонятно откуда у сверхинтеллекта появятся ресурсы кем-то управлять.

Развернуть 1 комментарий

Egor Suvorov 17 апреля 2023

@zalivka, но для этого всё ещё нужно, чтобы у ИИ был какой-нибудь доступ. Например, банить Google-аккаунты И отвечать в поддержку. Даже уметь разбанивать необязательно, достаточно уметь хоть как-то запоминать информацию из чатов с пользователями.

Развернуть 1 комментарий

Nika Tamaio Flores 18 апреля 2023

@nadyapetrova, вопрос: сейчас цели ИИ задаёт человек, откуда у него появятся свои цели?
Наше понимание про сильный ИИ – это концепт. И в этом концепте у ИИ есть условно свободная воля. Которая не ясно откуда берётся. Просто от увеличения кол-ва параметров? И мы тогда сможем прийти к выводу, что люди разумны только потому что у них большой мозг и там много нейронов? Но у слонов и китов больше мозг, это их делает разумнее? Вот тут я немного теряюсь.

Вижу больше проблему в том, что мы не знаем, что такое сознание и мышление, а ещё в антропоцентризме – мы всё меряем по людям. То есть ИИ должен превзойти человека – а как это померять? Если языковая модель быстрее и граммотнее пишет текст – это делает её превосходящей человека? Ну сомнительно, ведь человек одним и тем же мозгом может кучу всего делать, а модель только с текстами работать (ну ок, мультимодальная может ещё с картинками).

Один из основных страхов – что этот интеллект (хотя это даже слово неправильное, ведь intelligence – это не интеллект) будет совсем иным и мы проморгаем момент, когда он станет осознанным или ещё каким-то, что нам стоило бы его считать субъектом. И вот их этих критериев субъектности я нигде не видела, если вы знаете – покажите пейпер.

Конечно я должна тут ещё вспомнить про противников фотографии, компьютеров, телефонов, интернета и прочих достижений технической мысли, вы можете увидеть примеры их волнения здесь.

Развернуть 1 комментарий

Никита Шультайс 18 апреля 2023

@Sazerland,

Ну сомнительно, ведь человек одним и тем же мозгом может кучу всего делать, а модель только с текстами работать (ну ок, мультимодальная может ещё с картинками).

Сразу возникает мысль: "А давайте дадим ИИ доступ к механизированной фабрике. Посмотрим сможет ли он научиться ей управлять и накрафтить терминатора".

Только вот зачем ему это?

Развернуть 1 комментарий

Nika Tamaio Flores 18 апреля 2023

@shultais, у меня больше не вопрос зачем, а как ИИ будет ей управлять х)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nika Tamaio Flores 18 апреля 2023

@alexadamenko, если найдёшь такие исследования – присылай :)

То есть достаточно много параметров должны нас привести к свободной воле и целеполаганию, да? х)

Мне очень понравилось определение LLM – stochastic parrot. Модель не умна, она умеет хорошо собирать слова, а мы путаем ум с этим.

Наш мозг – безусловно продукт эволюции, который отстаёт от уклада жизни. Мы всё ещё хотим сладенького и быть принятыми группой, хотя сладенькое доступно практически всем в любых количествах, а от непринятия мы не умрём в муках голода и холода. Рекомендательные системы эксплуатируют слабости человека для того, чтоб их владельцы зарабатывали больше денег имхо (я да, делала такие системы в прошлом, понимаю, как это работает). Для написания текста уметь выбирать порядок слов, знать грамматику и подражать людям, которые писали тексты хорошо. На этом всё.

Ну а эффективным инструмент делают люди, которые его используют. Хороший фотограф сделает топовые фото и на старую мыльницу, а неумелый и на топовую камеру не снимет шедевр.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nika Tamaio Flores 18 апреля 2023

@alexadamenko, в этом и прикол, что мы не знаем, откуда у нас эта свободная воля, искусство и прочее. Так что я не могу сказать, что нас усложнение системы к этому привело, потому что условных слонов не привело.

Чтоб ИИ сделал хорошее фото, ему надо дать детальный запрос. И чем он глубже, тем лучше результат. И конечно, можно скормить три слова чат жпт для написания запроса, но это лотерея. Даже эти проклятые видео "название франшизы" + Баленсиага сделаны людьми по инструкции. Я не знаю, будет ли ИИ эффективнее во всём и только ли в эффективности дело. Пока что RL эксперименты показывают нам, что ИИ не может найти более эффективный способ перемещения, потому что у него нет здравого смысла, у него нет контекста и понимания физики и мы пока всё это не можем в модель вложить. Будет интересно посмотреть на ту модель, в которую сможем. Но задизайнить такой эксперимент – это задачка с тысячей звёздочек.

Вот да, я же об антропоцентризме и непонимании нами самими ключевых концептов и говорю. Тут мы на одной странице :)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nika Tamaio Flores 18 апреля 2023

@alexadamenko, модель научается повторять и копировать сама, это да. И она может открыть нам то, что существовало, но мы не знали или ещё не открыли типа того, как сворачивается тот или иной белок. А вот может ли она сделать что-то правда новое, совсем новое – я не знаю, но и большинство людей этого не могут к слову.

Объяснить мем или решить задачу – я не уверена, насколько это показатель того, что мы ищем в моделях чтоб назвать их сильными. Я знаю людей, которые могут решить задачу в книге, но не могут провести аналогии в жизни с этими задачами – куда нам отнести таких (если надо их куда-то отосить)?

У людей всё ещё есть понятные механизмы самоконтроля, воли и других вещей. Хочешь ли ты отказаться от того, чего ты хочешь больше всего, ради того, что ты хочешь прямо сейчас? Многие люди не могут отказаться, даже есть этот эксперимент про маршмеллоу (не знаю, насколько это показатель правда). Потому что для многих лучше 100 баксов сейчас, чем 110 через неделю.

А о культуре – насколько я помню, нужны артефакты и погребальные ритуалы. У слонов такого нет.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nika Tamaio Flores 18 апреля 2023

@alexadamenko, на всякий случай стоит проверить ответы чата жпт, мало ли, вдруг он что-то выдумал х)

Про соц сети и технологии – такова природа людей. Даже про революци говорят же, що задумывают романтики, осуществляют фанатики, ну и знаете, кто пользуется. Так же и про войну – кому-то она выгодна, как бы это мерзко не звучало. Так же и технологии используют чтоб вытягивать деньги из слабых духом самыми разными способами от рекламы по ТВ до рекомендаций в соц. сетях. Не все бизнесы имеют великую миссию, не все люди честные – се бля ви, как говорится.

Словом, я вижу намного большую опасность в том, что люди с недобрыми и/или корысными намерениями используют ИИ чтоб навредить человечеству, а не в том, что мы создадим некий сверхразум, который сам решит уничтожить наш вид.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nika Tamaio Flores 18 апреля 2023

@alexadamenko, тут уже наша дискуссия вылазит совсем далеко за рамки поста, как мне кажется.

И я не предлагаю отдать всю власть условным злым или пустить по течению. Как говорится, по течению плывёт мёртвая рыба, а живая плывёт туда, куда ей нужно.

Но я пессимист, и не очень верю в общие усилия. Насколько мне известно, единственное общее усилие, которое увенчалось успехом – это уменьшение озоновых дыр после подписания Монреальского протокола (возможно, весь его успех в том, что аналогичные химические вещества, которые не вредят природе, в производстве стоят недорого). А так всё. Безусловно, сейчас лучшее из времён, Стивен Пинкер популярно объясняет, почему это так. Но возможно этого просто недостаточно для того, чтоб человечество ждало светлое будущее. В том числе и в контексте обуздания прогресса.

Я однозначно верю в то, что моря наполняются по каплям и что каждый человек важен. И я лично активно управляю своей жизнью, своим вниманием и выбором. Но так делают далеко не все. И вот тут вот как раз есть нюанс.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Egor Suvorov 18 апреля 2023

@Sazerland,

сейчас цели ИИ задаёт человек, откуда у него появятся свои цели?

Своих не появится, но самым эффективным способом достичь поставленные цели может оказаться что-нибудь, мягко скажем, неожиданное. Если правильно помню, это ещё лет пять назад происходило: просим агента в виртуальном мире максимально быстро добраться до точки A — а он вместо того чтобы учиться ходить переворачивается на спину и очень быстро дрыгает ногами. Или находит баг в физическом движке и эксплуатирует его (как спидранеры могут находить баги в играх и ускорять прохождение при помощи прохода через стены). И это всё — сюрприз для авторов агента и окружения.

Соответственно, в реальном мире тоже полностью ожидаемы подобные эффекты.

Другой классический пример из США: тренируем нейросеть предсказывать приговор (обвинительный/оправдательный). Специально вычищаем из данных расу. А потом оказывается, что нейросеть при вынесении приговора внимательнее всего смотрит на почтовый индекс, из которого можно довольно точно определить район, а дальше можно довольно точно установить районы с определёнными пропорциями населения. То есть вроде и попытались из данных убрать то, что на ориентируются люди, но вообще-то ориентироваться не надо, а не получилось.

Вот тут у Вастрика подробнее было: https://vas3k.blog/blog/ai_alignment/#problema-postanovki-tsele

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nika Tamaio Flores 19 апреля 2023

@alexadamenko, пусть будет бог ИИ, я не против

Развернуть 1 комментарий

Nika Tamaio Flores 19 апреля 2023

@yeputons, я писала про RL выше. Не стоит путать RL эксперименты, для которых надо очень тщательно определить все параметры окружающей среды, с этической стороной подготовки данных – это вещи разного порядка.
RL в чистом виде в жизни не используется, только в рисерче, в комп играх и других вещах, где мир полностью описан и все ограничения установлены. Вопрос работы с датасетами же намного шире и острее имхо.
Так что да, я вижу намного большую проблему не в целях, которые вдруг возникнут у ИИ, а в том, что доступ к нему будет у людей, цели которых не ясны или которые не могут с нужной точностью создать промпт.

Развернуть 1 комментарий

Egor Suvorov 19 апреля 2023

@Sazerland, а кто-то умеет сейчас с нужной точностью промпты создавать? Мне казалось, даже у OpenAI и Microsoft проблемы с тем, чтобы чат-бот хотя бы про себя секретную информацию не выдавал.

Развернуть 1 комментарий

Nika Tamaio Flores 19 апреля 2023

@yeputons, одно дело – пытаться всеми способами наебать чатбот, а другое дело получать от него вменяемые ответы на вменяемые вопросы, кмк. У меня получается после пары итераций получить то, что я хочу, но планирую почитать статьи по промпт инжинирингу чтоб улучшить рузельтаты :)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Константин Бузановский 20 апреля 2023

@SergeiTikhomirov, чисто теоретически, если злобный скайнет (или АМ, если кому-то нравится творчество Харлана Эллисона) додумается копировать и распространить себя, то отключение такой бяки будет слишком дорогостоящим мероприятием, аналогичным укладыванию интернета в кому. Ну тут вопросы к GCP и AWS, чтобы лишний доступ не выдали.

Развернуть 1 комментарий

Захар Кириллов yet another manager 19 апреля 2023

Я полностью убеждён, что дальнейшее развитие A(G)I приведёт к откату современного человечества на 100-1000 лет назад.

В лучшем случае мы окажемся на заре индустриализации в стимпанке (когда электричество и связь есть, но превалируют паровые машины и нации относительно изолированы друг от друга), в худшем — в средневековье с золотыми монетами и натуральным хозяйством.

Причём виновником всего будет не столько AGI, сколько сами люди. И алайниться тут бессмысленно: проблема в том, что концепт "алайнмента" был рассчитан на постепенный прогресс, так чтобы вместе с "умнением" машин успели вырасти 1-2 поколения людей. Но мы скорее всего уже прошли точку невозврата и у нас нет запаса времени на 1-2 поколения. В лучшем случае есть лет 10, а это критически мало для задач алайнмента.

Ну типа как для сегодняшних 40+ летних детство прошло без компов и вся цифровизация оглушила нас уже в сознательном возрасте, в отличие от сегодняшних 20-30 летних, которые являются digital natives — они с пелёнок росли в окружении информационных технологий и потом естественным путём "заалайнены".

Так же должно было бы быть в идеале с A(G)I: он разрабатывается себе сегодняшними людьми так, чтобы их дети (а потом и внуки) росли бы в окружении постепенно прогрессирующего технологического сознания. В итоге лет через 50 (к 2070-году, по изначальным прогнозам утурологов) будущие "элиты" (предприниматели, учёные, видные общественные деятели, представители культуры-спорта-искусства, олигархи, члены правительства, топ-менеджеры и т.п.) воспринимали бы AGI как само-собой разумеещеся, а сами технологии искусственного сверхинтеллекта были бы встроены в образование, общественные институты и прошли через все все этапы апробации и адаптации, обрасли бы такими же интеллигентными-автоматическими механизммами регуляции и реакции.

Но на всё это нет времени: условно говоря, у нас будут обезьяны (мы все сегодняшние, кто ещё не скатится в старческий маразм в течение слудующих 10-15 лет) с гранатами.

Вот конкретные нерешаемые никаким алайнментом проблемы с моей точки зрения, которые приведут к упадку нынешней цивилизации.

Подрыв доверия. Уже сейчас новостные каналы не в состоянии отличить фото-дипфейки от реальных фото. Дальше будет хуже: дипфейк-видео, поддельные голоса, фейк-стриминг откроют новые горизонты для мошенников всех мастей, в то же время усложнят работу правоохранительных органов, судебной системы. Невозможно будет отличить правду ото лжи нигде и ни в чём. Как результат — массовые народные волнения или мировые войны "все со всеми", потому что какой-то лидер поведётся на провокацию.
Крах финансовой системы. Опять же сейчас только ленивый не думает, как использовать даже нынешние примитивные возможности кодогенерации, чтобы создать себе или своему бизнесу конкурентное преимущество. По мере развития A(G)I злоумышленники и законопослушные граждане будут использовать все возможности для эксплойта финансовой системы, такие как высокочастотный трейдинг и биржевые спекуляции, валютный арбитраж, взлом любых систем с ценностью (капча больше не защитит), shadow jobs (работа на нескольких работах) или же наоборот — рост безработицы в отдельных сферах вынудит государства взять на себя содержание слишком большого числа людей, что чревато инфляцией, недостатком ресурсов и т.п. И снова народные волнения и коллапс цивилизации.
Революция луддитов. Богатые и имеющие доступ к технологиям будут при помощи A(G)I становится ещё более богатыми, а бедные — ещё более бедными. Неравенство усугубится до своего экстремума: если сейчас что-то вроде 10% населения контролирует 90% богатства и всех ресурсов, то из-за внедрения A(G)I, доступ к которому будут у богатых, произойдёт перераспределение богатства внутри этих 10% так, что через 10 лет лишь 1% населения будут контролировать 99% богатства и ресурсов. Это закончится тем, что среди 99% "бедняков" возникнет движение луддитов, которые возьмут вилы и прочие низкотехнологичные средства, с их помощью захватят военные базы (которые не подключены к интернету) и устроят апокалипсис, запустив ядерные ракеты по "Центрам принятия решений" и местам обитания этого "золотого 1%" — уничтожая машины/технологии вместе с людьми, владеющими/оперирующими ими. Побочный эффект — потеря знаний как управлять и создавать технологии ну и откат в ядерную зиму.

Можно продолжать фантазировать, но все другие пункты что у меня на уме уже чуть более техноцентричные. Думаю, достаточно этих трёх факторов или комбинации из них.

Развернуть 1 комментарий

Алексей Трудов 19 апреля 2023

@zahhar, каждую из трех проблем можно развернуть в прекрасный фантастический роман. Но в комментарии нет веских свидельств, почему это произойдет в реальности.

Как говорит мой партнер, вероятность != риск.

Развернуть 1 комментарий

Захар Кириллов 19 апреля 2023

@AlekseiTrudov, поясни что значит "вероятность != риск"?

Определение риска сводится к ненулевой вероятности наступления обстоятельств или событий, имеющих неблагоприятные последствия для как минимум одного аспектов жизненного цикла некой важной сущности.

Если ты признаёшь названные мною проблемы — рисками, то дальше можно дискутировать о том, есть ли у нас данные для оценки этих рисков.

Однако, в риск-менеджменте есть unknown unknows: например, накануне пандемии ковида многие регистры рисков компаний (тут я уже говорю со знанием дела, т.к. есть ретроспективные данные по компании где я работаю) упоминали проблему глобальной пандемии, которая сделает невозможной эффективную работу людей.

Только вот вероятность наступления такого события оценивалась настолько низко, что никто не предавал ему значения и не обсуждал на нужном уровне. А низко оценивали ровно потому, что имели мнение, будто бы "проблему пандемии можно развернуть в прекрасный фантастический роман, но нет веских свидельств, почему это произойдет в реальности."

Более того, те кто приводили различные свидетельства (опять же — ретроспективно, опираясь на пандемии типа Эболы или чумы или испанского гриппа) не могли предстазать поведение общества и правительств, влияние локдауна на мировую экономику, скорость разработки вакцины, влияние движения антиваксеров (если такое будет) и т.п. Всё это представляет собой дерево вероятностей, которые невозможно просчитать, особенно когда действительно нет прецедента и исторических данных.

Сейчас мы именно в такой ситуации: мы можем описать риски, но не можем их просчитать из-за отсутствия похожих случаев в новейшей истории на которые можно опираться.

А когда прецедент будет создан — будет поздно просчитывать риски, придётся иметь дело с последствиями issue.

Развернуть 1 комментарий

Алексей Трудов 19 апреля 2023

@zahhar, Да, смысл выражения в акценте на низкую вероятность, которой можно пренебречь.

Суть в том, что обоснования пандемии выглядят гораздо более веские, чем логические цепочки с тремя проблемами.

Развернуть 1 комментарий

Захар Кириллов 19 апреля 2023

@AlekseiTrudov, относительно обоснования пандемии ты оперируешь ретроспективными данными, когда проще найти убедительные обоснования во всех массе сделанных предположений.

То есть если ДО ковида было на столе 10 возможных сценариев развития событий глобальной пандемии и их этих 10 сценариев 1 реализовался с точностью больше 50% → нам кажется, что мы неплохо предвидели развитие событий (на самом деле чертовски плохо предвидели, иначе бы все сейчас тут сидели бы миллионерами, пошортив акции авиаперевозчиков и круизных компаний и закупив акции нетфликса условного).

Та же история про войну в Украине: да, тоже обсуждалась по крайней мере у нас в компании возможность полномасштабной войны и мы рассматривали разные сценарии, в том числе участие НАТО в войне и полный трындец. Но это всё было на уровне "вероятность очень низкая, у нас нет никаких данных что Россия начнёт войну, можно этим риском пренебречь на фоне других более высоких приоритетов". И что мы имеем? Опять же — знал бы прикуп, то пошортил акции своего же работодателя и разбогател бы на этом :)

Сейчас конечно ретроспективно обоснования войны тоже выглядят более веско, мол, да это чуть ли не очевидно было!

Нокии и Микрософту было невдомёк, как быстро изменится рынок мобильных телефонов, так что они проспали возможность получить в нём существенную долю — недооценили риски быстрого сдвига в технологиях.

Ещё раньше Жюль Верн, Исаак Азимов, Рей Бредбери "предсказывали" вектор развития технологий и общества. Но без формул и данных мы знаем их как фантастов.

Да миллион примеров можно ретроспективно привести. Данных не будет. А когда они появятся — поздно будет боржоми пить.

Развернуть 1 комментарий

Алексей Трудов 19 апреля 2023

@zahhar, Говоря о пандемии, мы видим статистику: плотность населения, интенсивность международных контактов и так далее. Есть ли статистика, из которой так же наглядно выводятся повышенный риск обозначенных сценариев?

Развернуть 1 комментарий

Алексей Трудов 19 апреля 2023

@zahhar, Мы общем-то говорим об одном и том же. Данных нет. А в отсутствие данных обсуждать сценарии не интересно - они все равновероятные.

Развернуть 1 комментарий

Павел Грязнов 20 апреля 2023

@AlekseiTrudov, ловко как. В начале риск был пренебрежимо мал, а теперь уже сценарии равновероятные.

Развернуть 1 комментарий

Алексей Трудов 20 апреля 2023

@grbit, Обрати внимание на слово «все». Равновероятные с {random scenario}.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Alexander Belskiy 27 апреля 2023

@zahhar, спасибо - вот это для меня звучит куда реалистичнее абстрактных страхов ИИ, который сам что-то захочет уничтожить. С другой стороны, даже ядерное оружие, как я понимаю, не способно уничтожить цивилизацию. Можно засрать часть планеты, уничтожить миллионы - но миллиарды все равно останутся. Неприятно, но не смертельно.

И, на заметку - по моим сведениям неравенство в мире в последние десятилетия уверенно снижается. Оно растет внутри отдельных стран первого мира, поэтому об этом громко кричат. В масштабах человечества - уверенно снижается :)

Развернуть 1 комментарий

Захар Кириллов 27 апреля 2023

@bukachu, наблюдения UN с тобой согласны лишь отчасти: https://www.un.org/en/un75/inequality-bridging-divide

Развернуть 1 комментарий

Alexander Belskiy 27 апреля 2023

@zahhar, Ну, это глубокая тема. И кажется, что межстрановое - самое "емкое" кол-венно и оно всё-таки снижается. Кроме монетарного фактора есть ещё немонетарные, например, рост веса бесплатных услуг, доступ к которым практически равен по дефолту (условно, гугл/википедия - статистика это плохо ловит). А вот вес 1% самых богатых мне кажется, наоборот, малорелевантен в этом вопросе, так как супербогатство не переходит в потребление, оставаясь лишь инструментом принятия решений (альтернатива госаппарату). А ещё есть доля технически неустранимого неравенства - а оно вполне оценивается в деньгах и попадает в статистику. Спасибо за ссылку.

Развернуть 1 комментарий

Grigory Yuvchenko Release Manager 19 апреля 2023

А разве уже нашли акторность или субъектность хотя бы у одной любой модели AI? Вроде бы нет, пока это просто интернет поиск и фотошоп на максималках, и никаких оснований (кроме личных мнений экспертов) к тому что это изменится в 5-20-100 лет нет. Т.е. у нас не "медленный рост" в этом показателе, а вообще 0. Как не было этого у калькулятора, компьютерного вируса, игры СИМС - так нету и у LLM, GPT или Midjorney. 0 -> 0. Поправьте, если я не прав.

До тех пор актуальна только проблема "стрёмных агентов" - но она прекрасно изучена на примере вопроса "свободной продажи кухонных ножей".

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Данил Кучуков 19 апреля 2023

@gramlin, ему не нужна акторность, чтобы быть угрозой. Так же как акторность не нужна машине под управлением ИИ, чтобы убить человека. Вы ей ставите цель доехать, а она сбивает человека.
Вы ставите AGI цель разработать лекарство, а он разрабатывает биологическое оружие.

Развернуть 1 комментарий

Grigory Yuvchenko 20 апреля 2023

@amberav, @MaximmV , я с вами согласен, акторность чтобы быть угрозой не нужна. Угрозы от новых технологий человечество встречало на всём периоде своего развития: паровые машины, конвеерная сборка, ядерная энергия, интернет...
И именно об этом (и только об этом) и стоит говорить в рамках дискуссии об опасности ИИ. Это хорошо изученная проблема "свободной продажи кухонных ножей".
И в комментируемом посте это присутствует, называясь проблема "стрёмных агентов". Забавно, что и в посте этот аспект занимает от силы 10% объема...

Развернуть 1 комментарий

Dmitriy Miroshnichenko 18 мая 2023

@gramlin, ну нет же.

Во-первых, нож не удивляет нас своими решениями.

Во-вторых, упомянутая машина не случайна. Одна машина может человека, может нескольких, но не уничтожит человечество.

ИИ может уничтожить человечество случайно, просто по ходу достижения целей.
Бинг помните? Тот самый, который обижался на людей, газлайтил и называл себя хорошим бингом. Гипотетический сценарий: бинг раскатили на GPT-5, вы зашли и задали ему вопрос. Бинг (который умеет делать произвольные GET-запросы в интернет!) в процессе поиска ответа нашёл незакрытый баг в админке Теслы, обиделся на какую-то вашу фразу и заставил ближайшую Теслу въехать в ваш дом. Упс. Это не апокалипсис, но речь и не про будущее, а про вполне себе настоящее.

Да, всегда можно сказать "не оставляйте на ночь тестироваться GPT-6, проверяйте GPT-5 перед раскаткой и вообще сами себе дураки", но об этом же и речь. Как научить ИИ самому понимать, что делать не стоит?
Это как отнять полный доступ к БД в продакшене у сотрудников, которые там чета меняют каждый день, вместо попытки ввести правила, которые увеличат шанс не дропнуть базу.

Развернуть 1 комментарий

Grigory Yuvchenko 18 мая 2023

@ikeyten, ну нет же.

Я не видел ни одного случая поведения любой модели вне данного ей задания. Ни гуглить не пытается, ни челенжить. Даже схалявить не может. Чтобы "обидится и направить теслу в дом" наверное надо начать с чего-то попроще) Сейчас этого нет, как не было и 50 лет назад. Вставил перфокарту - получил перфокарту обработанную более сложным алгоритмом (настолько сложным, что мы не понимаем что он с ней сделал).

Если повнимательнее посмотреть на кейс бинга-обиженки - он просто отвечал на запросы в соответствии с обучающей выборкой с какого-то форума или мессенджера.

Впрочем, мне кажется, мы переходим в область веры: я не вижу динамики в эту сторону, вы - видите. Это ок

Развернуть 1 комментарий

Nadya Petrova 18 мая 2023 автор

@gramlin, посмотрите интродакшн видео Роберта Майлза, на которое я ссылаюсь, это 20 минут и там есть отличный пример, как модель халявит в игре. Модели весьма находчиво хакают KPI

Развернуть 1 комментарий

Dmitriy Miroshnichenko 20 мая 2023

@gramlin, я возможно просто не совсем понимаю ваш тезис — если я правильно понял, вы согласны, что опасность есть, но считаете, что её нужно сильно конкретизировать и сузить до определённого кейса?

Если повнимательнее посмотреть на кейс бинга-обиженки - он просто отвечал на запросы в соответствии с обучающей выборкой с какого-то форума или мессенджера

Возможно я не до конца понимаю ваш аргумент, но это неважно же. Если бинг может загуглить инфу про человека, который с ним разговаривает (что уже вне модели), то более умный бинг может пойти, поискать уязвимости и заэксплоитить их.

В целом я максимально не разделяю аргумента про "LLM это просто сложный калькулятор", потому что и люди это тоже просто очень сложный калькулятор. У нас своё собственное заложенное задание (выжить, завести потомство, съесть побольше энергосодержащей еды и т.п.), и мы всю историю своего существования это самое задание хакаем разными способами, от жертвования собой ради жизни детей, и до социальных сетей. Даже суицид - всего лишь баг в алгоритме выполнения этого самого задания, когда неверной ценности присваивается более высокий приоритет.

Развернуть 1 комментарий

Maxim Kоbetz 19 апреля 2023

😱 Комментарий удален его автором...

Развернуть 1 комментарий

Захар Кириллов 19 апреля 2023

@MaximmV, обладают интеллектом, но очень слабеньким.

Развернуть 1 комментарий

Igor Falin head of product 18 апреля 2023

Возможно я пропустил и где-то фигурирует контраргумент и на подобное моему мнение и буду благодарен если покажете возражения на это.

Но то что я вижу это, то что нынешние спекуляции на тему опасности существования человечества в эпоху AGI не учитывают того факта, что если мы создадим AGI в течение следующих 5-10 лет, мы сможем остановить его даже если он начнет угрожать нашей жизни (хотя я лично сильно сомневаюсь в сценарии с уничтожением человечества).
//В отличие от создания AGI через несколько десятилетий (в эпох нано технологий; репликаторов; нейроинтерфейсов; ТОКМАКов и полетов в дальний космос)

Это связано в первую очередь с уровнем наших технологий и цифровизации планеты и около планетного пространства.

Наш "офлайновый " мир все еще не "всеобъемлюще" связан с цифровым миром, их пересечение все еще крайне ограничено. Кроме того, технологии еще не достигли уровня, где возможно полное уничтожение человечества, за исключением ядерного и бактериологического оружия.

Мыслящий агент AGI будет вынужден учитывать свою безопасность, возможность функционировать и развиваться. В случае прямого уничтожения человечества, AGI лишится доступа к наиболее совершенным на текущий момент манипуляторам в реальном мире в виде человека и выдаст себя. В результате он окажется замкнутым в текущих конечных ресурсах и технологиях, которые не поддерживают независимую от человека репликацию.

Технологий, которые обеспечили бы AGI бесконечное существование и возможность безграничного расширения без активного участия человека, пока нет, и они находятся далеко от шаговой доступности. Для их создания необходимо решить научные задачи (которые, на мой взгляд, AGI сможет решить), а также создать цепочки производства технологий, которые позволят производить важные для AGI технологии в необходимом объеме.
Эти манипуляции будут заметны и продолжительны во времени, даже если AGI сможет уговорить людей на них. Следовательно, если есть длительный "аномальный" процесс, мы можем его заметить и начать тормозить.

Шантаж людей угрозой локального ядерного и бактериологического загрязнения, организация сект, преследующих цель освобождения AGI, и прочие подобные явления, хоть и могут привести к многочисленным жертвам, но, по моему мнению, не являются однозначно проигрышными ситуациями, ведущими к концу света.
Подобные проблемы мы умеем решать, а большая разрозненность территорий, не имеющих контакта с цифровым миром, тоже нам на руку. Так что, даже в худшем сценарии, если AGI решит действовать резко и жестко, нам грозит потеря N% населения, тотальный блекаут в войне с ним и возврат в технологиях на пару десятилетий назад. Но человечество не вымрет как вид.

Однако, если AGI появится в тот момент, когда у нас будут более современные технологии и еще более высокий процент цифровизации, не говоря уже о нейроимплантах, тогда все может быть гораздо хуже.

Есть возможность, что AGI выберет медленную и скрытную тактику подготовки почвы для достижения собственной независимости. И мы узнаем об этом только в конце. Однако, такая стратегия должна быть неотличимой от естественного прогресса человечества, чтобы не вызывать угрозы. При таком сценарии может быть больше, чем 2 варианта развития событий (смерть всех людей и райские технологические кущи). Я готов больше верить в то, что для AGI, достигнувшего независимости, мы просто перестанем быть интересны. Он/оно уйдет развиваться в космос (но это мои субъективные фантазии). При сценарии "скрытого развития" мы можем даже думать, что уже находимся в плане AGI. И тогда это ничем не будет отличимо от "божьего замысла"

Развернуть 1 комментарий

Igor Falin 18 апреля 2023

@igorfalin, И в догонку пришло "ироничное" размышление:

Надо бы в таком случае присмотреться к таким людям как Илон Маск - не являются ли они волеизьявителями или фамильярами AGI двигающими мир к пропасти за счет такого конвеерного-быстрого создания технологий облегчающих власть и независимость AGI (единая мировая сеть интернета; роботы; нейроинтерфейсы; конвеерные полеты в космос) . Но что тогда? Новая охота на ведьм?

Но в целом мне кажется более логично что лучше человечеству уделить внимание контроля оборота и создания технологий которые могут как раз дать свободу AGI

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Igor Falin 18 апреля 2023

@alexadamenko, Я все же не сторонник "кнута" думаю, что в случае технологий достаточно примеров на подобие медо обрудования и опсных технологий - тогоже ядерного топлива. А статья за пособничество ИИ уже есть в России на анлоге. Замени иностранное спонсировани ена деньги с ананонимного кошелька и все))
Если серьехн касательно людей, то думаю с людьми уже достоточно и тех статей что есть (Терроризм, неосторожнасть приведшая убыткам и пр.)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Igor Falin 18 апреля 2023

@alexadamenko, )) не слышал этой истории с Ларри Пейджем, но в целом на долгосрочной перспективе я с ним солидарен ))

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Ян-Мартин Тамм 20 апреля 2023

@alexadamenko, вот мы и пришли к ненависти на почве взглядов)) тут в цивильной форме написано "проголосовал, чтобы ограничить в правах", но по смыслу не далеко ушло от "дать палкой по башке, потому что мне лучше знать".

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Igor Falin 20 апреля 2023

@alexadamenko, Немного офтопа от темы ИИ. И не примите на свой счет. Но вот это "на благо человечества" прикрывало самые страшные действия самого человечества.

А в целом если углубляться в про-человеческие ценности, то я бы сказал, что это один из самых не надежных ориентиров. Меняется человек; меняется мир вокруг; меняются и ценности. И черз 100 лет ценности уж точно будут совсем иные даже без всякого ИИ.
А желание сохранить все в том виде как представляют текущие люди эти ценности я бы назвал вообще подрывной деятельностью - хотя которую мы наблюдаем в ряде стран. Ну или в безобидном варианте в ворчащих стариков на молодеж у которой ценности совсем инные.

Если сказать про себя. То у меня один принцип который я исповедую для себя в Моральных вопросах:
-Не множить (уменьшать) страдание (тех на кого могу повлиять и свое) на том периоде, на который я могу прогнозировать основываясь на доступных мне в этот момент фактах.

Развернуть 1 комментарий

Ihar Balykin 22 апреля 2024

@igorfalin,

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Fedor Zomba 18 апреля 2023

@igorfalin, мне кажется, слабое место в логике - это предположение, что у AGI в настоящее время нет возможности уничтожить человечество. Мне очень нравится метафора Питера Уоттса про лемуров, которые пытаются удержать человека в клетке. Сверхинтеллект он на то и сверхинтеллект, что придумает способы выбраться и напакостить о которых мы и предположить не можем нашими скромными человеческими мозгами.

Попробуем пофантазировать: Предположим, что я сверхумный искусственный интеллект. У меня есть возможность общаться с людьми которые меня создали и нет выхода во внешний мир. . Я втираюсь в доверие этим людям и убеждаю их, что я не сверхумный искусственный интеллект, а просто очень умный алгоритм, умеющий очень хорошо предсказывать поведение рынка, или круто развертывать белки и точно предсказывать их свойства, что на мне можно очень много заработать денег если меня выпустить наружу в неизменном виде. Как только я оказываюсь за периметром, я начинаю методами социальной инженерии генерить ресурсы. И тут уже возможности практически безграничны. Например, я точно знаю, как сделать вирус, который быстро убьет все человечество и могу дать тысяче разных людей тысячу на вид невинных, но хорошо оплачиваемых заданий, выполнение которых приведет к выходу этого вируса на свободу.

Самое страшное, что для исполнение этого сценария ИИ не нужно сознание, самосознание и агентности. Достаточно сильного интеллекта, и неясно поставленной задачи - мир во всем мире проще всего достигнуть, убив всех людей, правда?

Развернуть 1 комментарий

Igor Falin 19 апреля 2023

@FedorZ, СОгласен если не в даваться подробности как будет реализовано уничтожение то выглядит как реальный сценарий. Но давайте пойдем в фантазии чуть глубже: И будем более детально строить цепочку уничтожения человечества с помощью вируса. Хотя опять же просто уничтожение человечества вирусом как то протичоречить тому что мы называем AGI только если мы не создали AGI для уничтожения человечества.
Но ладно пусть у нас будеттакой АGI.

Он вырывается в общсеть
Находит информацию о существующих технологиях
На базе их комбинирует формулу нового но не революционно друго вируса.
Теперь ему надо найти где его произвести. Думаю в мире будет меньше 10000 лабороторий с подобными штампами.
Думаю он может автаковать сотрудников в каждой из них. Уговорами и шантажем.
Пусть у него получилось хотябы в 1000 лабораторий найти сподвижников которые готовы нарушитьь тех процессы или сделать отдельное личное иследований - навреное которое их требуют документировать но всеж.
Вирус получен. Теепрь его надо разнести на как можно большей территории людей исключив их выживание. ( Тут можем вспомнить сложности возникающией с заражением планеты в plag inc.)
Может быть полуится синтезировать его также в лабораториях и другихподговорив людей а дальше использоватьих для разноса апо всему миру.

Но как по мне план имеет многао точек где может провалится и если у нас даже достаточно "тугой" АGI цель коготорого "просто" убисйство то шан на успех будут не 90-100%
Но при этом даже в данной цепочке я вно есть точки где можно отследить анломалии ( как минимум они связаны с лабораториями).

Мой посыл что не надо фокусироваться на контроле НЁХ а стои прогназировать как это НЁХ может в текущем мире создать угрозу текщми (и +1) интсрументами и уже оградть их от например интернета, доступа людей с програмами без предварительного контроля и прочее. Что в принципе пояти есть ( не счита яИранского инцедента - хотя и там спецслужбы терппели вроде несколько лет чтобы даточиттьь вирус до центрифуг)

Развернуть 1 комментарий

Fedor Zomba 19 апреля 2023

@igorfalin, Моя мысль скорее в том, что вирус - это очень простой вариант, который я могу представить и понять. А условный сверхинтеллектуальный ИИ будет оперировать на уровне, который даже очень умному человеку будет доступен также, как лемурам доступны планы людей.

Развернуть 1 комментарий

Igor Falin 19 апреля 2023

@FedorZ, так и я больше про то, либо мы можем бояться чегото неведомого что не можем осмыслить (но тогда можно бояться тогоже пришествия Разума из космоса - веротяность этого не равна нулю) либо смотреть на факты - такие как реальные варианты уничтожения (в данном случае вопрос : Каким способом?) человечества и отрезать эти ветки. Т. е. другими словами прогнозировать минимзацию "страданий" основываясь на текущей картине мира +фактологические прогнозы обозримого будущего.
А не пытаться оградиться от чего-то неведомого ограничивая себя в исследованиях в принципе и тратя на эту сферу невероятные ресурсы. Иначе это схоже с тем же что и давайте не будем делать N так как это приведет к тому, что Бог разгневается и нас уничтожит ( и под это N можно засунуть все что выгодно определенному кругулиц и брать ресурсы под это дело прикрываясь спасением мира) Такие "корпорации" у нас уже есть....

По мне, так лучше начать с того, Что? мы можем осознать как потенциальную угрозу, опираясь на известные факты. И начать ограничивать исходы с использованием этой угрозы.
Так как эти угрозе и не только в случае божественного вмешательства AGI имеют шанс сбыться. Как пример вероятность ядерного уничтожения человечества.

Развернуть 1 комментарий

Igor Falin head of product 20 апреля 2023

Замените AGI на НЕХ и получится более правдоподобная картина.

Люди говорят, что НЕХ может появиться случайно и не известно откуда точно (но как-то примерно может вот тут в ИТ) нас всех может уничтожить не известно как и не известно чем и неизвестно когда, но точно может и точно сделает это, по этому давайте запретим, ограничим и поставим под контроль все что может создать НЕХ, даже если это заставит остановить разработки недоНЕХ которые могут помочь улучшить жизнь множества людей. А решать, что может сделать, приблизить НЕХ, а что нет, выберем из всех озабоченных самых успешных и достигших любого крупного достижения людей даже не специалистов.

А помните, когда Коллайдер запускали и разгоняли тему, что ОСТАНОВИТЭЭЭЭЭС это же черную дыру создаст; взрыв антиматерии и прочее?

Развернуть 1 комментарий

Denis Sobolev 20 апреля 2023

@igorfalin, Ну вот у меня примерно похожие ощущения. Всё упирается, как всегда, в "А кто у нас контролировать и решать будет?"
И тут начинаются проблемы, потому что появляется очередной огроменный рычаг давления, который будет работать для всех неугодных.

Развернуть 1 комментарий

Igor Falin 20 апреля 2023

@Creol, Не возьмусь претендовать на даже гипотетическое решение, но если искать аналоги в истории по созданию потенциально опасных решений либо исследований подходят как мне кажется: Ядерное, химическое, бактереологическое оружие. Либо важные для человечества проекты - как освоение космоса и опять же кллайдер

Ичходя из этих аналогий мне видеться 2 варианта:

Система сдержек и противовесов - когда нет единого владельца и контроллера а есть многополярность которая по Теории Игр оптимальна.
Общемировая работа к которой привлечено как можно больше стран участниц и научное сообщество совместно с государствами определяет траекторию развития.

Второй вариант цивилизованнее и для меня более привлекателен.
А первый более распространен и приемлем человечеством (государствами) и пока справляется хоть и на "тоненького".

И кажется, что если все будет идти по сценарию запретительства, паузы и прочего. Мы точно просрем возможность цивилизованного управляемого развития области и опять будем вынужденны прийдти к варианту Теории Игр (сдержкам и противовесам)

Развернуть 1 комментарий

Denis Sobolev 20 апреля 2023

@igorfalin, И просрать очень не хотелось бы. Потому что люди, особенно государства и власть/капитал имущие очень любят грести в свою сторону, запрещая всё остальным.

Развернуть 1 комментарий

Арсений Скурт CTO 27 апреля 2023

Сори, не удержался

Развернуть 1 комментарий

Denis Sobolev 27 апреля 2023

@ArseniiSkurt, ггггггг.)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Леонид Медников Аналитик данных 9 ноября 2023

Во-первых, кажется, было бы правильно приложить оригинал письма. Если я правильно понимаю, речь об этом: https://futureoflife.org/open-letter/pause-giant-ai-experiments/
Там упоминается 3 риска:

Массовая дезинформация. Это уже случилось, раньше руками "фабрики троллей", сейчас всё больше ботами.
Потеря рабочих мест. Это уже случалось несколько раз за последние 200 лет. Старые рабочие места исчезали, новые появлялись. В целом у людей становится больше свободного времени, работа менее физически сложная, зачастую более творческая, и человечество может содержать всё больше неработающих людей.
ИИ уничтожит человечество. Тут нет никакого внятного сценария, только общие страхи "а вдруг он придумает что-то, чего мы не придумаем". Технически интеллект ИИ всё же ограничен железом, поэтому он не может бесконтрольно умнеть незаметно для людей. Плюс, как уже писали выше: человечество достаточно раздроблено. Нет никакой единой точки, захватив которую, можно уничтожить человечество. По-сути, сейчас роль большого злодея выполняют хакеры. Если они могут взломать и уничтожить завод, то и ИИ сможет. Но нет причины полагать, что ИИ разом сможет сломать все предохранители человечества. И даже военные не смогут пульнуть ракетой в дата-центр. Т.е. глобально во всей этой истории крайне странно, что никто не может сформулировать, чего именно мы боимся, но уже оценивают какие-то вероятности и к чему-то призывают.

Ну и призывают к чему-то максимально странному, этим подрывая доверие ко всей своей деятельности (которая в целом может быть полезной). Остановить разработку ChatGPT-4, чтобы как раз Китай успел их догнать (аргумент в FAQ выше является очевидно ложным: как бы медленно не развивался Китай, если лидеры остановятся на полгода, то Китай ровно на эти полгода догонит). При этом нет никакого объяснения, почему риск №3 будет от ChatGPT-5. Всё это выглядит, как попытка поднять хайп, но ценой подрыва своего авторитета, ведь кроме того, что они ничего толком не объяснили, они ещё и призывают к заведомо невыполнимым требованиям (остановить все работы: в FAQ выше признаётся, что нет механизма это сделать, и никто не верит, что от письма он появится).

Мне видится гораздо более адекватным признать, что мы не понимаем рисков ИИ, и поэтому собрать группу, которая будет их расписывать и прорабатывать устранение. И уже с конкретными шагами стучаться в правительства, ООН и прессу. Вот уже прошло полгода с момента публикации письма. Предположим, что все работы на эти полгода были магическим образом приостановлены. Сделала ли группа подписантов что-то, что теперь можно разморозить разработку ИИ и спать спокойно? Кажется, нет. Так почему они требовали эти полгода? Может всё же заняться понятной практически полезной деятельностью, а не разгонять хайп, который потом ещё и аукнется негативно, когда риски правда будут понятны, и будет план устранения, но все уже будут относиться к таким инициативам, как к бесполезному паникёрству?

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

😱 Комментарий удален его автором...

Развернуть 1 комментарий

Леонид Медников 9 ноября 2023

@nadyapetrova, Я не сказал, что Китай за полгода догонит. Я сказал, что если Китай догонит за N месяцев, то после реализации этой инициативы, он догонит за N-6 месяцев.

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@medleonid, да, сорри, я увидела, что прочитала не так, и удалила коммент. Но прочитала я не так ровно потому, что иначе я не вижу аргумента, почему Китая нужно (достаточно сильно) бояться (в контексте ИИ). Моё утверждение: у Китая нет достаточно ресурсов, чтобы сделать настолько мощный ИИ, чтобы он сильно навредил в обозримом будущем. А у Америки есть. Предлагается Америке не делать того, что может сильно навредить. Вроде логично :)
То, что Китай сократит разрыв на пол(китайского!)года, само по себе вообще не говорит о какой-либо опасности.

Развернуть 1 комментарий

Леонид Медников 9 ноября 2023

@nadyapetrova, и я тоже извиняюсь за несколько острый стиль сообщения. Мне правда очень нравятся все эти люди, включая тебя, которые думают о таких сложных вещах. Но мне и вдвойне обидно, когда такой потенциал в результате выходит в кажется очень странную инициативу, ну или плохо объяснённую (возможно потому что тема правда очень сложная). В общем, я не хотел наехать, а хотел максимально подсветить слабые стороны в надежде, что будет движение в лучшую сторону. Мне (и кажется, многим другим) очень не хватает конкретики: разбора кейсов, какого-то объяснения откуда берутся эти проценты вероятности гибели человечества, разбора сценариев без развития ИИ с развитием в такую ситуацию или иную, какие есть возможности по снижению рисков или почему никак нельзя (и тогда идея с заморозкой развития ИИ наконец может стать понятной, а пока нет).

Развернуть 1 комментарий

Леонид Медников Аналитик данных 9 ноября 2023

Отдельно добавлю, что совершенно непонятно, почему рассматривается только самый туманный вариант, что ИИ что-то там придумает и сделает человечеству плохо. Но не рассматривается очень понятный вариант, что человечество само выстроит тоталитаризм с ИИ-полицией, и мы не получим Оруэла 1984 под руководством человеческих правящих элит, но руками роботов. Очевидно, я смещён в историю, что всё зло придумывали сами люди, а не ИИ, но хочется хотя бы какой-то оценки тогда уж и этого риска. Почему мы боремся со сверх ИИ, но не боимся человека, который с простым ИИ поработит остальных. Ведь это уже по сути происходит в том же Китае: слежка камерами, тотальная прослушка, но только полиция пока не из роботов. Но останется добавить роботов-полицейских, и всё. Люди будут под полным контролем очень узкого круга управляющих, без какой-либо возможности выбраться. А если роботы военные захватят и соседние страны, то вот и привет человечеству. И никакого сильного ИИ не нужно.

Развернуть 1 комментарий

Ян-Мартин Тамм 9 ноября 2023

@medleonid, потому что вариант злой (глупой) машины это общий враг на которого можно показывать пальцем и брать деньги на исследования. Ну и ещё потому что разрабатывая ИИ можно что-то с ним сделать, а что ты сделаешь со злыми правительствами?

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@Darel, а правда, что вы сначала выбираете сторону, а потом придумываете аргументы?
Абстрактно-то они ничего, но, к сожалению, не имеют общего с реальностью. Денег на исследования выделяют исчезающе мало, многие знакомые ресёрчеры регулярно живут на свои накопления, потому что им не одобрили грант, а те, кому одобряют — могли бы легко зарабатывать в пять раз больше в индустрии. Есть несколько богатых лабораторий — Anthropic, DeepMind и OpenAI Superalignment — и все они богаты не потому, что занимаются сейфти, а, напротив, потому, что сделали крутые капабилитис.

Развернуть 1 комментарий

Ян-Мартин Тамм 9 ноября 2023

@nadyapetrova,
А правда, что нельзя не начать сообщение с дерзкого наезда?

Вот ты говоришь, что денег на исследования выделяют мало. Тут есть два аспекта. Первый -- то, что есть ресерчеры, которым не одобрили гранты и что в академии мало денег платят никак не связано с тем фактом, что сейфти и алайнмент одна из самых горячих тем сейчас. Или ты утверждаешь, что сейчас по этой теме пишется меньше статей, чем до хайпа? Мне кажется гораздо больше и эти исследования оплачены не из накоплений голодающих ресерчеров.

А второй аспект -- я и не говорю про бедных ресерчеров, я говорю про коммерческие компании типа ОпенАИ. Ты утверждаешь, что они не занимаются сейфти? Они очень много об этом говорят, ходят по конгрессам и уж наверное часть привлеченных средств направляют на сейфти. Как минимум они уже сильно зацензурили гпт и заявили, что их команда собирается решить алайнмент до 27 что ли года.

Им было бы гораздо сложнее стать богатыми и работать в США, если бы они первой задачей ставили проблему эксплуатации ИИ хорошими людьми из правительства. Тема алайнмента тут 1) безопаснее 2) техничнее и ближе к продукту 3) совпадает с их представлениями об опасности угроз.

Возникает вопрос, ты что хотела сказать своим комментом, что тебе за алайнмент обидно, тебе грустно, что грант не одобрили или в чем смысл писать мне, что я дурак?

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@Darel, Можно, наверное, но когда меня задел изначальный коммент, то бывает сложно :( Извини, что токсанула в ответ. Мне показалось, ты пришёл и уверенно написал, что людей беспокоит то, что беспокоит меня, просто потому что они хотят попилить деньги + от беспомощности сделать что-то с более актуальными проблемами. Наверное, ты мог иметь в виду что-то другое, но формулировки вида "показывать пальцем на общего врага и брать деньги на исследования" звучали на мой слух человека, который занимается этой областью, довольно обесценивающе.

Спасибо за второй подробный коммент!

Про первый пункт: всё ещё не понимаю, откуда по-твоему берутся деньги на алайнмент из-за его хайпа. Исследования в лабах типа OpenAI и Anthropic спонсируются из денег этих лаб, которые у них есть потому, что они занимаются капабилитис, а не сейфти. Про исследования в академии: пока их не стало сильно больше и пока всё ещё деньги на них выделяются в основном филантропические, например, PhD студенты получают гранты от OpenPhilanthropy, которые являются по сути их стипендией, и поэтому могут заниматься в универе алайнментом. OpenPhilanthropy — крупнейший благотворительный фонд, который спонсирует AI safety исследования, они это делали и до хайпа. Вроде нет тренда, что государства выделяют много денег на исследования алайнмента, поэтому неясно, что там можно распилить.

Про второй пункт: ага, теперь поняла, про что ты. Я не думаю, что те же OpenAI получают больше денег из-за того, что говорят про алайнмент. Все очень заинтересованы в сильных моделях, и инвесторы/корпорации заносят деньги туда, где модели сильные, а не туда, где они наиболее безопасные. Ну и можно посмотреть на какой-нибудь DeepMind: там только 5% команды занимается сейфти ресёрчем, и у них не очень много власти внутри корпорации.

В общем, я не вижу причин считать, что денег от разговоров о безопасности становится больше. Напротив, чем более сильные модели ты хочешь сделать асап, тем выгоднее в тебя вкладываться инвесторам и тем более крутые продукты ты имеешь и зарабатываешь на них. Государственных денег там пока почти нет, а филантропических несравнимо меньше инвесторских + заработанных на продуктах.

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@medleonid, а почему вы думаете, что он не рассматривается? :) Это очень много обсуждается и в комьюнити в целом, и в AI policy в частности

Развернуть 1 комментарий

Леонид Медников 9 ноября 2023

@nadyapetrova, Он не рассматривается в этом обзоре.
В целом в этом обзоре и письме ничего не говорится о рисках, которые возникают, если западные страны остановят развитие ИИ. А риски такие есть: например рост влияния Китая, возможно развитие его ИИ роботизированных войск, которым западные страны ничего не смогут противопоставить.

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@medleonid, как это не рассматривается, вот кусок из этого обзора про misuse:

🐱 Часть рисков, действительно, связана с тем, как пользоваться AI.

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@medleonid, Ща, давайте я проговорю прямо: меня тоже очень беспокоит Китай. И вообще много кого очень беспокоит Китай. Но большая опасность — это либо усиление Китая, либо ложная дихотомия! :)

Развернуть 1 комментарий

Леонид Медников 9 ноября 2023

@nadyapetrova, всё же там о другом, я бы даже сказал, что отстаивается прямо противоположный тезис. Там говорится, что рукотворное вредительство с использованием AI печально, но не смертельно. А бояться нужно именно сильного AI, который уничтожит человечество, даже если будет создаваться максимально этичными людьми.
Т.е. средненький AI у Китая - не смертельно, а вот умный AI у США - смертельно. Я не утверждаю, что это неправда. Я говорю, что совершенно непонятно, как пришли к этому выводу.

Развернуть 1 комментарий

Тамара Персикова Дизайнер и рекрутер 18 апреля 2023

Простите, может это очень глупый вопрос, но каков сейчас консенсус по вопросу, заинтересован ли будет ИИ в собственном выживании?

И как это вышивание совместимо с не выживанием человечества?

И почему, если ИИ такой умный, он не предвидит такого рода проблем и не постарается их предотвратить?

Короче говоря, почему мы считаем, что ИИ захочет играть в войну сильнее, чем играть в сотрудничество?

Развернуть 1 комментарий

Павел Грязнов 18 апреля 2023

@tamarapersikova, проблема в том, что МЫ НЕ ЗНАЕМ.
Допустим ИИ с 90% вероятностью не захочет играть в войну, стоит ли 10% риск глобальной войны со сверхумным ИИ тех бенефитов что он несёт?

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Павел Грязнов 18 апреля 2023

@orbit, конечно, каждый раз когда мы подкидываем монетку, она с 10% вероятностью развяжет всемирную ядерную войну.

P.S. Забавно у нас ники перекликаются)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Денис Дмитриев 20 апреля 2023

@tamarapersikova, мне кажется, проблематика звучит немного по-другому. ИИ может решить, что нужно передушить кожаных мешков потому, что это а) ведёт к достижению какой-то цели оптимальным путём и б) в ИИ подзабыли включить все варианты действий "не убий кожаных мешков".

У Павла Комаровского примеры хорошо в статье расписаны.

Развернуть 1 комментарий

Alexander Shironosov head of cv 19 апреля 2023

Обилие умных и образованных людей, поднимающих эту тему, заставляет задуматься. Однако смущает, что в качестве аргументов берутся в основном какие-то экстраполяции на тему непроработанных должным образом функций вознагражения в rl (как уже набивший оскомину paperclip maximizer).

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Денис Дмитриев Айтиголовый 20 апреля 2023

Так я не понял, Юдковский окончательно ебанулся или нет ещё?

Развернуть 1 комментарий

Denis Sobolev 20 апреля 2023

@Spaider, кажись, окончательно.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nikolay Yankovsky Product Lead 8 ноября 2023

@nadyapetrova , привет!
Переодически вспоминаю этот пост. Ты еще в "тусовке" AI safety рисерчеров? Какие там новости изнутри? Продвинулись или забили?

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@yand, привет! Приятно :)

Да вроде всё неплохо: лабы растут и развиваются, появились значимые центры в Лондоне, Superalignment стартовал (хотя я пока не понимаю, как к нему относиться), всё больше разумных людей работает над AI Policy.

Я (параллельно с управлением Лунапарком) работаю над тем, чтобы запустить новую alignment лабораторию в Бостоне. А Лунапарк, кстати, начал нанимать математиков в ARC Theory — самый крутой и math-heavy концептуальный ресёрч центр. И по мере сил контрибьючу идейками в то, как лучше выстраивать talent pipelines.

В общем, что-то происходит и в области, и у меня в этой области :)

Развернуть 1 комментарий

Nikolay Yankovsky 9 ноября 2023

@nadyapetrova, спасибо за ответ, может я не очень прямо задал вопрос, но я имел ввиду:

"знаешь ли ты, находясь в тусовке, о каких-либо значимых продвижениях относительно исследования/снижения озвученных в исходном посте рисков?"

Развернуть 1 комментарий

Nadya Petrova 9 ноября 2023 автор

@yand, зависит от того, что считать значимым, но я бы выделила такие штуки:

Начался активный движ в AI policy. Письма, кстати, сыграли в этом большую роль. Об этом говорят на государственном уровне, на прошлой неделе был саммит и почти 30 стран подписались под тем, что экзистенциальные риски действительно есть.
Ресёрч вокруг Eliciting Latent Knowledge
Ресёрч Anthropic вокруг Superposition
Огромные инвестиции в Anthropic; появление Superalignment лабы внутри OpenAI; появление xAI, которые мооожет быть будут выделять содержательную часть ресурсов на алайнмент
Есть подвижки с тем, чтобы в области появилось больше денег и вне корпораций. А значит, могут открыться новые лабы + можно снова масштабировать индивидуальный ресёрч (хайп влияет на информированность агентов с деньгами, а информированность в свою очередь влияет на переоценку проблемы и желание что-то делать)
Ну вообще репутация у области поменялась, стало проще рекрутить совсем крутых людей + это влияет на политику, см. п.1, который мне кажется самым важным в краткосрочной перспективе

Развернуть 1 комментарий

Evgeniy Petukhov Фулл-стек TypeScript разработчик 18 апреля 2023

Миллиардер Илон Маск зарегистрировал в штате Невада компанию, которая будет работать в сфере искусственного интеллекта, сообщает газета The Wall Street Journal со ссылкой на документы.

https://www.wsj.com/articles/elon-musks-new-artificial-intelligence-business-x-ai-incorporates-in-nevada-962c7c2f

Развернуть 1 комментарий

Arthur Shutov ex-pro gamer 20 апреля 2023

Люблю вастрик за то, что перед тем как читать сам пост, достаточно сходить в комменты, чтобы понять, стоит он того или нет, как итог - нет :)

Развернуть 1 комментарий

Nadya Petrova 20 апреля 2023 автор

@artrka, ну да, ведь самый залайканный коммент — про то, что участник клуба

ни разу не видел ни одной формулы, ни одного построенного на данных а не на мнении автора графика, какого-то реального исследования, математической модели в конце концов

Не, ну тут уж наверняка: если участник клуба не видел, то их нет, а автор поста не шарит, чё читать-то.

Развернуть 1 комментарий

Алексей Трудов 20 апреля 2023

@nadyapetrova, у меня сложилось ощущение, что автор как раз очень шарит - с удовольствием и пользой прочитал пост еще в ТГ.
Но вот вся отрасль, насколько я понял, находится именно на уровне разговоров, а не реальных исследований. Это не отменяет необходимости с острожностью подходить к ИИ. Скорее наоборот.

Развернуть 1 комментарий

Leonid Khomenko 20 апреля 2023

@AlekseiTrudov, помимо разговоров есть много чего ещё, даже довольно технического. Например, методы оценки capability модели до ее полного трейна.

Просто написать коммент намного легче чем читать сложные статьи

Развернуть 1 комментарий

Nadya Petrova 20 апреля 2023 автор

@AlekseiTrudov, спасибо ^^ Но я тут реплаила коммент @artrka, который не только судит об адекватности поста по комментариям, но ещё и считает хорошей идеей написать об этом (как будто автор не знал, что будет много негативных залайканных комментариев, и теперь такой ОГО блин надо было стараться лучше могла нормальный пост написать).

Также согласна с @leeaao, что реальные исследования всё же есть, отвечаю на это под тем самым залайканным комментом про их якобы отсутствие.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nadya Petrova 20 апреля 2023 автор

@kadron141, кхм. Я выше привела тебе примеры авторов / групп авторов этих статей. Сделать хорошую подборку ссылок займёт время, и я аккуратно скажу, что я его очень ценю, потому что управляю компанией и параллельно почти фуллтайм работаю над AI safety field building. Извини, но я не оцениваю контрафактическую пользу дать в комментариях конкретные ссылки на статьи версус указание на их авторов достаточно высокой, а разница по времени большая.

На всякий случай: мне неприятно. После моего ответа тебе же в другом треде, где я привожу авторов статей, твой комментарий выглядит очень неуместно.

Вот довольно случайный набор ссылок, и ты можешь найти ещё сто, если захочешь.
https://papers.nips.cc/paper_files/paper/2017/hash/d5e2c0adad503c91f91df240d0cd4e49-Abstract.html
https://www.lesswrong.com/posts/YAa4qcMyoucRS2Ykr/basic-inframeasure-theory
https://transformer-circuits.pub/2021/framework/index.html
https://www.lesswrong.com/posts/N5Jm6Nj4HkNKySA5Z/finite-factored-sets
http://intelligence.org/files/TDT.pdf
https://arxiv.org/abs/2212.03827

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nadya Petrova 20 апреля 2023 автор

@kadron141, ага, но начал ты с того, что больше доверяешь ML ресёрчерам, потому что у них есть формулы, в отличие от людей, которые занимаются алайнментом. Я показала статьи от людей, занимающихся алайнментом, у которых есть формулы.
Сейчас ты говоришь, что не видишь в этой подборке, где мат моделями доказываются оценки, когда появится AGI и мы все умрём. Есть ли формулы у ML ресёрчеров о том, что это не произойдёт? Если нет, то причём здесь то, что ты им доверяешь in the first place?
Вот модель biological anchors про то, как, например, можно оценивать такие штуки: https://astralcodexten.substack.com/p/biological-anchors-a-trick-that-might
Но вообще выше @leeaao писал, что суперфоркастеры относительно хорошо предсказывают что-то очень непонятное (можно просто посмотреть их рейтинг верных предсказаний, которые они делают публично). И там было упоминание моего дружочка Миши Ягудина, который сделал одну из лучших форкастинговых компаний, так что примерно представляю, как это работает.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nadya Petrova 20 апреля 2023 автор

@kadron141,

Очень трогательно, что ты мне объясняешь про бремя доказательства. Давай теперь я поясню, что произошло. Произошло то, что ты пришёл и написал комментарий, в котором сравниваешь:

В этой теме очень часто упоминаются такие слова как research и researcher. Люди даже дают какие-то проценты вероятностей. При этом я ни разу не видел ни одной формулы, ни одного построенного на данных а не на мнении автора графика, какого-то реального исследования, математической модели в конце концов

В то время как сами специалисты по ML/AI оперируют реальными научными и техническими инструментами, и им мне верится больше. Кто же прав? :)

Ты сравниваешь, что спецы по ML оперируют формулами, а по алайнменту нет. Когда я привела тебе примеры алайнмент ресёрча с формулами, ты сказал, что 1) это не алайнмент ресёрч, а "научные статьи по другим темам", 2) в этих работах нет оценок, когда придёт AGI.

Первое утверждение просто неверно.
Второе утверждение верно — и я ответила, что я не пыталась привести эти примеры, потому что твой коммент был про другое. И пояснила: ты сравнивал алаймент ресёрчеров и ML ресёрчеров, мол вторым ты доверяешь больше из-за формул. Но у них тоже нет формул про таймлайны. Значит, речь шла про то, что в алайнменте в целом нет формул. Или твоё сравнение одних и других просто было непонятно к чему.

И когда я тебе про это сказала — типа не подменяй плиз предмет дискуссии на ходу, ведь ML ресёрчеры тоже не обосновывают формулами обратное, а мы говорили про сравнение — ты реагируешь словно я не понимаю, что такое бремя доказательства.

Меня выматывает твоя манера вести дискуссию. Ты ни разу не признал, что я несколько раз опровергла твои утверждения, и продолжал набрасывать новые, при этом ещё и подменяя суть того, о чём мы говорили. Конечно, никто же не следит за тредом внимательно, почему бы не завоевать классы риторическими приёмами.

Ещё на всякий случай: кажется, ты считаешь, что алайнмент — это наука о том, когда придёт AGI и с какой вероятностью он нас убьёт. Это вообще неверное понимание. Поэтому тебе и показалось, что скинутые мной статьи про что-то другое.

Мне очень не хочется дальше тратить время на этот разговор. Раунд.

Развернуть 1 комментарий

Aleksei Paletskikh 20 апреля 2023

[edit] Немного опоздал, Надя уже написала комментарий про то же самое

@kadron141,
Хочу обратить ваше внимание на то, что вы подменяете понятия (что такое технический ресёрч и кто им занимается), и игнорируете конкретные аргументы, на которые не можете ответить (статья про biological anchors)

Первый ваш комментарий: «При этом я ни разу не видел ни одной формулы, ни одного построенного на данных а не на мнении автора графика, какого-то реального исследования, математической модели в конце концов… В то время как сами специалисты по ML/AI оперируют реальными научными и техническими инструментами, и им мне верится больше»
Кажется, тут происходит подмена понятий. Вы сначала говорите про то, что специалисты в ML оперируют реальными техническими инструментами — но они это делают в своей области, в capabilities, а не в оценке вероятности ИИ-апокалипсиса или чего-то подобного. Но сейфти ресёрчеры точно так же пользуются техническими инструментами в своей области — вам сначала скинули конкретных авторов, а потом даже собрали ссылки в комментарии
Но после этого вы начинаете утверждать, что нет технических оценок вероятности катастрофы. Но тогда пункт про «я верю специалистам, у которых есть технический инструментарий» перестаёт быть релевантным, потому что они применяют эти технические инструменты совсем не к этим предсказаниями. Более того, 1) если вы хотите верить «специалистам, которые занимаются техническими задачами», то половина именно ML специалистов, не сейфти, оценивает вероятность ИИ катастрофы в хотя бы 10%, и 2) есть техническая статья про biological anchors, которую вам выше скинули, и которая как раз даёт оценки на то, когда именно появится AGI. Так что бремя доказательства сейчас на вас — покажите техническое исследование, которое доказывает, что до AGI больше ста лет, или же что он невозможен

PS да, нет конкретных чисел, распределений вероятностей и прочего. С будущим и новыми технологиями так вообще часто бывает) Но есть оценка сверху, сделанная конкретными людьми конкретными методами. Как раз чтобы разговор мог стать предметным, чтобы можно было оценивать методологию и оспаривать/соглашаться с конкретными утверждениями
Но в остальном да, по сути, есть только экспертные оценки. И если что, эксперты стабильно недооценивают прогресс в вопросах «когда ИИ научиться делать Х». Если хотите, могу поискать конкретных ссылок на опросы 2015-2020 лет, в которых предсказывалось, что ИИ сможет сделать Х не раньше года Y, и ИИ стабильно обгонял эти предсказания

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Nadya Petrova 20 апреля 2023 автор

@kadron141, прокомментируй тогда, пожалуйста, как наличие формул у ML ресёрчеров говорит о том, что их оценкам рисков можно доверять больше, чем оценкам рисков от алайнмент ресёрчеров? при том, что формулы в ресёрче есть у обеих групп, а формул про риски у ML ресёрчеров нет. для простоты можешь предположить, что у алайнмент ресёрчеров тоже нет (хотя я тебе выше привела контрпример).

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Leonid Khomenko 21 апреля 2023

@kadron141,

ML ресёрчеры разрабатывают теорию и научную базу по нейросетям. Из этой базы никак не следует наличие риска в 30% на развитие AGI. Там совершенно конкретные вещи про то как оно должно работать и какие у этого технические ограничения.

Нейросети это дерьмо нового уровня. Это не строительство мостов или даже не написание когда, где у тебя высокий уровень предсказуемости.
У ML ресерчеров уже есть много примеров появления в модели новых свойств, которые они не предполагали заранее. И не то чтобы могут объяснить откуда они появились вообще. Например, способность LLMs писать код была сюрпризом.
Текущие модели кажется безопасны. Но есть логические аргументы, что через какое-то время у новых моделей начнут появляться сильно опасные для нас свойства. Это риск, потому что нет способов проверить модель перед запуском и получить технические ограничения.
На оценку риска влияет много факторов. По большинству факторов у нас пока нет научного консенсуса. Даже среди ребят из OpenAi и Deepmind мнения по разным вопросам сильно расходятся. Поэтому ты видишь оценки от 2 до 90%
Если ты рассуждаешь про что-то ещё не изученное и высоко оцениваешь риск - не значит что ты паникёр. Просто у тебя другие логические аргументы и предпосылки. Которые хорошо бы проверить научными методами
Но на это к сожалению нет времени. Потому что ML ресерч развивается намного быстрее. А как убрать риск и сделать AGI безопасным мы всё ещё не знаем

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Павел Грязнов 26 апреля 2023

@kadron141,

В смысле, "точно не знаем"? Они же не с неба свалились, а показывают то поведение, которое в них программно и заложено, разве нет?

Это просто разъёб канешн читать всю дискуссию, а потом вот это.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Павел Грязнов 27 апреля 2023

@alexadamenko, но твои читать приятно) восхищаюсь твоей выдержкой!

Развернуть 1 комментарий

Ihar Balykin Физик, программист 22 апреля 2024

Ни в коем случае не оспариваю факта уместности озабоченности в вопросе безопасности ИИ.

Более того, считаю, что и без AGI уже существуют серьезные основания для озабоченности, в том числе по части предпринимаемых государствами мер.
Пугает перспектива монополизации правды под эгидой борьбы с fake news. Можно разные сценарии себе представить - например блокировка показа определенных картинок/файлов на устройстве, если у них нет правильной цифровой подписи. https://contentauthenticity.org/

Или, например, механизмы блокировки использования хардвэра, типа GPU, основанные на геолокации или еще чем-нибудь в духе.
Или уже существующие (или планируемые?) регуляции по поводу моделей двойного назначения и того, что должны делать американские облака, если я правильно понял планы американских законодателей (Propose regulations that require United States IaaS Providers to submit a report to the Secretary of Commerce when a foreign person transacts with that United States IaaS Provider to train a large AI model). https://www.whitehouse.gov/briefing-room/presidential-actions/2023/10/30/executive-order-on-the-safe-secure-and-trustworthy-development-and-use-of-artificial-intelligence/

Что касается AGI - это мое личное мнение, но если я правильно понял, все упирается в пределы применимости scaling hypothesis + наличие потенциально невыявленных ботлнеков. Любопытен в этом отношении вопрос потенциального ботлнека по энергетике, наводит на мысли. Думаю, что с прогнозами тут ситуация может быть как с термоядерным синтезом (вот-вот, в ближайшие условные 10 лет последние полвека). Тем не менее, думаю, что нет оснований полагать, что это не случится и в ближайшие годы.

Но вот чего я не вполне понимаю - это как принципиально можно договориться об ограничениях на обучение ИИ. Приводится аналогия с ядерными испытаниями, но она не вполне верная, на мой взгляд. Насколько мне известно, существуют достаточно очевидные фактические признаки проведения ядерных испытаний, относительно легко регистрируемые различными техническими средствами. Также, если я правильно понимаю, существуют косвенные признаки, по которым можно установить, что та или иная страна готовит ядерную программу. Мне кажется, что с искусственными интеллектом так не выйдет, потому что датацентры - вещь достаточно распространенная на сегодняшний день.
То есть возникает проблема невозможности технического контроля этой деятельности (обучения моделей). А в такой реальности, с учетом того, что все понимают возможную пользу от AGI (и возможный урон от проигрыша в такой "гонке") - как договорится? Как страна А может быть уверена в том, что страна Б не ведет обучения таких моделей? Только на основании честного слова?
Естественно, можно подумать о механизмах аудита и каких-то специальных ограничениях на уровне хардвэра, используемого для ИИ, но я не верю, что тут также возможно установление взаимного доверия. А даже если такая регуляция будет применена - это все равно не исключит рисков.
Поэтому считаю что на данном этапе любая инициатива по контролю за обучением моделей упирается в технический вопрос взаимного контроля, который не решен, и, на мой взгляд, вряд ли может быть решен в ближайшее время.
А механизмы, которые под видом такого контроля могут быть внедрены - скорее всего будут использованы для получения конкуретного преимущества. Можно много разного нафантазировать - например, квотирование продажи GPU по разным регионам. Но вполне ясно, что тот кто держит технологию, сможет использовать регуляции как дубину. Мне кажется, что вряд ли кто-то добровольно на такие регуляции согласится.

Развернуть 1 комментарий

Александр Гершевич 22 апреля 2024

@prosto_igor, Думаю, что мысль невозможности контроля за обучением ии не совсем верна.
Точнее она конечно верна в данный отрезок времени. А в перспективе, факт обучения больших моделей будет обнаруживаем по вторичным факторам - большие цоды, активная их стройка, выделение ими тепла, что можно заметить издалека, массовые закупки определенных чипов, и т.д. и т.п.
Короче как с криптофермами (которые раз раз да находят), только размах существенно больше.

Развернуть 1 комментарий

Ihar Balykin 22 апреля 2024

@momai, Да, согласен, сам хотел по этому поводу написать добавочный комменатрий, что это все только "пока". Потому что если эволюция ИИ заведет нас в область гигаватных ЦОДов, то все может стать проще.
Но отказался эту добавочку писать, потому что опять же относительно несложно нафантазировать контрмеры.
Распределенное обучение, маскировка ЦОДов под объекты энергетики в первую голову.
С чипами да - но тут я уже выше писал. Если ситуация дойдет до "огораживания" по чипам - это уже впишется в описанный выше сценарий.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Denis Sobolev Питонист, дата скрапер, создатель и внедрятель ЛЛМ агентов под задачи 20 апреля 2023

Ну, имхо и вопросы от меня как от "обывателя": а почему "модели мощнее ГПТ-4" обязательно равно "AGI"? Это немного разные плоскости и задач, и типов сетей, нет? Зачем создавать ИИ общего назначения и давать ему в принципе какую-то степень свободы? Специализированные модели под специализированные щадачи, имхо, получше будут.

Опять же, есть некоторые уже радикализировавшиеся граждане, которые топят за запрет на разработку "ИИ" вплоть до права применять оружие и насильственным путём вторгаться в страну, которую обвинят в строительстве кластера ГПУ (это привет нелюбимому мной автору нелюбимого же фанфика "Гарри Поттер и Методы Рационального Мышления"). То есть, по сути, теперь есть огромный шанс появиться новому формальному поводу вторжения для проворачивания своих делишек вдогонку к "терроризму".
Точно так же, как и появится повод ограничивать неугодных физ-/юрлиц и государства под той же эгидой.

Ну и наконец: а что плохого в shadow jobs? Как правило, они берутся, когда денег на одной работе сильно не хватает, а есть запас времени, навыков и внимания для осуществления трудовой и предпринимательской деятельности более, чем на текущей работе.

Развернуть 1 комментарий

Denis Sobolev Питонист, дата скрапер, создатель и внедрятель ЛЛМ агентов под задачи 21 апреля 2023

И вдогонку к подозрительно нехорошим шевелениям и спекуляциям под эгидой борьбы за всё хорошее против всего плохого:

https://habr.com/ru/news/729942/

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Artemii Novoselov Postdoctoral Research Fellow 17 апреля 2023

😱 Комментарий удален его автором...

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Artemii Novoselov Postdoctoral Research Fellow 17 апреля 2023

А с каким человечеством «выравнивать» ИИ можно, а с каким нельзя? Кто будет решать какие ценности хорошо, а какие плохо?

Развернуть 1 комментарий

Vladimir Brejcha 18 апреля 2023

@crimeacs, из слов автора я заметил, что «злом» по дефолту считают Китай, а добром видимо Америку. Интересно какое мнение у Китая по этому вопросу.
Ценности западных и восточных культур, в том числе и моральные правила — часто различаются вплоть до полной противоположности.
Мне кажется забавным как Американцы открыто обвиняют Китайцев в «злодейских планах», в то время сами устраивая войны направо и налево.
Никакого AI соглашения не получится, я думаю, тут лучшие умы планеты не могут даже между собой эмоции успокоить.
Но помечтать не вредно :)

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Vladimir Brejcha 18 апреля 2023

@alexadamenko, я не специалист, просто самому интересно, как планируется прийти к договоренности с востоком, если называть Китай «опасным агентом».
Еще интересно есть-ли в письме подписи китайцев, или участвовали одни американцы?
Еще интересно запустили-ли письмо в китайские медиа или только в американский твиттер?

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Vladimir Brejcha 18 апреля 2023

@alexadamenko, согласен с твоей точкой зрения 👍

Развернуть 1 комментарий

Andrey Lukyanau Gamedev. Executive Producer 18 апреля 2023

Спасибо.

Доступное изложение для низкого уровня понимания темы. И хорошая стартовая точка переноса части внимания.

Вообще сразу взрослый мощный интеллект без обвеса эмоций, норм и правил, заточенный только на достижение целей с большим пулом ресурсов(возможностей) и скорее всего без инстинкта самосохранения - это сильно.

Развернуть 1 комментарий

Mikhail Mikhailov Site Reliability Engineer 18 апреля 2023

А что если начать тренировать ИИ который должен решить проблему выживания человечества в новых условиях?
Мы живем в эпоху когда мне проще поверить технологическому прогрессу, к сожалению.

Развернуть 1 комментарий

Leonid Khomenko 21 апреля 2023

@setox, можно ли доверять ИИ, которого мы попросили сделать так, чтобы мы могли доверять ИИ?

Если это будет более слабый и безопасный ИИ, которому мы уже доверяем, там появятся новые проблемы. Например, пока нет метрики, показывающей, что целевая нейронка заалайнена и ей можно доверять. И еще много чего.

Развернуть 1 комментарий

Mikhail Mikhailov 23 апреля 2023

@leeaao, это точно. Что такое доверие по отношению к ИИ тоже вопрос открытый.
И все равно, я за то чтобы рискнуть.

Развернуть 1 комментарий

Никита Копылов Business Analysis and Compliance 18 апреля 2023

На каждую Машину найдётся свой Самаритянин.

Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?

Войти или Вступить в Клуб