Что вы автоматизировали в Comet?

 Публичный пост

Comet — ИИ-фёрст браузер от Perplexity, в котором есть агентский режим. То есть, браузер может выполнять действия в интернете от имени пользователя.

Пользуюсь им уже несколько месяцев, но агентский режим игнорировал — не находил кейсов. Только недавно случился ИИ-момент и я автоматизировал выгрузку сербских слов с сайта школы в сайт с карточками для изучения.

После каждого урока, на сайте школы есть отдельная вкладка со ссылкой на карточки в Quizlet. Плюс, в процессе урока преподаватель пишет дополнительные слова в чат.

Проблемы две:

  1. Я пользуюсь не Quizlet, а Noji
  2. Слова из чата выгружать запарно (копирование всего чата сделано криво)

В итоге придумалось несколько шорткатов для браузера:

  1. На странице со словами урока в Quizlet запускаю /srb-extract-quizlet, который через пыточный UX доводит меня до состояния «экран с парами слов для копировани». Результат руками вгружаю в Noji.
  2. На странице урока на платформе запускаю /srb-chat-extract, который сам листает чат, выгружает слова и показывает их мне в нативном для Noji формате. Результат руками вгружаю в Noji.
  3. Внутри Noji запускаю /srb-cleanup-cards, который делает все карточки "Reversed" (чтобы учить и сербский-русский и русский-сербский) и проверяет на наличие дубликатов.

Как объединить все три шортката в один, пока не придумал — агент не очень хорошо умеет ходить между сайтами и все время путается.

А какие задачи вы уже делегрировали агентам в браузере?

10 комментариев 👇
Дима Черненьков коучу с применением IFS, пишу, на работе получаю 💰 за скучное 2 часа назад

Делал несколько подходов к Comet, но каждый раз ощущения одни и те же - то ли лыжи не едут, то ли со мной что не так.

Почту разобрать по запросу (как в их рекламных материалах написано) - это он кое-как справился, пока всё было просто, из серии "просто всё заархивируй". Все остальные штуки, вроде попыток изменить настройки отображения (у меня с давних времен были какие-то настроены сегменты), или сформулированное естественным языком "найди вот это старое письмо в почте" - он не справился (хотя ключевое слово, которое я ему дал, забитое в поиск, тут же привело к нужному результату).

С календарем он плюс-минус адекватно сделал для меня пару самых примитивных задач ("поставь встречу"), но как только я просил что-то более сложное (например, у меня есть отдельный календарь, у него есть имя, посчитай все слоты в нем на этой неделе - это просто мой счетчик окон для работы с клиентами в коучинге/терапии) - он начинал ошибаться, делать непредсказуемую херню и так далее. Я получил нужный результат, сильно не сразу, и по соотношению сил и времени это было "лучше сам сделаю".

В google sheets я пробовал чем-то надуманным его нагрузить, ничего сложнее "сложить в столбик" он не может, он десять минут будет думать, пытаясь написать конструкцию с if и скажет, что не вышло что "он сделаль", хотя ничего не сделал.

На яндекс.картах попросил проложить маршрут - чудовищно долго он справлялся с этим заданием,выполнил его неточно (один из сегментов пути был не на том транспорте, на котором я просил), ну да ладно. Зато это породило чудесный нейромем, надо запостить куда-нибудь.

оказывается у Ai-агентов точно такие же жизненные проблемы
оказывается у Ai-агентов точно такие же жизненные проблемы

Да, теоретически, он может например пойти в соседнюю вкладку и в тудушник что-то вписать. Но я быстрее это руками сделаю.

Чем я пользуюсь регулярно - он неплохо (лучше яндекса) пересказывает ютуб и статьи, хорошо отвечает на уточняющие вопросы, это нативно получается, приятнее, чем ходить ссылку постить туда-сюда.

Короче, хз, может это старость, может надо лучше и дотошнее писать промты, но не знаю. Мне это теперь также неинтересно делать, как осваивать новые телефоны. Раньше было интересно - теперь нет, вообще плевать.

  Развернуть 1 комментарий

@DmitriyChernenkov,

пересказывает ютуб

А в YouTube есть уже встроенный пересказ. Очень удобно, никуда ходить не надо вроде.

  Развернуть 1 комментарий

@Alex_Gift, прямо на Ютубе силами Ютуба?
Или расширениями хрома?

  Развернуть 1 комментарий

Тут даже не вопрос в том, что данные сливаются маркетологам. Они везде сливаются.

Самая большая проблема в Комете - это то, что дыры в безопасности будут зиять и закрыть их будет просто невозможно. Любой приказ этому браузеру может закончится тем, что твои карточки уйдут не к маркетологам, а к каким-то ребятам в Индии.

Поэтому, никаких логинов, паролей и карточек.

По факту использовал его пару раз. Если мне надо найти котакты какого-то чувака на линкедине, я заряжаю его профиль в комет, и прошу прочесать интернеты в поисках его личных контактов. В 60% случаев такая фигня работает.

Плюс, когда на Хабре товарищь Майор выкладывает очередной высер в стиле "Российские сотрудники НИИХУЯ только что выдумали невероятный рецепт жидкости, которая как-бы сращивает два куска бумаги" то Комет обычно может быстро найти эту жидкость на китайских маркетплейсах, и показать, что это всё - клей.

  Развернуть 1 комментарий
Alex V ORM (интернет репутация) 2 часа назад

я обычно прошу что-то простое, типа проверить пришли ли заказы на озон и в вб. Самое сложное что давал - найти в почте последние письма от банка и занести в гуглодоковскую табличку информацию о приходах и расходах. Условно справился, но понял что руками проще и быстрее всё же)

  Развернуть 1 комментарий

Я пользуюсь Comet как вторичным браузером. Не доверяю ему свои логины-пароли, тем более привязанные к карточкам. При этом использую исключительно для агентских целей.
Основной сценарий: "обойди маркетплейсы X, Y и Z и найди мне товары нужной категории, подходящие по моим критериям"

  Развернуть 1 комментарий

"обойди маркетплейсы X, Y и Z и найди мне товары нужной категории, подходящие по моим критериям"

а разве не проще это делать через grok или chatgpt? они же могут в поиск, еще и отзывы парсят с сайтов типа редита и дают сводку по плюсам и минусам

  Развернуть 1 комментарий

@gwyllium, perplexity все то же самое делает. Выбрал пользоваться ими, а не grok/chatgpt по 2м причинам - меньше карячится, чтобы оплатить из РФ лично мне было, а еще разрабы постулируют, что галюны это баг, а не фича, и вообще на всё дают ссылки на оригинальный сайт.

  Развернуть 1 комментарий

Открыл 50 вкладок HH c резюме, попросил выбрать которые подходят под нашу вакансию. Один раз сработало приемлемо (дал список ФИО, прокомментировал кто подходит на 100%, кто с оговорками).
Но потом он почему то перестал видеть другие вкладки, видел только 1 и начал пытаться там че то накликать.
Вердикт - сыровато. (

  Развернуть 1 комментарий

Думаю, и так достаточно сливается всем тов. майорам и маркетинг специалистам. Не хотелось бы максимально интенсифицировать слив всего себя с помощью ИИ.

Если читать мелкий шрифт, вроде API до сих пор обещает приватность. Использую API, но тоже не особо верю.

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб