Что вы автоматизировали в Comet?

 Публичный пост

Comet — ИИ-фёрст браузер от Perplexity, в котором есть агентский режим. То есть, браузер может выполнять действия в интернете от имени пользователя.

Пользуюсь им уже несколько месяцев, но агентский режим игнорировал — не находил кейсов. Только недавно случился ИИ-момент и я автоматизировал выгрузку сербских слов с сайта школы в сайт с карточками для изучения.

После каждого урока, на сайте школы есть отдельная вкладка со ссылкой на карточки в Quizlet. Плюс, в процессе урока преподаватель пишет дополнительные слова в чат.

Проблемы две:

  1. Я пользуюсь не Quizlet, а Noji
  2. Слова из чата выгружать запарно (копирование всего чата сделано криво)

В итоге придумалось несколько шорткатов для браузера:

  1. На странице со словами урока в Quizlet запускаю /srb-extract-quizlet, который через пыточный UX доводит меня до состояния «экран с парами слов для копировани». Результат руками вгружаю в Noji.
  2. На странице урока на платформе запускаю /srb-chat-extract, который сам листает чат, выгружает слова и показывает их мне в нативном для Noji формате. Результат руками вгружаю в Noji.
  3. Внутри Noji запускаю /srb-cleanup-cards, который делает все карточки "Reversed" (чтобы учить и сербский-русский и русский-сербский) и проверяет на наличие дубликатов.

Как объединить все три шортката в один, пока не придумал — агент не очень хорошо умеет ходить между сайтами и все время путается.

А какие задачи вы уже делегрировали агентам в браузере?

35 комментариев 👇
Дима Черненьков коучу с применением IFS, пишу, на работе получаю 💰 за скучное 17 ноября 2025

Делал несколько подходов к Comet, но каждый раз ощущения одни и те же - то ли лыжи не едут, то ли со мной что не так.

Почту разобрать по запросу (как в их рекламных материалах написано) - это он кое-как справился, пока всё было просто, из серии "просто всё заархивируй". Все остальные штуки, вроде попыток изменить настройки отображения (у меня с давних времен были какие-то настроены сегменты), или сформулированное естественным языком "найди вот это старое письмо в почте" - он не справился (хотя ключевое слово, которое я ему дал, забитое в поиск, тут же привело к нужному результату).

С календарем он плюс-минус адекватно сделал для меня пару самых примитивных задач ("поставь встречу"), но как только я просил что-то более сложное (например, у меня есть отдельный календарь, у него есть имя, посчитай все слоты в нем на этой неделе - это просто мой счетчик окон для работы с клиентами в коучинге/терапии) - он начинал ошибаться, делать непредсказуемую херню и так далее. Я получил нужный результат, сильно не сразу, и по соотношению сил и времени это было "лучше сам сделаю".

В google sheets я пробовал чем-то надуманным его нагрузить, ничего сложнее "сложить в столбик" он не может, он десять минут будет думать, пытаясь написать конструкцию с if и скажет, что не вышло что "он сделаль", хотя ничего не сделал.

На яндекс.картах попросил проложить маршрут - чудовищно долго он справлялся с этим заданием,выполнил его неточно (один из сегментов пути был не на том транспорте, на котором я просил), ну да ладно. Зато это породило чудесный нейромем, надо запостить куда-нибудь.

оказывается у Ai-агентов точно такие же жизненные проблемы
оказывается у Ai-агентов точно такие же жизненные проблемы

Да, теоретически, он может например пойти в соседнюю вкладку и в тудушник что-то вписать. Но я быстрее это руками сделаю.

Чем я пользуюсь регулярно - он неплохо (лучше яндекса) пересказывает ютуб и статьи, хорошо отвечает на уточняющие вопросы, это нативно получается, приятнее, чем ходить ссылку постить туда-сюда.

Короче, хз, может это старость, может надо лучше и дотошнее писать промты, но не знаю. Мне это теперь также неинтересно делать, как осваивать новые телефоны. Раньше было интересно - теперь нет, вообще плевать.

  Развернуть 1 комментарий

@DmitriyChernenkov,

пересказывает ютуб

А в YouTube есть уже встроенный пересказ. Очень удобно, никуда ходить не надо вроде.

  Развернуть 1 комментарий

@Alex_Gift, прямо на Ютубе силами Ютуба?
Или расширениями хрома?

  Развернуть 1 комментарий

@Rastishka, прямо. Там кнопка AI, и можно сказать чтобы рассказала про видео или ответила на конкретные вопросы.

US YouTube here. Может в других регионах такого нет, не знаю.

  Развернуть 1 комментарий

Тут даже не вопрос в том, что данные сливаются маркетологам. Они везде сливаются.

Самая большая проблема в Комете - это то, что дыры в безопасности будут зиять и закрыть их будет просто невозможно. Любой приказ этому браузеру может закончится тем, что твои карточки уйдут не к маркетологам, а к каким-то ребятам в Индии.

Поэтому, никаких логинов, паролей и карточек.

По факту использовал его пару раз. Если мне надо найти котакты какого-то чувака на линкедине, я заряжаю его профиль в комет, и прошу прочесать интернеты в поисках его личных контактов. В 60% случаев такая фигня работает.

Плюс, когда на Хабре товарищь Майор выкладывает очередной высер в стиле "Российские сотрудники НИИХУЯ только что выдумали невероятный рецепт жидкости, которая как-бы сращивает два куска бумаги" то Комет обычно может быстро найти эту жидкость на китайских маркетплейсах, и показать, что это всё - клей.

  Развернуть 1 комментарий

@newarked, но по сути чатжпт сделает то же самое в твоих примерах, или комет чем-то лучше?

  Развернуть 1 комментарий

@sol, Чуть лучше. Он открывает ссылки и смотрит на них.

  Развернуть 1 комментарий
🕵️ Юзер скрыл свои комментарии от публичного просмотра...
Ленар Шагиев Руководитель команды разработки 17 ноября 2025
  • «Найди мне в этом идиотском интерфейсе google cloud где создать api-ключ для доступа к почте»
  • «не понимаю, где тут открыть доступы сотруднику, найди»
  • «расскажи кратко суть»
  Развернуть 1 комментарий
Nick Sandalov Quality Engineering Manager 24 ноября 2025

Использую Atlas, но одна фигня так-то.
Основной юзкейс - "Вот я положил товар в корзину, а теперь пошерсти весь интернет на предмет наличия скидок, примени все найденные купоны, выбери лучший.".
Почти всегда можно найти 5-15% скидку, иногда везет сильно больше.

  Развернуть 1 комментарий
Daniel Khaliulin Технический менеджер 21 ноября 2025

Собрал список клиник, которые входят в мою страховку, и зарядил его на сайте с отзывами о врачах найти мне топовых врачей только в этих клиниках. На выходе 5 врачей с лучшими оценками, которых одобряе моя страховая.

Сам бы копался, наверно с час-другой

  Развернуть 1 комментарий

Создал задачу "ежедневно проверяй наличие билетов на концерт по такой-то ссылке". Результат:

This cannot be reliably automated with the tools available here, because programmatic access to the ticket page is currently failing and there is no built‑in background monitoring or push‑notification mechanism tied to that site.
...
As a data engineer, you could run a simple Python script on a small VPS or a home server that: ...

  Развернуть 1 комментарий

@flash_grenade,

Кстэ, это Тим одно сделать если поставить Claude-cli и прикрутить к нему playwright-mcp.

Вместе эти загогулины дают тебе возможность работать с браузерным ИИ в консоли.

  Развернуть 1 комментарий

Открыл 50 вкладок HH c резюме, попросил выбрать которые подходят под нашу вакансию. Один раз сработало приемлемо (дал список ФИО, прокомментировал кто подходит на 100%, кто с оговорками).
Но потом он почему то перестал видеть другие вкладки, видел только 1 и начал пытаться там че то накликать.
Вердикт - сыровато. (

  Развернуть 1 комментарий

@Rastishka, продолжаю безуспешно давать шанс Comet.

Попросил его выбрать наушники среди продаваемых в нашей деревне брендов.

На одном сайте не смог кликать по ссылками почему то, так и завис, ссылки были обычные a href="".

На втором сайте смог покликать, но выбрал наушник с 1 ухом.......

  Развернуть 1 комментарий

Я пользуюсь Comet как вторичным браузером. Не доверяю ему свои логины-пароли, тем более привязанные к карточкам. При этом использую исключительно для агентских целей.
Основной сценарий: "обойди маркетплейсы X, Y и Z и найди мне товары нужной категории, подходящие по моим критериям"

  Развернуть 1 комментарий

Думаю, и так достаточно сливается всем тов. майорам и маркетинг специалистам. Не хотелось бы максимально интенсифицировать слив всего себя с помощью ИИ.

Если читать мелкий шрифт, вроде API до сих пор обещает приватность. Использую API, но тоже не особо верю.

  Развернуть 1 комментарий

@Alex_Gift, кмк, главный прайваси консёрн в этом деле это даже не бэкдоры для майоров и маркетологов, а то что он может просто случайно отправить не то и не туда (условно, разослать данные карты всему списку контактов)

  Развернуть 1 комментарий

Я делаю арт-проект: беру телеграм-канал моей подруги, где посты удачно пронумерованы и делаю из каждого треки в жанре "dark but optimistic techno". Тексты и музыку генерят ChatGPT и Suno, а я только продюссирую. Думал, идеальный кейс, чтоб натравить на это Комет, но он после скольких-то итераций стал выдумывать посты сам, в стиле конечно, но никакого отношения к исходному каналу не имеющие - и вышла обаятельная галиматья.

  Развернуть 1 комментарий
Alex V ORM (интернет репутация) 17 ноября 2025

я обычно прошу что-то простое, типа проверить пришли ли заказы на озон и в вб. Самое сложное что давал - найти в почте последние письма от банка и занести в гуглодоковскую табличку информацию о приходах и расходах. Условно справился, но понял что руками проще и быстрее всё же)

  Развернуть 1 комментарий

"обойди маркетплейсы X, Y и Z и найди мне товары нужной категории, подходящие по моим критериям"

а разве не проще это делать через grok или chatgpt? они же могут в поиск, еще и отзывы парсят с сайтов типа редита и дают сводку по плюсам и минусам

  Развернуть 1 комментарий

@gwyllium, perplexity все то же самое делает. Выбрал пользоваться ими, а не grok/chatgpt по 2м причинам - меньше карячится, чтобы оплатить из РФ лично мне было, а еще разрабы постулируют, что галюны это баг, а не фича, и вообще на всё дают ссылки на оригинальный сайт.

  Развернуть 1 комментарий
Vlad Priymak Senior Backend Developer 17 ноября 2025

Я сам все еще в поисках кейсов применения.

Пока все сводится к бытовому применению, из последнего, я просил собрать корзину продуктов на амазоне для своей день рожденческой вечеринки, что в комете, что в атласе это было не очень плохо, но оооооочень долго, еще эти вечные просьбы что-то подтвердить, а продолжить ему или нет, короче выгляди как боль пока и быстрее чтото сделать ручками.

Я вижу эти браузеры с ии просто как точку входа в продукт, как хром входом в гугл и все. На современных сайта так много контекста, что агент просто теряется при многошаговых задачах в рамках сайтов(собери корзину, найди билеты и пр).

Считаю, что тут будущее все еще за API/MCP, когда агент дергает ручки и не отвлекается на весь визуальный мусор и не засоряет себе контекст.

  Развернуть 1 комментарий
Дмитрий Тимаков Руководитель управления AI 20 ноября 2025

Моя топ-ванлав-фича: шорткат форм регистраций. В контексте данные для форм и дальше - вижу форму, прошу заполнить (но не отправлять).
А еще - переводы, суммаризации в разные форматы, извлечение нужных данных

  Развернуть 1 комментарий

@timakovdmitry, а где агент берет информацию для заполнения форм?

  Развернуть 1 комментарий

@MyDen, а прямо в промте к шорткату.

  Развернуть 1 комментарий
Александр Элеазер Поддерживаю контентные проекты 24 ноября 2025

Использовал для модерации телеграм-каналов в парсере. Создал ему страницу с двумя кнопками - мусор и одобрено. И он кликал. В принципе неплохо, планирую пользоваться. Иногда халтурит, и постоянно пытается слиться, типа "еще же 2000 каналов, это так много, пойду посмотрю как бы это дело автоматизировать". В итоге максимально жесткий промт и 100 каналов за проход ему ставлю.

  Развернуть 1 комментарий
Дмитрий Бабенков Автоматизирую всякое 17 ноября 2025

Комет годится как десктоп приложение perplexity, потому что само приложение perplexity у меня работало криво.

Закидывать туда запросы на ресерч всякой дряни и держать во вкладках вполне удобно. Но авторизацию важных сервисов чет не хочется там делать

  Развернуть 1 комментарий

Yo bitchezzzz! Chrome browser with Gemini in da house!

More of the same.

  Развернуть 1 комментарий

@Alex_Gift, подскажи пожалуйста, как это включить? У меня актуальная версия chrome, но такой кнопки нет

  Развернуть 1 комментарий

@dmenshikov, burger Menu (three dots) - Open Gemini in Chrome.

BUT! I really don't recommend it either.

If I need Gemini, I go to the free aistudio.google.com. There, I enter only the info I control. Please don't feed ALL your browsing to any AI - it's dangerous.

  Развернуть 1 комментарий

Юзал ChatGPT Atlas для поиска квартир — формочку поиска он конечно заполнял минут 10, зато с идеей "посмотри на фотки и собери мне ссылки на светлые просторные квартиры" справился неплохо.

  Развернуть 1 комментарий

Я делала в комете домашку по английскому =)
Но в целом вижу его скорее как помощника в контекстных сценариях работы, когда нужно поправить документ, найти недостающие данные и тд

  Развернуть 1 комментарий
Alex V ORM (интернет репутация) 29 ноября 2025

😱 Комментарий удален его автором...

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб