Что это?
Всем привет! Хочу рассказать про то как мы с другом сделали брелок с ии ассистентом. И как вы можете заиметь такой же за 50$.
Главная фича - это умный диктофон. Вы с помощью одной большой кнопки (как walkie-talkie) наговариваете заметки, а дальше ИИ делает то, что умеет лучше всего - переписывает поток сумбурных мыслей в красивый стройный текст выделяя главные идеи.
Использую его чтобы поработать когда клавиатурой пользоваться не удобно. Во время прогулки, езды на велосипеде, в поезде.
В целом это даже позволяет перенести часть работы в более приятную обстановку. Можно писать посты в блог, или строить планы смотря на закат на берегу Вислы, вдыхая запах леса, а не в душных 4х стенах. Я называю это - работать со свободными глазами.
Фото моего кабинета
upd: Еще один постоянный кейс - это запись конспектов ютуб-ролика, или аудио-книги. Ставлю на паузу, диктую свои мысли, продолжаю. С каждого ролика получается аккуратная заметка на тему.
Мотивация
Идея иметь карманного помощника который всегда готов к работе - давно крутилась у меня в голове.
Да, можно сделать приложение в смартфоне, но, хочется простоты и лаконичности. Чтобы не надо было искать иконку приложения, целиться в кнопки в интерфйсе. Хочется иметь одну кнопку, которую ты можешь даже с закрытыми глазами нажать и начать говорить.
Ну и конечно же есть определенный шарм в носимых в отдельных гаджетах-брелках вроде Тамагочи или Flipper Zero.
Глава 1. Девайс.
Ок, раз мы разрабатываем гаджет - надо начать самого девайса. Мини-компьютеры raspberry pi сейчас мощнее чем мой первый десктоп в дестве. Так что можно разгулятьяся.
Как обычно сначала создаем франкенштейна из проводов и плат, потом упаковываем его как тетрис его в портативный корпус. Это отдельное искусство, которым я попросил заняться своего друга, но это отдельная тема.
Версия 1
В этом месте гаджет уже заговорил с нами поставленным сгенерированным голосом и делал запросы к ИИ. Но сразу выявилась проблема что Распбери прожорливый батарейки хватает на 4 часа и с этим ничего не поделать, кроме как поставив 3 батарейки вместо одной.
Внезапное решение
Мы начали думать: итак нам надо гаджет с микрофоном, динамиком, автономным интернетом чтобы это все хорошо держало батарейку... хм.. звучит как смартфон.
Но как же размер? Как же специализированный гаджет с доступностью по физической кнопке?
И тут я как заядлый фанат айфонов увидел преимущества Андроида.
Оказалось что существуют сверх портативные тюремные детские смартфоны, с полноценной операционкой и набором функций.
И это оказался идеальный фит!
- Да, у них 2 Гб памяти и слабый процесор, но этого и достаточно даже для пары суток аудиозаписи.
- Да, мелкий экран, но нам для ассистента нужна только одна кнопка.
- Еще можно взять водостойкий телефон, чтобы делать заметки в самом плодотворном для всех мыслителей месте - под душем.
- Цена от 50$, каждый может купить себе сам цвет и марку, если мне делать из этого бизнес - не надо возиться со сборкой и отправкой.
- А покопавшись в внутренностях андроида можно запустить его в режиме одного приложения и с запуском с физической кнопки громкости. В таком режиме работают например терминалы в макдональдсе.
Я тоже андроид смартфон
Глава 2. Маркетинг/конкуренты.
Я делал проект скорее для себя, чтобы поиграться с ИИ и тк не нашел приложения для заметок. Но хотелось показать поделку другим людям. А где можно показать собранный на коленке хобби гаджет? Правильно, на самой крупной выставке электроники CES в Лас-Вегасе. (Просто удачно совпала возможность сделать там стенд, а мы подумали почему бы и нет)
Тогда еще версии с мини-мобилкой небыло и мы показывали версию с Распберри. Там конечно много было приключений. Как все глючило и допиливалось уже в процессе выставки, как софт в посольстве заглючил ровно на моем профиле ровно перед сезоном праздников и не успели с визой. Но это тоже другая история.
В этой истории - самое интересное было то, что этом же CES другая компания предтавила портативный walike-talkie ИИ ассистент Rabbit R1.
Я конечно не сравниваю этот крутой продукт с дизайном от топового агенства и кастомной язковой моделью. Но забавно сравнить наши способы участия в выставке.
Мы показывали свой уже работающий гаджет физически, но не рекламировались. А наоборот они сделали эффектный промо-ролик с обещаниями, но физически на выставке вообще не присутствовали и сам гаджет никто не видел.
По итогу мы поговорили с несколькими десятками людей, а Rabbit R1 собрал 10000 предзаказов.
Лучше грубый прототип, чем красивые рендеры
Глава 3. Ассистент.
Это, пожалуй, самая сложная часть разработки. Никто пока не понимает как должен работать ИИ ассистент.
Но время работы с этой проблемой я собрал такие идеи:
Лучше что-то одно но хорошо
Мне видится, что разработчики слишком идеализируют ИИ ассистентов думая что они умеют все подряд. Добавляют фичу если ее можно легко подключить. И такси вызвать, и билеты на самолет заказать и заметку записать. Но на практике это делает каждую отдельну фичу недоработаной и неудобной. Доверили бы купить авиабилеты в отпуск чату-гпт?
Лучше пусть ассистент сначала делает один трюк, но делает это хорошо. В нашем случае это будут умные заметки, где языковые модели максимально надресированы.
Плохой подход, умеет все, но стартануть запись заметки не удобно
Как собрать мысли по одной теме?
Возникла проблема что заметки у меня были короткие тк сложно выдать все мысли по теме за раз. Поэтому когда отпускаешь кнопку - запись ставится автоматом на паузу и только при двойном клике отправляется на обратоку. Так заметки получаются более длинными и пользователь может спокойно подумать перед тем как завершать тему. И для ИИ облегчается работа, тк ему есть где разгуляться с большим текстом.
Куда девать мелкие идеи?
Иногда хотелось записать небольшую мысль, или запомнить что надо сделать какое-то дело. Если сообщение короткое - его нет смысла ужимать и делать заголовок. Поэтому сообщения меньше 50 слов ИИ проверяет. Сморит это идея, или задача - и собирает их в отдельный список Ideas, Tasks, Other. При этом удобство заметок больше 50 слов не страдают. см пункт 1.
Как потом это читать?
Общение с ассистентом максимально простое - одна кнопка. Это подходит для ситуаций когда нет компьютера под рукой. В домашних же условиях можно раскрыть приложение на большом экране и все разобрать.
Все заметки за сегодня записывается на страницу на день. Удачные записи можно сохранить в избранное, ненужные - уходят в прошлое с новым днем.
Пример работы: текст усыхает от воды где-то на 50%, разделяется на абзацы, добавляется заголовок.
Глава 4. Как получить?
Если вам понравилась идея - есть три уровня как пользоваться:
Уровень 1 - веб-версия на вашем смартфоне
Можно уже сейчас пользоватся веб-версией. Она адаптирована под все телефоны iOS, Android и компьютеры. Попробовать и получать пользу уже сейчас.
Уровень 2 - выделить старый андроид телефон.
Можно установить приложение на старый андроид. Специализированный гаджет с запуском физической кнопкой - это уже другой экспириенс.
Уровень 3 - купить маленький смартфон и сделать полноценный ИИ брелок.
Советую "Soyes xs16" - если хочется за 50$, или "Unihertz Atom" - если хочется водо/ударо-стойкий.
Можете писать в личку - помогу настроить.
https://t.me/eagerbeaverrr
Ваши мысли?
Многие написали в личку вопросы по теме приватности. Поэтому думаю выложить проект в опенсорс для селф хоста, чтобы решить вопрос окончательно.
Как вам такой вариант?
Очень нравятся твои посты, Игорь! Серийное предпринимательство — это про тебя, ты прямо супер крутой!
| Лучше грубый прототип, чем красивые рендеры
💯 👍
Не знаю зачем мне, но захотелось. Такой тамагочи-джарвис в кармане :)
Твой проект охуенный. Ты охуенный.
Охуенно.
Тоже не покидает идея создать кнопку с ИИ в душ для идей, стоишь в душе, раз идея пришла - нажал записал. Кнопка для "идей в душе", это прям моя идея фикс.
О круто! Мы как раз делали для этого аппку, получается угадали с юз кейсом)
А у тебя прямо железяка, все серьезно, огонь!
Есть какой-нибудь вариант повесить это на action button в последних айфонах?
Идея топ. Сразу бы закинул фича реквест - интегрировать в logseq. Чтоб заметки по датам раскидывал и теги проставлял чтоб потом красивое облако получалось! Такое буду рад сам помочь законтрибьютить если будет опен сорс!
Отличная идея, я часто гуляю по городу, во время прогулок меня посещает большое количество мыслей, некоторые из них не одиночные заметки о увиденном перед глазами, а продолжения каких то ранних, которые появлись в ассоциации с ландшафтом. Это решение видится мне возможностью записывать такие мысли на ходу и с помощью кастомных промтов, которые можно реализовать в таком приложении, формировать из этих надиктовок, что-то типа книги. Я не писатель и не блоггер, но когда такие мылси "по-ходу" появляются, некоторые мне очень нравятся и я пока не придумал как их фиксировать, просто диктофон понятно, но это надо потом обрабатывать и т.д. что делает как раз этот ассистент как понял.
Проект отличный)
Я сейчас использую для этого Telegram Premium + ChatGPT4.
В любое время закидываю голосовое в Telegram в заметки себе.
Когда добираюсь до ноута, транскрибирую и запускаю в ChatGPT4 на структурирование.
Выглядит красиво!
А "писать в личку - помогу настроить" — это для всех уровней или таки уровень 1 можно самостоятельно пройти? Ткните пальцем в нужном направлении, пожалуйста :)
Круто что ты делаешь такой проект
Пошарил в сообществе где ребята пытаются записывать мысли чтобы потом писать тексты.
Чуть пофидбечу по опыту использования:
В любом случае проект классный!
Нео-бумер изобрел диктофон :)
Я шучу конечно, DIY занятньій получился, 5+!
Торопитесь. чуваки, вам на пятки наступают!
https://www.limitless.ai/#pendant
Очень интересная идея! У самого крутится в голове нечто похожее. Поэтому очень жду когда наконец Гемини интегрируют с гугл ассистентом, чтобы можно было с ним общаться через одну кнопку на часах.
Когда вижу такие проекты, вспоминаю этот момент из Друзей:
https://youtube.com/clip/UgkxC0h91JQfjM2fQWq-iQ5E-T7Odqd3BYAm?si=z-MJhCR4hBOgoWXU
Так как у меня тоже кажется не так уж и много мыслей))
огонь, крутая статья, успехов!
Я уже много лет ищу для себя идеальный диктофон. Чтобы был с физической кнопкой, водо/ударостойчивый. Мне не нужна ИИ-обработка, но была бы желательна полезна расшифровка голоса текст. Попробую собрать такое из детского смартфона, спасибо за идею!