Проект: WalkieNotes — Как заполучить брелок с ИИ ассистентом за 50$  Публичный пост
12 апреля 2024  2275
WalkieNotes - Как заполучить брелок с ИИ ассистентом за 50$

Что это?

Всем привет! Хочу рассказать про то как мы с другом сделали брелок с ии ассистентом. И как вы можете заиметь такой же за 50$.

Главная фича - это умный диктофон. Вы с помощью одной большой кнопки (как walkie-talkie) наговариваете заметки, а дальше ИИ делает то, что умеет лучше всего - переписывает поток сумбурных мыслей в красивый стройный текст выделяя главные идеи.

Использую его чтобы поработать когда клавиатурой пользоваться не удобно. Во время прогулки, езды на велосипеде, в поезде.

В целом это даже позволяет перенести часть работы в более приятную обстановку. Можно писать посты в блог, или строить планы смотря на закат на берегу Вислы, вдыхая запах леса, а не в душных 4х стенах. Я называю это - работать со свободными глазами.

Фото моего кабинета

upd: Еще один постоянный кейс - это запись конспектов ютуб-ролика, или аудио-книги. Ставлю на паузу, диктую свои мысли, продолжаю. С каждого ролика получается аккуратная заметка на тему.

Мотивация

Идея иметь карманного помощника который всегда готов к работе - давно крутилась у меня в голове.

Да, можно сделать приложение в смартфоне, но, хочется простоты и лаконичности. Чтобы не надо было искать иконку приложения, целиться в кнопки в интерфйсе. Хочется иметь одну кнопку, которую ты можешь даже с закрытыми глазами нажать и начать говорить.

Ну и конечно же есть определенный шарм в носимых в отдельных гаджетах-брелках вроде Тамагочи или Flipper Zero.

Глава 1. Девайс.

Ок, раз мы разрабатываем гаджет - надо начать самого девайса. Мини-компьютеры raspberry pi сейчас мощнее чем мой первый десктоп в дестве. Так что можно разгулятьяся.

Как обычно сначала создаем франкенштейна из проводов и плат, потом упаковываем его как тетрис его в портативный корпус. Это отдельное искусство, которым я попросил заняться своего друга, но это отдельная тема.


Версия 1

В этом месте гаджет уже заговорил с нами поставленным сгенерированным голосом и делал запросы к ИИ. Но сразу выявилась проблема что Распбери прожорливый батарейки хватает на 4 часа и с этим ничего не поделать, кроме как поставив 3 батарейки вместо одной.

Внезапное решение

Мы начали думать: итак нам надо гаджет с микрофоном, динамиком, автономным интернетом чтобы это все хорошо держало батарейку... хм.. звучит как смартфон.

Но как же размер? Как же специализированный гаджет с доступностью по физической кнопке?

И тут я как заядлый фанат айфонов увидел преимущества Андроида.
Оказалось что существуют сверх портативные тюремные детские смартфоны, с полноценной операционкой и набором функций.


И это оказался идеальный фит!

  • Да, у них 2 Гб памяти и слабый процесор, но этого и достаточно даже для пары суток аудиозаписи.
  • Да, мелкий экран, но нам для ассистента нужна только одна кнопка.
  • Еще можно взять водостойкий телефон, чтобы делать заметки в самом плодотворном для всех мыслителей месте - под душем.
  • Цена от 50$, каждый может купить себе сам цвет и марку, если мне делать из этого бизнес - не надо возиться со сборкой и отправкой.
  • А покопавшись в внутренностях андроида можно запустить его в режиме одного приложения и с запуском с физической кнопки громкости. В таком режиме работают например терминалы в макдональдсе.

Я тоже андроид смартфон

Глава 2. Маркетинг/конкуренты.

Я делал проект скорее для себя, чтобы поиграться с ИИ и тк не нашел приложения для заметок. Но хотелось показать поделку другим людям. А где можно показать собранный на коленке хобби гаджет? Правильно, на самой крупной выставке электроники CES в Лас-Вегасе. (Просто удачно совпала возможность сделать там стенд, а мы подумали почему бы и нет)

Тогда еще версии с мини-мобилкой небыло и мы показывали версию с Распберри. Там конечно много было приключений. Как все глючило и допиливалось уже в процессе выставки, как софт в посольстве заглючил ровно на моем профиле ровно перед сезоном праздников и не успели с визой. Но это тоже другая история.

В этой истории - самое интересное было то, что этом же CES другая компания предтавила портативный walike-talkie ИИ ассистент Rabbit R1.

Я конечно не сравниваю этот крутой продукт с дизайном от топового агенства и кастомной язковой моделью. Но забавно сравнить наши способы участия в выставке.

Мы показывали свой уже работающий гаджет физически, но не рекламировались. А наоборот они сделали эффектный промо-ролик с обещаниями, но физически на выставке вообще не присутствовали и сам гаджет никто не видел.

По итогу мы поговорили с несколькими десятками людей, а Rabbit R1 собрал 10000 предзаказов.

Лучше грубый прототип, чем красивые рендеры

Глава 3. Ассистент.

Это, пожалуй, самая сложная часть разработки. Никто пока не понимает как должен работать ИИ ассистент.
Но время работы с этой проблемой я собрал такие идеи:

Лучше что-то одно но хорошо

Мне видится, что разработчики слишком идеализируют ИИ ассистентов думая что они умеют все подряд. Добавляют фичу если ее можно легко подключить. И такси вызвать, и билеты на самолет заказать и заметку записать. Но на практике это делает каждую отдельну фичу недоработаной и неудобной. Доверили бы купить авиабилеты в отпуск чату-гпт?

Лучше пусть ассистент сначала делает один трюк, но делает это хорошо. В нашем случае это будут умные заметки, где языковые модели максимально надресированы.

Плохой подход, умеет все, но стартануть запись заметки не удобно

Как собрать мысли по одной теме?

Возникла проблема что заметки у меня были короткие тк сложно выдать все мысли по теме за раз. Поэтому когда отпускаешь кнопку - запись ставится автоматом на паузу и только при двойном клике отправляется на обратоку. Так заметки получаются более длинными и пользователь может спокойно подумать перед тем как завершать тему. И для ИИ облегчается работа, тк ему есть где разгуляться с большим текстом.

Куда девать мелкие идеи?

Иногда хотелось записать небольшую мысль, или запомнить что надо сделать какое-то дело. Если сообщение короткое - его нет смысла ужимать и делать заголовок. Поэтому сообщения меньше 50 слов ИИ проверяет. Сморит это идея, или задача - и собирает их в отдельный список Ideas, Tasks, Other. При этом удобство заметок больше 50 слов не страдают. см пункт 1.

Как потом это читать?

Общение с ассистентом максимально простое - одна кнопка. Это подходит для ситуаций когда нет компьютера под рукой. В домашних же условиях можно раскрыть приложение на большом экране и все разобрать.

Все заметки за сегодня записывается на страницу на день. Удачные записи можно сохранить в избранное, ненужные - уходят в прошлое с новым днем.

Пример работы: текст усыхает от воды где-то на 50%, разделяется на абзацы, добавляется заголовок.

Глава 4. Как получить?

Если вам понравилась идея - есть три уровня как пользоваться:

Уровень 1 - веб-версия на вашем смартфоне
Можно уже сейчас пользоватся веб-версией. Она адаптирована под все телефоны iOS, Android и компьютеры. Попробовать и получать пользу уже сейчас.

Уровень 2 - выделить старый андроид телефон.
Можно установить приложение на старый андроид. Специализированный гаджет с запуском физической кнопкой - это уже другой экспириенс.

Уровень 3 - купить маленький смартфон и сделать полноценный ИИ брелок.
Советую "Soyes xs16" - если хочется за 50$, или "Unihertz Atom" - если хочется водо/ударо-стойкий.

Можете писать в личку - помогу настроить.
https://t.me/eagerbeaverrr

Ваши мысли?

Связанные посты
38 комментариев 👇

Многие написали в личку вопросы по теме приватности. Поэтому думаю выложить проект в опенсорс для селф хоста, чтобы решить вопрос окончательно.
Как вам такой вариант?

@igor-beaver, Можно будет подглядеть промпты для саммаризации и очистки текста))

  Развернуть 1 комментарий

@igor-beaver, топ. Согласен, это важный вопрос. С монетизацией думаю все будет ок - 99% будет лень селф хостом заниматься. А кому надо - оценять и пошарят дальше. Да и задонатить тоже могут) да и вообще можно оставить подписку. Уж ковырять код и выпилвать это вряд ли будет много делающих

  Развернуть 1 комментарий

Не знаю зачем мне, но захотелось. Такой тамагочи-джарвис в кармане :)

  Развернуть 1 комментарий
Сергей Кузьмичев Системный администратор, с тягой к полетам 12 апреля в 05:53

Мне кажется главная фича, это возможность иметь как отдельное устройство, так и приложуху на своем телефоне. Мне например куча отдельных гаджетов не нравится, лучше отдельный телефон, но если он сломается хоть в петлю.

  Развернуть 1 комментарий

@SergKuz, конечно, ребятам надо запартнерится с производетеоем таких детских телефонов и продавать на $100-$150, ценности в самом приложении как будто не сильно много

  Развернуть 1 комментарий
Миша Безверхий управляющий изделием Команда Клуба 12 апреля в 07:23

Очень нравятся твои посты, Игорь! Серийное предпринимательство — это про тебя, ты прямо супер крутой!

  Развернуть 1 комментарий

@mixbez, Спасибо за поддержку! Очень принятно слышать

  Развернуть 1 комментарий
Ruslan Akmanov Старший инженер тестирования и сопровождения 12 апреля в 07:35

Отличная идея, я часто гуляю по городу, во время прогулок меня посещает большое количество мыслей, некоторые из них не одиночные заметки о увиденном перед глазами, а продолжения каких то ранних, которые появлись в ассоциации с ландшафтом. Это решение видится мне возможностью записывать такие мысли на ходу и с помощью кастомных промтов, которые можно реализовать в таком приложении, формировать из этих надиктовок, что-то типа книги. Я не писатель и не блоггер, но когда такие мылси "по-ходу" появляются, некоторые мне очень нравятся и я пока не придумал как их фиксировать, просто диктофон понятно, но это надо потом обрабатывать и т.д. что делает как раз этот ассистент как понял.

  Развернуть 1 комментарий

Проект отличный)

Я сейчас использую для этого Telegram Premium + ChatGPT4.

В любое время закидываю голосовое в Telegram в заметки себе.

Когда добираюсь до ноута, транскрибирую и запускаю в ChatGPT4 на структурирование.

  Развернуть 1 комментарий

@Vagabond, пилю себе что-то похожее. Только транскрибирую не телеграмом, а через openAI API. Сейчас пилю возможность строить эмбеддинги и получать ответы от GPT на вопросы на естественном языке в телеге

Хотя так-то это уже аналог продукта из топика получается только чисто для себя :)

  Развернуть 1 комментарий

О круто! Мы как раз делали для этого аппку, получается угадали с юз кейсом)

А у тебя прямо железяка, все серьезно, огонь!

  Развернуть 1 комментарий

@VladimirBrejcha, симпатичный бложик, это самописный такой ?

  Развернуть 1 комментарий

@dzybay, кажется блог сделан на Craft.do

Про него еще есть пост

  Развернуть 1 комментарий

@AcoStyle, спасибище!! на vas3k.club не зря подписался, комьюнити огонь!!

  Развернуть 1 комментарий

Блог по функционалу охрененный, но почему-то раздражающе долго загружается (>10с) даже на десктопе 🥲 И дело не в тяжёлых картинках

  Развернуть 1 комментарий
Andrei Shniak специалист по автоматизации бизнес-процессов в сфере продаж. Владелец небольшой компании, занимающейся поставками автоматических 12 апреля в 13:28

Тоже не покидает идея создать кнопку с ИИ в душ для идей, стоишь в душе, раз идея пришла - нажал записал. Кнопка для "идей в душе", это прям моя идея фикс.

  Развернуть 1 комментарий

@dzybay, эта кнопка должна тут же публиковать пост в r/showerthoughts

  Развернуть 1 комментарий

| Лучше грубый прототип, чем красивые рендеры

💯 👍

  Развернуть 1 комментарий

@kzvonov, С инженерной точки зрения - да. Но увы, мы живем в мире, где балом правит маркетинг, а продажи - это не столько про функционал, сколько про emotional management. Поэтому клевые эмоции от даже не существующего в физическом мире продукта чаще побеждают сухую утилитарность того, что уже можно пощупать.

  Развернуть 1 комментарий
Сергей Драган Java программист, тимлид 14 апреля в 08:18

Твой проект охуенный. Ты охуенный.
Охуенно.

  Развернуть 1 комментарий

Есть какой-нибудь вариант повесить это на action button в последних айфонах?

  Развернуть 1 комментарий

@Mambes, через Shortcuts можно сделать вызов почти чего угодно. Например открыть веб страницу со спец параметром, где запись начнётся моментально.
Затем этот шорткат вешается на action button

  Развернуть 1 комментарий

Выглядит красиво!

А "писать в личку - помогу настроить" — это для всех уровней или таки уровень 1 можно самостоятельно пройти? Ткните пальцем в нужном направлении, пожалуйста :)

  Развернуть 1 комментарий

@spiridonov, можно конечно и самому, но продукт ранний, поэтому в большинстве случаев у новых пользователей что-то идет не так. )
Открыть сайт и разобраться самому можно если нажать на заголовок поста, там ссылка.

  Развернуть 1 комментарий

@igor-beaver, о, спасибо.
У нас, оказывается, недавно созданные домены блокирует какой-то сильно умный файрволл :) дома посмотрю

  Развернуть 1 комментарий

Торопитесь. чуваки, вам на пятки наступают!
https://www.limitless.ai/#pendant

  Развернуть 1 комментарий

@dmitripotchepko, Если кто-то что-то делает параллельно, это не обязательно, что у них всё получится лучше. Главный инженер может уйти, основатели переругатся, HR захватить woke активисты, а фирму купить Майкрософт

  Развернуть 1 комментарий

Круто что ты делаешь такой проект
Пошарил в сообществе где ребята пытаются записывать мысли чтобы потом писать тексты.

Чуть пофидбечу по опыту использования:

  1. Сложно было найти что ссылка на веб-сайт в заголовке. Может продублировать ее в теле поста?
  2. Разобраться с логикой даблтапа пришлось несколько минут. У меня нет нормального предложения как упростить, но чтобы отправить первую заметку ушло много внимания.

В любом случае проект классный!

  Развернуть 1 комментарий

Очень интересная идея! У самого крутится в голове нечто похожее. Поэтому очень жду когда наконец Гемини интегрируют с гугл ассистентом, чтобы можно было с ним общаться через одну кнопку на часах.

  Развернуть 1 комментарий

Нео-бумер изобрел диктофон :)

Я шучу конечно, DIY занятньій получился, 5+!

  Развернуть 1 комментарий
Денис Кандров Делаю линейку для производительности ПО 18 апреля в 23:10

Когда вижу такие проекты, вспоминаю этот момент из Друзей:
https://youtube.com/clip/UgkxC0h91JQfjM2fQWq-iQ5E-T7Odqd3BYAm?si=z-MJhCR4hBOgoWXU

Так как у меня тоже кажется не так уж и много мыслей))

  Развернуть 1 комментарий
Nikita Bogatov Андроид разработчик 19 апреля в 03:09

огонь, крутая статья, успехов!

  Развернуть 1 комментарий

Я уже много лет ищу для себя идеальный диктофон. Чтобы был с физической кнопкой, водо/ударостойчивый. Мне не нужна ИИ-обработка, но была бы желательна полезна расшифровка голоса текст. Попробую собрать такое из детского смартфона, спасибо за идею!

  Развернуть 1 комментарий

@asleptsov, посмотрел рекомендованные модели, нет слишком большие, это полноценные смартфоны. Я заказывал с Алиэкспресса диктофон размером примерно 10 мм * 6 мм * 30 мм с одной кнопкой. Включил - запись пошла, выключил - запись остановилась. Всем хорош, кроме того, что работает нестабильно, качество записи низкое, стартует долго (после включения, нужно несколько секунд подождать).

  Развернуть 1 комментарий

  Развернуть 1 комментарий
Petr Korolev ETHusiast in open-source & privacy 23 апреля в 13:53

Идея топ. Сразу бы закинул фича реквест - интегрировать в logseq. Чтоб заметки по датам раскидывал и теги проставлял чтоб потом красивое облако получалось! Такое буду рад сам помочь законтрибьютить если будет опен сорс!

  Развернуть 1 комментарий

@skywinder, +1 за logseq

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб