Пару слов про меня
Меня зовут Юра. В студенческие годы я катался по стажировкам в Google, Nvidia, Lyft и Amazon. Потом два года строил стартап Myna Labs, где мы создавали AI Celebrity Digital Clones и собирали миллионы просмотров на видосах в TikTok. Затем я ушел и запустил пару инди проектов со своими друзьями: вот, вот и вот.
Сейчас я делаю Fluently - приложение, которое помогает людям совершенствовать английский давая им обратную связь на их повседневные звонки. Что-то типа Grammarly, но только для видеоконференций.
Как появилась идея?
Я прожил больше года в штатах, где прокачал свой английский до advanced уровня (по крайней мере, я так считаю, хех). Да и почти всю информацию, включая книги, потребляю только на английском.
Но не смотря на это, за последние 4 месяца жизни в Лондоне, где я проходил акселератор Entrepreneur First, заметил, что иногда люди все еще меня переспрашивают, и я вижу по их лицам, что они ничего не поняли (хах, такое сложно скрыть).
Самая забавная ситуация приключилась, когда один парень из Латвии подошел ко мне и тихо сказал на ушко: “Юрец, ты вместо vague произносишь wagyu”. Первое слово переводится как неясный или расплывчатый, а вот второе - это японское мясо. Да, не самые близкие слова по значению… зато объясняет недоумение на лицах слушателей.
Вообщем, я еще раз почувствовал желание прокачать свой английский язык. Хочу быть как нейтив - хочу любую мысль доносить четко, понятно и красиво. Вариант “да пофиг, и так поймут, я ж не местный” меня совсем не устраивает.
При этом ходить по репетиторам сложновато. Во-первых нужно выделить время на занятия. Во-вторых, хорошие репетиторы стоят дорого. В-третьих, объема обратной связи после часового занятия не очень то и много на неделю.
Да, если у вас нет англоязычной коммуникации, это точно решение. А что если она у меня уже есть? Что если я работаю в англоязычной компании или питчу свой проект зарубежным инвесторам?
Хочу виртуального репетитора, который органично впишется в мою повседневную рутину и выведет мой английский язык на новый уровень. Вот. Так все и началось.
Прикол. Так и что делали?
Первым делом я решил потратить недельку, чтобы посмотреть интересно ли это кому-нибудь еще.
Поэтому пошел собрал лендинг, где можно записаться в вейтлист, а на самом сайте простенько накидал основные ценности продукта. На текущий момент сайт пока еще не менялся.
Затем прошелся с этим лендингом по моим знакомым фаундерам с заходом “ой глянь, что нашел”, чтобы посмотреть, как они отреагируют и что скажут. Не очень этично, признаю 😌
На удивление 2/3 проявили интерес к приложению и записались в лист ожидания на сайте. Остальные либо хорошо владеют английским (по крайней мере, они так считают, хех), либо им пофиг (ок, хозяин барин)
После этого было решено собрать первую версию приложения под MacOS, которая бы давала обратную связь только по произношению. Например, у тебя закончился англоязычный зумчик, и ты получаешь 10 карточек с самыми грубыми ошибками, которые допустил. На самих же карточках можно послушать и себя и то, как правильно.
На эту часть ушло еще 3 недели, поскольку она далеко от тривиальной: начиная от технологии детекции ошибок произношения, заканчивая автоматическим определением начала и конца звонка у пользователя.
Тю, так надо было сайт бахнуть!
Да, давайте объясню, почему все же приложение под MacOS, а не веб-сайт или плагин для зума. Причин на это было много:
- Во-первых, я не верю во все решения, где пользователь должен пойти и сам что-то сделать: пойти на сайт и загрузить аудио или зайти в приложение и начать запись. Почему? Да потому что почти все будут забывать это делать. Нужно решение, которое будет работать без всякого фрикшена.
- Во-вторых, люди часто пользуются различными сервисами для видеозвонков, включая Zoom, Meet и Skype. Поэтому делая плагин только для одного из них мы сильно режем свою потенциальную аудиторию. Поэтому решили начать с десктоп приложения.
- В-третьих, мы планируем, что все работало локально. Так и нам не нужно платить за серваки, да и данные пользователей никогда не покидают девайс. Privacy! А учитывая производительность новых процессоров M1/M2, первым делом это все заработает на Mac.
- Ну и в-четвертых, у меня самого Mac 😂
На чем код то писали?
Поскольку приложение под MacOS, то решил написать клиент на Swift. Конечно, еще можно было посмотреть и на Electron, но нейтив приложения имхо всегда ощущаются лучше. Да и если придется лезть во что-то низкоуровневое, то думаю быстрее будет решать вопросики на Swift.
И да, конечно же, сам Swift я не знал. Благо, что язык оказался приятным, и голова на плечах есть. Отдельно кайфанул от верстки на SwiftUI. Спасло еще то, что за последний год я научился собирать приложения на React, на который SwiftUI уж очень похож.
Сейчас приложение детектирует начало звонка и начинает анализировать аудио пользователя небольшими кусочками обрабатывая их на сервере. При этом анализируется только речь самого пользователя, а речь собеседника приложение даже и не слышит (не считая некоторых случаев, когда громкий разговор без наушников)
Бекенд написан на многим любимом питончике, а ML модельки на pytorch. Сервер получает аудио и детектирует ошибки в произношении, которые отправляет обратно в приложение.
В детали реализации самого пайплайна вдаваться не буду, поскольку там на отдельный пост. Будет время - напишу! Если упрощать, то все утроено следующим образом: аудио распознается в текст, текст переводится в фонемы, а отдельная моделька смотрит на сколько они соотносятся с произнесенными звуками на аудиозаписи.
Разумеется, сами записи мы не собираем, а только сохраняем статистику по ошибкам. Privacy! Да и не то, чтобы нам нужна была англоязычная речь с русским акцентом. Я вам такое и сам записывать часами могу!
И как? Пользуется кто-нибудь?
Когда появилась первая версия приложения, то я поделился коротким демо видео в своем телеграм канале, а пару друзей сделали еще и репост у себя. Таким образом в вейтлист набежало больше 200 человек.
Поскольку приложение еще сырое, то не имеет смысла запускать туда сразу всех. Очень важно сначала пустить небольшую группу пользователей, которые активно дают обратную связь, чтобы приложение можно было быстро улучшать.
Чтобы лучше понять, кто записался в лист ожидания и что им нужно, я решил провести короткие 15-минутные интервью. Итого за 2 недели я поговорил больше чем с 60 людьми.
Вот их сейчас потихоньку и запускаю в продукт.
Так, а заработать то получилось?
Вообще планируется монетизировать приложение подпиской по $20/месяц. При этом сейчас самой цели заработать нет. Куда более важнее проверить, есть ли у людей потребность в таком продукте и готовы ли они за него платить.
Поскольку продукт еще далек от идеального, то сейчас я предлагаю людям купить подписку за $10/месяц. Пока мы впустили только 18 человек и собрали ~$360 (есть те, кто решили купить лайфтайм за $99). Еще два десятка в очереди.
Неплохо. Что дальше?
Пока исправляем баги и неожиданные проблемы, которые вылезли у людей в процессе пользования продуктом. Некоторые из них оказались на столько не тривиальными, что пришлось написать свой аудиодрайвер.
Класс! Могу чем-нибудь помочь?
Да в целом все хорошо - серваки крутятся, а продукт мутится.
Единственное, если у вас есть англоязычная коммуникация (репетитор на том же скаенге считается) и потребность в нашем продукте, то можете оставить заявку по ссылке, а я к вам вернусь 🫡
Сейчас вот выходит новая версия, куда завезли еще и грамматику.
Заключение
Кайфую, что работаю на продуктом, который решает мою же проблему. Делать крутое решения для чужих проблем однозначно сложнее.
Постарался рассказать вам про наш проект как можно живее. Надеюсь, что вам понравился пост, и вы оставите свой апвоут 🔼
Также буду рад видеть вас в своем канальчике в телеге, где я подробней рассказываю про свои проекты.
Я считаю это просто гениально!! Моя лень ликует, я снова могу ничего не делать))
Заявку оставила)
@wllrsvlcff так нужно как минимум иметь коммуникацию на англ! Вряд ли это можно сделать, ничего не делая, хах
Юра крутой, впечатляет, как ты быстро собрал мвп!
Расскажи про то, откуда берешь фонетику? Там же куча исключений должно быть: как борешься со всякими забавными корнер кейсами вроде смеха, может ли оно имена собственные править?
Я вот в случае всякой стремоты иду на youglish.com - очень помогает.
Исключения пока идут лесом! Сейчас самые понятные и частые юзкейсы
Идея офигенная. Можешь подробнее рассказать про модельку и на чем ее тренировал?
Я сейчас ради такого же эффекта часто прошу включить запись и транскрипцию командных созвонов в google meet под видом "ну понадобится же", а сам смотрю на то как мой английский распознался :)
Идея крутецкая!
Напрашивается недельный триальчик или условно-бесплатная версия с Х минут в неделю/месяц.
Пошел заявку писать.
Классная идея!
Были бы интересны две вещи:
Идея очень крутая 👍
Но на вебе, записав аудио, получил "Cannot read properties of undefined (reading 'score')" 😵
О, внезапно! Я год назад делал Entrepreneur First в Париже, а еще меня в Лондон на ReForm тогда же занесло. И тоже работал над языковым приложением - хотел сделать виртуального учителя языков (чтоб можно было голосом, и сразу на многих языках). Не сложилось найти кофаундера.
Хитрая идея с лендинговой страницей! У нас тоже была, но мы её показывали, как свою - даже нашел её https://tension-receive.unicornplatform.page/. Названия даже схожи :)
Отдельный респект за раннюю монетизацию.
Желаю удачи! Приятно удивлюсь, если в 2023 получится сделать новое успешное приложение для изучения языков :)
Привет!
Спасибо за пост дико интересно. И моя субличность продакта просто ликовала. Успехов тебе с продуктом!
Привет!
А так и задумывалось, что записаться на early access нельзя без реги в airtable?))
Привет!
Оч крутой и, что самое главное, понятный (на первый взгляд, но интересно поюзать) продукт)
С большим интересом оставила заявку! И присоединяюсь к коллегам, чьи души продактов ликуют
Очень классный проект! Оставил заявку, жду доступ!
Классная идея! Успехов в реализации.
Пинганите, когда виндоводы смогут потестить