TLDR; Я комфортно потребляю сериалы и книги в оригинале. Но все равно, регулярно встречаю слова которые я понимаю только из контекста. И быстро забываю. В итоге наклепал бота, что бы упростить себе жизнь и набить шишек на попытках сделать продукт.
Comedy Central - не судитесь со мной. Я поменяю иконку когда найду дизайнера 👾
Расскажите о сути проекта?
Memberry — телеграм бот для "правильного" перевода и заучивания английских слов. Английские слова часто зависят от контекста использования. И имееют по сотне значений.
Google Translate и другие популярные переводчики дают не все переводы и вообще не дают примеров использования. А с крылатыми выражениями и сленгом вообще беда.
Если интересна полная предыстория, прошу в мой пост про то как я собрался делать продукты.
Как появилась идея? Что вдохновило?
Я долго пользовался Anki — у меня накопилось около 2000 слов. Но искать переводы и примеры вручную банально надоело.
Очень спасает Context.Reverso. Но туда тоже приходиться лазить и собирать по крупицам. Пора автоматизировать 👻
Год назад я начал делал мобильное приложение для флеш-карточек. В итоге пришел к мысли, что я постоянно пользуюсь телеграмом и нет смысла иметь отдельное приложение. Плюс нет проблем с дизайном 😁. Так что я отправил приложение в чистилище для проектов и расчехлил Node.js с Telegraf.
Что вошло в прототип и сколько времени на него было потрачено?
Чистого времени ушло в районе 15-20 часов. По факту — целый месяц. На работе начался аврал и вступив в сговор с гриппом умерили мой пыл. А я планировал справиться за выходные 😅
Вроде изян.
Какой технологический стек вы использовали? Почему?
Node.js, MongoDB, Telegraf, cheerio
Цель проекта не выучить новый язык или библиотеку, так что я взял то c чем уже работал. Для аналитики юзаю Amplitude. Задеплоил на AWS EC2 с PM2.
Как вы запускались и искали первых пользователей?
Первая релизная версия вышла вчера 🙃. На текущий момент у бота 20 пользователей (пару знакомых и несколько человек из моего телеграм канала). Сейчас основная задача - стабилизировать и покрыть тестами существующий функционал.
Дальше буду залазить в подборки для изучения английского и тематические чаты. Как только прикручу другие языки пойду колядовать на реддит.
С какими самыми неожиданными трудностями пришлось столкнуться?
Изначально хотел использовать DeepL для перевода. Но они быстро блочат по IP — хватает 10 запросов за 20 минут. Писать proxy rotator мне не хотелось, поэтому попробовал Yandex.Dictionary. Но они дискриминировали меня по национальному признаку и не дают доступа к API (не работает вне РФ).
В итоге использую Context.Reverso. Много полезных вещей работает из коробки. Например — автоисправление слов, перевод слэнга и целых фраз. Но нет API и теоретически могут дать по шляпе за скрапинг сайта.
А вообще я не нашел адекватных апишек для перевода и транскрипции. Если вы знаете такие, отпишите плиз.
Сколько потратили и заработали? Есть идеи как это можно монетизировать?
Прямых затрат пока не было. По части задач мне помогает наш джун, так что можно включить в смету его ЗП.
Текущий функционал монетизировать не собираюсь, цель собрать аудиторию пользователей и двигатся в сторону более общего решения.
Какие планы на будущее?
На ближайшее время:
- Покрыть все тестами
- UX улучшения
- Слово дня (по типу https://t.me/en_pic)
- Добавить транскрипцию и озвучку
- Поддержка дополнительных языков из Context.Reverso
- Chrome Extension (переводить и добавлять слово из статтей и видео).
Идеи (пока хз):
- Разработка своего решения для перевода (на основе субтитров). У Context.Reverso нет API, а надеятся на их милость глупо.
- Мобильное приложение с контентом и возможностью общения с ботом
Нужны ли какие-то советы или помощь Клуба?
Запустить и поюзать бот несколько дней. Если не зайдет, отписать что пошло не так. Мне это очень поможет, так как опыта создания продуктов нет. Приходиться учиться на граблях.
Бот в альфа версии и точно будут баги. Если что-то сломалось или выглядит как херня сразу пишите мне https://t.me/tmaniac
ПС. О том как из сайд-проекта я пытаюсь сделать продукт пишу у себя в канале. Последний месяц я не особо радовал апдейтами, но обещаю исправиться 🌚
Отличная задумка, сам какое то время назад думал запилить подобного бота, так как приложения все для запоминания слов какие-то не те, но руки не дошли
Круто, здорово, что довел до прототипа и уже есть пользователи, пожелаю, чтобы дальше все только нарастало! Вопрос, а ты смотрел, пробовал nocode/0code решения?
Чувак, это офигенно! Я только недавно думал о том, что телеграм боты - идеальная платформа для Anki.
Сам учил слова в лингвалео, и мне отлично заходили прочие их тренировки. Как насчет других видов повторений, кроме "помню - не помню"?
Мне заходили "слово - варианты перевода" (англ - рус, и рус - англ) - если сделать их по-умному, а не рандомно, будет вообще класс. Например, варианты брать только из слов из набора пользователя + семантически близкие (по вектору эмбеддинга слов из натренированных моделей, например).
Насчет "Google Translate и другие популярные переводчики дают не все переводы и вообще не дают примеров использования. А с крылатыми выражениями и сленгом вообще беда." - не совсем так. Любой уважающий себя онлайн словарь так умеет приводить примеры использования ([тут] (https://www.collinsdictionary.com/dictionary/english-thesaurus/taunt) и тут, urban dictionary тот же). Google translate и deepL все-таки заточены на перевод текстов и фраз, глупо ожидать от них функционал словаря. Уверен, что среди англо-словарей (тезаурусов) найдется приличный с доступным API. А перевод на русский (слов и примеров фраз) можно делать на лету.
chrome extension - топ, удваиваю
Из фичей мне было бы удобно пользоваться выгрузкой слов из словаря киндла - там слова лежат в бд, ее можно легко получить подключившись по usb. Помню писал скрипт, чтобы выгрузить слова оттуда в лингвалео - боль (по вине сервиса, бд очень простая). Да и вообще, чем проще пользователям закинуть уже имеющиеся коллекции - тем лучше.
Поигрался, спасибо!
Концепт очень интересный, но мне не зашел вот почему.
Я упорядочил по MoSCoW — первые пункты прям то из-за чего не буду дальше пользоваться, а последние — просто nice to have, но не влияют на моё решение пользоваться ботом дальше.
Таки нужен Deepl!
Здорово, точно бы не помешало выделять результаты среди кусков текста как в Reverso Context. Для простых слов и фраз сервис работает отлично, правда я что-то понажимал и бот перестал мне отвечать :)) Если поискать несколько слов а уже потом по истории прокликать Add то начинает тупить
Круто, полезный бот!
Мне в нем не хватает только настройки с выбором направления учёбы, en-ru / ru-en
Пушка! Использовал rememba, когда учил испанский, но зачем приложение, если есть бот!
Что мне лично не хватает сейчас – написать свою версию для карточкки (например, контекст иногда наоборот лишний и раздражает, хочется видеть одно слово-перевод). Иногда я, например, использовал ассоциации или перевод на другой язык (испанский - английский, вместо испанский - русский)