Каждый второй человек, умеющий создавать телеграм ботов уже сделал своего убийцу ChatGPT.
И я собственно не исключение. Настал век нейронок и я уже юзаю нейросети повседневно - Codeium для написания кода, Phind и Perplexity для гугления сложных тем.
Я учусь в институте и уже все студенты юзают Чатгпт чтобы писать за них тексты и решать задачки. И мне подвернулась возможность создать имбового помощника во втором - бота, который понимает содержимое изображений и может решать задачи с фото. Просто заскринил вопрос онлайн теста - и он дал ответ. Заскринил задачу с задачника - получил ответ. Крутотень же.
А все потому что Google релизнули Gemini Pro Vision и API к ней в декабре прошлого года.
Конечно жителям большой страны не доступны эти сверх современные технологии и API доступно только под VPN.
Я сначала для теста развернул прокси и начал обращаться к модели. Сначала сделал тестовый сайт, но потом вместе с другом мы обернули это дело в телеграм бота, которому можно скинуть скрин и он даст ответ.
Про гугловскую Gemini можно прочитать в интернете. Кратко: они сказали что это убийца GPT-4. Но промо видео оказалось смонтированным и по факту модель превосходит GPT-3.5 и уступает GPT-4. Но для нас самое крутое - API Vision и нейронке можно сразу кормить картинки.
Бот на написан на питоне, база MongoDB, пачка проксей и скрипт, который отправляет запросы к API нейронки с разных ключей и разных прокси, чтобы не забанили, а то сервер в России. Обернуто в Docker и запущено на Coolify.
Подключил платежку в бота, подключили API так же обычного GPT-3.5, чтобы юзеры могли выбирать модели. И запустили проект для студентов моего вуза.
У всех уже есть GPT
Хоть ChatGPT и заблокирован в России, но никого даже халявным ботом с доступом к нему без впн не удивишь. Поэтому до старта в идею никто кроме нас особо не верил ( в клубе уже была статья https://vas3k.club/post/22536/ )
Мы начали кидать разные смешные и странные картинки в нейронку, чтобы посмотреть что она отвечает
Возможно у гугла в датасете были мемы. Но нейронка иногда выкупает метаиронию в мемах и даже выдает базу. А еще иной раз поражает как она понимает смысл изображения, а не только его содержимое.
Привлечение юзеров рофлами
С запуска бота прошла всего неделя. Первые юзеры - однокурсники. Мы начали прощупывать целевую аудиторию. Попробовали на взрослую ЦА обычных обывателей, которые не сильно слышали о нейронках - закуп в телеге и инсте по ним ничего не дал.
Зато идея с рофлами хорошо зашла - получилось нагнать трафик с ютуба! 1000 первых юзеров за 8 дней. Первая продажа случилась на второй день.
Мы загрузили в ютуб шортсы монтаж смешных ответов нейросети с озвучкой другой нейронкой (бот Silero - афигенные ребята), музыкой и игрой на заднем фоне. Лайк подписка колокольчик.
Че дальше?
Все-таки в телеге огромнейшая конкуренция в нише ботов с GPT и если рассматривать бота как полноценный проект - то очень трудно его будет вывести на окупаемость, не смотря на то что у нас есть фича в виде распознавания изображений.
Хочется сделать нормальную веб версию и есть наработки с эмбеддингами для того, чтобы нейронка могла в качестве контекста понимать pdf документы, презентации - вот эта фича будет очень полезна в учебе. Этакий ассистент, которому можно задавать вопросы по доку с документацией микроконтроллера, например.
Пока можете попробовать заюзать бота в телеге, хотелось бы услышать фидбек и интересные кейсы где поможет распознавание картинок.
Канал: https://t.me/studgpt
Бот: https://t.me/ai_studgpt_bot
Сайт?: https://www.studgpt.ru/
Привет, а как ты отслеживаешь статистику ТГ бота?