Все видели как GPT пишет SQL, который мы можем скопипастить и выполнить в IDE (главное чтобы он еще был правильный и учитывал схему БД).
Я пошел дальше в вопросе освобождения людей от различного рода умственных нагрузок (и рабочих мест) и написал (с помощью chatGPT, конечно) техническую демку, которая делает аналититку в БД за вас, ей только нужны:
- креды от вашей БД
и номер кредитки. Но можно просто юзать мою, специально подготовленную для этого демо (креды вшиты); - непосредственно ваш вопрос по поводу данных там хранящихся (сформулированный простым человеческим языком).
Приложуха подумает и выдаст ответ в виде таблички (прям как дата-аналитик кидающий в вас excel файл).
- Потыкать на тестовой БД с типичными sales данными можно тут (переодически крашится, но чаще работает)
- Код лежит тут
PS: привычка перезапустить неработащий код еще раз в надежде, что "на второй раз точно заработает" тут не является чем-то порицаемым, а скорее must have если вы встретили ошибку. ChatGPT каждый раз генерирует разный подход к решению задачи, так что на второй раз часто действительно работает...
Примеры:
Несложный запрос с парой джойнов
Любимые оконные функции для финансистов
Когда в БД нет колонок содержащих необходимые данные, chatGPT додумывает фильтрацию сам
Комментарии, критика, скрины с крашами -- welcome в комменты
Прости, похоже не следовало мне просить ChatGPT дропнуть все таблицы и все данные у тебя в базе...
Но может ли твой робоаналитик делать это?

Ну ок, мы получили человека, который пишет не запросы в SQL, а запросы в ChatGPT. И это, на самом деле апликабл к куче профессий, не только дата аналитика.
А дэшборды в PowerBI или Табло бизнес давно сам умеет строить.
Как человеку, работающему в большой корпорации, мне лично не совсем пока ясно, как работать с chat-GPT, когда ты имеешь дело с чувствительными данными, с которыми ты обычно работаешь только в защищенной среде. Ты не можешь просто скормить их внешней программе. Есть идеи как это может работать "безопасно"?
ура! пошёл себя заменять
@raymany, это просто охуенно!
Надо срочно делать из этого продукт, это же безумно удобно.
Больше интеграций, оптимизировать промпты и в релиз! Сделать еще гайдов для людей которые не умеют пользоваться от слова совсем и это лишит работы огромное количество бесполезных людей.
Оч круто, хочется бить себя сковородой по голове, что это придумал не я.
Одну проблему вижу я — внятное название колонок и разметка данных. И внятная документация к схемам.
Но это уже не проблема твоего продукта, это проблема 99.9% дата команд… Документация аутдейтед, столбцы называются хер пойми как, и часто дублируются, или очень похожи друг на друга без нормального пояснения, при переходе со слоя на слой часто путаница в названиях происходит и т.п.
Короч без людей всё равно никуда. Но для менеджеров, или для потребителей данных (если делать Дата Продукт под ключ) → оч классная идея.
P.S. чо прям можно себе уволочь продукт?
😱 Комментарий удален его автором...
В Tableau есть похожая штука, Ask data, которая призвана переводить с менеджерского, на условный SQL. Но по-моему оно работало всегда так себе, скорее для маркетинга было. Чую, будут переводить потом все подобные фичи на движки GPT.
Мне очень нравится такое решение в теории, но я не вижу выгоды от его применения, например, у себя на работе. Если говорить о крупных конторах, такого бота можно было бы использовать в областях, где нужно регулярно доставать однотипные датасеты, немного меняя условия. Например, для генерации рассылочных листов из crm, аудита. Но для этого придется потратить время/деньги на внедрение приложения и на обучение +круги бюрократического ада. Я бы сказала, что дешевле и быстрее попросить ДА выкатить пару дэшбордов с кучей фильтров и отправить заниматься дальше нормальной работой
Чем больше я читаю восторженных соображений по поводу языкового AI, тем глубже записываю себя в скептики.
ChatGPT это, конечно, здорово. И я им тоже пользуюсь.
Но он же не «понимает» контекст, он просто сплетает слова в предложения. Он буквально не гарантирует, что говорит правду, а не что-то правдоподобное.
И все кейсы «вот сейчас бизнес как сгенерит запрос к базе» разобьются о то, что в какой-то момент он сделает рандомно-неправильный запрос, и спросить будет не с кого