Все видели как GPT пишет SQL, который мы можем скопипастить и выполнить в IDE (главное чтобы он еще был правильный и учитывал схему БД).
Я пошел дальше в вопросе освобождения людей от различного рода умственных нагрузок (и рабочих мест) и написал (с помощью chatGPT, конечно) техническую демку, которая делает аналититку в БД за вас, ей только нужны:
- креды от вашей БД
и номер кредитки. Но можно просто юзать мою, специально подготовленную для этого демо (креды вшиты); - непосредственно ваш вопрос по поводу данных там хранящихся (сформулированный простым человеческим языком).
Приложуха подумает и выдаст ответ в виде таблички (прям как дата-аналитик кидающий в вас excel файл).
- Потыкать на тестовой БД с типичными sales данными можно тут (переодически крашится, но чаще работает)
- Код лежит тут
PS: привычка перезапустить неработащий код еще раз в надежде, что "на второй раз точно заработает" тут не является чем-то порицаемым, а скорее must have если вы встретили ошибку. ChatGPT каждый раз генерирует разный подход к решению задачи, так что на второй раз часто действительно работает...
Примеры:
Несложный запрос с парой джойнов
Любимые оконные функции для финансистов
Когда в БД нет колонок содержащих необходимые данные, chatGPT додумывает фильтрацию сам
Комментарии, критика, скрины с крашами -- welcome в комменты
Прости, похоже не следовало мне просить ChatGPT дропнуть все таблицы и все данные у тебя в базе...
Но может ли твой робоаналитик делать это?
Ну ок, мы получили человека, который пишет не запросы в SQL, а запросы в ChatGPT. И это, на самом деле апликабл к куче профессий, не только дата аналитика.
А дэшборды в PowerBI или Табло бизнес давно сам умеет строить.
Как человеку, работающему в большой корпорации, мне лично не совсем пока ясно, как работать с chat-GPT, когда ты имеешь дело с чувствительными данными, с которыми ты обычно работаешь только в защищенной среде. Ты не можешь просто скормить их внешней программе. Есть идеи как это может работать "безопасно"?
ура! пошёл себя заменять
Оч круто, хочется бить себя сковородой по голове, что это придумал не я.
Одну проблему вижу я — внятное название колонок и разметка данных. И внятная документация к схемам.
Но это уже не проблема твоего продукта, это проблема 99.9% дата команд… Документация аутдейтед, столбцы называются хер пойми как, и часто дублируются, или очень похожи друг на друга без нормального пояснения, при переходе со слоя на слой часто путаница в названиях происходит и т.п.
Короч без людей всё равно никуда. Но для менеджеров, или для потребителей данных (если делать Дата Продукт под ключ) → оч классная идея.
P.S. чо прям можно себе уволочь продукт?
😱 Комментарий удален его автором...
В Tableau есть похожая штука, Ask data, которая призвана переводить с менеджерского, на условный SQL. Но по-моему оно работало всегда так себе, скорее для маркетинга было. Чую, будут переводить потом все подобные фичи на движки GPT.
Мне очень нравится такое решение в теории, но я не вижу выгоды от его применения, например, у себя на работе. Если говорить о крупных конторах, такого бота можно было бы использовать в областях, где нужно регулярно доставать однотипные датасеты, немного меняя условия. Например, для генерации рассылочных листов из crm, аудита. Но для этого придется потратить время/деньги на внедрение приложения и на обучение +круги бюрократического ада. Я бы сказала, что дешевле и быстрее попросить ДА выкатить пару дэшбордов с кучей фильтров и отправить заниматься дальше нормальной работой
Чем больше я читаю восторженных соображений по поводу языкового AI, тем глубже записываю себя в скептики.
ChatGPT это, конечно, здорово. И я им тоже пользуюсь.
Но он же не «понимает» контекст, он просто сплетает слова в предложения. Он буквально не гарантирует, что говорит правду, а не что-то правдоподобное.
И все кейсы «вот сейчас бизнес как сгенерит запрос к базе» разобьются о то, что в какой-то момент он сделает рандомно-неправильный запрос, и спросить будет не с кого