Стоит ли использовать ksqlDB
Публичный пост
17 марта 2021
608
Confluent поднял моду на Kafka до небывалых высот и активно продвигает базу данных, построенную поверх Kafka Streams — ksqlDB (бывший KSQL).
Стоит ли вообще ее использовать, если да, то для чего, и какие будут плюсы и минусы?
Смотрели на KSQL(года полтора назад) в рамках подбора технологий для одного нагруженного проекта. На нагрузочном тестировании примера мы поняли, что сервер KSQL плохо масштабируется, получается, что он один на кластер и нужно какое-то очень мощное железо для него под наши задачи. Задачи были как раз в аналитике данных в потоке, приблизительно реалтайм (небольшая задержка допустима). И есть статья на хабре о минусах и плюсах kafka streams, поверх которых KSQL и работает https://m.habr.com/ru/company/maxilect/blog/537344/
Я пока не особо хорошо ориентируюсь, но мне кажется, пока теме ДБ изнутри наружу еще развиваться и развиваться.
КСКЛДБ ограничен.
Кафкаконнект - проебывает типы полей, когда накармливает БД данными со стрима.
Т.е. пока выходит, что надо эвенты собирать своими же сервисами самописными и писать в БД "ручками". Но со временем может это все подтянется.
О, кажется реализовали идею из этой статьи https://martin.kleppmann.com/2015/03/04/turning-the-database-inside-out.html. Если я правильно понял, это позволяет агрегировать статистику на ходу, например для подсчета просмотров или другой не очень важной информации.