Ну вот взяли тебя дата саентистом. Дальше-то что?

Публичный пост

5 июля 2021 5427

Evgenii Kochanov

Этот пост - продолжение материала о том, как я вкатывался в аналитику и прочую биг дату. Первую часть я закончил на том, что к концу 2018 года мне удалось взять крейсерскую скорость в самообразовании, походах на собеседования и погружении в около-DS среду. Всё это в итоге закончилось офером на позицию Junior Data Scientist-а.

Сегодня хочется поделиться своим опытом и ощущениями, которые испытал в первое время работы “официальным” дата саентистом. Даже несмотря на то, что к успешному оферу я шел почти два года, первые месяцы преподнесли несколько сюрпризов, местами - не совсем приятных.

Нулевой сюрприз случился уже на моменте получения офера - зарплата на новой позиции была ненамного, на 5000р, но всё-таки меньше моей текущей. Да, начинать в новой области нелегко :). Разницу удалось наверстать достаточно быстро, у джунов в IT везде зп растет бодро (при наличии рук и головы из нужных мест).

Следующее откровение, о котором я знал, но не осознавал - под Дата Саентистом понимают в настоящее время очень разных специалистов - от дата инженеров до математиков, включая по пути программистов на самых разных языках, от C++ до Экселя. Сейчас этот зоопарк мне знаком и понятен, а три года назад я искренне считал, что настоящие дата саентисты - это те, кто нейронки обучает да прочие случайные леса выращивает. А все остальное, где нет Machine Learning-а как бы и не считается. И поэтому был слегка обескуражен, когда выяснил, что мне НА САМОМ ДЕЛЕ на новой работе большую часть времени придется ковыряться SQL запросами в бесконечных табличках с данными, чтобы выудить из них крупицы информации. На первой неделе, когда коллега бросил что-то вроде "ну там такой небольшой запрос, строк на 500", я подумал, что он преувеличивает. Но через два дня уже сам писал полотна на 100+ строк :)
А на обучение машин и смежные с ним задачи хорошо если 5% времени придётся. Первоначальное уныние достаточно быстро сменилось позитивными вибрациями - понял, что мне очень даже нравится тип работы, в котором много общения, в котором из маленьких кубиков информации составляешь общую картину, а потом ещё и споришь о ней с заказчиком. *Достаточно быстро я также узнал, что вот это вот рисование графиков, изучение когорт и прочие A/B тесты называется “продуктовая аналитика”. И да, это тоже дата саенс. *

И это тоже дата саенс

И тут появилась следующая дилемма. С одной стороны, работа продуктовым аналитиком мне пришлась по душе. С другой - “я же как бы не настоящий дата саентист, как же глубокие нейронные машины?”. И решение вроде бы простое - продолжать то, что делал до вкатывания в ДС - учиться и тренироваться на кошках, благо “кошки” под рукой у продуктового аналитика более чем подходящие. Это всё в теории. На практике столкнулся с тем, что в первые полгода не было ни сил, ни возможностей изучать что-то дополнительно. Дивный новый мир практического анализа данных заставил в спешном порядке осваивать множество самых разных инструментов, от Гугл Аналитики и Tableau до экспресс-курса по R. Последний вообще оказался для меня неожиданным сюрпризом - на собеседовании ребята из команды мельком упомянули, что часть из них пишет на R, но в плане выбора языка никто никого ни к чему не обязывает… В реальности оказалось, что почти половина кода написана на R, но свой, действительно, можно писать на питоне. Но ведь читать и осознавать написанное тоже как-то нужно, поэтому пришлось разбираться :) Кроме новых технологий нужно было разбираться и с особенностями новой компании - от того, как бизнес и продукт устроены и до того, как откуда данные берутся, как складываются и до каких можно дотянуться. На то, чтобы закрыть пробелы в знаниях и разобраться на необходимом уровне в данных, ушло где-то полгода. Устроился в конце 2018, к июлю 2019 получилось более-менее выдохнуть и начать учить что-то “для себя”. Кстати, *такое положение вещей можно считать очередным “сюрпризом” - времени и/или энергии на дополнительное самообразование при смене работы, и уж тем более - профессии, практически не будет. *

Увидел твит как раз во время изучения R!

Итак, я решил продолжить обучение. На горизонте у меня виднелось два эпика. Во-первых, много раз упомянутая в прошлом посте специализация от Яндекса и МФТИ. Во-вторых, mlcourse.ai от известного в кругах дата саентистов сообщества ods.ai. (Забавно, что узнал и вступил в сообщество только после того, как сам начал работать настоящим дата саентистом). Решил начать со второго, осенью 2019 у курса была последняя очная сессия, с рейтингами, проверками домашек и прочими атрибутами настоящего обучения. Курс доступен и сейчас, но уже полностью в self-paced режиме. Я и еще один мой коллега вписались в эту движуху… И оба бросили обучение буквально после первого модуля. Впечатления у нас были похожие - началось все за здравие, хорошей разминочной главой про EDA - исследование данных. Но уже следующая часть с размаха кидала в матан и прочую теорию и выглядела примерно так - “вот вам огромная статья с теорией, вот “необязательные” лекции (по часу+ каждая), немножко примеров кода, в вот куча тестов и заданий, дедлайн через две недели”. Куски большие, и теории, и домашки, требуют приличного количества времени на “разогрев”, поэтому максимально неудобно было их совмещать с основной работой. А лично мне еще не понравилось, что изначально русский курс перевели на английский. Текст еще ничего, а вот лекции от этого очень сильно пострадали. Короче, этот курс я бросил, не зашло. Вам, возможно, подойдет, если получается на учебу выделять “жирные” блоки времени - несколько раз в неделю по 1.5-3 часа.

ощущения от курса, когда можешь посвящать ему минут 20-30 в день

Следующий заход в ML случился в начале 2020, когда удалось на работе получить оплаченный доступ к Курсере. Наконец-то дорвался до специализации “Машинное Обучение и Анализ Данных”, и начал потихоньку проходить ее курсы - всего пять штук + дипломный проект. И закрывать гештальт, открытый аж в 2017 году. Что могу сказать… По состоянию на 2020/2021 не могу рекомендовать эту специализацию к прохождению. Причем, самая засада в том, что качество курсов идет по наклонной - первые два (вводный, с математикой и питоном и про основы машинного обучения) сделаны хорошо, нормальные задания, качественные лекции. А вот с третьего курса (про обучение без учителя) специализация начинает скатываться. Выглядит это так - практические задания становится все сложнее запихать в грейдер, код из примеров перестает работать на актуальных версиях библиотек, а людей на форуме становится все меньше и меньше. Преподаватели так и вообще последний раз там мелькали в 2018 :). Пятый курс выглядит как жалкая попытка максимально сжато рассказать про все темы, которые ещё есть в области ML - недельку на предсказания, недельку на computer vision, немножко про тексты, чуток про ранжирование. Получается максимально сжато с откровенно тупыми заданиями, которые уже делаешь лишь бы пройти дальше. Венец всего - дипломный проект, который делается по инструкции, а проверяется такими же страдальцами, дошедшими до конца. Я на этом моменте специализацию бросил, понял, что электронный диплом затраченных усилий не оправдает, а получение новых знаний закончилось на четвертом курсе специализации (раздел про статистику и а/б тесты).

Специализацию проходил большую часть 2020" года. Начал в конце января, закончил в октябре. Я к тому моменту уже достаточно повзрослел, чтобы не сильно переживать из-за “незаконченных” или “брошенных” дел, но вот одна вещь меня начала напрягать. Раньше мне казалось, что задачи, связанные с обучением машин, я начну лихо делать, как только прокачаюсь в теории и разберусь как оно там все внутри устроено. Практика показала, что даже получив реальные ML задачи на работе, я как-то не испытывал от них особого энтузиазма. Объяснять продактам, что они неправы, и как ЦИФРЫ ЭТО ПОДТВЕРЖДАЮТ, было намного веселее, даже по зуму вместо личных встреч. Опять стал вырисовываться паттерн, о который я уже спотыкался ранее, еще до того, как начал заниматься аналитикой (об этом - в первой части). Повзрослевшему мне даже пришло небольшое озарение - вещи, на которые ты осознанно потратил приличное количество времени могут не зацепить или даже разонравиться.

Примерно так раньше представлял себе "настоящего дата саентиста за работой

А окончательно на свои места всё расставила вот эта статья, про роль “дата аналитиков” в компаниях. Если вкратце - есть несколько типов Дата Саентистов:

ML-инжинеры. Хорошо пишут код вообще и ML модельки в частности, доводят их до совершенства и выводят в продакшн, в обеденные перерывы выигрывают медальки на Kaggle. Таких товарищей я считал “настоящими” дата саентистами и сам пытался таким стать (см иллюстрацию выше)
Статистики и математики. От и до знают, как правильно проверять гипотезы, на какие метрики смотреть с какими поправками и как при обсчете результатов не наступить на грабли с одновременным выстрелом в ногу).
Аналитики данных. Мастера на все руки, которые очень быстро проверяют абстрактные идеи и хотелки от продактов, разработчиков, маркетологов и других важных и уважаемых людей. Результатом “проверки” является либо сразу готовый ответ на вопрос (отчётик там, дэшборд или презентация), либо отказ от идеи, либо задача одному из спецов выше - на правильную организацию эксперимента или создание ML-модели. Аналитик данных/продуктовый аналитик - то чем я по факту сейчас занимаюсь 95% времени на работе.

Первые два типа дата саентистов отлично владеют хардскиллами и прекрасно справляются со своими “нишевыми” задачами. Третий тип, “просто аналитик” не так хорош в технической части, но намного лучше понимает, что вообще происходит и как всё со всем связано. Вполне логично, что именно аналитикам такого типа прямая дорога на следующую ступеньку бизнеса, в “решалы”. Как красиво сказано в статье - Of the three breeds, analysts are the most likely heirs to the decision throne. И вот такая перспектива меня вполне устроила, думать, как заработать побольше $$$ не только для себя, но и для компании мне, в целом, нравится больше, чем скрещивать очередного ужа с ежом в зоопарке питоновских ML/DS библиотек. На этом моменте я обрел внутренний дзен относительно своих дальнейших карьерных перспектив и стал меньше смотреть в сторону технических нюансов и больше - в сторону всяких софт скиллов и методов заработка денег. Чтобы, как аналитик, прибыль не только считать, но и помогать её приносить. Посмотрим, что из этого выйдет дальше!

Аналитика + Деньги = ...

P.S. для бездушных поисковых роботов - оригинал и этого поста тоже был сначала опубликован у меня в личном бложике

Связанные посты

Как стать дата саентистом. The hard way

Вопрос: Датасатанисты, расскажите о своей работе

46 комментариев 👇

Сергей Белоус iOS-разработчик 6 июля 2021

Прастите, просто забавно совпало

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@belous, это было несложно, кажется, сегодня было несколько новых сатанистов в клубе)

Развернуть 1 комментарий

Artur Mindiiarov Backend developer 5 июля 2021

Учился на дата саентиста, после начал работать дата инжинером, в итоге дата сайнс и всякое машинное обучение разонравилось и сейчас работаю в бекенде :)

Развернуть 1 комментарий

Seva Oparin 5 июля 2021

@ArtMi, несколько раз заходил в МЛ-ку. Каждый раз отваливал либо в бекенд, либо в аналитику по предметной области, либо вообще в теор. информатику (считай, чистая математика с доказательствами и теоремами).

Развернуть 1 комментарий

Evgenii Kochanov 5 июля 2021 автор

@ArtMi, понимаю, как можно из ML переобуться в Дата Инженера. Но с какого момента и как возникает желание уходить в "чистые" программисты?)

Развернуть 1 комментарий

Artur Mindiiarov 5 июля 2021

@kochanoff, надоело джэйсоны перекладывать и гонять данные туда сюда. Как то у нас в команде было однообразно. Познакомился с языком Scala, написал пару высоконагруженных сервисов, вкатился в функциональное программирование и понеслось.

Развернуть 1 комментарий

Artur Mindiiarov 5 июля 2021

Scala кстати изучалась мной для Big data, но в итоге помогла перекатиться в чистые программисты. Как и data science помог перекатиться в дата инженеры кек)

Развернуть 1 комментарий

Дмитрий Хайтин 5 июля 2021

@ArtMi, а сильно эти прыжки отражаются на зп и карьерном росте? Есть беспокойство, что вот я уйду в дата инженера, потом надоест перекладывать джейсоны, уйду чисто в бекенд или другую разработку - и вот я 5 лет бегал странными путями, часть опыта вообще никак не конвертируется в то, чем я занимаюсь сейчас, и я получаю денег как если бы был в профессии только пару лет. А в это же время люди, которые начали одновременно со мной, но копали одну яму вместо трех, имеют гораздо больше размер денежного вознаграждения.

Развернуть 1 комментарий

Artur Mindiiarov 5 июля 2021

@SyntaxWarrior, ну в моем случае вопрос о смене с data engineer на software engineer был вопросом смены команды внутри компании, так что зп сохранилась. Можно сказать что я свичнулся за счёт компании. Через год уже просил повышение и получил где то 30-40% к зп. Возможно в случае дата саентиста будет сложнее переход на дата инженера, но мне было в кайф. В любом случае хард скиллы качаются пару-тройку лет и потом уже растешь больше за счёт софт скилов. Думаю что это очень круто иметь разный опыт, это может дать некорые преимущества. Кстати зп растёт не линейно с годами опыта, там что возможно копая три ямы у тебя больше шансов найти клад))

Развернуть 1 комментарий

Evgenii Kochanov 5 июля 2021 автор

@SyntaxWarrior, мне кажется, ты упускаешь тот момент, что копать одну яму вместо трех будет эффективно, только если это интересно и прёт. Но тогда и вопрос метаний не стоит. И наоборот, три "ямы" с интересом будут примерно равны одной, но без огонька. Ну если только ты из программирования не уходишь в моряки, а потом - в продавцы :)

Развернуть 1 комментарий

Stepan Zastupov 6 июля 2021

@ArtMi, > надоело джэйсоны перекладывать и гонять данные туда сюда

но ведь по сути, бэкэнд тем же и занимается :)

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@stepaha,

Развернуть 1 комментарий

💀 Юзер Удалился 7 июля 2021

@kochanoff, когда видишь всю эту грязь в данных и чушь в чужих мыслях, когда всю твою разработку ограничивают импульсивными деливери, когда семь бед - один юнет и от него шагать в сторону никто не хочет, и тебя не поддержат. Вообще код одноразовый у инженеров, беда какая-то. На бэкенде и рядом с ним до черта всего интересного, те же распределенные системы, да и зп можно выбить побольше.
А если вспомнить трактор по ML, то в некоторых развитых странах считают, что без бумажки ты букашка, которая не знает математики. И это на скрине. Да и рынок гораздо уже, чем для чисто-кодеров.

Трава зеленее, да. От компаний, где работал в МЛ, зависят впечатления. Но уже пройден небольшой путь и, имхо, как-то тухловато.

Велика вероятность нарваться на semi-ученых, у которых ум впереди кода, а выхлопа на практике мало. То же самое с энтерпрайзом, только МЛ в качестве ярлыка, из которого полезного выхлопа 5% проектов.
Гиганты типа DeepMind и OpenAI для меня лично недосягаемые сущности(в силу локаций и опыта), и то неизвестно, какой хаос и разочарование там ждут мелкого DS/ML спеца.

Сам хочу завести трактор, смотрю на рынок вакансий в Германии, и хочется сразу чего-нибудь покодить за такие деньги и непредвзятые требования, чем что-то доказывать очередным картинко-вращателям, что ты имеешь те самые знания и интуицию, которые им нужны.

Кстати, там много МЛ вакансий, которые закрыты для понаехов без разрешений на линкедине. И, нет, не коронавирус, а просто разработки в такой категории, что нельзя на них из-за бугра брать.

Развернуть 1 комментарий

Дмитрий Хайтин Разработчик DWH 5 июля 2021

Дай обниму! Схожий карьерный путь пока, схожие ощущения. Прошёл специализацию, курс от ODS, устроился в стартап на первую работу и там... все по-другому! BigQuery, DataStudio, дашборды, базы данных, пайплайны и много подводных камней.

Помню, на первой же большой таске знатно обосрался. Надо было сделать дашборд с финпоказателями компании-клиента. Я сижу в 2 ночи, ковыряюсь в этом и внутри ору «ты же устраивался обучать модели, почему ты занят бухгалтерией?». Под этот ор я не заметил, как сджойнил две таблицы, условно с доходами и расходами рекламных кампаний по id кампании. И все было бы хорошо, я отчитался, что все доделал, закинул в DataStudio и лёг спать. Каково же было мое удивление, когда утром мне сказали, что я оч знатно накосячил. Расходы есть, доходов нет. Оказалось, динамическая типизация в одной таблице прочитала ключ как int, в другой как str. И все, никакого джойна)

Я быстро пришёл в разум, много чего делал в компании и даже до машинного обучения дошёл. Но табличные данные оказалось очень скучно шатать. Думал либо вот этот курс https://dlcourse.ai/ пройти, либо забить и вкачаться в то, что мне уже нравится. Выбрал второе, учу сейчас всякое, чтобы на дата инженера податься.

Удачи! Буду рад через полгода почитать про продолжение твоего квеста) Инсайт, что то, куда ты вложил кучу времени и средств, может в итоге вообще не зайти - неочевидный, но реально важный)

Развернуть 1 комментарий

Evgenii Kochanov 5 июля 2021 автор

@SyntaxWarrior, подобные истории научили регулярно перепроверять полученное в джойнах с "реальными" данными во всяких админках). И когда все слишком хорошо, и когда подозрительно плохо!

Развернуть 1 комментарий

Anatolii Maksimov Product Analyst 12 июля 2021

вещи, на которые ты осознанно потратил приличное количество времени могут не зацепить или даже разонравиться.

сук до слёз

Развернуть 1 комментарий

Evgenii Kochanov 12 июля 2021 автор

@tolord,

А ты ведь тоже что-то похожее писал в клубе не так давно. Только не помню, тебе "разонравилась" аналитика вообще или какие-то частные аспекты типа ковыряния в табличках?

Развернуть 1 комментарий

Anatolii Maksimov 12 июля 2021

@kochanoff, аналитика в целом. Ну то есть мне хочется решать более абстрактные и высокоуровневые задачи, иногда прибегая к инструменту «аналитика»

Развернуть 1 комментарий

Kirill Lukyanov Системный бизнес-аналитик 17 января 2023

Прошло два года. Как успехи?

Развернуть 1 комментарий

Evgenii Kochanov 17 января 2023 автор

@HoneySocks, за это время случился дальнейший рост вглубь и немножко вширь. Формально, должность соответствует senior product analyst, по факту примерно 50% времени уходит на микс задач тимлида и продакта - учу новичков, передаю знания коллегам и ставлю им задачки по своей области, продакту в своей команде накидываю идеи о том, что еще нам можно попробовать, вместе смотрим результаты. Чувствую, что в ближайшем будущем доля тимлидства будет расти, а дальше уже посмотрим...

Развернуть 1 комментарий

Kirill Lukyanov 17 января 2023

@kochanoff, а можете что посоветовать человеку который очень хочет начинать с ML аналитика, а у него за спиной брошенный курс на GB? вопрос скорее риторический, понятное дело что обучаться. Однако на просторах самообразования так легко перегореть или прийти не туда, что кажется самый просто путь начинать со стажировки у кого нибудь. я прав?

Развернуть 1 комментарий

Evgenii Kochanov 17 января 2023 автор

@HoneySocks, это самый простой способ в теории, так как в принципе джуном/стажером очень сложно устроиться в нынешних реалиях. Тем более сразу со спецификой machine leraning-а.

Если будет желание и минутка - напиши мне в личку в телеграме поподробнее, что делал, на чём остановился, чего хочется и почему - подумаем вместе и приватно, чтобы тут не офтопить)

Развернуть 1 комментарий

Maximus Электрический инженер 5 июля 2021

Всё никак не поинтересуюсь: а как сейчас с дата-майнингом?

Или отмайнились майнеры? :/

Развернуть 1 комментарий

metya 5 июля 2021

@Maximus, это тоже самое что машин лернинг и дата саенс. в целом синонимы)

Развернуть 1 комментарий

Maximus 5 июля 2021

@metya, а тогда зачем было новое слово придумывать? ☺️

Развернуть 1 комментарий

metya 5 июля 2021

@Maximus, какое именно? Термину data science примерно столько же лет сколько data mining. Просто в разных средах в разное время юзались разные термины. Десять лет назад все пришло к одному знаменателю.

(Сейчас снова разошлось)

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@Maximus, мне кажется, дата майнинг (в моем понимании это в первую очередь создание структурированных данных из (открытых и не очень) неструктурированных) живее всех живых. Задача нужная, важная, немного нишевая, ей продолжают заниматься, в том числе и мои коллеги.

Вот только мне кажется, что хайпа вокруг неё никогда особого и не было, чтобы можно было про них писать "отмайнились" :)

Развернуть 1 комментарий

Maximus 6 июля 2021

@kochanoff, да там же и "майнинг", и "сайенс" — всё то же самое.

Просто посдедние пару лет решили форсить "сайенс". :)

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@Maximus, ну хз, глядя "изнутри" кажется, что там много разных направлений, такой же разной степени востребованности

Развернуть 1 комментарий

metya 6 июля 2021

@kochanoff, из какого "изнутри"?)
у всех изнутри разное)
и у всех понимание что есть что тоже разное.
но правда в том, что сейчас все специализируются, и поэтому нет общего зонтика.

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@metya, "изнутри" тут скорее как противовес к том, о чем автор комментария пишет. У которого дата саенс = дата майнинг :)

Развернуть 1 комментарий

Александр Лядов Computer vision Инженер 5 июля 2021

Вы пришли не из профильной области, иначе говоря самоучка :)
Поэтому вопрос: присутствует/присутствовал ли у Вас синдром самозванца?

(Если да, то как справляетесь/справлялись?)

Развернуть 1 комментарий

Evgenii Kochanov 5 июля 2021 автор

@8l1iUcE6ChZrwkvYLiadov, не могу сказать, что был. Наверное, на момент смены области я уже достаточно хорошо слышал про подобное явление)

Было другое, охреневание от того, СКОЛЬКО ЕЩЕ ВСЕГО РАЗНОГО есть в ML/DS (и сколько всего я даже теоретически не знаю). Это когда я только начал осваивать ODS

Развернуть 1 комментарий

Александр Лядов 6 июля 2021

@kochanoff, и как справляетесь с пробелами? Забили? :D

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@8l1iUcE6ChZrwkvYLiadov, осознание и принятие того, что ВСЁ знать невозможно - одна из самых сильных трагедий моего детства и юности :)

Что же до "пробелов" в DS - ну, тут два пути:

Искренне переживать, что где-то там, "на передовой", люди исследуют и тренируют какие-нибудь модные GAN-ы, а потом пишут научные статьи и делают модные приложеньки, а ты такой глотаешь пыль на обочине прогресса
Вспомнить, что ты на работе занимаешься вещами, весьма далекими от 95% описанных модных штучек. И сосредоточиться на восполнение пробелов в оставшихся 5%).

В целом, по последней ссылке в посте неплохо эта ситуация разложена.

Развернуть 1 комментарий

Ivan Kitov Дата сотонист 6 июля 2021

BRUH

Про специализацию яндекса согласен полностью. Первый заход в неё делал в 2018 году - тогда она, параллельно с ОДС очень хорошо бустанула меня до уровня аналитика в Яндексе. Попроходил основные части, оставил последние пару курсов на потом и пару заданий с грейдером из разных этапов.

Прошло пару лет, в 20м году открыл её снова. И выглядело это совсем уж уныло.
Курс ОДС могу всё ещё посоветовать домучать, т.к. там всё же хорошая база даётся, а от этого можно уже дальше плясать.

Только у меня, подобно твоему опыту, всё пришло к тому, что вместо трушно-пацанского машинного обучения, мне стало комфортнее заниматься тем, что объясняю продактам, где они неправы, как сделать данные вкуснее, пинаю разрабов и приправливаю это математикой и инжинирингом.

И, как оказалось, что рынок МЛ, конечно, большой, но самое интересное происходит в основном у гигантов-корпораций, а остальные занимаются делишками и делают продукты. А в продуктах, всё-таки, МЛ нужен далеко не всегда и куда проще обойтись парой достаточно хорошо работающих эвристик, а это "достаточно хорошо" определяют уже аналитики, которые могут и модельку натравить, и дисперсию снизить, margin of error увеличить и прочую магию сделать.

Короч, очень приятно видеть продолжение твоей истории, буду ждать следующей части через полгодика-год!

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@diveup, спасибо!

Развернуть 1 комментарий

Anton Nekrasov ML Engineer 5 июля 2021

Ого 🔥
Получается мне крупно повезло, учился шатать нейронки, сейчас на первом месте работы тоже их шатаю.
К вопросу скурпулезного отношения к данным приучили ещё на курсе. Заветное Garbage in - garbage out запомнил на всю жизнь.
Так и получилось, что в NLP, что в ASR...а уж в таблицах наверное и подавно, важность качества и корректности данных.

Развернуть 1 комментарий

Daniel Baldin Решения для контактных центров(Senior product owner). 6 июля 2021

Правильно сказал автор. Отличный путь развития любого разработчика или дата саентиста - это в бизнес. Будь то групповой фриланс, стартап или позиция в крупной компании. Разработка продуктов или пресейл. В редких случаях даже чистые продажи.

Я синьор продакт, сейчас учу дата саенс(компания оплатила скиллбокс) так как должен именно с точки зрения бизнеса понимать стек методов, как "летит градиент через свертку" ,чтобы можно было работать с командой на одном языке и прогнозировать поведение метрик.

Развернуть 1 комментарий

Evgenii Kochanov 6 июля 2021 автор

@danikbaldin, "компания оплатила скиллбокс" - за что они тебя так...

Ну а если шутки в сторону - там полноценный курс? Или что-то типа DS для менеджеров? Как ощущения?

Развернуть 1 комментарий

Daniel Baldin 7 июля 2021

@kochanoff, курс я купил, так как столкнулся с проблемой баланса между крутыми знаниями, на которые нужно кучу времени и возможностью помощи преподавателей.

Именно поэтому медленно, с учетом текущей загрузки, вкатываюсь как продакт в эту сферу, прекрасно осозновая, что уровня Junior мне будет предостаточно, чтобы общаться с заказчиками, впонимать метрики и работать с командой. Золото на Kaggle - не моя цель. Компания оплатила, поэтому что скиллбокс, что Youtube для меня бесплатны, только первом случае есть
реальная поддержка и интересные проекты

Курс действительно полноценный, но там дают наверное 20, от силы 25% знаний, которые будут нужны. Например нет теории графов, NoSQL баз данных, основ BigData (Hadoop, Spark, прочее), AutoML (AWS,Google, SberCloud), также очень мало рассказывают про нейросети.

Зато есть глубокое погружение в Python с ООП(что не всегда весть в DS курсах), полноценный курс R, SQL, нормальная математика (173 лекции, хороший старт для тупых, как я, чтобы потом самому понимать страшные формулы и зачем все это надо), обучение Gitlab, а также крутые курсовые и дипломные проекты с действительно хорошей поддерджкой. Самому можно много вникать, но с преподом всегда можно себя проверить. Важно, чтобы мои результаты кто-то проверял и критиковал. Ну и конечно в процессе обучение есть участие в соревновании на Kaggle. Обучение длится 2 года

Плюс на подобных курсах неплохое Community. Например, я закнчил SkillFactory по курсу AI Product manager. Так контент - ну вода немного с сахаром и где то с солью. Зато сообщество - бесподобное. Митапы, звезды бизнеса в DS, ментор - просто гений своего дела.

Стоит отметить, что домашки рассчитаны на хорошее знание Google, StackOvFo, так что теория на 20%, а домашки на 120%. Что хорошо, так как еще одна функция курсов - motivation stick + обзение с преподами.

Вывод. Если у вас есть 100к+ или вам оплатит компания, а также у вас нету времени, то есть вы уже в IT на хорошей позиции, тогда имеет смысл взять платный курс ради преподов и сообщества, готового материала и мотивации. А дополнительные знания в любом случае надо будет получать в ODS, Youtube, Kaggle и т.д.

Важно! Попробовать на платных курсах не дают. То есть если вы оплатили или взяли рассрочку, вы пройдете хотя бы один урок, то вам вернут всего 30% от суммы, что очень явно, черным по белому прописано в договоре, который вам дают подписать перед тем, как вы будете оплачивать. Если вы не активировали ЛК и не прошли ни одного урока - то 100% вернут без проблем.

Развернуть 1 комментарий

Evgenii Kochanov 7 июля 2021 автор

@danikbaldin, понятно, спасибо за подробный отзыв!

Развернуть 1 комментарий

Anton Sol решаю вопросики (с данными) 18 июля 2021

Спасибо, было интересно прочитать! Буду ждать следующих частей :)

А "методы заработка денег" это про поиск бизнес-модели, максимизирующую прибыль, или идеи для новых продуктов/фич, которые будут продаваться?

Развернуть 1 комментарий

Evgenii Kochanov 18 июля 2021 автор

@sol, основное сейчас - это поиск и подсвечивание того, что работает максимально эффективно. Например, выделение лэндингов или рекламных кампаний, которые в среднем лучше остальных или поиск триалок, после которых пользователи лучше конвертятся в платящих. Нам (аналитикам) сложно придумать что-то прицнипиально новое в продукте, все таки мы не продакты и не маркетологи. Но вот ткнуть в то, что работатат максимально эфективно, мы можем. Или, наоборот, показать, где теряется необоснованно много денег.

Развернуть 1 комментарий

Anton Sol 18 июля 2021

@kochanoff,

сложно придумать что-то прицнипиально новое в продукте, все таки мы не продакты и не маркетологи

ок, логично :)
Просто прочитав последний абзац, подумал что ты метешь в продакт манагера, а значит может изучаешь какие-то навыки на эту позицию.

Развернуть 1 комментарий

Evgenii Kochanov 19 июля 2021 автор

@sol, не совсем в продакта, но навык "приносить пользу и денежки" стараюсь развивать. А вообще по разговарам с продактами и сочувствующими понял, что один из основных инструментов для поиска вдохновения (на новые фичи и способы заработка) - это общение, с непосредственными пользователями продукта. Из него и рождаются идеи и понимание потребностей юзера

Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?

Войти или Вступить в Клуб