Как стать дата саентистом. The hard way

 Публичный пост
23 апреля 2021  8558

У нас в клубе любят истории успеха и вкатывания, поэтому поделюсь своей, надеюсь, кому-то будет полезно!

Я поделюсь своим путем в "самую сексуальную профессию 21 века". До 2018 я занимался не очень связанными с Data Science и Machine Learning (далее DS/ML или по-русски) штуками, я и программировать-то толком не умел! Поэтому у меня регулярно знакомые интересуются, как же я дошел до такой жизни, что для этого нужно и как именно я учился-вкатывался. Вот и решил написать пост, а в него положить всяких полезных ссылочек и своих впечатлений, о том, что работает хорошо, а что - так себе, и как оно вообще ощущалось по пути.

В анализе данных я работаю уже три с лишним года, с начала 2018 года начал делать первые робкие шаги, в декабре 2018 устроился полноценным Дата Саентистом, да так и продолжаю. Буду периодически по тексту упоминать даты, чтобы было понятно, сколько занимали по времени разные этапы.

0. Вводные данные

Почти сразу после окончания универа (Бонч-Бруевича, "телефонная" специальность) в 2010 году я устроился в мониторинг, он же NOC. Мониторинг - это такая работа, которая требует от инженера знать всего понемножку, а так же уметь из этих (обычно весьма поверхностных и обрывочных) знаний составить картину поломки и понять, кого из "взрослых" будить среди ночи для оперативного устранения. С одной стороны - никакой специализации, с другой - возможность прокачиваться в любом направлении и становится уже полноценным инженером в какой-либо области - сети, железки, администрирование серверов - выбирай, что душе ближе. Лично я в разных качествах, от мальчика на подхвате до старшего смены работал в NOC-е почти 8 лет. И, наверное, 6 из них пытался понять, что же делать дальше, тыкался в разные прилегающие области, но дело как-то совсем не шло.


Типичный мониторинг, когда всё работат в штатном режиме, без аварий

Первые несколько лет разбирался в сетях, наиболее близкой теме к тому, что изучал в универе. Дело шло ооочень медленно. CCNA в конце 2015 года сдал, только для того, чтобы понять, что дальше я коммутаторы-маршрутизаторы изучать не хочу, уж слишком это все низкоуровневое. После краткого экскурса в информационную безопасность решил, что мне больше подойдет роль ДевОпса - этакого суперадмина, который и в линуксах понимает, и программирует немножко, и вообще совмещает в себе лучшее из программистов и системных администраторов. Сказано - сделано! Начал с изучения всяких линуксовых штук, даже пару экзаменов (LPIC) сдал в 2016 году. В том же году сменил работу, попал в еще более крутой NOC, в котором начал называться SRE-инженером. Официально - Service Reliability Engineer, де факто - Simply Restart Everything :). И стал на еще один шажок ближе к заветной должности DevOps-а. Там же посмотрел на этих самых ДевОпсов поближе и понял что? Правильно, что нафиг мне это на самом деле не нужно. И вообще ни в какие ветки админства мне уходить абсолютно не хочется. Альтернатива, прокачаваться по управленческой ветке, тоже не очень цепляла. Даже если станешь начальником, то руководить будешь NOC-ом. И это не то чтобы плохо, но весь мой предыдущий опыт показал несколько предвзятое отношение со стороны и коллег-руководителей, и более высокого начальства к подразделениям мониторинга. Итог - есть два стула, ни на один садиться не хочется. Что же делать? Учиться дальше.

Вывод первый - если вы решили что-то в жизни поменять, но перемены идут черепашьими шагами, а огонь в глазах все не загорается, то нужно разбираться с мотивацией, возможно даже с помощью психолога. На морально-волевых "цели" можно достигнуть. Только чтобы расстроиться из-за того, что она не очень-то и нужна оказалась.

1. Учиться дальше

В некотором карьерном ступоре я продолжил по инерции изучать всякие навыки, необходимые абстрактному ДевОпсу. Один из них - программирование, и я решил освоить Python. Начал с книги-сайта Learn Python the Hard Way (на тот момент ещё полностью бесплатной), в целом, понравилось, неплохой вариант начать хоть что-то делать, если нет вообще никакого опыта кодинга, или, как у меня, с универских лет всё позабылось. После продолжил курсом Complete Python Bootcamp на Udemy. И вот на нем случилось очередное "озарение". Мне очень понравился стиль преподавания, и я решил посмотреть, какие еще у преподавателя есть курсы. Приглянулся Python for Data Science and Machine Learning Bootcamp. И хоть я я на тот момент еще думал "Ну где я, а где машинное обучение, там ж ПРОГРАММИРОВАТЬ надо вовсю, да и матан на статистике сидит, да теорвером погоняет!" Но курс запомнил. В конце концов, раз преподаватель смог мне Python объяснить, то и с чуть более сложными темами справится.


И с математикой, и с программированием в итоге разобрался. С Божьей помощью

Любопытный момент - последним доводом купить курс стала реклама специализации на "Машинное обучение и анализ данных" на Курсере. Я тогда посмотрел на ту специализацию, загорелся DS/ML, пооблизывал слюни - они обещали очень обстоятельно научить всему-всему, от необходимой математики-статистики до нейронныз сетех, и за разумное время. Но специализация стоила для меня дорого, около 5000Р в месяц (я тогда не знал, что "финансовую помощь" на Курсере раздают с минимальной проверкой), поэтому я в итоге пошел на Udemy и купил там упомянутый курс. Аж за 10$. Учиться начал в апреле 2017, эту дату можно считать стартом, моментом, когда осознанно покатился в сторону DS. У меня от старта до первой полноценной работы вышло 1.5 года.

DS курс на Udemy, несмотря на его скромный размер, проходил достаточно долго. Тут виновата была уже не прокрастинация, а другие штуки. Во-первых, почти сразу я осознал огромный объем того, что я не знаю (забыл, знаю посредственно) - от теории вероятностей до SQL. Постоянно приходилось брать паузы на минимальное изучение той или иной области. Во-вторых, текущая работа на тот момент не особо позволяла расслабленно проходить курсы прямо на рабочем месте (как я обычно делал ранее). Первая половина дня выдавалась очень напряженной, и совсем неудивительно, что второй учёба шла туго. Но это очевидно сейчас, а в моменте я очень растраивался и винил себя за "лень" и "прокрастинацию". Что радуает - в моменте уже не возникало мыслей "А может, это не мое, надо попробовать что-то другое". В отличие от сетей и линуксов я точно понял, что Дата Саенс, не важно, в каком именно воплощении, это моё, и продолжать определённо хочется.

Вывод второй - совмещать учёбу и фултайм работу может быть тяжело. Не надо расстраиваться и корить себя, если не получается проходить курсы в "рекомендованном" темпе и вовремя решать домашки. И точно в такой ситуации не стоит записываться на (платные) курсы, которые будут отчислять за несданные вовремя работы. Учёба - это марафон, лучше добраться до финиша в своем темпе, чем потратить всю энергию на полпути, выгореть и сойти с дистанции.

2. Набираем опыт

До окончания своего первого курса по DS я даже особо и не думал насчет того, чтобы ходить по собесам. Да и после окончания я понимал, что теперь я не знаю еще больше, чем представлял себе в начале обучения. Классическая ситуация! А делать-то что? Усугублялось всё тем, что ни одного знакомого ни в области DS, ни в чем-то смежном у меня не было, совета спрашивать было не у кого. Сейчас я понимаю, что надо было спрашивать вообще у всех худо-будно айтишных людей - "Ты знаешь как быть, куда идти? А кто может знать?", это наверняка бы выгорело. Но я предпочел идти своим путём (см название поста). Суть моего пути была предельно проста - попытаться на текущем месте работы придумать себе задачи и опыт, который можно будет в резюме обернуть как максимально похожий на работу аналитика. Ну и параллельно продолжать самообразование.

С начала 2018 (9 месяцев с начала обучения) я начал бурную деятельность по поиску и решению любых задач в области NOC/SRE со словом "аналитика":

  • Разобрать крупные аварии и попытаться разделить их на категории? Да, запишем в резюме как "анализ инцидентов"!
  • Ковырять БД заббикса в поисках неправильно настроенных хостов для мониторинга? Да, потренируем SQL!
  • Накостылить кастомные запросы для Джиры на их несчастном JQL чтобы было понятно, кто из коллег в NOC-е сколько тикетов открывает и обрабатыавает? Дайте два, "метрики и анализ работы отдела!"
  • Автоматизировать сбор большого еженедельного отчета с кучей разных источников, и картинок? "Берём!" Тут даже и думать не надо, и python с pandas-ами пригодится, и картиночки красивые в Seaborn-е порисуем.

Примерно через 5 месяцев (апрель-май 2018) подобных упражнений я почувствовал себя достаточно уверенно, чтобы переписать своё резюме под нужным углом и попытаться пробиться на первые собеседования. Накопленного опыта, правильно составленного резюме и собственной наглости хватало, чтобы благополучно проходить HR-фильтр и попадать на технические собесы. Которые, конечно же, либо заканчивались фиаско, либо были в итоге совсем не про DS/анализ данных. Сейчас вспоминать забавно, но в моменте было очень досадно - год учёбы, а выхлопа никакого. Последней каплей стало собеседование в Okko, на котором я сначала долго тупил над простейшей задачей по теории вероятностей, а потом переволновался и не смог внятно ответить ни на один вопрос по машинному обучению. Правда, не то чтобы я знал ответы на все из них и в спокойном состоянии... В любом случае, после такого особенно громкого провала я окончательно расстроился и взял паузу на футбол, как раз начинался ЧМ-2018.

Собеседования, тем не менее, не прошли даром - я понял, какие вопросы задают потенциальному дата саентисту, какие знания - must have, а на что готовы закрывать глаза. И через некоторое время продолжил обучение...

Что прочитал за тот период:

  • Ч. Уилан, "Голая Статистика"; Д. Хафф, "Как лгать с помощью статистики". Не столько учебники, сколько развлекательная литература. Необходимый минимум знаний по статистике из них тоже можно почерпнуть.
  • К. Андерсон - "Аналитическая Культура". Хард-скиллы не прокачивает, но дает представление о том, чем вообще занимаются дата-саентисты. Оказывается, там далеко не только машинное обучение, но и множество других, не менее интересных направлений. Книга "на вырост", если вдруг захочется стать менеджером.
  • Д. Грас "Data Science. Наука о данных с нуля". Впечатления двоякие. В первый заход я ничего не понял вообще и бросил. Вернулся к ней через полгода, когда поднабрался опыта и понял основные концепции. Смысл в изучении и построении своих собственных ML-велосипедов, а книга именно про это, появился. Как первую книгу по DS точно не советую.

Вывод третий - опыт нужен, причем подойдет любого качества. Собственные проекты, посты в тематических блогах, портфолио на гитхабе, аналитические и DS задачи на текущей работе - при правильной подаче сгодится всё! Курсы и книжки - это очень здорово, но потенциальный работодатель хочет видеть, что хоть что-то из теории вы умеете применять на практике!

3. Больше самообразования, больше собеседований

Не могу сказать, что я после первых провалов как-то изменил свою тактику и добавил новых приемов. Досада сменилась дополнительной мотивацией, стало понятно, на какие моменты обратить дополнительное внимание. Первый курс по DS был пройден, что учить дальше? Тратить по 5000Р на ту самую специализацию от Яндекса и МФТИ мне было особо не по карману, поэтому я на той же Курсере нашел другой, бесплатный, курс - "Введение (АХАХАХАХА) в Машинное Обучение", от Яндекса и ВШЭ. В нём мне попалось супер-комбо - образование в стиле российского ВУЗа помноженное на косяки курсеровской платформы (это когда ты значимую часть времени тратишь не на то, чтобы сделать задание, а чтобы грейдер его принял). Курс у меня оставил очень яркие и противоречивые эмоции. Лекции - отвратительные, чистая теория, из которой понятно было процентов 30.


Увы, сопутствующая лекция воспринималась так же тяжело, как пять этажей формул без пояснений

Причем, на лекциях вообще ни слова о том, как этим всем пользоваться на практике, кода лектор не показывал. После теории (на которой IDE ни разу не открывалась) идёт практика. Суть практических заданий "Ну вот вам датасет, покрутите на нем логистическую регрессию с разными видами регуляризации, ответ к заданию - качество предсказаний в сценарии X при условии Y. Вам понадобится библиотека ххх, вот тут можно доки-справочки почитать, как ей пользоваться. Ну вы взрослые, разберетесь. Удачи!" Казалось бы, зачем себя истязать и проходить такой курс? Но буквально с первых же домашек я понял, что "глаза бояться, а руки делают". И у меня, ОКАЗЫВАЕТСЯ, уже была накоплена критическая масса опыта и знаний, чтобы не только пробиваться через эти задания, но извлекать из себя что-то новое. На таких вот лютых квестах, на грани выполнимого, как раз и растет понимание того, как вся эта теория машинного обучения устроена под капотом. В общем, теоретическую часть курса я категорически не рекомендую, а вот практической все таки можно воспользоваться, в качестве задачника-тренажера.

В августе-сентябре 2018 я пошел на второй круг собеседований, стало получаться уже намного лучше. Я по-прежнему не получал оферов, но отказы были скорее из-за недостатка практического опыта, нежели из-за того, что не могу задачки на интервью порешать. А так начали уже и тестовые задания после технической части присылать, и на следующие этапы звать.

Больше всего запомнилось два собеседования в этот период. Первое было в одну из дочек Газпрома, в качестве тестового задания они предложили провести расчеты того, как нефтепродукты по железной дороге путешествуют по стране. Сама позиция была не очень интересна, но все тестовые в тот момент я старательно делал для наработки скилов. Зарылся в это задание на пару дней, потом еще неделю мне снились все эти Омские, Нижегородские и Москвоские НПЗ, какой груз на них сколько времени проводит, и что в итоге доезжает до морского порта в Петербурге.

Второй запомнившийся собес был от Grid Dynamics, они тогда набирали начинающих спецов на что-то вроде обучения-стажировки. Очень хотелось попасть, по описанию было то, что нужно - и по-английски говорят, и в командировки в Америку отправляют, и всему научат, да еще и денег заплатят. Первый тест у них прошел относительно легко, а вот с основной технической частью случился провал. Тут я виню технику - у нас не сложилось офлайновое собеседование, общались в скайпе. В итоге, мы друга слышали примерно на 3 из 5, постоянно переспрашивали, уточняли, повторяли... Блеснуть умом, когда приходится повторяться и прерываться, очень сложно, а я с тех пор не люблю собеседования в онлайне. Хорошо, что я не знал тогда, что в 2020 у нас только такие и останутся :)

Параллельно с собесами, дальнейшим самообразованием и практикой на работе я так же начал пытаться себе создавать "правильную" информационную среду. Сходил на пару митапов, посвященных DS и анализу данных, начал слушать подкаст Data Framed (там разные эксперты в области DS рассказывают, как дошли вообще до такой жизни), стал читать все подряд о том, как весь этот дата саенс используется на практике. Таким образом, к концу осени 2018 у меня уже накопилась критическая масса знаний (как хардовых, так и околопрофессиональных), опыта прохождения собеседований и решения тестовых заданий, получение офера стало вопросом времени.

Символично, что офер пришел через пару дней после того, как закончил чтение эпичного лонгрида от Вастрика про Машинное Обучение. Статья определенно заряжена на успех! В конце ноября получил предложение от компании Semrush, в декабре начал там работать и до сих пор продолжаю. Успех? Ага, щас... Стало понятно, что по сути, всё только начинается, но это уже тема для следующего поста.

Вывод последний - иногда кажется, что наши долгосрочные усилия не приводят вообще ни к какому результату. А это совсем не так, просто мы ожидаем, что выхлоп будет линейным, а на самом деле он идет с небольшой задержкой (см ниже). Продолжайте, и у вас все обязательно получится!

P.S. для бездушных поисковых роботов - оригинал изначально опубликован у меня в бложике

Связанные посты
43 комментария 👇
🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Какой крутой пост! Поздравляю с успешным вкатыванием!
Истории вкатывания и смены карьерной траектории во взрослом возрасте (в смысле, не сразу после вуза, а когда где-то уже поработал нехило) - прям круто и вдохновляюще!

Кстати вот интересно, как работает ценообразование на курсере:

прям стало любопытно, почему такая разница (но я недостаточно соображаю в теме, чтобы суметь сравнить программы по ценности содержимого)

  Развернуть 1 комментарий

@jamie_liberty, Спасибо! Я сегодня с утра, сидя с ребенком, осознал, что основная работа по вкатыванию шла не только в момент уже типа устоявшейся карьеры, но и сразу после того, как стал молодым отцом, с конца 2017. Со свободным временем стало ещё тяжелее, но на правильной мотивации (см первый вывод) как-то удавалось находить свободную минутку и продолжать

  Развернуть 1 комментарий

@jamie_liberty, через университет 2035 - курсера=бесплатно

  Развернуть 1 комментарий

@Alexander_A, я скорее удивилась, что так по-разному стоят курсы на одну тему - Гугл в два раза дешевле МФТИ практически, загадка

  Развернуть 1 комментарий

Автор молодец, поздравляю!

Мне тоже повезло вкатиться в ДС в 34 года, причём с ноги. Заняло всего 3 с половиной месяца после семи лет работы во дворце детского творчества (до этого умудрился поработать даже аниматором в аквапарке). За плечами был только неоконченный Мат-мех СПбГУ и дикое желание заняться наконец чем-то интересным и нормально оплачиваемым.

После ухода с основной работы в сентябре 2019 года плотно засел за курсы, учился по 14-16 часов в сутки одновременно на Курсере, Степике, Ютубе, различным сайтам и книжкам. Через месяц начал качать хождение на собеседования, т.к. в этом опыт был абсолютно нулевой. За три месяца успел сходить на 5-6 интервью (разослал наверное больше двухсот), перестал дрожать и стал замечать закономерности. Ну и знания подкопились.

В итоге повезло и в декабре я устроился в разработку нейронок для компьютерного зрения. С тех пор радуюсь уже полтора года, но продолжаю ежедневно учиться, т.к. всё больше понимаю, что знаю ну оооочень мало. С книжек постепенно перелез на статьи с arxiv.org, постепенно вникаю в соседние науки + качаю английский. В общем, делаю всё то, что не доделал в университете. Больше всего радуют перспективы роста, кайфовые задачи и постоянное развитие самой области дип лернинга.

Короче говоря, вкатиться можно, нужна только сильная мотивация. Рекомендую :)

  Развернуть 1 комментарий

@stopmosk, Серёга, привет)

  Развернуть 1 комментарий

@SyntaxWarrior, добрейший вечерочек :)

  Развернуть 1 комментарий

@stopmosk, мощно! У меня с самообразованием аналогично, ощущения, что уж если вкатился, то всё, теперь можно расслабиться, и зарплата сама начнет расти в геометрической прогрессии, не возникало. Новые знания, по ощущениям, впитываются примерно в таких же объемах, как и до вкатывания. И да, понимание того, что нихера не знаешь, только усиливается :)

"За плечами был только неоконченный Мат-мех СПбГУ и дикое желание заняться наконец чем-то интересным и нормально оплачиваемым." - а раньше-то почему не складывалось? Что в итоге стало "последней каплей"? К таким, достаточно резким переменам?

  Развернуть 1 комментарий

@kochanoff, да-да, тут как почти как у Кэрролла: "Нужно бежать со всех ног, чтобы только оставаться на месте...".

А почему раньше не складывалось - вообще оно складывалось, даже в какой-то момент казалось, что у меня хорошо получается работать с детьми и это призвание. Но потом перебесился, стал спокойнее и за несколько лет постепенно понял, что выбирал тот путь, т.к. просто было весело и беззаботно. И дальше надо всё взвесить и уже серьёзно решить.

"Последней капли" у меня не было, просто в какой-то момент я сначала понял, что застрял на текущем месте, потом понял, что перспектив и в соседних местах особо нет, потом понял, что не забыл матан и теорвер и, наконец, понял, куда именно я хочу двигаться. Длительный, в общем, был процесс понимания. Закончился длинным отпуском в Португалии и заявлением об увольнении.

Кстати, тоже пытался осилить тот курс с Курсеры, где много формул. Соглашусь, что он совсем не в духе обучающих платформ. Зато очень зашли курсы со Степика от Samsung про CV и NLP. Проходил параллельно с курсом ods на ютьюбе от Семёна и книжкой Франсуа Шолле "Глубокое обучение".

  Развернуть 1 комментарий

@stopmosk, ОГО!

  Развернуть 1 комментарий
🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Супер крутой пост, спасибо!
А расскажите, если не секрет, просела ли зарплата у Вас при переходе на первую работу в DS? (на сколько, как быстро восстановилась?)
А то у меня это больная тема. Несколько раз собеседовалась, но предлагали сильно меньше, чем я сейчас зарабатываю как программист. И вот вроде и хочу в DS, но жаба душит)

  Развернуть 1 комментарий

@larisaoriekhova, Благодарю!

Да, у уменьшению ЗП я был морально готов, понижение было, на 5000Р, а еще сгорела годовая премя на предыдущем месте. В целом же, я на зарплатных переговорах озвучил этот момент, поэтому договорились следующий пересмотр ЗП сделать почти сразу после испытательного срока. Так оно через 3-4 месяца и вышло.

Если хочется в DS, и не поджимают другие обязательства, то можно и переходить. Это с моим инженерным прошлым перспективы роста были не очень понятны, а "программисткими" скиллами, как мне кажется, можно почти наверняка за год отыграть просадку и потом уже дальше идти в плюс

  Развернуть 1 комментарий

ой, и кстати интересно - сейчас уже, когда все произошло - как ты оцениваешь свой процесс, ты бы стал что-то менять или делать по-другому, если снова бы пришлось?

  Развернуть 1 комментарий

@jamie_liberty, я слишком поздно начал общаться с реальными людьми, которые уже работают в области, у меня долгое время просто вообще никого не было среди знакомых! А по незнакомым людям я ходить боялся, и, кстати, зря:)

Как по мне, так возможность именно вживую общаться с опытными товарищами очень сильно помогает понять, что важно в процессе вкатывания, а на что можно и забить.

  Развернуть 1 комментарий
Михаил Семиколенов разработчик электронной бюрократии 25 апреля 2021

иногда кажется, что наши долгосрочные усилия не приводят вообще ни к какому результату. А это совсем не так, просто мы ожидаем, что выхлоп будет линейным, а на самом деле он идет с небольшой задержкой

Где-то читал такую концепцию, что на знания, как на капитал, капает сложный процент. Поэтому сначала всё медленно, но со временем происходит точка перелома графика "профит от знания" вверх и начинает всё получаться.

  Развернуть 1 комментарий

@TepMex, на знания, на капитал, на репутацию и на полезные привычки)

  Развернуть 1 комментарий
Olga Kai админ в Метаверсошной 25 апреля 2021

Классный опыт. Видно, что тебя очень зажигает эта сфера, потому что без настоящей страсти такой путь вообще не затащить - будешь помирать от фрустрации на каждом шагу.
Кстати интересно, есть ли кейсы перехода в DS из полных гуманитариев. Или скажем, в программисты из гуманитариев.
Видела только один ролик на ютубе девушки-бариста, которая стала java разработчиком.

  Развернуть 1 комментарий

@Elly404, я из маркетинга в DS попала (три года опыта), но изначально целилася не в инженерную специальность, а в менеджерскую. Четвёртый год уже в сфере, если считать год учёбы :)

  Развернуть 1 комментарий

@Sazerland, круто! а как осуществлялся процесс вкатывания в эту сферу из маркетинга?

  Развернуть 1 комментарий

@Elly404, через очную учебу в бизнес-школе :)

  Развернуть 1 комментарий

Автор, ты красавчик!
В моей компании запустили менторство пару лет назад, где мы помогаем всем желающим вкатиться в ДС и МЛ под присмотром ментора. Путь похож на тот, что ты описывал: онлайн курсы, книги, поиск практических задачек на работе и на каггле.

Но мало у кого есть мотивация дойти до момента смены работы. Большинство людей боится потерять деньги или начинает бесконечно откладывать учёбу из-за работы или чего угодно ещё.

Очень рада, что у тебя получилось!

  Развернуть 1 комментарий

@Sazerland, Спасибо большое! Считаю, что в плане потери денег я был в выгодной ситуации - в предыдущей области(NOC-SRE) и так почти уперся в зарплатный потолок, а в DS это был входной уровень. Разница в окладе составила 5000Р, отыграл и переиграл ее уже через 4+ месяца

  Развернуть 1 комментарий

@kochanoff, очень крутой!
А сейчас какие в основном задачи на работе решаешь?

  Развернуть 1 комментарий

@Sazerland, Сейчас процентов на 80 - продуктовая и около аналитика, с небольшими отвлечениями на А/Б тесты и, изредка, машинное обучение

  Развернуть 1 комментарий

@kochanoff, спасибо! А продолжаешь сейчас обучение активное или пока приостановился?

  Развернуть 1 комментарий

@Sazerland, да, куда ж без него. Это вообще тема отдельного поста - как ощущал себя в новой роли, как пришлось подстраиваться на ходу и какие знания-навыки прокачивать по ходу дела. Вкратце - примерно первые полгода обучение шло по рабочим задачам, потом стало как-то полегче и снова стал смотреть на дополнительные курсы. Всегда есть ощущение, что чего-то не хватает, что-то можно подтянуть-освежить. И это только чтобы оставаться в тонусе в текущей роли!

  Развернуть 1 комментарий

@kochanoff, напишешь вторую часть?)

  Развернуть 1 комментарий

@Sazerland, "давайте уже после праздников"

  Развернуть 1 комментарий

@kochanoff, ахаха, ну ок, но только ж напиши!

  Развернуть 1 комментарий

@Sazerland, праздники прошли, я написал)))
https://vas3k.club/post/10856/

  Развернуть 1 комментарий
Andrii Sharshakov Сообразительный, в меру ленивый фулстек-бабуин 27 апреля 2021

CCNA в конце 2015 года сдал, только для того, чтобы понять, что дальше я коммутаторы-маршрутизаторы изучать не хочу

So true. На этом месте расплакался и дальше пока не читал.

  Развернуть 1 комментарий

Как же все написанное знакомо. И хотя я в DS зашел не с нуля, все равно это было непросто. Но путь был аналогичным: после ухода с предыдущего места работы прошел курсы Карпова на степике, потом от МФТИ на курсере, параллельно юзая DataCamp. Потратил примерно 4 месяца. А потом уже начал постепенно вспоминать то, что проходил обучаясь/работая в универе. Но первые собеседования были полнейшими фейлами. Просто тупо потому, что я не знал как на практике применяется тот или иной метод, хотя и понимал его. До сих пор помнится тестовое задание от авито, где нужно было по выборке оценить удовлетворенность клиентов после общения со службой технической поддержки. Сколько ошибок я там сделал...
Но и сейчас, работая дата саентистом уже больше года, прекрасно понимаю, что нельзя останавливаться на месте, верно было подмечено: чем больше изучаешь, тем больше понимаешь, что не знаешь еще больше))))

  Развернуть 1 комментарий

Как нашлись митапы? Может посоветуешь какие? :)

  Развернуть 1 комментарий

@ch3sh1r, в тот момент я еще не выбирал и не искал что-то специальное, а просто ходил на те, про которые случайно узнавал, и по времени было удобно)

"Находились" они либо из внутренней почтовой рассылки - там в офтоп периодически кидали ссылки на мероприятия, либо через timepad.ru или что-то аналогичное. Там если на один митап по теме сходишь, он потом сам аналогичные подкидывает.

Не скажу, что это тогла было как-то супер полезно с практической точки зрения, навыков и скиллов. Но вот на живых людей посмотреть, понять, что "великим и могучим" дата саенсом и машин лернингом не только мифические полубоги занимаются, но и простые люди было очень полезно для самооценки.

Сейчас в поисках полезного я бы смотрел в первую очередь в сторону того, что в ods.ai обсуждают и советуют

  Развернуть 1 комментарий

Привет. Отличный пост. Мне тоже нравится всё, что связано с питоном и машинным обучением.
А можно узнать, какие задачки для DS ты мог бы посоветовать для начального уровня, чтоб прям вкатиться?

  Развернуть 1 комментарий

@zed, спасибо!
Ответ на твой вопрос зависит от того, для кого этот начальный уровень. Если что-то, что показать на собеседовании, то это может быть джупитер-ноутбук с исследованием какого-нибудь датасета, который ты "знаешь" и про который сможешь что-то рассказать. Типа "вот мы загружаем данные, вот мы их чистим, вот тут убрали дубли, тут построили гистограммы, нашли на них интересные выбросы-аномалии. Теперь немножко ML - кладем эти данные в модельку и предсказываем Y на искуственных данных"

Например, я увлекаюсь бегом, для портфолио хотел сделать такой проект - взять протокол беговых соревнований, почистить-попреобразовывать данные, показать, сколько мальчиков-девочек в какой категории, кто в клубе беговом, кто сам бежал, кто из России, а кто нет. Порисовать картинки, а потом в конце предсказать (хоть бы и простейшей линейной регрессией) время на финише в зависимости от названных выше "фичей"

  Развернуть 1 комментарий

@kochanoff, звучит бомбически твой пример. Возможно, я задам вопрос в клубе в основной ветке чуть позже. Сейчас немного мысли соберу в пост. Спасибо

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб