Как биологу вкатиться в аналитику данных

 Публичный пост
31 июля 2024  1043

Всем привет!

Большой пост о том, как биолог/биоинформатик может переквалифицироваться в аналитика данных, что для этого потребовалось сделать в моем случае.

Будет немного личного и субъективного, а также рекомендации курсов и советы для тех, кто захочет пройти схожий путь.

Надеюсь, это не будет выглядеть как-то так

🌱 Немного контекста

Бэкграунд

У меня высшее образование в биологии (бакалавриат и магистратура) в Новосибирском государственном университете. До переезда и переквалификации работала в научном институте биоинформатиком (о чем область, можно почитать здесь и здесь).
Дальше будет немного деталей для биологов:
Моя научная работа в аспирантуре была связана с изучением генных сетей растений на примере модельного растения Arabidopsis thaliana. Это было интересно изучать, у меня опубликовано несколько статей в научных журналах (Q1). Из методов требовалось проводить различные эксперименты с растениями (например, смотреть как действие фитогормона будет влиять на рост корня), считать статистику (привет, A/B тестирование) и визуализировать полученные данные, для этого писала скрипты на R и в меньшей степени на Python + MatLab. Для обработки RNA-seq писала баш скрипты и научилась выходить из вима 💪

Почему не биоинформатика?

В сентябре 2022-го года переехали из России с мужем в связи с небезызвестными событиями, а в конце 2022-го года я окончательно уволилась из института (до этого пыталась сохранить какое-то подобие удаленки) и думала, что делать дальше. Пробовала остаться в биоинформатике и подавалась на различные позиции в Европе через Linkedin, где не требовалось PhD, таких позиций было немало, но конверсия в приглашения на собеседования была околонулевой. Для меня осталось загадкой, с чем это было связано – недостаточно навыков и опыта (что странно, учитывая опыт в биоинформатике 4+ лет), отказ компаний работать с гражданами РФ, может резюме было недостаточно хорошим или надо было еще увеличить количество откликов (было около 30).

Еще подавалась и прошла все этапы интервью на вакансию, связанную с компьютерным зрением, в биоинформатическую компанию BostonGene, но на последнем этапе мне не согласовали релокейшн в Армению, что было довольно обидно.

После этого решила пробовать податься в аналитика данных.

🤔 Почему аналитика данных?

Вообще я достаточно давно была подписана на страничку karpov.courses еще ВК и видела у них программы как вкатиться в аналитику с нуля, и прочее + у вастрика видела рекламу курсов по ML (тот самый пост про машинное обучение для людей 😎), но пока училась в аспирантуре и работала биоинформатиком, было неактуально, хотя и смотрела в ту сторону.

После решения сменить область деятельности выбор пал именно на аналитику данных. Почему? Тут было несколько причин:

  • Работа с данными, в чем уже был достаточный опыт (в принципе поменять данные с биологических на телефонные или ритейл не так сложно)
  • Часть навыков, например R, Python и статистика уже были освоены и используемы
  • Новая область с другими задачами, возможность посмотреть, как оно все устроено в айтишке
  • Подруга продуктовый аналитик в Яндексе (привет, Настя) советовала попробовать и убеждала, что аналитика не так сложно и все получится.

Как оказалось, видов аналитик много разных, например, еще есть системная и бизнес-аналитика, но с моим бэкграундом наиболее подходящей является аналитика данных и продуктовая аналитика.

✍️ Что понадобилось изучить, какие курсы

Посмотрела требования в вакансиях на хедхантере, в среднем для аналитиков данных можно выделить такой набор хард скиллов:

  • SQL - маст хев, диалект не так важен, чаще всего нужен ClickHouse, PostgreSQL, MS SQL, реже Oracle.
  • Python/R со значительным преобладанием первого, плюс библиотеки для анализа и визуализации данных: pandas, numpy, scipy, seaborn.
  • Различные Bi-системы для построения дашбордов, например Tableau, PowerBI, Superset.
  • Excel - как минимум чтобы выгружать отчеты заказчикам, делать сводные таблицы, иногда какие-то ad hoc задачи проще быстро посчитать в экселе, и отправить заказчикам, чем писать скрипты.
  • Linux, Git, Docker - не всегда, но нередко требуется.
  • Airflow, AWX для построения ETL.

Для продуктовых аналитиков добавляется:

  • Знания и опыт в проведении A/B тестов
  • Статистика и теория вероятностей
  • Продуктовое мышление

Список не максимально полный, но наиболее необходимое здесь есть.

В моем случае необходимо было выучить SQL, и научиться делать дашборды, хотя бы понимать, что это такое.

SQL изучала на бесплатном симуляторе SQL с karpov.courses. Курс-тренажер очень крутой и полезный, подходит для тех, кто с нуля, все достаточно подробно объясняется и можно проходить без дедлайнов. Я на курсе выучила SQL на достаточном уровне, чтобы справляться с рабочими задачами в компании.

По дашбордам рекомендую лекции Романа Бунина по Tableau, например про алгоритм проектирования дашборда, верстку дашбордов в Tableau, кроме этого уже на первой работе проходила курс на udemy по Tableau. В самом начале было полезно, но целиком рекомендовать не могу, поскольку проходила за счет компании.

Поиск работы

Искала через hh, но конверсия откликов была очень низкая, так как мне требовалась удаленка не из РФ, а джунов не очень охотно берут на удаленку (в принципе можно понять, почему). Плюс, как мне кажется, резюме было составлено недостаточно хорошо, без акцента на предыдущие проекты и опыт работы и, следовательно, ничем не выделялось среди множества аналогичных откликов. Кроме этого, мне кажется существует небольшое предубеждение к людям из науки, из разряда, что человек не знает процессы и не сможет работать после института в компании (если это не так, поправьте в комментариях). Конечно, в индустрии есть своя специфика, но не то, что этому невозможно научиться 🤷‍♀️

Свою первую работу в аналитике нашла с помощью рекомендации в местную (Кыргызстан) телефонную компанию O! Mobile, хотя условия были не лучшие (обязательно офис, не самая высокая зарплата и тп), но я согласилась, так как посчитала, что важно найти первую работу в отрасли, а потом уже можно будет перебраться на условия получше.
Задачи были типичные для аналитика, удалось набраться опыта в SQL, построении дашбордов и проектировании автоматизации (настроила отчеты в телеграм вместо экселя). Эти навыки пригодились при устройстве на работу в X5 Tech, где я сейчас работаю.

Найти первую работу в новой области объективно сложно, приходится конкурировать с множеством людей после курсов, тут мне самой немного повезло, что благодаря рекомендации прошла первый этап отбора, и далее смогла хорошо пройти собеседование.
Думаю, могу осторожно рекомендовать уделить больше времени и внимания составлению резюме, чтобы подсветить релевантные моменты из предыдущего опыта, лучше представить учебные проекты и тд.

Что можно делать дальше

Для меня было бы интересно развиваться дальше как продуктовый аналитик, поскольку есть необходимый бэкграунд в статистике и опыт в проведении экспериментов. Для этого читаю материалы по продуктовой аналитике, подписалась на телеграм- каналы (по-моему у каждого второго аналитика сейчас телеграм-канал).
Многие авторы проводят курсы, посвященные A/B тестированию, сама пока не проходила, но присматриваюсь.

Рекомендации для желающих стать аналитиком данных

По скиллам написала выше, здесь кратко: SQL, скриптовые языки для анализа данных (R/Python), дашборды, статистика и теория вероятностей (для продуктовых аналитиков).

Остальные рекомендации будут относительно общими для любой айтишной области, но для себя убедилась, что это работает.

  • Стоит уделить достаточно времени качественному составлению резюме и сопроводительных писем, так как у рекрутеров большой поток и нужно чем-то выделиться.
  • Быть готовым к большому количеству отликов и отказов.
  • Быть готовым, что для первой работы условия могут быть не самыми лучшими.

А так, я думаю, что самое главное - это желание и готовность выделить время и силы на освоение навыков и поиск работы. Не буду утверждать, что мне было легко, но возможно. Если есть вопросы по теме, пишите здесь или в телеграме, постараюсь на все ответить.

Я веду телеграм-канал по статистике и аналитике, выкладываю материалы по статистике и мемы, подписывайтесь, буду всем рада!

7 комментариев 👇
Evgenii Kochanov Анализирую данные 31 июля в 06:43

Поздравляю с удачным перекатыванием!

Правда, мне со стороны реально кажется, что стуация как на картинке с жирафом в воде — считаю, что на прошлой работе у тебя были более сложные задачи + уже была получена необходимая база хардскиллов (если от R не дергается глаз, то всё остальное будет осовить изи). С таким вводными получить работу аналитика (данных) — просто вопрос времени и достаточной настойчивости.

  Развернуть 1 комментарий
Максим Кудрявцев Маркетинговый аналитик 31 июля в 07:23

Карпов вроде тоже из биолога стал аналитиком - удачно курс подобран)

  Развернуть 1 комментарий

@maxcurl, почти, он психологом был, но курсы вел в том числе для биологов и биоинформатиков

  Развернуть 1 комментарий
Natalia Sergeeva пилю Frontend когда не лень 31 июля в 15:35

Поздравляю! Молодец! Знакомый был phd в ботанике (Томск) стал синьором фронтендом!! Так что ты на верном пути) А почему решила поменять дайрекшн? тяжело в науке?

  Развернуть 1 комментарий

@agarkowa, тут много факторов, не в последнюю очередь финансовый вопрос (не очень-то что в РФ, что на западе финансируют науку). Плюс наложилась внешнеполитическая обстановка и в такой ситуации неплохо обладать возможностью удаленки. И еще муж, тоже биолог, решил оставаться в науке, а двум ученым в западной научной системе находить работу в одном городе квест очень сложный, если в семье один айтишник, ситуация упрощается.

Еще мне в аналитике нравится, что больше начинаешь задумываться как устроены вещи, с которыми контактируешь каждый день, какие механики монетизации у приложений и прочее, мне говорят, что изучать живую природу интереснее, но что придумали люди изучать тоже прикольно.

  Развернуть 1 комментарий

Всем напоминаю, что если вы хотите попасть аналитиком в Яндекс, то скорее всего вам придется задрочить на Leetcode АЛГОРИТМЫ.
Это уже мем.

Также сейчас часто аналитика так или иначе использует ML. Начиная от простых эконометрических моделей типа линейной регрессии, и заканчивая этими вашими нейронными сетями. Но тут обычно зависит от вас насколько сложную модель вы готовы строить, и какую часть из нее хотите написать сами.

  Развернуть 1 комментарий

@setterhead, о да, алгоритмы в яндексе это жиза, тоже туда собеседовалась на аналитика-разработчика. Про ML согласна, что часто нужно, но не везде, потому что либо отдельно есть ML-ребята (даже целые поздразделения), либо сама специфика области не подразумевает работу с моделями. Регрессии я мысленно отношу скорее к области статистики, хотя тут грань тонкая, можно спокойно отнести и к ML-алгоритму

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб