Ожидания компаний от специалистов по Data Science

ИТ-рынок постоянно меняется, и требования к начинающим специалистам в области data science также продолжают изменяться. Карьерный коуч Саша Куликова из Elbrus Bootcamp проанализировала несколько десятков актуальных вакансий по data science и показала, какими будут ожидания от джунов в этой области к 2023 году. Сана Оберемок, выпускница того же буткемпа, дополняет рассказ, основываясь на своем опыте прохождения собеседований за последние несколько месяцев.

Что касается стека технологий, то он остался практически неизменным. Наиболее часто встречающимися в требованиях к джунам являются знание SQL, Python, ML и DS/ML-библиотек (Catboost, GLM, Statsmodels, Pandas), а также Hadoop, Spark и Hive.

Среди новых требований можно выделить опыт работы с облачными платформами, который все чаще упоминается в вакансиях, а также понимание принципов DevOps. Некоторые компании также требуют опыт в построении непрерывной интеграции (CI) и непрерывной доставки (CD) для ML-моделей.

Саша Оберемок добавляет, что все больше работодателей интересуются также общими IT-компетенциями кандидата, такими как работа с Git, опыт контейнеризации и понимание того, что данные не просто берутся из файла, а хранятся в кластере.

Практический опыт работы становится все более важным, поэтому рекрутеры все чаще обращают внимание на проекты, такие как личные или пет-проекты, результаты участия в хакатонах и стажировках. Он должен включать неучебный опыт построения моделей.

Вот несколько примеров практического использования ASCII:

  • При разработке интернет-ресурсов и приложений разработчикам необходимо использовать ASCII для кодировки символов, которые не входят в национальную кодировку.
  • ASCII также может быть использован для сохранения файлов в закодированном виде для передачи информации. Однако при этом некоторые функции форматирования могут быть недоступны.
  • ASCII-коды могут быть введены с клавиатуры нажатием клавиши Alt и вводом числового значения, соответствующего символу из таблицы. Это позволяет печатать иероглифы, смайлики, буквы алфавитов других стран и так далее.

Таблица ASCII использует 8-битную кодировку, а числа представлены в двоичном формате для возможности распознавания компьютером. Десятичное представление понятнее для людей, а шестнадцатеричное представление позволяет группировать значения в таблице.
Также важно иметь хороший уровень английского языка, так как в половине исследованных вакансий требуется его знание. Это позволяет читать техническую документацию на оригинальном языке и общаться на английском с коллегами.

Как видно из всех этих требований, data science - это не только техническая область, но и требует развитых софт-скиллов, таких как коммуникация и умение работать в команде.