Як влаштуватися на першу роботу в галузі наукових даних?

Як можна отримати свою роботу на першому рівні в якості даних вченого або аналітика даних? Якщо ви прокрутите форуми з наукових даних, ви знайдете багато питань навколо цієї теми. Читачі мого блогу з наукових даних (data36.com) час від часу запитують у мене те саме. І я можу сказати вам, що це цілком справедлива проблема!

Я вирішив узагальнити свої відповіді на всі основні питання!

НОВИЙ! Я створив комплексний (безкоштовний) онлайн-відео-курс, який допоможе вам розпочати роботу з Data Science. Клацніть тут для отримання додаткової інформації: Як стати науковцем даних.

РЕЄСТРУЙТЕ ТУТ (БЕЗКОШТОВНО): https://data36.com/how-to-become-a-data-scientist/

№1: Які найважливіші навички та інструменти вченого? І як їх можна дістати?

Хороші новини - погані новини.

Почну з поганого. У 90% випадків навички, які вони навчають вас у університетах, не дуже корисні в проектах з наукових даних про реальне життя. Як я вже писав кілька разів, в реальних проектах потрібні ці 4 навички кодування даних:

  • bash / командний рядок
  • Пітон
  • SQL
  • R
  • (а іноді і Java)
джерело: KDnuggets

Які 2 або 3 вам будуть найбільш корисними, дійсно залежить від компанії… Але якщо ви навчились одного, то дізнатися інше буде набагато простіше.

Тож перше велике питання: як можна отримати ці інструменти? Ось приходить гарна новина! Всі ці засоби безкоштовні! Це означає, що ви можете їх завантажувати, встановлювати та використовувати, не платячи за них ні копійки. Ви можете практикувати, будувати проект хобі даних або будь-що інше!

Нещодавно я написав покрокову статтю про те, як встановити ці інструменти на комп’ютер. Перевірте це тут.

№ 2: Як навчитися?

Є два основні способи легко та економічно вивчити науку про дані.

1-й: Книги.

Ніби стара школа, але все ж хороший спосіб навчання. З книг ви можете отримати дуже цілеспрямовані, дуже детальні знання про онлайн-аналіз даних, статистику, кодування даних тощо ... Я виділив тут 7 книг, які рекомендую в своїй попередній статті.

Топ-7 книг даних я рекомендую

2-е: Інтернет-вебінари та відео-курси.

Інтернет-курси з наукових даних пропонують справедливі ціни (від 10 до 500 доларів), і вони охоплюють різні теми, починаючи від кодування даних до бізнес-розвідки. Якщо ви не хочете витрачати гроші на це на початку, я перерахував безкоштовні курси та навчальні матеріали в цій публікації.

(3-й курс: Перший місяць курсу молодшого вченого. Я створив 6-тижневий онлайн-науковий курс для того, щоб прагнути науковця даних працювати на практиці та вирішувати реальні завдання на основі даних про реальне життя: Перший місяць молодшого вченого даних .)

# 3: Як практикувати та як отримати реальний життєвий досвід

Це хитро, правда? Кожна компанія хоче, щоб люди мали хоча б трохи реального життєвого досвіду… Але як отримати реальний досвід життя, якщо вам потрібен реальний життєвий досвід, щоб отримати першу роботу? Класичний улов-22. І відповідь: проекти для домашніх тварин.

"Проект для домашніх тварин" означає, що ви придумали ідею проекту для передачі даних, яка вас захоплює. Тоді ви просто починаєте його будувати. Ви можете думати про це як про невеликий запуск, але переконайтеся, що ви продовжуєте зосереджуватися на науково-дослідницькій частині проекту та можете просто ігнорувати бізнес-частину. Щоб дати вам кілька ідей, ось декілька моїх проектів для домашніх тварин за останні кілька років:

  • Я створив сценарій, який відстежував веб-сайт нерухомості та надіслав мені найкращі пропозиції в режимі реального часу - так що я міг отримати ці угоди перед усіма іншими.
  • Я створив сценарій, який охоплював усі статті з ABC, BBC і CNN, і, виходячи із вживаних слів, з'єднав статті, які були приблизно в одній і тій же темі, на трьох різних порталах новин.
  • Я побудував чат-бот самонавчання в Python. (Хоча це не надто розумно - так як я ще цього не тренував.)

Будь креативним! Знайдіть проект для домашніх тварин, пов’язаний з науковою інформацією, і починайте кодування! Якщо ви потрапили в стіну з проблемою кодування - це може статися легко, коли ви почнете вивчати нову мову даних - просто використовуйте google та / або stackoverflow. Один короткий мій приклад - про те, наскільки ефективним є стартовий потік:

ліва сторона: моє запитання - права сторона: відповідь (через 7 хвилин)

Помітьте мітку часу! Я надіслав своєрідне складне запитання, і відповідь я отримав за 7 хвилин. Єдине, що мені потрібно було зробити - це скопіювати і вставити код у мій виробничий код і бум, він просто працював!

(Примітка. Перевірена перевірка - це ще один чудовий форум для питань, пов’язаних із наукою даних.)

Пропозиція +1:

Навіть якщо це трохи важко, спробуйте отримати наставника. Якщо вам пощастить, ви знайдете когось, хто працює в ролі Data Scientist у хорошій компанії, і який може проводити з вами годину щотижня або щотижня та обговорювати чи навчати щось.

# 4: Куди і як ви надсилаєте свою першу заяву на роботу?

Якщо вам не вдалося знайти наставника, ви все одно можете знайти свого першого у своїй першій компанії. Це буде вашою першою роботою, пов’язаною з наукою про дані, тому я пропоную не зосереджуватися на великих грошах або над надзвичайній атмосфері запуску. Зосередьтеся на пошуку середовища, де можна навчитися та вдосконалитись.

Прийняття вашої першої роботи з наукових даних у багатонаціональній компанії може не узгоджуватися з цією ідеєю, оскільки там люди зазвичай занадто зайняті своїми речами, тому вони не матимуть часу та / та мотивації, щоб допомогти вам покращитись (звичайно, завжди є винятки).

Починати з крихітного старту, як особа, яка займається першими даними в команді, не є гарною ідеєю, як і у вашому випадку, тому що у цих компаній немає старших хлопців з даних, з яких слід вчитися.

Раджу зосередитись на 50–500 компаніях розміру. Це золота середина. Старші науковці працюють на борту, але вони не надто зайняті, щоб допомогти та навчити вас.

Гаразд, ви знайшли кілька хороших компаній ... Як подати заявку? Деякі принципи вашого резюме: підкресліть свої вміння та проекти, а не свій досвід (оскільки у вас ще не так багато років, щоб викласти на папері). Перерахуйте відповідні мови кодування (SQL та Python), якими ви користуєтесь, і зв’яжіть деякі пов'язані з ними репозиторії github, щоб ви могли показати, що ви справді використовували цю мову.

Також у більшості випадків компанії просять супровідний лист. Це, звичайно, хороша можливість висловити свій ентузіазм, але ви також можете додати деякі практичні деталі, наприклад, що б ви зробили за перші кілька тижнів, якби вас найняли. (Наприклад, "Дивлячись на ваш потік реєстрації, я думаю, що ____ веб-сторінка відіграє важливу роль. У перші мої тижні я б виконував ___, ___ та ___ (конкретні аналізи), щоб довести цю гіпотезу та глибше зрозуміти її. Це може допомогти компанії покращити _____ і врешті-решт підштовхнути _____ КПІ. ")

Сподіваємось, це допоможе вам взяти співбесіду на роботі, де ви можете поговорити трохи про проекти ваших улюбленців, пропозиції супровідного листа, але це стосуватиметься, головним чином, перевірки особистості та, ймовірно, базового тесту на вміння. Якщо ви потренувались достатньо, ви пройдете це ... але якщо ви нервовий тип і хочете більше займатися, ви можете це зробити на hackerrank.com.

Висновок

Ну, це все. Я знаю, що це звучить легше, коли він пишеться, але якщо ви дійсно налаштовані на те, щоб бути науковцем даних, це не складе жодних проблем, щоб це сталося! Успіхів у цьому!

Якщо ви хочете спробувати, як це бути молодшим науковцем даних при запуску реальної роботи, ознайомтеся з моїм 6-тижневим онлайн-курсом з вивчення даних: Перший місяць молодшого вченого!

А якщо ви хочете дізнатися більше про науку про дані, перевірте мій блог (data36.com) та / або підпишіться на мій інформаційний бюлетень! І не пропустіть мою нову серію навчальних посібників із кодування: SQL для аналізу даних!

Дякуємо за прочитане!

Сподобалась стаття? Будь ласка, дайте мені знати, натиснувши нижче. Це також допомагає іншим людям бачити історію!

Томі Местер, автор даних3636 Twitter: @ data36_com