Карьера в области данных: от исследователя до дата-сайентиста

Вопрос или проблема

В настоящее время я работаюResearch Assistant в области информатики, специализируясь как на взаимодействии человека с компьютером (HCI), так и на медицинской информатике (HI). В рамках своей роли я собираю данные от нескольких клинических специалистов (врачей, медиков и докторов) и анализирую их (например, t-тест, ANOVA и так далее). Преобразуя проанализированные данные и организуя их в несколько наборов данных, мы сообщаем и используем их, создавая научные документы, которые будут основой нашего анализа.

Недавно я начал интересоваться областью Data Science и рассматриваю возможность развиваться в этом направлении и стать Data Scientist. Как я уже упоминал, я уже применяю статистический анализ в своей работе. Это вызывает несколько вопросов:

  1. Как связаны области HCI и Data Science?
  2. Как я могу перейти с должности Research Assistant в области HCI на карьеру в Data Science?
  3. Какие курсы/учебники мне стоит пройти?

Отличный вопрос! Я понимаю, что у вас есть база статистики, на которую можно опираться. Большинство Data Scientist – особенно те, кто ходит в эти “лагеря” данных или что-то подобное – не имеют этого, и это должно помочь вам в вашей карьере. Вот несколько ответов на ваши вопросы, по порядку:

  1. Ваш опыт поможет вам, потому что вы привыкли к таким вещам, как проектирование и выполнение исследований, а также работе с данными. Но я не вижу ничего конкретного для HCI, что могло бы помочь вам. Когда вы хороший Data Scientist, сами данные становятся менее важными. Прямо сейчас, когда я работаю над проектом, мне важно, чтобы данные были собраны устойчивым образом, но то, что данные есть, не так уж и важно. В конечном итоге вы тоже к этому придете – это всего лишь числа и математика 🙂
  2. У вас есть основа в статистике. Теперь вам нужны (1) навыки программирования и (2) навыки моделирования. Вам следует выбрать язык, такой как Python или R, и развивать свои навыки в этом направлении. После этого вам следует начать изучать соответствующие библиотеки, такие как Tensorflow и Keras, чтобы помочь вам развивать свои навыки моделирования. Вам также стоит взять учебник или другой ресурс, который объясняет, что на самом деле делают модели и как их настраивать, независимо от выбранного вами языка. Наконец, вы будете готовы к исследованиям нейронных сетей и тому, как они работают. Критерием успеха здесь будет умение написать некоторые “традиционные” модели в Tensorflow (например, регрессию, деревья решений и т. д.) и также умение написать нейронную сеть в Keras.

Я думаю, что ваша база, уже связанная с экспериментами и (предположительно) применением научного метода, будет вам полезна и уже ставит вас впереди большинства Data Scientist. Теперь дело только в том, чтобы уметь делать все это с помощью кода, и, если вы следуете приведенным выше шагам, я думаю, вы увидите эти связи и поймете, как войти в мир Data Science.

Я бы порекомендовал вам прочитать “Введение в статистическое обучение” Гэрета Джеймса. Обязательно посмотрите “Введение в машинное обучение” Эндрю Нга на Coursera. Это действительно дает хорошее представление о том, что такое Data Science. Выберите R или Python, проверьте Kaggle.com, и у вас появится лучшее представление о том, что делать дальше.

В зависимости от того, каким Data Scientist вы хотите стать, вы можете быть готовы просто начать активно подавать заявки на работу. Группа R&D по Data Science, в которой я работаю (в компании Fortune 5), склонна ценить критическое мышление и технический опыт больше, чем способность программировать на определенном языке или умение реализовать какую-либо отдельную модель.

Это зависит от позиции в Data Science, но в индустрии большое внимание уделяется сбору хороших данных, в отличие от настройки алгоритма. Обычно в индустрии используются более простые модели. Часто Data Scientist работает с клиентами (или заинтересованными сторонами), потому что они лучше всего знают, какие данные им нужны. Они также лучше всего подходят для обсуждения результатов. Обязательно учитывайте этот аспект.

Я верю, что этот вопрос должен дать вам некоторое понимание: https://stats.stackexchange.com/questions/355390/industry-vs-kaggle-challenges-is-collecting-more-observations-and-having-access/355524#355524

Astala Vista baybe 0021aio Lolita

Ответ или решение

Карьера в области науки данных: от исследователя до специалиста по данным

Введение

Преобразование из исследовательской роли в области компьютерных наук в карьеру специалиста по данным представляет собой захватывающий путь, открывающий множество возможностей для профессионального роста. Ваш опыт работы в качестве научного ассистента в области взаимодействия человека с компьютером (HCI) и медицинской информатики (HI) предоставляет вам отличную основу для данного перехода. Данная статья будет посвящена изучению взаимосвязи HCI и науки о данных, шагам для смены карьеры и необходимым образовательным ресурсам.

1. Взаимосвязь HCI и науки о данных

На первый взгляд, HCI и наука о данных могут показаться различными областями, однако они глубоко взаимосвязаны. HCI фокусируется на том, как люди взаимодействуют с технологиями, в то время как наука о данных включает анализ и интерпретацию данных, связанных с этими взаимодействиями. Ваш опыт сбора и анализа данных от клиницистов и докторов обеспечит вам понимание того, как данные могут быть использованы для улучшения пользовательского опыта и создания более эффективных решений.

Ваша способность применять статистические методы для анализа данных уже представляет ценное преимущество. В науке о данных важно уметь задавать правильные вопросы, интерпретировать данные и представлять результаты так, чтобы они были понятны и полезны для конечных пользователей.

2. Как перейти от научного ассистента к карьере в науке о данных

Чтобы осуществить переход от роли научного ассистента к карьере в науке о данных, следуйте этим рекомендациям:

  • Развитие программных навыков: Изучение языков программирования, таких как Python или R, является ключевым шагом. Эти языки популярны в области анализа данных и предоставляют мощные библиотеки для обработки и визуализации данных.

  • Углубление в моделирование: Изучите машинное обучение, включая основные модели и алгоритмы, такие как линейная регрессия, деревья решений и нейронные сети. Рекомендуется ознакомиться с библиотеками, такими как TensorFlow и Keras, для практического применения этих методов.

  • Применение научного подхода: Ваш опыт работы над исследовательскими проектами — огромный плюс. Используйте свой опыт в проектировании и выполнении экспериментов для применения научного метода в решить задачи анализа данных.

3. Рекомендуемые курсы и ресурсы

Для максимального успеха в карьере в науке о данных, рекомендуется следующее:

  • Книги:

    • "Introduction to Statistical Learning" Гарета Джеймса — Отличный ресурс для понимания методов статистического анализа.
  • Онлайн-курсы:

    • "Machine Learning" от Эндрю Нга на Coursera — Обеспечивает крепкую базу в машинном обучении и вдохновляет на применение теории на практике.
  • Практические площадки:

    • Kaggle.com — Платформа для соревнований в области науки о данных, где вы можете применять свои знания на практике, изучая реальный опыт, конкурируя и получая отклики от сообщества.

Заключение

Учитывая ваши текущие навыки и опыт, переход от научного ассистента к специалисту по данным вполне осуществим. Главные акценты должны быть сделаны на развитие программирования, углубление в машинное обучение и использование вашего научного подхода к решению проблем. С учетом перечисленных рекомендаций и ресурсов, вы сможете успешно осуществить этот переход и открыть для себя новые горизонты в сфере науки о данных. Удачи на вашем новом пути!

Оцените материал
Добавить комментарий

Капча загружается...