Въпроси за интервю за наука за данни

Ръководството за кариера на Data Scientist на BrainStation може да ви помогне да направите първите стъпки към доходоносна кариера в науката за данни. Прочетете за преглед на често срещаните въпроси за интервю за работа в областта на науката за данни и как най-добре да отговорите на тях.



Станете специалист по данни

Говорете със съветник по обучение, за да научите повече за това как нашите учебни лагери и курсове могат да ви помогнат да станете специалист по данни.



Като щракнете върху Изпращане, вие приемате нашите Условия .



Изпращане

Не можа да се изпрати! Да опресните страницата и да опитате отново?

Научете повече за нашия учебен лагер за Data Science

Благодаря ти!

Ще се свържем скоро.



Вижте страницата на Data Science Bootcamp

Процесите на интервю за наука за данни могат да варират в зависимост от компанията и индустрията. Обикновено те ще включват първоначален телефонен преглед с мениджъра по наемането, последван от едно или няколко интервюта на място.

Ще трябва да отговорите на въпроси за интервю за технически и поведенчески данни и вероятно ще завършите проект, свързан с умения. Преди всяко интервю трябва да прегледате автобиографията и портфолиото си, както и да се подготвите за потенциални въпроси за интервю.

Въпросите за интервю за наука за данни ще тестват вашите знания и умения за статистика, програмиране, математика и моделиране на данни. Работодателите ще оценяват вашите технически и меки умения и колко добре бихте се вписали в тяхната компания.



Като подготвите някои често срещани въпроси и отговори за интервю за наука за данни, можете да влезете в интервюто с увереност. Има няколко различни типа въпроси за Data Scientist, които можете да очаквате да срещнете по време на интервюто си за наука за данни.

Списък с въпроси за интервю за наука за данни: Въпроси, свързани с данни

Работодателите търсят кандидати, които имат добри познания по техники и концепции на науката за данни. Въпросите за интервю, свързани с данните, ще варират в зависимост от позицията и необходимите умения.

Ето някои примери за примерни въпроси и отговори за интервю, свързани с данни:



Каква е разликата между контролирано и неконтролирано учене?

Най-голямата разлика между контролирано и неконтролирано учене включва използването на маркирани и немаркирани набори от данни. Контролираното обучение използва изходни и входни данни, които са етикетирани, а алгоритмите за обучение без надзор не. Друга разлика е, че контролираното учене има механизъм за обратна връзка, докато ученето без надзор няма. И накрая, често използваните алгоритми за контролирано обучение включват логистична регресия, поддържаща векторна машина и дървета на решения, докато алгоритмите за обучение без надзор са клъстериране на k-средни, йерархично клъстериране и априорен алгоритъм.

Каква е разликата между дълбоко обучение и машинно обучение?

На този въпрос може да е трудно да се отговори ясно, защото тук очевидно има известно припокриване. Започнете с обяснението, че дълбокото обучение е по същество подполе на машинното обучение и че и двете попадат под чадъра на изкуствения интелект. Когато машинното обучение използва алгоритми за анализиране на данни и в крайна сметка се научава да взема решения въз основа на това, което извежда от данните, дълбокото обучение наслоява тези алгоритми, за да създаде изкуствени невронни мрежи, способни да учат и да вземат информирани решения.

  • Можете ли да предоставите подробно обяснение на алгоритъма на дървото на решенията?
  • Какво е вземане на проби? С колко метода за вземане на проби сте запознати?
  • Как правите разлика между грешка тип I и тип II?
  • Моля, дефинирайте линейна регресия.
  • Какво означават термините p-стойност, коефициент и r-квадратна стойност? Защо всеки компонент е важен?
  • Моля, дефинирайте пристрастия при избора.
  • Моля, дефинирайте статистическо взаимодействие.
  • Можете ли да предоставите пример за набор от данни с негаусово разпределение?
  • Моля, обяснете формулата за биномна вероятност.
  • Можете ли да обясните разликата между k-NN и k-means клъстериране?
  • Какъв е вашият подход за създаване на модел на логистична регресия?
  • Какво е правилото 80/20? Как е важно да се валидира модел?
  • Определете прецизност и припомняне. Как се отнасят те към кривата ROC?
  • Моля, обяснете как да се направи разлика между L1 и L2 методите за регуляризация?
  • Преди да приложите алгоритми за машинно обучение, какви са стъпките за спорове и почистване на данни?
  • Можете ли да обясните разликата между хистограма и квадратен график?
  • Как определяте кръстосаното валидиране?
  • Можете ли да обясните какво е фалшиво положително и фалшиво отрицателно? Какво бихте казали, че е по-добре да имате: твърде много фалшиви положителни или твърде много фалшиви отрицателни?
  • Когато проектирате модел за машинно обучение, кое е по-важно: точността на модела или производителността на модела?
  • Според вас кое е по-добре: 50 малки дървета за решения или едно голямо?
  • Можете ли да измислите проект за наука за данни в нашата компания, който би ви заинтересувал?
  • Можете ли да помислите за няколко примера за най-добри практики в науката за данни?

Списък с въпроси за интервюта за наука за данни: Въпроси за технически умения

Въпросите за технически умения в интервю за наука за данни се използват за оценка на вашите знания, умения и способности в областта на науката за данни. Тези въпроси ще бъдат свързани със специфичните задължения на длъжността Data Scientist.

Въпросите за интервю за технически данни могат да имат един верен отговор или няколко възможни решения. Ще искате да покажете своя мисловен процес, когато решавате проблеми и ясно да обясните как сте стигнали до отговора.

Примерите за въпроси за интервю за умения за технически данни включват:

Кои са най-добрите инструменти и технически умения за специалист по данни?

Науката за данни е силно техническа област и вие ще искате да покажете на мениджъра по наемането, че владеете всички най-нови стандартни инструменти, софтуер и езици за програмиране. От различните езици за статистическо програмиране, използвани в науката за данни, R и Python най-често се използват от Data Scientists. И двете могат да се използват за статистически функции като създаване на нелинеен или линеен модел, регресионен анализ, статистически тестове, извличане на данни и др. Друг важен инструмент за наука за данни е RStudio Server, докато Jupyter Notebook често се използва за статистическо моделиране, визуализации на данни, функции за машинно обучение и т.н. Разбира се, има редица специални инструменти за визуализация на данни, използвани широко от Data Scientists, включително Tableau, PowerBI , Боке, Сюжет и Инфограма. Data Scientists също се нуждаят от много опит в използването на SQL и Excel.

Вашият отговор трябва също да споменава всички специфични инструменти или технически компетенции, изисквани от работата, за която интервюирате. Прегледайте описанието на длъжността и ако има някакви инструменти или програми, които не сте използвали, може да си струва да се запознаете с тях преди интервюто.

Как се отнасяте към извънредните стойности?

Някои видове отклонения могат да бъдат премахнати. Стойности за боклук или стойности, за които знаете, че не могат да бъдат верни, могат да бъдат отхвърлени. Отклоненията с екстремни стойности далеч извън останалите точки от данни, групирани в набор, също могат да бъдат премахнати. Ако не можете да махнете извънредните стойности, можете да преосмислите дали сте избрали правилния модел, можете да използвате алгоритми (като произволни гори), които няма да бъдат засегнати толкова силно от стойностите на извънредни стойности, или можете да опитате да нормализирате данните си.

  • Моля, кажете ни за оригинален алгоритъм, който сте създали.
  • Кой е любимият ви статистически софтуер и защо?
  • Работили ли сте по проект за наука за данни, който изисква значителен компонент за програмиране? Какво взехте от преживяването?
  • Опишете как ефективно да представите данни с пет измерения.
  • Трябва да генерирате прогнозен модел, използвайки множествена регресия. Какъв е вашият процес за валидиране на този модел?
  • Как гарантирате, че промените, които правите в алгоритъма, са подобрение?
  • Моля, предоставете своя метод за работа с небалансиран набор от данни, който се използва за прогнозиране (т.е. много повече отрицателни класове, отколкото положителни класове).
  • Какъв е вашият подход за валидиране на модел, който сте създали, за да генерирате прогнозен модел на количествена променлива на резултата, използвайки множествена регресия?
  • Имате два различни модела със сравнима изчислителна производителност и точност. Моля, обяснете как решавате кое да изберете за производство и защо.
  • Получавате набор от данни, състоящ се от променливи със значителна част от липсващи стойности. Какъв е вашият подход?

Списък с въпроси за интервю за наука за данни: Лични въпроси

Наред с тестването на вашите знания и умения в областта на науката за данни, работодателите вероятно ще задават и общи въпроси, за да ви опознаят по-добре. Тези въпроси ще им помогнат да разберат вашия стил на работа, личност и как бихте могли да се впишете в тяхната фирмена култура.

Въпросите за интервю за специалист по лични данни могат да включват:

Какво прави добър специалист по данни?

Вашият отговор на този въпрос ще разкаже на мениджъра по наемането много за това как виждате ролята си и стойността, която носите в организацията. В отговора си бихте могли да говорите за това как науката за данни изисква рядка комбинация от компетенции и умения. Добрият специалист по данни трябва да комбинира техническите умения, необходими за анализиране на данни и създаване на модели, с бизнес усет, необходим за разбиране на проблемите, с които се справят, както и за разпознаване на полезни прозрения в своите данни. В отговора си бихте могли да обсъдите и специалист по данни, на когото се доверявате, независимо дали е колега, когото познавате лично, или проницателна фигура в индустрията.

  • Моля разкажете ми за себе си.
  • Кои са най-добрите ти качества в професионален план? Кои са вашите слабости?
  • Има ли един Data Scientist, на когото се възхищавате най-много?
  • Какво вдъхнови интереса ви към науката за данни?
  • Какви уникални умения или характеристики носите, които биха помогнали на екипа?
  • Какво ви накара да напуснете последната си работа?
  • Какво ниво на възнаграждение очаквате от тази работа?
  • Предпочитате ли да работите сами или като част от екип от специалисти по данни?
  • Къде виждате кариерата си след пет години?
  • Какъв е вашият подход за справяне със стреса на работното място?
  • Как намирате мотивация?
  • Какъв е вашият метод за измерване на успеха?
  • Как бихте описали идеалната си работна среда?
  • Какви са вашите страсти или хобита извън науката за данни?

Списък с въпроси за интервю за наука за данни: Лидерство и комуникация

Лидерството и комуникацията са две ценни умения за специалистите по данни. Работодателите ценят кандидатите за работа, които могат да проявят инициатива, да споделят своя опит с членовете на екипа и да съобщават целите и стратегиите на науката за данните.

Ето някои примери за въпроси за интервю за лидерство и комуникационни данни:

Какво харесвате в работата в мултидисциплинарен екип?

Data Scientist си сътрудничи с голямо разнообразие от хора в технически и нетехнически роли. Не е необичайно специалист по данни да работи с разработчици, дизайнери, продуктови специалисти, анализатори на данни, екипи по продажби и маркетинг и ръководители на най-високо ниво, да не говорим за клиенти. Така че в отговора си на този въпрос трябва да илюстрирате, че сте екипен играч, който се наслаждава на възможността да се среща и да си сътрудничи с хора в цялата организация. Изберете пример за ситуация, в която сте докладвали на хората от най-високо ниво в една компания, за да покажете не само, че ви е удобно да общувате с всеки, но и да покажете колко ценни са били вашите базирани на данни прозрения в миналото.

  • Можете ли да си представите професионална ситуация, в която сте имали възможност да демонстрирате лидерство?
  • Какъв е вашият подход към разрешаването на конфликти?
  • Какъв е вашият подход за изграждане на професионални взаимоотношения с колеги?
  • Какъв е примерът за успешна презентация, която дадохте? Защо беше толкова убедително?
  • Ако разговаряте с колега или клиент от нетехнически опит, как обяснявате сложни технически проблеми или предизвикателства?
  • Моля, припомнете си ситуация, когато трябваше да боравите с чувствителна информация. Как подходихте към ситуацията?
  • От ваша гледна точка, как бихте оценили вашите комуникационни умения?

Списък с въпроси за интервю за наука за данни: поведенчески

С въпросите за поведенческо интервю работодателите търсят конкретни ситуации, които показват определени умения. Интервюиращият иска да разбере как сте се справяли със ситуации в миналото, какво сте научили и какво сте в състояние да донесете в тяхната компания.

Примерите за поведенчески въпроси в интервю за наука за данни включват:

Спомняте ли си ситуация, когато трябваше да почистите и организирате голям набор от данни?

Проучванията показват, че специалистите по данни прекарват по-голямата част от времето си в подготовка на данни, за разлика от извличането на данни или моделирането. Така че, ако имате някакъв опит като специалист по данни, почти сигурно е, че имате опит в почистването и организирането на голям набор от данни. Вярно е също, че това е задача, която малко хора наистина харесват. Но почистването на данни също е една от най-важните стъпки за всяка компания. Така че трябва да преведете мениджъра по наемането през процеса, който следвате при подготовката на данните: премахване на дублиращи се наблюдения, коригиране на структурни грешки, филтриране на отклонения, справяне с липсващи данни и валидиране на данните.

  • Помислете за проект за данни, по който сте работили, където сте се сблъскали с проблем или предизвикателство. Каква беше ситуацията, каква беше пречката и как я преодоляхте?
  • Моля, дайте конкретен пример за използване на данни за повишаване на опита на клиент или заинтересована страна?
  • Моля, посочете конкретна ситуация, в която сте постигнали цел. Как го постигна?
  • Моля, посочете конкретна ситуация, при която не сте успели да постигнете цел. Какво се обърка?
  • Какъв е вашият подход за управление и спазване на кратки срокове?
  • Можете ли да си спомните момент, в който сте се сблъсквали с конфликт по време на работа? Как се справихте с това?

Списък с въпроси за интервю за наука за данни от водещи компании (Amazon, Google, Facebook, Microsoft)

За да ви дадем представа за някои други въпроси, които могат да възникнат в интервю, ние съставихме списък с въпроси за интервю за наука за данни от някои от най-добрите технологични компании.

  • Каква е разликата между машината за поддържащ вектор и логистичната регресия? Моля, дайте примери за ситуации, в които бихте избрали да използвате едното, вместо другото.
  • Ако премахването на липсващи стойности от набор от данни причинява пристрастия, какво бихте направили?
  • Когато разглеждате здравето, ангажираността или растежа на даден продукт, какви показатели бихте оценили?
  • Когато се опитвате да адресирате или разрешите бизнес проблеми, свързани с нашия продукт, какви показатели бихте оценили?
  • Как оценявате производителността на продукта?
  • Как да разберете дали ново наблюдение е извънредно?
  • Как бихте дефинирали компромис от отклонение-отклонение?
  • Какъв е вашият метод за произволен избор на извадка от потребителска популация на продукти?
  • Какъв е вашият процес за спорове и почистване на данни, преди да приложите алгоритми за машинно обучение?
  • Как бихте подходили към небалансирана двоична класификация?
  • Как правите разлика между добра и лоша визуализация на данни?
  • Моля, създайте функция, която проверява дали дадена дума е палиндром.

Kategori: Новини