Data Scientist

Ръководството за кариера на Data Scientist на BrainStation може да ви помогне да направите първите стъпки към доходоносна кариера в науката за данни. Прочетете за преглед на областта на науката за данни, както и длъжността Data Scientist.

Станете специалист по данни

Говорете със съветник по обучение, за да научите повече за това как нашите учебни лагери и курсове могат да ви помогнат да станете специалист по данни.



Като щракнете върху Изпращане, вие приемате нашите Условия .



Изпращане

Не можа да се изпрати! Да опресните страницата и да опитате отново?

Научете повече за нашия учебен лагер за Data Science

Благодаря ти!

Ще се свържем скоро.



Вижте страницата на Data Science Bootcamp

Какво е специалист по данни?

Data Scientists събират, организират и анализират големи набори от големи данни – структурирани и неструктурирани данни – за да създадат ефективни бизнес решения и планове, управлявани от данни, за компании и други организации. Комбинирайки усет към математиката, компютърните науки и бизнеса, специалистите по данни трябва да притежават както техническите умения за обработка и анализиране на големи данни, така и бизнес нюх, за да открият полезни прозрения, скрити в тези данни.

Data Science срещу Data Mining

Има няколко разлики между науката за данни и извличането на данни. Нека разгледаме по-отблизо:

Наука за данни

  • Това е широка област, която има тенденция да включва машинно обучение, изкуствен интелект, предсказващ причинно-следствен анализ и предписващ анализ
  • Работи с всички видове данни, включително както структурирани, така и неструктурирани данни
  • Целта е да създаде продукти, ориентирани към данните, и да взема решения, базирани на данни
  • Фокусира се върху научното изследване на данни и модели

Извличане на данни

  • Това е подгрупа от наука за данни, която включва почистване на данни, статистически анализ и разпознаване на модели и понякога включва визуализация на данни, машинно обучение и трансформация на данни
  • Работи предимно със структурирани данни, а не с неструктурирани данни
  • Целта е да вземе данни от различни източници и да ги направи използваеми
  • Фокусира се върху бизнес практиките

Какво прави специалист по данни?

Data Scientist анализира големи масиви от данни, за да открие модели и тенденции, които водят до действени бизнес прозрения и помагат на организациите да разрешават сложни проблеми или да идентифицират възможности за приходи и растеж. Специалистът по данни може да работи в почти всяка област и трябва да умее да борави със структурирани и неструктурирани набори от данни. Това е мултидисциплинарна работа и за да станете специалист по данни, трябва да имате разбиране по математика, компютърни науки, бизнес и комуникация, за да изпълнявате работата си ефективно.



Въпреки че специфичните работни задължения и отговорности на специалист по данни ще варират значително в зависимост от индустрията, позицията и организацията, повечето роли на Data Scientist ще включват следните области на отговорност:

Изследвания

Специалистът по данни трябва да разбере възможностите и болките, специфични както за индустрията, така и за отделна компания.

Подготовка на данни

Преди да бъде намерена каквато и да е ценна информация, специалистът по данни трябва да определи кои набори от данни са полезни и подходящи, преди да събира, извлича, почиства и прилага структурирани и неструктурирани данни от различни източници.



Създаване на модели и алгоритми

Използвайки принципите на машинното обучение и изкуствения интелект, специалистът по данни трябва да е способен да създава и прилага алгоритмите, необходими за внедряване на инструменти за автоматизация.

Анализ на данни

Важно е за специалист по данни да може бързо да анализира своите данни, за да идентифицира модели, тенденции и възможности.

Визуализация и комуникация

Специалистът по данни трябва да може да разказва историите, открити чрез данни, като създава и организира естетически привлекателни табла и визуализации, като същевременно притежава комуникационни умения, за да убеждава заинтересованите страни и другите членове на екипа, че констатациите в данните си струва да се действа.

Най-новото проучване на дигиталните умения на BrainStation установи, че специалистите по данни прекарват по-голямата част от времето си в спорове и почистване на данни. Респондентите също така заключиха, че целта на тяхната работа най-често е оптимизирането на съществуваща платформа, продукт или система (45%) или разработването на нови (42%).

Видове наука за данни

По-широката област на науката за данни включва много различни дисциплини, включително:

Инженеринг на данни

Проектиране, изграждане, оптимизиране, поддръжка и управление на инфраструктурата, която поддържа данни, както и потока от данни в цялата организация.

Подготовка на данни

Почистване и трансформиране на данни.

Извличане на данни

Извличане (и понякога почистване и трансформиране) на използваеми данни от по-голям набор от данни.

Прогнозни анализи

Използване на данни, алгоритми и техники за машинно обучение за анализиране на вероятността от различни възможни бъдещи резултати въз основа на анализ на данни.

Машинно обучение

Автоматизиране на изграждането на аналитичен модел в процеса на анализ на данни, за да се учите от данните, да откриете модели и да даде възможност на системите да вземат решения без много човешка намеса.

Визуализация на данни

Използване на визуални елементи (включително графики, карти и диаграми) за илюстриране на прозрения, открити в данните, по достъпен начин, така че публиката да може да разбере тенденциите, отклоненията и моделите, открити в данните.

Предимства на науката за данни

Компаниите във всички индустрии във всички части на земното кълбо отделят все повече и повече пари, време и внимание на науката за данни и търсят да добавят специалист по данни към своя екип. Изследванията показват, че компаниите, които наистина приемат вземането на решения, базирани на данни, са по-продуктивни, печеливши и ефективни от конкуренцията.

Науката за данни е от решаващо значение за подпомагане на организациите да идентифицират правилните проблеми и възможности, като същевременно помагат за формиране на ясна картина на поведението и нуждите на клиентите и клиентите, ефективността на служителите и продуктите и потенциалните бъдещи проблеми.

Науката за данни може да помогне на компаниите:

  • Вземете по-добри решения
  • Научете повече за клиентите и клиентите
  • Възползвайте се от тенденциите
  • Очаквайте бъдещето

Как науката за данни може да подобри стойността за една компания?

Науката за данни е толкова все по-популярна инвестиция за бизнеса, защото потенциалната възвръщаемост на инвестициите при отключване на стойността на големите данни е огромна. Науката за данни е достойна инвестиция, защото:

    Премахва догадките и предоставя полезни идеи.Компаниите вземат по-добри решения, основани на данни и количествено измерими доказателства.Компаниите разбират по-добре своето място на пазара.Науката за данни ще помогне на компаниите да анализират конкуренцията, да изследват исторически примери и да правят препоръки, базирани на числа.Може да се използва за идентифициране на най-добрите таланти.В големите данни се крият много прозрения за производителността, ефективността на служителите и цялостното представяне. Данните могат да се използват и за набиране и обучение на таланти.Ще научите всичко за вашата целева аудитория, клиент или потребител.Сега всеки генерира и събира данни и компаниите, които не инвестират правилно в науката за данни, просто събират повече данни, отколкото знаят какво да правят. Прозренията за поведението, приоритетите и предпочитанията на минали или потенциални клиенти или клиенти са безценни и те просто чакат квалифициран специалист по данни, който да открие.

Заплати за специалисти по данни

Докато заплатите на специалистите по данни се различават значително в зависимост от региона и индустрията, средната заплата за специалист по данни в САЩ се отчита като някъде от $96 000 до $113 000, в зависимост от източника. Старши специалист по данни може да донесе средно около 130 000 долара.

Търсене на специалисти по данни

Data Scientists са в голямо търсене и недостиг в почти всички индустрии. Доклад на Deloitte Access Economics установи, че 76% от фирмите планират да увеличат разходите през следващите години за възможности за анализ на данни, докато IBM прогнозира 28% скок в търсенето на наука за данни в началото на десетилетието.

Бюрото по трудова статистика на САЩ прогнозира 31% ръст в науката за данни през следващите 10 години. Междувременно Доклад за пазарите и пазарите установи, че се предвижда глобалният пазар за големи данни да нарасне до 229,4 милиарда долара до 2025 г., като платформата за наука за данни ще нарасне с 30 процента до 2024 г.

Изглежда, че навсякъде по света инвестициите в науката за данни се очаква да нараснат, а с това и търсенето на специалисти по данни.

Какви инструменти използват специалистите по данни?

Data Scientists използват различни инструменти и програми за дейности, включително анализ на данни, почистване на данни и създаване на визуализации.

Python е най-добрият език за програмиране за специалисти по данни, анкетирани в проучването на BrainStation Digital Skills Survey. Език за програмиране с общо предназначение, Python е полезен за приложения за обработка на национални езици и анализ на данни. R също така често се използва за анализ на данни и извличане на данни. За по-тежко пресоване на числата, базираните на Hadoop инструменти като Hive са популярни. За машинно обучение специалистите по данни могат да избират от широк набор от инструменти, включително h2o.ai, TensorFlow, Apache Mahout и Accord.Net. Инструментите за визуализация също са важна част от арсенала на Data Scientist. Програми като Tableau, PowerBI, Bokeh, Plotly и Infogram помагат на Data Scientists да създават визуално привлекателни диаграми, топлинни карти, графики, диаграми на разсейване и др.

Data Scientists също трябва да бъдат изключително удобни както с SQL (използван в редица платформи, включително MySQL, Microsoft SQL и Oracle), така и с програми за електронни таблици (обикновено Excel).

От какви умения се нуждаят специалистите по данни?

Има редица умения, които всички амбициозни специалисти по данни и трябва да развият, включително:

    Excel.Най-използваният инструмент за 66% от специалистите по данни, анкетирани в проучването на BrainStation Digital Skills Survey, Excel все още е от решаващо значение за специалистите по данни.SQL.Този език за заявки е незаменим при управлението на база данни и се използва от приблизително половината от респондентите на данни.Статистическо програмиране.Python и R обикновено се използват от Data Scientists за провеждане на тестове, създаване на модели и извършване на анализи на големи набори от данни.Визуализация на данни.Инструменти като Tableau, Plotly, Bokeh, PowerBl и Matplotlib помагат на Data Scientists да създават завладяващи и достъпни визуални представяния на своите открития.

Кариерни пътеки на Data Scientist

Като сравнително нова професия, кариерните пътеки на Data Scientist не са изписани в камък и много хора намират своя път към науката за данни от опит в компютърните науки, ИТ, математиката и бизнеса. Но четирите основни оси за кариерата на Data Scientist обикновено са данни, инженеринг, бизнес и продукт. Много мултидисциплинарни роли в науката за данни изискват владеене на няколко или всички от тези области.

Хората, работещи в областта на науката за данни, са в челните редици на технологичните промени, които ще повлияят най-много на бъдещето. Тъй като науката за данни може да допринесе за напредъка в почти всяка друга област, Data Scientists са в състояние да по-нататъшни изследвания във всичко - от финанси и търговия до актюерска статистика, зелена енергия, епидемиология, медицина и фармацевтика, телекомуникации - списъкът е практически безкраен. Всяка индустрия трафикира свои собствени различни типове данни, като ги използва по различни начини за постигане на различни цели. Където и да се случи това, Data Scientists могат да ръководят по-добро вземане на решения, независимо дали става дума за разработване на продукти, анализ на пазара, управление на взаимоотношенията с клиенти, човешки ресурси или нещо съвсем друго.

Не само приложенията за наука за данни са широки, засягащи много различни сектори, но има и различни видове наука за данни. Общото за всички тези дейности е, че всички те се опитват да превърнат данните в знание. По-точно, Data Scientists използват методичен подход за организиране и анализ на необработени данни, за да идентифицират модели, от които полезна информация може да бъде идентифицирана или изведена.

Като се има предвид обхвата на тяхното въздействие, не е чудно, че специалистите по данни заемат позиции, които са силно влиятелни – и много търсени. Въпреки че пътят към това да станете специалист по данни може да бъде труден, сега има повече ресурси за амбициозни специалисти по данни от всякога и повече възможности за тях да изградят кариерата, която искат.

Но въпреки всички начини, по които специалистите по данни могат да допринесат за различни индустрии, и всички различни кариерни пътеки, които може да следва един Data Scientist, видовете работа, която вършат, могат да бъдат разделени на няколко основни категории. Не всички науки за данни се вписват добре в тези групи, особено в челните редици на компютърните науки, където непрекъснато се разбиват нови основи – но те ще ви дадат известна представа за начините, по които Data Scientists превръщат данните в прозрение.

Статистика

В основата на науката за данни статистиката е областта на математиката, която описва различните характеристики на набор от данни, независимо дали това са числа, думи, изображения или някакъв друг вид измерима информация. Голяма част от статистиката е съсредоточена върху просто идентифициране и описване на това, което има – особено при много големи набори от данни, само да се знае какво прави и какво не включва информацията е задача сама по себе си. В областта на науката за данни това често се нарича описателен анализ. Но статистиката може да отиде още по-далеч, като тества дали вашите предположения за това, което има в данните, са верни или, ако са верни, дали са значими или полезни. Това може да включва не само разглеждане на данните, но и манипулирането им, за да се извлекат основните им характеристики. Има много различни начини да направите това – линейна регресия, логистична регресия и дискриминантен анализ, различни методи за вземане на проби и така нататък – но в крайна сметка всяка от тези техники е свързана с разбирането на характеристиките на набор от данни и колко точно тези характеристики отразяват някаква значима истина за света, на който отговарят.

Анализ на данни

Макар че е изграден върху основата на статистиката, анализът на данните отива малко по-далеч по отношение на разбирането на причинно-следствената връзка, визуализацията и съобщаването на констатациите на другите. Ако статистиката има за цел да дефинира какво и кога от даден набор от данни, анализът на данните се опитва да идентифицира защо и как. Анализаторите на данни правят това, като почистват данните, обобщават ги, трансформират ги, моделират ги и ги тестват. Както бе споменато по-горе, този анализ не се ограничава само до числа. Докато голяма част от анализите на данни използват цифрови данни, е възможно също да се извършва анализ на други типове данни - например писмена обратна връзка с клиенти или публикации в социалните медии, или дори изображения, аудио и видео.

Една от основните цели на анализаторите на данни е да се разбере причинно-следствената връзка, която след това може да се използва за разбиране и прогнозиране на тенденции в широк спектър от приложения. При диагностичния анализ анализаторите на данни търсят корелации, които предполагат причина и следствие, което от своя страна може да се използва за промяна на резултатите. Прогнозният анализ по подобен начин търси модели, но след това ги разширява допълнително, екстраполирайки техните траектории отвъд известните данни, за да помогне да се предскаже как могат да се развият неизмерени или хипотетични събития – включително бъдещи събития. Най-напредналите форми на анализ на данни имат за цел да предоставят насоки за конкретни решения чрез моделиране и прогнозиране на резултатите от различни избори, за да идентифицират най-подходящия начин на действие.

Изкуствен интелект и машинно обучение

Едно от големите постижения, които се случват в момента в науката за данни – и това, което е готово да окаже огромно влияние в бъдеще – е изкуственият интелект и по-конкретно машинното обучение. Накратко, машинното обучение включва обучение на компютър да изпълнява задачи, за които обикновено смятаме, че изискват някаква форма на интелигентност или преценка, като например да можем да идентифицираме обектите в снимка. Това обикновено се постига, като му се предоставят обилни примери за вида на решителността, която обучавате мрежата да прави. Както можете да си представите, това изисква както купища (обикновено структурирани) данни, така и способност да накарате компютър да осмисли тези данни. Силни статистически умения и умения за програмиране са задължителни.

Благоприятните ефекти от машинното обучение са практически неограничени, но на първо място е способността да се изпълняват сложни или продължителни задачи по-бързо, отколкото всеки човек би могъл, като например идентифициране на конкретен пръстов отпечатък от хранилище от милиони изображения или кръстосани препратки десетки променливи в хиляди медицински досиета за идентифициране на асоциации, които биха могли да предложат улики за това какво причинява заболяване. С достатъчно данни, експертите по машинно обучение могат дори да обучават невронни мрежи да произвеждат оригинални изображения, да извличат смислени прозрения от масивни части от писмен текст, да правят прогнози за бъдещи тенденции в разходите или други пазарни събития и да разпределят ресурси, които зависят от изключително сложно разпределение, като енергия , с максимална ефективност. Предимството от използването на машинно обучение за изпълнение на тези задачи, за разлика от други форми на автоматизация, е, че неконтролиран ИИ. системата може автоматично да се учи и подобрява с течение на времето - дори без ново програмиране.

Бизнес разузнаване

Както може би се досещате от по-ранното споменаване на пазарни събития, светът на бизнеса и финансите е едно от местата, където машинното обучение е оказало едно от най-ранните и дълбоки въздействия. Благодарение на огромното количество налични цифрови данни – маркетингови бази данни, проучвания, банкова информация, данни за продажби и т.н., повечето от които са добре организирани и сравнително лесни за работа – специалистите по данни могат да използват статистика, анализ на данни и машинно обучение за извличане на прозрения за безброй аспекти на света на бизнеса, насочване на вземането на решения и оптимизиране на резултатите до степен, че бизнес интелигентността се превърна в поле на науката за данни за себе си.

Доста често разработчиците на Business Intelligence не просто разглеждат каквито и да са налични данни, за да видят какво могат да открият; те активно се стремят към събиране на данни и разработват техники и продукти, за да отговорят на конкретни въпроси и да постигнат конкретни цели. В този смисъл разработчиците и анализаторите на Business Intelligence са от решаващо значение за стратегическото развитие в световете на бизнеса и финансите – помагат на ръководството да взема по-добри решения и да ги прави по-бързо, да разбира пазара, за да идентифицира възможностите и предизвикателствата на бизнеса и да подобрява цялостната ефективност на системите и работата на бизнеса, всичко това с общата цел за постигане на конкурентно предимство и увеличаване на печалбите.

Инженеринг на данни

Последната основна област на обучение, в която специалистите по данни често работят, включва цяла гама от различни длъжности – инженер по данни, системен архитект, архитект на приложения, архитект на данни, архитект на предприятието или архитект на инфраструктура, за да назовем само няколко. Всяка от тези роли има свой собствен набор от отговорности, като някои разработват софтуер, други проектират ИТ системи, а трети привеждат в съответствие вътрешната структура и процеси на компанията с технологията, която използва, за да преследва своите бизнес стратегии. Това, което свързва всички тях, е, че специалистите по данни, работещи в тази област, прилагат данни и информационни технологии за създаване или подобряване на системи с конкретна функция.

Архитект на приложения, например, наблюдава как бизнес или друго предприятие използва специфични технологични решения, след което проектира и разработва приложения (включително софтуер или ИТ инфраструктура) за подобрена производителност. Архитектът на данни разработва по подобен начин приложения – в този случай решения за съхранение, администриране и анализ на данни. Инфраструктурен архитект може да разработи всеобхватните решения, които компанията използва за извършване на ежедневен бизнес, за да гарантира, че тези решения отговарят на системните изисквания на компанията, независимо дали това е офлайн или в облака. Инженерите на данни, от своя страна, се фокусират върху обработката на данни, замислянето и прилагането на тръбопроводите за данни, които събират, организират, съхраняват, извличат и обработват данните на организацията. С други думи, определящата характеристика на тази широка категория наука за данни е, че тя включва проектиране и изграждане на неща: системи, структури и процеси, чрез които се осъществява науката за данни.

Кои са най-търсените работни места в областта на науката за данни?

Науката за данни като цяло е много търсено умение, така че има много възможности, които можете да намерите във всяка област и специалност в областта. Всъщност през 2019 г. LinkedIn посочи Data Scientist като най-обещаващата работа за годината, а QuantHub прогнозира остър недостиг на квалифицирани специалисти по данни през следващата година.

Ключовата дума тук е квалифициран. Често техническите изисквания, които трябва да изпълни специалистът по данни, са толкова специфични, че може да отнеме няколко години опит, работещ в индустрията, за да се изгради необходимия набор от компетенции, като се започне като генералист, след което бавно се добавят все повече способности и способности към техния набор от умения.

Това са само някои от най-често срещаните начини, по които специалистите по данни могат да направят това – има толкова потенциални кариерни пътеки, колкото има и специалистите по данни, но във всеки случай напредването в кариерата зависи от придобиването на нови умения и опит с течение на времето.

Анализатор на данни

Както подсказва името, анализаторите на данни анализират данни – но това кратко заглавие улавя само малка част от това, което анализаторите на данни всъщност могат да постигнат. От една страна, данните рядко започват в лесна за използване форма и обикновено анализаторите на данни са тези, които са отговорни за идентифицирането на вида на необходимите данни, събирането и сглобяването им и след това почистването и организирането им – преобразуването им в повече използваема форма, определяща какво всъщност съдържа наборът от данни, премахване на повредени данни и оценка на тяхната точност. След това има самия анализ – използване на различни техники за изследване и моделиране на данни, търсене на модели, извличане на значение от тези модели и екстраполиране или моделиране. И накрая, анализаторите на данни правят своите прозрения достъпни за другите, като представят данните в табло за управление или база данни, до които други хора имат достъп, и съобщават своите констатации на други чрез презентации, писмени документи и диаграми, графики и други визуализации.

Кариерен път на Data Analyst

Data Analyst е отлична входна точка в света на Data Science; може да бъде позиция на начално ниво, в зависимост от необходимото ниво на опит. Новите анализатори на данни обикновено навлизат в областта направо след училище – със степен по статистика, математика, компютърни науки или подобни – или преминават към анализ на данни от свързана област като бизнес, икономика или дори социални науки, обикновено чрез надграждане на своите умения в средата на кариерата чрез bootcamp за анализ на данни или подобна програма за сертифициране.

Но независимо дали са наскоро завършили или опитни професионалисти, които правят промяна в средата на кариерата, новите учени по данни обикновено започват с извършване на рутинни задачи като придобиване и манипулиране на данни с език като R или SQL, изграждане на бази данни, извършване на основен анализ и генериране визуализации с помощта на програми като Tableau. Не всеки анализатор на данни ще трябва да знае как да прави всички тези неща – може да има специализация, дори на младша позиция – но трябва да можете да изпълнявате всички тези задачи, ако се надявате да напреднете в кариерата си. Гъвкавостта е голямо предимство на този ранен етап.

Как напредвате като анализатор на данни зависи до известна степен от индустрията, в която работите – маркетинг, например, или финанси. В зависимост от сектора и вида работа, която вършите, можете да изберете да се специализирате в програмирането на Python или R, да станете професионалист в почистването на данни или да се концентрирате единствено върху изграждането на сложни статистически модели или генерирането на красиви визуални изображения; от друга страна, можете също да изберете да научите по малко от всичко, което ще ви настрои да заемете лидерска позиция, докато поемате титлата старши анализатор на данни. С достатъчно богат и дълбок опит, старши анализатор на данни е готов да поеме лидерска роля, наблюдавайки екип от други анализатори на данни, в крайна сметка да стане мениджър на отдел или директор. С допълнително обучение за умения анализаторите на данни също са в силна позиция да преминат към по-напредналата позиция на Data Scientist.

Data Scientist

Истинските специалисти по данни обикновено могат да правят всички неща, които могат да направят анализаторите на данни, плюс още няколко неща освен това – всъщност, с подходящото обучение и опит, анализаторът на данни може в крайна сметка да премине до позицията на Data Scientist. Така че да, Data Scientists трябва да могат да придобиват, почистват, манипулират, съхраняват и анализират данни – но също така да разбират и работят с различни методи на машинно обучение и да могат да програмират на Python, R или подобен език за статистическо програмиране, за да изграждане и оценка на по-модерни модели.

Кариерен път на Data Scientist

Много хора влизат в областта като анализатори на данни, преди да придобият опит и добавени умения, необходими, за да се нарекат учени по данни. След това, от Junior Data Scientist, следващата стъпка обикновено е Senior Data Scientist – въпреки че тази проста промяна в заглавието противоречи на работата, необходима за извършване на този преход; старши специалист по данни или ще владее превъзходно разбиране на почти всички аспекти на науката за данни – ИИ, съхранение на данни, извличане на данни, изчисления в облак и т.н. – в допълнение към познаването им в специфична за индустрията област като бизнес стратегия или анализ на здравеопазването , или те ще се специализират в една от тези области с опит на ниво гуру.

Струва си да се спомене, че докато някои учени по данни започват кариерата си в анализа и си проправят път до по-високи позиции в специализирани области като психология, маркетинг, икономика и така нататък, други започват като професионалисти в една от тези различни области, преди да преминат към данни научна роля.

За мнозина старши специалист по данни е крайната цел в кариерата; това вече е толкова напреднала роля, че поне в областта на науката за данни, това често е най-високата позиция, която може да бъде постигната – просто ставате по-добър, по-способен старши специалист по данни с по-големи области на специализация. За някои обаче, особено тези, които прилагат по-общ подход, е възможно да направят по-нататъшен напредък в управленска позиция като водещ специалист по данни, управляващ екип или отдел, или дори главен служител по данни, който ръководи стратегията за данни на институцията на най-високо ниво и отговаря само на главния изпълнителен директор.

Инженер по данни

Това, което отличава Data Engineers от другите професионалисти, работещи в областта на данните, е фактът, че те проектират и изграждат цели системи – включително инфраструктурата и процесите, които компанията използва, за да се възползва максимално от тези данни. Тоест инженерите по данни са хората, които определят начините, по които другите специалисти по данни могат да вършат работата си. Какви форми на данни може да побере системата на компанията? Какви методи се използват за събиране на данни от продажбите и маркетинга или резултатите от проучване в здравеопазването и предоставянето им за анализ? За да направят това, инженерите по данни трябва да са добре запознати с видовете работа, която извършват другите специалисти по наука за данни – администратори на бази данни, анализатори на данни, архитекти на данни и т.н. – до степен, че инженерите на данни често могат да изпълняват всяка една от тези роли като добре. Но тъй като те са строители, инженерите по данни обикновено прекарват повече време в разработването, отколкото други специалисти по наука за данни – пишат софтуерни програми, създават релационни бази данни или разработват инструменти, които позволяват на компаниите да споделят данни между отделите.

Кариерен път на Data Engineer

Подобно на други работни места, работещи с данни, първата стъпка към това да станете инженер на данни често е университетска степен (обикновено бакалавърска или магистърска степен по инженерство, компютърни науки или математика) – но не винаги. Някой с много опит, работещ в ИТ или разработка на софтуер, може да открие, че вече има всички необходими умения, за да стане инженер по данни, с изключение на самите умения за данни, в който случай някои умения за преквалификация, като например bootcamp, могат да помогнат за тяхното придобиване до скорост. Много от уменията, от които се нуждае инженерът по данни (като SQL, UNIX и Linux, разработка на ETL или конфигуриране на ИТ системи) могат да бъдат развити чрез работа в съседна област; други (като машинно обучение или изграждане на тръбопроводи от данни) ще изискват по-фокусирано обучение.

Като се има предвид това, повечето инженери по данни започват кариерата си, работейки в някаква област на компютърните науки, преди да придобият всички умения, необходими, за да станат младши инженер по данни – наистина, повечето обяви за работа за младши инженери по данни изискват между една и пет години професионален опит. Оттам следващата логична стъпка е към старши инженер по данни и водещ инженер по данни. Но с тяхното владеене на толкова много аспекти на ИТ, софтуерно инженерство и наука за данни, има много други позиции, отворени и за инженери по данни – включително архитект на данни, архитект на решения или архитект на приложения. За някой, който иска да върши по-малко практическа работа и повече управление на служителите, други опции включват мениджър за развитие на продукти – или в крайна сметка, като се имат предвид правилните умения на хората, дори главен директор по данни или главен информационен директор.

Могат ли специалистите по данни да работят от вкъщи?

Подобно на много работни места в областта на технологиите, ролите на Data Scientist често могат да се изпълняват дистанционно, но това в крайна сметка зависи от компанията, за която работите, и вида на работата, която вършите.

Кога специалистите по данни могат да работят дистанционно?

Позиции в областта на науката за данни, които работят с изключително чувствителни или поверителни данни и информация (която включва голям брой от тях, дори извън области с поверителността като банкиране и здравеопазване, тъй като личните данни могат да бъдат един от най-ценните активи на голяма компания), ще открият, че се сблъскват с много повече ограничения по отношение на дистанционната работа. В тези случаи е вероятно от вас да се изисква да работите в офиса през работно време.

Някои други фактори, които трябва да имате предвид:

  • Колко традиционна е вашата компания. По-големите, по-стари компании обикновено не са толкова удобни от разстояние, въпреки че COVID може да донесе големи промени в тази област.
  • Колко лесно можете да работите дистанционно с други съотборници и отдели. Ако работата ви е силно съвместна, по-вероятно е да се наложи да се появите лично.
  • Специалистите по данни, работещи на договор или дори на консултантска основа, може също да имат по-голяма гъвкавост при избора на собствено местоположение.

Kategori: Новини