Vedec dát

Kariérna príručka BrainStation Data Scientist vám môže pomôcť urobiť prvé kroky smerom k lukratívnej kariére v oblasti vedy o údajoch. Čítajte ďalej a získajte prehľad o oblasti vedy o údajoch, ako aj o pracovnej pozícii Data Scientist.

Staňte sa dátovým vedcom

Porozprávajte sa s poradcom pre vzdelávanie a dozviete sa viac o tom, ako vám naše bootcampy a kurzy môžu pomôcť stať sa dátovým vedcom.



Kliknutím na tlačidlo Odoslať súhlasíte s našimi Podmienky .



Predložiť

Nepodarilo sa odoslať! Chcete obnoviť stránku a skúsiť to znova?

Zistite viac o našom Data Science Bootcampe

Ďakujem!

Čoskoro sa vám ozveme.



Pozrite si stránku Data Science Bootcamp

Čo je dátový vedec?

Data Scientists zhromažďujú, organizujú a analyzujú veľké súbory veľkých údajov – štruktúrovaných a neštruktúrovaných údajov – s cieľom vytvárať podnikové riešenia a plány založené na údajoch pre spoločnosti a iné organizácie. Spojením zmyslu pre matematiku, informatiku a obchod musia dátoví vedci disponovať technickými zručnosťami na spracovanie a analýzu veľkých dát a obchodným bystrosťou, aby odhalili použiteľné poznatky skryté v týchto dátach.

Data Science vs. Data Mining

Existuje niekoľko rozdielov medzi vedou o údajoch a dolovaním údajov. Pozrime sa bližšie:

Data Science

  • Je to široká oblasť, ktorá má tendenciu zahŕňať strojové učenie, umelú inteligenciu, predikčnú kauzálnu analýzu a preskriptívnu analýzu
  • Zaoberá sa všetkými druhmi údajov vrátane štruktúrovaných aj neštruktúrovaných údajov
  • Zameriava sa na vytváranie produktov zameraných na údaje a prijímanie rozhodnutí na základe údajov
  • Zameriava sa na vedecké štúdium údajov a vzorov

Data Mining

  • Je podmnožinou vedy o údajoch, ktorá zahŕňa čistenie údajov, štatistickú analýzu a rozpoznávanie vzorov a niekedy zahŕňa vizualizáciu údajov, strojové učenie a transformáciu údajov.
  • Zaoberá sa predovšetkým štruktúrovanými údajmi, nie neštruktúrovanými údajmi
  • Zameriava sa na získavanie údajov z rôznych zdrojov a ich využitie
  • Zameriava sa na obchodné praktiky

Čo robí dátový vedec?

Data Scientist analyzuje veľké súbory údajov, aby odhalil vzorce a trendy, ktoré vedú k praktickým obchodným poznatkom a pomáhajú organizáciám riešiť komplikované problémy alebo identifikovať príležitosti na zisk a rast. Data Scientist môže pracovať prakticky v každej oblasti a musí byť zbehlý v zaobchádzaní so štruktúrovanými a neštruktúrovanými súbormi údajov. Je to multidisciplinárna práca a na to, aby ste sa stali dátovým vedcom, musíte poznať matematiku, informatiku, obchod a komunikáciu, aby ste svoju prácu vykonávali efektívne.



Aj keď sa konkrétne pracovné povinnosti a zodpovednosti Data Scientist budú značne líšiť v závislosti od odvetvia, pozície a organizácie, väčšina úloh Data Scientist bude zahŕňať nasledujúce oblasti zodpovednosti:

Výskum

Data Scientist musí pochopiť príležitosti a bolestivé body špecifické pre odvetvie aj individuálnu spoločnosť.

Príprava údajov

Predtým, ako bude možné nájsť akékoľvek cenné poznatky, musí dátový vedec definovať, ktoré súbory údajov sú užitočné a relevantné pred zhromažďovaním, extrahovaním, čistením a aplikáciou štruktúrovaných a neštruktúrovaných údajov z rôznych zdrojov.



Vytváranie modelov a algoritmov

Pomocou princípov strojového učenia a umelej inteligencie musí byť dátový vedec schopný vytvárať a aplikovať algoritmy potrebné na implementáciu nástrojov automatizácie.

Analýza dát

Pre dátového vedca je dôležité, aby bol schopný rýchlo analyzovať svoje dáta a identifikovať vzory, trendy a príležitosti.

Vizualizácia a komunikácia

Dátový vedec musí byť schopný rozprávať príbehy objavené prostredníctvom údajov vytváraním a organizovaním esteticky príťažlivých informačných panelov a vizualizácií, pričom musí mať aj komunikačné schopnosti, aby presvedčil zainteresované strany a ostatných členov tímu, že zistenia v údajoch sa oplatí konať.

Najnovší prieskum digitálnych zručností BrainStation zistil, že dátoví profesionáli trávili väčšinu času hádkou a čistením dát. Respondenti tiež dospeli k záveru, že cieľom ich práce je najčastejšie optimalizácia existujúcej platformy, produktu alebo systému (45 percent), prípadne vývoj nových (42 percent).

Typy vedy o údajoch

Širšia oblasť Data Science zahŕňa mnoho rôznych disciplín, vrátane:

Dátové inžinierstvo

Navrhovanie, budovanie, optimalizácia, údržba a správa infraštruktúry, ktorá podporuje údaje, ako aj tok údajov v rámci organizácie.

Príprava dát

Čistenie a transformácia údajov.

Dolovanie dát

Extrahovanie (a niekedy čistenie a transformácia) použiteľných údajov z väčšieho súboru údajov.

Prediktívna analytika

Používanie údajov, algoritmov a techník strojového učenia na analýzu pravdepodobnosti rôznych možných budúcich výsledkov na základe analýzy údajov.

Strojové učenie

Automatizácia vytvárania analytického modelu v procese analýzy údajov s cieľom učiť sa z údajov, objavovať vzory a umožniť systémom prijímať rozhodnutia bez veľkého zásahu človeka.

Vizualizácia dát

Používanie vizuálnych prvkov (vrátane grafov, máp a grafov) na ilustrovanie poznatkov nájdených v údajoch prístupným spôsobom, aby publikum mohlo pochopiť trendy, odľahlé hodnoty a vzorce nachádzajúce sa v údajoch.

Výhody Data Science

Spoločnosti vo všetkých odvetviach vo všetkých častiach sveta venujú stále viac peňazí, času a pozornosti vedeckej oblasti údajov a chcú do svojho tímu pridať Data Scientist. Výskum ukazuje, že spoločnosti, ktoré skutočne využívajú rozhodovanie založené na údajoch, sú produktívnejšie, ziskovejšie a efektívnejšie ako konkurencia.

Veda o údajoch je kľúčová pre pomoc organizáciám identifikovať správne problémy a príležitosti a zároveň pomáha vytvoriť si jasný obraz o správaní a potrebách zákazníkov a klientov, výkonnosti zamestnancov a produktov a potenciálnych budúcich problémoch.

Dátová veda môže spoločnostiam pomôcť:

  • Robte lepšie rozhodnutia
  • Zistite viac o zákazníkoch a klientoch
  • Využite trendy
  • Predvídať budúcnosť

Ako môže dátová veda zvýšiť hodnotu pre spoločnosť?

Dátová veda je čoraz populárnejšou investíciou pre podniky, pretože potenciálna návratnosť investícií pri uvoľnení hodnoty veľkých dát je obrovská. Dátová veda je hodnotná investícia, pretože:

    Odstraňuje dohady a poskytuje užitočné informácie.Spoločnosti robia lepšie rozhodnutia na základe údajov a kvantifikovateľných dôkazov.Spoločnosti lepšie chápu svoje miesto na trhu.Dátová veda pomôže spoločnostiam analyzovať konkurenciu, skúmať historické príklady a robiť odporúčania založené na číslach.Dá sa využiť na identifikáciu top talentov.Vo veľkých údajoch sa skrýva množstvo poznatkov o produktivite, efektívnosti zamestnancov a celkovom výkone. Údaje možno použiť aj na nábor a výcvik talentov.Dozviete sa všetko o vašej cieľovej skupine, klientovi alebo spotrebiteľovi.Každý teraz generuje a zhromažďuje údaje a spoločnosti, ktoré neinvestujú správne do vedy o údajoch, jednoducho zbierajú viac údajov, než vedia, čo robiť. Prehľady správania, priorít a preferencií minulých alebo potenciálnych zákazníkov alebo klientov sú neoceniteľné a jednoducho čakajú, kým ich objaví kvalifikovaný dátový vedec.

Platy pre dátových vedcov

Zatiaľ čo platy Data Scientists sa značne líšia v závislosti od regiónu a odvetvia, priemerná mzda pre Data Scientist v USA sa uvádza niekde od 96 000 do 113 000 USD, v závislosti od zdroja. Senior Data Scientist môže priniesť v priemere približne 130 000 dolárov.

Dopyt po dátových vedcoch

Data Scientists sú veľmi žiadané a majú nedostatok prakticky vo všetkých odvetviach. Správa Deloitte Access Economics zistila, že 76 percent podnikov plánuje v nasledujúcich rokoch zvýšiť výdavky na možnosti analýzy údajov, zatiaľ čo IBM predpovedala 28-percentný nárast dopytu po dátovej vede na začiatku dekády.

Americký úrad pre štatistiku práce predpokladá 31-percentný rast v oblasti vedy o údajoch počas nasledujúcich 10 rokov. Medzitým Správa o trhoch a trhoch zistila, že sa predpokladá, že globálny trh s veľkými údajmi do roku 2025 vzrastie na 229,4 miliardy USD, pričom platforma pre vedu o údajoch vzrastie do roku 2024 o 30 percent.

Zdá sa, že všade na svete sa očakáva nárast investícií do vedy o údajoch a s tým aj dopyt po vedcoch údajov.

Aké nástroje používajú dátoví vedci?

Data Scientists používajú množstvo rôznych nástrojov a programov na činnosti vrátane analýzy údajov, čistenia údajov a vytvárania vizualizácií.

Python je najlepší programovací jazyk pre dátových vedcov, ktorí sa zúčastnili prieskumu BrainStation Digital Skills Survey. Univerzálny programovací jazyk Python je užitočný pre aplikácie na spracovanie národného jazyka a analýzu údajov. R sa tiež často používa na analýzu údajov a dolovanie údajov. Pre náročnejšie čísla sú obľúbené nástroje založené na Hadoope, ako je Hive. Pre strojové učenie si Data Scientists môžu vybrať zo širokej škály nástrojov vrátane h2o.ai, TensorFlow, Apache Mahout a Accord.Net. Vizualizačné nástroje sú tiež dôležitou súčasťou arzenálu Data Scientist. Programy ako Tableau, PowerBI, Bokeh, Plotly a Infogram pomáhajú Data Scientist vytvárať vizuálne príťažlivé diagramy, tepelné mapy, grafiku, bodové grafy a ďalšie.

Data Scientists by tiež mali byť veľmi spokojní s SQL (používaný na celom rade platforiem vrátane MySQL, Microsoft SQL a Oracle) a tabuľkovými programami (zvyčajne Excel).

Aké zručnosti potrebujú dátoví vedci?

Existuje množstvo zručností, ktoré by mali rozvíjať všetci začínajúci dátoví vedci, vrátane:

    Excel.Excel, ktorý je najpoužívanejším nástrojom pre 66 percent dátových profesionálov opýtaných v prieskume digitálnych zručností BrainStation, je pre Data Scientists stále kľúčový.SQL.Tento dopytovací jazyk je nevyhnutný pri správe databáz a používa ho približne polovica respondentov.Štatistické programovanie.Data Scientists bežne používajú Python a R na spúšťanie testov, vytváranie modelov a vykonávanie analýz veľkých súborov údajov.Vizualizácia dát.Nástroje ako Tableau, Plotly, Bokeh, PowerBl a Matplotlib pomáhajú Data Scientists vytvárať presvedčivé a dostupné vizuálne reprezentácie ich zistení.

Kariérne cesty dátových vedcov

Ako relatívne nová profesia nie sú kariérne cesty Data Scientist vytesané do kameňa a veľa ľudí si nájde cestu k vede o údajoch z prostredia informatiky, IT, matematiky a podnikania. Ale štyri hlavné osi kariérneho postupu Data Scientist sú vo všeobecnosti údaje, inžinierstvo, obchod a produkt. Mnoho multidisciplinárnych úloh v dátovej vede si vyžaduje zvládnutie niekoľkých alebo všetkých týchto oblastí.

Ľudia pracujúci v dátovej vede sú v samom popredí technologických zmien, ktoré najviac ovplyvnia budúcnosť. Pretože dátová veda môže prispieť k pokroku v prakticky každej inej oblasti, Data Scientists sú schopní ďalej skúmať všetko od financií a obchodu po poistno-matematickú štatistiku, zelenú energiu, epidemiológiu, medicínu a farmáciu, telekomunikácie – zoznam je prakticky nekonečný. Každé odvetvie prevádzkuje svoje vlastné odlišné typy údajov a využíva ich rôznymi spôsobmi na dosiahnutie rôznych cieľov. Kdekoľvek sa to stane, Data Scientists môžu viesť lepšie rozhodovanie, či už ide o vývoj produktov, analýzu trhu, riadenie vzťahov so zákazníkmi, ľudské zdroje alebo niečo úplne iné.

Nielenže sú aplikácie pre vedu o údajoch široké a dotýkajú sa mnohých rôznych sektorov, ale existujú aj rôzne typy vedy o údajoch. Všetky tieto aktivity majú spoločné to, že všetky sa snažia premeniť dáta na poznatky. Presnejšie povedané, Data Scientists používajú metodický prístup na organizáciu a analýzu nespracovaných údajov na identifikáciu vzorov, z ktorých možno identifikovať alebo odvodiť užitočné informácie.

Vzhľadom na rozsah ich vplyvu niet divu, že Data Scientists zaujímajú pozície, ktoré sú veľmi vplyvné – a veľmi žiadané. Zatiaľ čo cesta stať sa dátovým vedcom môže byť náročná, teraz existuje viac zdrojov pre začínajúcich dátových vedcov ako kedykoľvek predtým a viac príležitostí pre nich vybudovať si takú kariéru, akú chcú.

Ale pre všetky spôsoby, akými môžu dátoví vedci prispieť k rôznym odvetviam a všetky rôzne kariérne cesty, ktorými sa dátoví vedci môžu uberať, typy práce, ktorú robia, možno rozdeliť do niekoľkých hlavných kategórií. Nie všetka veda o údajoch presne zapadá do týchto skupín, najmä v popredí počítačovej vedy, kde sa neustále prelamuje nová pôda – dajú vám však určitú predstavu o tom, ako dátoví vedci premieňajú údaje na poznatky.

Štatistiky

V srdci vedy o údajoch je štatistika oblasťou matematiky, ktorá popisuje rôzne charakteristiky súboru údajov, či už ide o čísla, slová, obrázky alebo nejaký iný druh merateľných informácií. Veľká časť štatistík sa sústreďuje na jednoduchú identifikáciu a popis toho, čo tam je – najmä pri veľmi veľkých súboroch údajov, už len vedieť, čo informácie obsahujú a čo nie, je úloha sama o sebe. V oblasti vedy o údajoch sa to často nazýva deskriptívna analytika. Štatistiky však môžu ísť ešte ďalej a testovať, či sú vaše predpoklady o tom, čo je v údajoch správne, alebo, ak sú správne, či sú významné alebo užitočné. To môže zahŕňať nielen skúmanie údajov, ale aj manipuláciu s nimi, aby sa získali ich hlavné črty. Existuje mnoho rôznych spôsobov, ako to urobiť – lineárna regresia, logistická regresia a diskriminačná analýza, rôzne metódy odberu vzoriek atď. – ale v konečnom dôsledku je každá z týchto techník o pochopení vlastností súboru údajov a o tom, ako presne sú tieto vlastnosti odrážať nejakú zmysluplnú pravdu o svete, ktorému zodpovedajú.

Analýza dát

Hoci je založená na štatistikách, analýza údajov ide o niečo ďalej, pokiaľ ide o pochopenie kauzality, vizualizáciu a oznamovanie zistení ostatným. Ak štatistika stanovuje, čo a kedy zo súboru údajov, analýza údajov sa pokúsi identifikovať prečo a ako. Analytici údajov to robia tak, že údaje vyčistia, zosumarizujú, transformujú, modelujú a testujú. Ako je uvedené vyššie, táto analýza sa neobmedzuje iba na čísla. Zatiaľ čo pri analýze údajov sa používajú číselné údaje, je možné vykonať analýzu aj s inými typmi údajov – napríklad písomnou spätnou väzbou od zákazníkov alebo príspevkami na sociálnych sieťach, alebo dokonca obrázkami, zvukom a videom.

Jedným z hlavných cieľov Data Analysts je pochopiť kauzalitu, ktorú potom možno použiť na pochopenie a predpovedanie trendov v širokej škále aplikácií. V diagnostickej analýze analytici údajov hľadajú korelácie, ktoré naznačujú príčinu a následok, pričom tieto poznatky môžu byť následne použité na úpravu výsledkov. Prediktívna analýza podobne hľadá vzory, ale potom ich rozširuje ďalej, pričom ich trajektórie extrapoluje mimo známych údajov, aby pomohla predpovedať, ako sa môžu odohrať nemerané alebo hypotetické udalosti – vrátane budúcich udalostí. Najpokročilejšie formy analýzy údajov majú za cieľ poskytnúť usmernenie pri konkrétnych rozhodnutiach modelovaním a predpovedaním výsledkov rôznych možností s cieľom určiť najvhodnejší postup.

Umelá inteligencia a strojové učenie

Jedným z veľkých pokrokov, ktoré sa v súčasnosti odohrávajú vo vede o údajoch – a ktorý má v budúcnosti obrovský vplyv – je umelá inteligencia a konkrétnejšie strojové učenie. Stručne povedané, strojové učenie zahŕňa trénovanie počítača na vykonávanie úloh, o ktorých by sme si zvyčajne mysleli, že vyžadujú určitú formu inteligencie alebo úsudku, ako napríklad schopnosť identifikovať objekty na fotografii. To sa zvyčajne dosiahne tak, že mu poskytnete množstvo príkladov typu odhodlania, na ktoré trénujete sieť. Ako si viete predstaviť, vyžaduje si to množstvo (zvyčajne štruktúrovaných) údajov a schopnosť prinútiť počítač, aby dal týmto údajom zmysel. Silné štatistické zručnosti a programovacie zručnosti sú nutnosťou.

Priaznivé účinky strojového učenia sú prakticky neobmedzené, ale v prvom rade je to schopnosť vykonávať zložité alebo zdĺhavé úlohy rýchlejšie, ako by to dokázal ktorýkoľvek človek, ako je identifikácia konkrétneho odtlačku prsta z úložiska miliónov obrázkov alebo krížové odkazy. desiatky premenných v tisíckach lekárskych záznamov na identifikáciu asociácií, ktoré by mohli poskytnúť vodítka k tomu, čo spôsobuje ochorenie. S dostatkom údajov môžu odborníci na strojové učenie dokonca trénovať neurónové siete na vytváranie originálnych obrázkov, získavať zmysluplné poznatky z masívneho množstva písaného textu, predpovedať budúce trendy vo výdavkoch alebo iné udalosti na trhu a prideľovať zdroje, ktoré závisia od vysoko komplexnej distribúcie, ako je energia. s maximálnou účinnosťou. Výhodou používania strojového učenia na vykonávanie týchto úloh, na rozdiel od iných foriem automatizácie, je to, že A.I. systém sa môže časom automaticky učiť a zlepšovať – dokonca aj bez nového programovania.

Obchodné spravodajstvo

Ako ste mohli uhádnuť z predchádzajúceho odkazu na udalosti na trhu, svet podnikania a financií je jedným z miest, kde strojové učenie malo jeden zo svojich prvých a najzávažnejších vplyvov. Vďaka obrovskému množstvu dostupných číselných údajov – marketingových databáz, prieskumov, bankových informácií, údajov o predaji atď., z ktorých väčšina je vysoko organizovaná a relatívne ľahko sa s nimi pracuje – môžu Data Scientists využívať štatistiky, analýzu údajov a strojové učenie na získanie poznatkov o nespočetných aspektoch obchodného sveta, usmerňovanie rozhodovania a optimalizáciu výsledkov až do takej miery, že obchodné spravodajstvo sa stalo samo o sebe oblasťou vedy o údajoch.

Pomerne často sa vývojári Business Intelligence jednoducho nepozerajú na akékoľvek dostupné údaje, aby zistili, čo môžu objaviť; proaktívne sledujú zber údajov a vyvíjajú techniky a produkty, aby odpovedali na konkrétne otázky a dosiahli konkrétne ciele. V tomto zmysle sú vývojári a analytici Business Intelligence kľúčoví pre strategický rozvoj vo svete podnikania a financií – pomáhajú vedeniu robiť lepšie rozhodnutia a robiť ich rýchlejšie, porozumieť trhu, identifikovať príležitosti a výzvy podniku a zlepšiť celkovú efektivitu podnikových systémov a prevádzky, to všetko s hlavným cieľom dosiahnuť konkurenčnú výhodu a zvýšiť zisky.

Dátové inžinierstvo

Posledný hlavný študijný odbor, v ktorom Data Scientists často pracujú, zahŕňa celý rad rôznych pracovných pozícií – dátový inžinier, systémový architekt, aplikačný architekt, dátový architekt, podnikový architekt alebo architekt infraštruktúry, aby sme vymenovali len niektoré. Každá z týchto rolí má svoj vlastný súbor zodpovedností, pričom niektoré vyvíjajú softvér, iné navrhujú IT systémy a ďalšie zosúlaďujú internú štruktúru a procesy spoločnosti s technológiou, ktorú používa na presadzovanie svojich obchodných stratégií. To, čo ich všetkých spája, je to, že Data Scientists pracujúci v tejto oblasti používajú údaje a informačné technológie na vytváranie alebo zlepšovanie systémov so zreteľom na špecifickú funkciu.

Aplikačný architekt napríklad sleduje, ako podnik alebo iný podnik používa špecifické technologické riešenia, potom navrhuje a vyvíja aplikácie (vrátane softvéru alebo IT infraštruktúry) na zvýšenie výkonu. A Data Architect podobne vyvíja aplikácie – v tomto prípade riešenia pre ukladanie, správu a analýzu dát. Architekt infraštruktúry môže vyvinúť zastrešujúce riešenia, ktoré spoločnosť používa na každodenné podnikanie, aby zabezpečil, že tieto riešenia budú spĺňať systémové požiadavky spoločnosti, či už je to offline alebo v cloude. Dátoví inžinieri sa zameriavajú na spracovanie údajov, koncepciu a implementáciu dátových kanálov, ktoré zhromažďujú, organizujú, ukladajú, získavajú a spracúvajú údaje organizácie. Inými slovami, definujúcou črtou tejto širokej kategórie vedy o údajoch je to, že zahŕňa navrhovanie a vytváranie vecí: systémov, štruktúr a procesov, ktorými sa veda o údajoch vykonáva.

Aké sú najžiadanejšie pracovné miesta v oblasti dátovej vedy?

Dátová veda je vo všeobecnosti vysoko žiadaná zručnosť, takže v každej oblasti a špecializácii tejto oblasti sa dá nájsť veľa príležitostí. V skutočnosti v roku 2019 LinkedIn uviedol Data Scientist ako najsľubnejšiu prácu roka a QuantHub predpovedal akútny nedostatok kvalifikovaných Data Scientists v nasledujúcom roku.

Kľúčové slovo je tu kvalifikované. Technické požiadavky, ktoré musí Data Scientist spĺňať, sú často také špecifické, že môže trvať niekoľko rokov skúseností s prácou v tomto odvetví, kým si vybuduje potrebný rozsah kompetencií, počnúc všeobecným odborníkom, potom pomaly pridávaním ďalších a ďalších schopností a schopností. súbor ich zručností.

Toto je len niekoľko z najbežnejších spôsobov, ako to Data Scientists dokážu – existuje toľko potenciálnych kariérnych dráh, koľko je Data Scientists, no v každom prípade kariérny postup závisí od získavania nových zručností a skúseností v priebehu času.

Dátový analytik

Ako už názov napovedá, Data Analysts analyzuje dáta – ale tento krátky názov zachytáva iba malú časť toho, čo môžu Data Analyst skutočne dosiahnuť. Po prvé, údaje len zriedka začínajú v ľahko použiteľnej forme a sú to zvyčajne analytici údajov, ktorí sú zodpovední za identifikáciu druhu potrebných údajov, ich zhromažďovanie a zostavovanie a potom ich čistenie a organizáciu – premenu na použiteľný formulár, určenie toho, čo súbor údajov skutočne obsahuje, odstránenie poškodených údajov a vyhodnotenie ich presnosti. Potom je tu samotná analýza – použitie rôznych techník na skúmanie a modelovanie údajov, hľadanie vzorov, extrahovanie významu z týchto vzorov a ich extrapoláciu alebo modelovanie. A nakoniec, dátoví analytici sprístupňujú svoje poznatky ostatným tým, že ich prezentujú na dashboarde alebo databáze, ku ktorej majú prístup iní ľudia, a oznamujú svoje zistenia ostatným prostredníctvom prezentácií, písomných dokumentov a tabuliek, grafov a iných vizualizácií.

Kariérna dráha analytika údajov

Data Analyst je vynikajúcim vstupným bodom do sveta Data Science; môže ísť o pozíciu na základnej úrovni v závislosti od požadovanej úrovne odbornosti. Noví analytici údajov zvyčajne vstupujú do tejto oblasti hneď po škole – s titulom v odbore štatistika, matematika, informatika alebo podobne – alebo prechádzajú na analýzu údajov z príbuznej oblasti, ako je obchod, ekonómia alebo dokonca sociálne vedy, zvyčajne upgradovaním svojho zručnosti uprostred kariéry prostredníctvom bootcampu na analýzu údajov alebo podobného certifikačného programu.

Ale či už ide o čerstvých absolventov alebo skúsených profesionálov, ktorí robia zmenu uprostred kariéry, noví dátoví vedci zvyčajne začínajú vykonávaním rutinných úloh, ako je získavanie a manipulácia s údajmi pomocou jazyka ako R alebo SQL, budovanie databáz, vykonávanie základných analýz a generovanie vizualizácie pomocou programov ako Tableau. Nie každý dátový analytik bude musieť vedieť, ako robiť všetky tieto veci – môže existovať špecializácia, dokonca aj na juniorskej pozícii – ale mali by ste byť schopní vykonávať všetky tieto úlohy, ak dúfate, že pokročíte vo svojej kariére. Flexibilita je v tomto ranom štádiu veľkou výhodou.

To, ako napredujete ako dátový analytik, do určitej miery závisí od odvetvia, v ktorom pracujete – napríklad marketingu alebo financií. V závislosti od odvetvia a typu práce, ktorú robíte, si môžete vybrať špecializáciu na programovanie v Pythone alebo R, stať sa profesionálom v oblasti čistenia dát alebo sa sústrediť výlučne na vytváranie zložitých štatistických modelov alebo generovanie krásnych vizuálov; na druhej strane sa tiež môžete rozhodnúť naučiť sa zo všetkého trochu a pripraviť vás na vedúcu pozíciu, keď prevezmete titul Senior Data Analyst. S dostatočne širokými a dostatočne hlbokými skúsenosťami je senior dátový analytik pripravený prevziať vedúcu úlohu pri dohľade nad tímom iných dátových analytikov a prípadne sa stať manažérom oddelenia alebo riaditeľom. S dodatočným školením zručností majú dátoví analytici tiež silnú pozíciu na to, aby sa posunuli na pokročilejšiu pozíciu Data Scientist.

Vedec dát

Správni dátoví analytici môžu zvyčajne robiť všetky veci, ktoré môžu robiť dátoví analytici, plus niekoľko ďalších vecí – v skutočnosti môže dátový analytik so správnym školením a skúsenosťami nakoniec postúpiť na pozíciu dátového analytika. Takže áno, dátoví vedci by mali byť schopní získavať, čistiť, manipulovať, ukladať a analyzovať dáta – ale tiež porozumieť rôznym metódam strojového učenia a pracovať s nimi a byť schopní programovať v Pythone, R alebo podobnom štatistickom programovacom jazyku. vytvárať a vyhodnocovať pokročilejšie modely.

Kariérna dráha Data Scientist

Mnoho ľudí vstupuje do tejto oblasti ako analytici údajov predtým, ako získajú skúsenosti a ďalšie zručnosti potrebné na to, aby sa mohli nazývať Data Scientists. Potom, od Junior Data Scientist, je ďalším krokom zvyčajne Senior Data Scientist – hoci táto jednoduchá zmena názvu popiera prácu, ktorú je potrebné vykonať na tento prechod; Senior Data Scientist bude buď ovládať vynikajúce znalosti prakticky všetkých aspektov vedy o údajoch – AI, dátové sklady, dolovanie údajov, cloud computing atď. – okrem toho, že budú poznať oblasť špecifickú pre daný priemysel, ako je obchodná stratégia alebo analytika v oblasti zdravotnej starostlivosti. , alebo sa budú špecializovať na jednu z týchto oblastí s odbornosťou na úrovni guru.

Stojí za zmienku, že zatiaľ čo niektorí dátoví vedci začínajú svoju kariéru v analytike a prepracujú sa na vyššie pozície v špecializovaných oblastiach, ako je psychológia, marketing, ekonómia atď., iní začínajú ako profesionáli v jednej z týchto odlišných oblastí pred prechodom na dáta. vedecká úloha.

Pre mnohých je Senior Data Scientist konečným kariérnym cieľom; toto je už taká pokročilá úloha, že prinajmenšom v oblasti vedy o údajoch je to často najvyššia pozícia, ktorú možno dosiahnuť – jednoducho sa stanete lepším a schopnejším starším vedcom údajov s väčšími oblasťami špecializácie. Pre niektorých, najmä pre tých, ktorí majú všeobecnejší prístup, je však možné dosiahnuť ďalší pokrok na manažérskej pozícii, ako je vedúci dátový vedec, vedenie tímu alebo oddelenia alebo dokonca hlavný dátový riaditeľ, ktorý vedie dátovú stratégiu inštitúcie na najvyššej úrovni. a zodpovedá sa len generálnemu riaditeľovi.

dátový inžinier

To, čo odlišuje dátových inžinierov od iných profesionálov pracujúcich v dátovej oblasti, je skutočnosť, že navrhujú a stavajú celé systémy – vrátane infraštruktúry a procesov, ktoré spoločnosť používa na čo najlepšie využitie týchto dát. To znamená, že dátoví inžinieri sú ľudia, ktorí určujú spôsoby, akými môžu iní dátoví vedci vykonávať svoju prácu. Aké formy údajov dokáže podnikový systém prijať? Aké metódy sa používajú na zber údajov z predaja a marketingu alebo výsledkov prieskumu v oblasti zdravotnej starostlivosti a ich sprístupnenie na analýzu? Aby to dosiahli, musia byť dátoví inžinieri veľmi dobre oboznámení s typmi práce, ktorú vykonávajú iní profesionáli v oblasti dátovej vedy – správcovia databáz, analytici dát, dátoví architekti atď. – do tej miery, že dátoví inžinieri môžu často vykonávať každú z týchto rolí ako dobre. Ale keďže sú to tvorcovia, dátoví inžinieri zvyčajne trávia viac času prácou na vývoji ako iní profesionáli v oblasti dátovej vedy – písaním softvérových programov, budovaním relačných databáz alebo vývojom nástrojov, ktoré umožňujú spoločnostiam zdieľať dáta medzi oddeleniami.

Kariérna cesta dátového inžiniera

Rovnako ako pri iných zamestnaniach pracujúcich s údajmi, prvým krokom k tomu, aby ste sa stali dátovým inžinierom, je často vysokoškolské vzdelanie (zvyčajne bakalársky alebo magisterský titul v inžinierstve, informatike alebo matematike) – ale nie vždy. Niekto s množstvom skúseností s prácou v oblasti IT alebo vývoja softvéru môže zistiť, že už má všetky potrebné zručnosti na to, aby sa stal dátovým inžinierom, okrem samotných dátových zručností. V takom prípade mu môže pomôcť preškolenie niektorých zručností, ako je napríklad dátový bootcamp. do rýchlosti. Mnohé zo zručností, ktoré dátový inžinier vyžaduje (napríklad SQL, UNIX a Linux, vývoj ETL alebo konfigurácia IT systémov), možno rozvíjať prácou v susednej oblasti; iné (napríklad strojové učenie alebo budovanie dátových kanálov) si budú vyžadovať sústredenejšie učenie.

Ako už bolo povedané, väčšina dátových inžinierov začína svoju kariéru prácou v niektorej podoblasti počítačovej vedy predtým, ako získa všetky zručnosti potrebné na to, aby sa stala juniorským dátovým inžinierom – väčšina pracovných ponúk pre mladých dátových inžinierov si skutočne vyžaduje jeden až päť rokov pracovných skúseností. Odtiaľ je ďalším logickým krokom vedúci dátový inžinier a vedúci dátový inžinier. Ale vzhľadom na to, že ovládajú toľko aspektov IT, softvérového inžinierstva a dátovej vedy, existuje množstvo ďalších pozícií otvorených aj pre dátových inžinierov – vrátane Data Architect, Solutions Architect alebo Applications Architect. Pre niekoho, kto chce robiť menej praktickej práce a viac riadiť zamestnancov, sú k dispozícii ďalšie možnosti vrátane manažéra vývoja produktu – alebo prípadne, ak má ľudia tie správne zručnosti, dokonca aj Chief Data Officer alebo Chief Information Officer.

Môžu dátoví vedci pracovať z domu?

Rovnako ako mnohé pracovné miesta v technologickej oblasti, úlohy Data Scientist možno často vykonávať na diaľku – to však v konečnom dôsledku závisí od spoločnosti, pre ktorú pracujete, a od druhu práce, ktorú vykonávate.

Kedy môžu dátoví vedci pracovať na diaľku?

Pozície v oblasti dátovej vedy, ktoré pracujú s vysoko citlivými alebo dôvernými údajmi a informáciami (ktoré zahŕňajú veľké množstvo z nich, a to aj mimo oblastí náročných na súkromie, ako je bankovníctvo a zdravotníctvo, pretože vlastnícke údaje môžu byť jedným z najcennejších aktív veľkej spoločnosti), nájdu čeliť mnohým ďalším obmedzeniam, pokiaľ ide o prácu na diaľku. V týchto prípadoch je pravdepodobné, že budete musieť počas pracovnej doby pracovať v kancelárii.

Niektoré ďalšie faktory, ktoré treba zvážiť:

  • Aká tradičná je vaša spoločnosť. Väčšie, staršie spoločnosti nie sú zvyčajne také priateľské na diaľku – hoci COVID mohol v tejto oblasti priniesť veľké zmeny.
  • Ako jednoducho môžete na diaľku spolupracovať s ostatnými spoluhráčmi a oddeleniami. Ak je vaša práca založená na vysokej spolupráci, je pravdepodobnejšie, že budete musieť prísť osobne.
  • Data Scientists pracujúci na základe zmluvy – alebo dokonca na základe konzultácií – môžu mať tiež väčšiu flexibilitu pri výbere vlastného miesta.

Kategori: Správy