Deň v živote dátového vedca

Kariérna príručka BrainStation Data Scientist vám môže pomôcť urobiť prvé kroky smerom k lukratívnej kariére v oblasti vedy o údajoch. Čítajte ďalej a získajte prehľad o tom, ako Data Scientists trávia dni v práci.

Staňte sa dátovým vedcom

Porozprávajte sa s poradcom pre vzdelávanie a dozviete sa viac o tom, ako vám naše bootcampy a kurzy môžu pomôcť stať sa dátovým vedcom.



Kliknutím na tlačidlo Odoslať súhlasíte s našimi Podmienky .



Predložiť

Nepodarilo sa odoslať! Chcete obnoviť stránku a skúsiť to znova?

Zistite viac o našom Data Science Bootcampe

Ďakujem!

Čoskoro sa vám ozveme.



Pozrite si stránku Data Science Bootcamp

Deň v živote dátového vedca

Zo všetkých disciplín skúmaných v Brainstation’s Digital Skills Survey môže dátová veda zahŕňať najširšiu škálu aplikácií. No hoci veda o údajoch existuje už desaťročia, naplno rozkvitla len nedávno. Ako sa dostupnosť údajov rozšírila, spoločnosti si uvedomili, aká dôležitá môže byť veda o údajoch, hovorí Briana Brownell, zakladateľka a generálna riaditeľka spoločnosti Pure Strategy a už 13 rokov pracuje v oblasti údajov. Každá spoločnosť sa teraz musí čiastočne zamerať na technológie. Napríklad len tento týždeň spoločnosť McDonald’s zaplatila odhadom 300 miliónov USD za získanie vlastnej spoločnosti s veľkými údajmi.

Nie je preto divu, že konkurencia pre Data Scientists je neuveriteľne vysoká. Len za dva roky sa očakáva nárast dopytu o 28 percent, čo zodpovedá približne 2,7 miliónom nových pracovných miest. To je viac otvorov, ako budú môcť noví absolventi zaplniť – čo znamená, že technickí pracovníci v iných oblastiach si budú musieť oprášiť svoje zručnosti a prejsť na údaje, aby splnili tento dopyt.

V skutočnosti náš prieskum naznačuje, že sa to už deje. Zhruba štyria z piatich dátových profesionálov začali svoju kariéru niečím iným a 65 percent všetkých dátových vedcov pracuje v tejto oblasti päť rokov alebo menej. Tento obrovský prílev nových myslí má dvojaký efekt, hovorí Brownell; na jednej strane prichádza veľa nových nápadov, hovorí. Keď sa pozriem na obsah pochádzajúci z komunity vedy o údajoch, som prekvapený, koľko inovácií tam je. Odvrátenou stranou je však tendencia znovu vynájsť koleso.



Vysoký dopyt po Data Scientists je skvelý, ak ním ste (alebo uvažujete o tom, že sa ním stanete), no pre zamestnávateľov môže byť nábor skľučujúcou výzvou. Tu je rekvalifikácia jasným riešením; môže byť nákladovo efektívnejšie preškoliť súčasného zamestnanca v oblasti vedy o údajoch ako hľadať nového.

Ale aj keď plánujete najať nový tím pre vedu o údajoch, vaša organizácia ako celok možno bude musieť oprášiť svoju dátovú gramotnosť, varuje Brownell. Každý chce pracovať na niečom, čo má vplyv na jeho pracovisko, čo zlepšuje životy ľudí, hovorí. Ak vaša firemná kultúra nie je taká, aby [vaši dátoví vedci] mohli ovplyvniť, je takmer nemožné zamestnať sa. Vedenie musí byť schopné nielen komunikovať s potenciálnymi zamestnancami, ako budú môcť prispieť, ale aj porozumieť návrhom, ktoré ich tím pre vedu údajov nakoniec predloží.

Bohužiaľ, hovorí Brownell, nepohodlnú väčšinu tvoria spoločnosti, ktoré na veci neprišli. Náš prieskum to potvrdzuje: väčšina respondentov (52 percent) opísala úroveň dátovej gramotnosti vo svojich organizáciách ako základnú, pričom ďalšou najčastejšou odpoveďou bola stredná (31 percent). To naznačuje, že niektoré základné školenia v oblasti vedy o údajoch by mohli byť užitočné pre veľkú väčšinu spoločností – najmä v oblasti vedenia.



Táto potreba zlepšenej dátovej gramotnosti – a komunikácie – je zvýšená tým, ako je štruktúrovaná väčšina tímov pre dátovú vedu: ako samostatný tím, zvyčajne s 10 ľuďmi alebo menej (podľa 71 percent respondentov) a často päť alebo menej (38 percent ). Tieto úzke tímy si nemôžu dovoliť byť izolované. Jednotlivci, ktorí pracujú vo väčších spoločnostiach, sú zvyčajne v rámci malej skupiny špecifickej pre vedu o údajoch a ich klienti sú interní – iné časti organizácie, vysvetľuje Brownell, takže je to tím, ktorý musí pôsobiť v mnohých rôznych oblastiach organizácie.

Čo je to vlastne dátová veda?

Bežné vnímanie (že Data Scientists lámu čísla) nie je príliš vzdialené, hovorí Brownell. Existuje veľa množín údajov, z ktorých je potrebné odhaliť poznatky, a to zahŕňa množstvo krokov, ako je vytváranie modelu a čistenie údajov, a dokonca len rozhodnutie o tom, aké údaje potrebujete. V konečnom dôsledku je však toto úsilie zamerané na cieľ: Vo svojej podstate musíte s údajmi niečo urobiť.

Údaje nie sú vždy čísla. Zatiaľ čo väčšina respondentov (73 percent) uviedla, že pracuje s číselnými údajmi, 61 percent uviedlo, že pracuje aj s textom, 44 percent so štruktúrovanými údajmi, 13 percent s obrázkami a 12 percent s grafikou (a malé menšiny dokonca pracujú s videom a zvukom). —6 percent a 4 percentá). Tieto výsledky prieskumu naznačujú, akým spôsobom sa veda o údajoch rozširuje ďaleko za finančné tabuľky a získava ľudí pre také projekty, ako je maximalizácia spokojnosti zákazníkov alebo získavanie cenných poznatkov z hasičskej hadice sociálnych médií.

Výsledkom je, že v oblasti vedy o údajoch existuje obrovská rozmanitosť, hovorí Brownell. Každé odvetvie má svoj vlastný názor na to, na akých typoch údajov Data Scientists pracujú, na typoch výsledkov, ktoré očakávajú, a ako to zapadá do štruktúry vedenia ich spoločnosti. V každom prípade je však cieľom využiť údaje, ktoré pomôžu spoločnosti robiť lepšie rozhodnutia. Mohlo by to byť zlepšovanie produktov, pochopenie trhu, na ktorý chcú vstúpiť, udržanie väčšieho počtu zákazníkov, pochopenie ich využívania pracovnej sily, pochopenie toho, ako zarábať dobrých zamestnancov – všetky druhy rôznych vecí.

Data Science Jobs

V niektorých oblastiach techniky môže byť vašou najlepšou nohou pri dverách stať sa všeobecným odborníkom – nie je tomu tak v prípade vedy o údajoch. Zamestnávatelia zvyčajne hľadajú zručnosti špecializované na ich odvetvie. Keďže dátová veda prichádza v mnohých rôznych variantoch, náš prieskum sa zameral hlbšie a skúmal päť hlavných pracovných kategórií: dátový analytik, výskumník, obchodný analytik, dátový a analytický manažér a samotný dátový vedec.

Naprieč všetkými týmito pracovnými názvami zaberá hádka s údajmi a čistenie väčšinu času – ale na čo? Najčastejšie je cieľom optimalizácia existujúcej platformy, produktu alebo systému (45 percent), prípadne vývoj nových (42 percent). Pri hlbšom skúmaní sme zistili, že optimalizácia existujúcich riešení má tendenciu prináležať obchodným analytikom a dátovým analytikom, zatiaľ čo vývoj nových riešení častejšie patrí dátovým vedcom a výskumníkom.

Techniky, ktoré Data Scientists používajú, sa líšia aj v rôznych špecializáciách. Lineárna regresia bola bežným nástrojom vo všetkých kategóriách, čo uviedlo 54 percent respondentov, ale keď sme sa pozreli na softvér, ktorý ľudia používajú, došlo k niekoľkým prekvapeniam.

Excel – ten ťažný kôň manipulácie so súbormi údajov – je prakticky všadeprítomný, uvádza ho 81 percent všetkých respondentov a je najobľúbenejším nástrojom v každej kategórii okrem vlastných Data Scientists (ktorí sa najčastejšie spoliehajú na Python – a tiež citoval väčší súbor nástrojov ako iné kategórie. ). Prečo je Excel taký neprehliadnuteľný aj v roku 2019?

Na Exceli milujem to, ako vám umožňuje vidieť údaje a získať pre ne intuitívny pocit, vysvetlil Brownell. Používame tiež veľa jazyka Python a v takom prípade, keď robíte analýzu dátového súboru, je skrytý; pokiaľ špecificky nenaprogramujete časť svojho kódu na vizualizáciu nespracovaných údajov, ktoré analyzujete, nevidíte to. Zatiaľ čo s Excelom je to priamo pred vami. To má veľa výhod. Niekedy môžete spozorovať problémy s dátovým súborom. Nikdy som nevidel, že by Excel z analýzy zmizol.

To znamená, že stále existuje dlhý zoznam ďalších programov používaných v tejto oblasti - neprekvapujúce vzhľadom na jeho rozmanitosť. SQL (43 percent) a Python (26 percent) vedú v popularite, pričom Tableau (23 percent), R (16 percent), notebooky Jupyter (14 percent) a niekoľko ďalších dosahujú významné čísla - nehovoriac o obrovskom 32 percent respondentov, ktorí uviedli iné nástroje, a to aj vzhľadom na tento dlhý zoznam.

Aká je budúcnosť dátovej vedy?

Nakoniec sme sa opýtali, aké trendy budú formovať digitálnu krajinu v nasledujúcich piatich až desiatich rokoch. Strojové učenie a AI – obe majú aplikácie v rámci vedy o údajoch – boli v prevažnej miere vývoj, ktorý respondenti očakávali, že bude mať najväčší vplyv, a to 80 percent a 79 percent. A to aj napriek tomu, že menej ako štvrtina (23 percent) z nich v súčasnosti pracuje s AI.

Umelá inteligencia môže úplne zmeniť vedu o údajoch, potvrdzuje Brownell, ktorého spoločnosť vyvíja produkty AI. To je naozaj sláva metód učenia bez dozoru. Máme len toľko času, aby sme si prezreli tieto množiny údajov, a najmä pri tých veľkých je veľmi ťažké urobiť všetko. Nástroje AI môžu pomôcť odhaliť niečo, čo by vás možno ani nenapadlo hľadať. Nám sa to už určite stalo.

Ďalšie trendy Dátoví vedci očakávajú, že budú v blízkej budúcnosti dominovať: internet vecí (51 percent), blockchain (50 percent) a elektronický obchod (36 percent), rozšírená realita a virtuálna realita (38 percent a 27 percent) a dokonca aj hlasové založené skúsenosti (25 percent) – všetky významné zobrazenia a všetky oblasti, v ktorých sa dá veda o údajoch dobre využiť.

Kategori: Správy