Otázky na pohovor v oblasti dátovej vedy

Kariérna príručka BrainStation Data Scientist vám môže pomôcť urobiť prvé kroky smerom k lukratívnej kariére v oblasti vedy o údajoch. Čítajte ďalej, kde nájdete prehľad bežných otázok týkajúcich sa pohovorov pre pracovné miesta v oblasti dátovej vedy a ako na ne najlepšie odpovedať.

Staňte sa dátovým vedcom

Porozprávajte sa s poradcom pre vzdelávanie a dozviete sa viac o tom, ako vám naše bootcampy a kurzy môžu pomôcť stať sa dátovým vedcom.



Kliknutím na tlačidlo Odoslať súhlasíte s našimi Podmienky .



Predložiť

Nepodarilo sa odoslať! Chcete obnoviť stránku a skúsiť to znova?

Zistite viac o našom Data Science Bootcampe

Ďakujem!

Čoskoro sa vám ozveme.



Pozrite si stránku Data Science Bootcamp

Procesy pohovorov v oblasti vedy o údajoch sa môžu líšiť v závislosti od spoločnosti a odvetvia. Zvyčajne budú zahŕňať úvodné telefonické preverenie s náborovým manažérom, po ktorom nasleduje jeden alebo niekoľko pohovorov na mieste.

Budete musieť odpovedať na otázky týkajúce sa pohovoru o technických a behaviorálnych údajoch a pravdepodobne dokončíte projekt týkajúci sa zručností. Pred každým pohovorom by ste si mali skontrolovať svoj životopis a portfólio, ako aj pripraviť sa na prípadné otázky na pohovore.

Otázky na pohovor v oblasti dátovej vedy preveria vaše znalosti a zručnosti v oblasti štatistiky, programovania, matematiky a modelovania údajov. Zamestnávatelia budú hodnotiť vaše technické a mäkké zručnosti a ako dobre by ste zapadli do ich spoločnosti.



Keď si pripravíte niekoľko bežných otázok a odpovedí na pohovor v oblasti dátovej vedy, môžete do rozhovoru vstúpiť s istotou. Existuje niekoľko rôznych typov otázok Data Scientist, s ktorými sa môžete stretnúť počas vášho pohovoru o vede o údajoch.

Zoznam otázok z pohovoru o dátovej vede: Otázky týkajúce sa dát

Zamestnávatelia hľadajú kandidátov, ktorí majú rozsiahle znalosti o technikách a konceptoch dátovej vedy. Otázky na pohovore súvisiace s údajmi sa budú líšiť v závislosti od pozície a požadovaných zručností.

Tu je niekoľko príkladov vzorových otázok a odpovedí na rozhovory súvisiace s údajmi:



Aký je rozdiel medzi učením pod dohľadom a učením bez dozoru?

Najväčší rozdiel medzi učením pod dohľadom a učením bez dozoru spočíva v použití označených a neoznačených súborov údajov. Učenie pod dohľadom používa výstupné a vstupné údaje, ktoré sú označené, a algoritmy učenia bez dozoru nie. Ďalším rozdielom je, že učenie pod dohľadom má mechanizmus spätnej väzby, zatiaľ čo učenie bez dozoru ho nemá. Napokon, bežne používané algoritmy učenia pod dohľadom zahŕňajú logistickú regresiu, podporný vektorový stroj a rozhodovacie stromy, zatiaľ čo algoritmy učenia bez dozoru sú zhlukovanie k-means, hierarchické zhlukovanie a apriórny algoritmus.

Aký je rozdiel medzi hlbokým učením a strojovým učením?

Na túto otázku môže byť ťažké jednoznačne odpovedať, pretože tu zjavne existuje určité prekrývanie. Začnite vysvetlením, že hlboké učenie je v podstate podoblasťou strojového učenia a že obe spadajú pod umelú inteligenciu. Tam, kde strojové učenie používa algoritmy na analýzu údajov a nakoniec sa učí robiť rozhodnutia na základe toho, čo z údajov prináša, hlboké učenie vrství tieto algoritmy na vytváranie umelých neurónových sietí schopných učiť sa a robiť informované rozhodnutia.

  • Môžete poskytnúť podrobné vysvetlenie algoritmu rozhodovacieho stromu?
  • Čo je odber vzoriek? Koľko metód odberu vzoriek poznáte?
  • Ako rozlišujete medzi chybou typu I a typu II?
  • Definujte prosím lineárnu regresiu.
  • Čo znamenajú pojmy p-hodnota, koeficient a r-kvadratická hodnota? Prečo je každá zložka dôležitá?
  • Definujte skreslenie výberu.
  • Definujte štatistickú interakciu.
  • Môžete poskytnúť príklad súboru údajov s negaussovským rozložením?
  • Vysvetlite vzorec binomickej pravdepodobnosti.
  • Môžete vysvetliť rozdiel medzi zoskupovaním k-NN a k-means?
  • Aký je váš prístup k vytvoreniu modelu logistickej regresie?
  • Čo je pravidlo 80/20? Ako je dôležité overovať model?
  • Definujte presnosť a zapamätanie. Ako súvisia s krivkou ROC?
  • Vysvetlite, prosím, ako rozlišovať medzi metódami regularizácie L1 a L2?
  • Aké sú kroky na boj s údajmi a čistenie údajov pred použitím algoritmov strojového učenia?
  • Môžete vysvetliť rozdiel medzi histogramom a krabicovým grafom?
  • Ako definujete krížovú validáciu?
  • Môžete vysvetliť, čo sú falošne pozitívne a falošne negatívne? Čo by ste povedali, že je lepšie mať: príliš veľa falošných pozitív alebo príliš veľa falošných negatív?
  • Čo je pri navrhovaní modelu strojového učenia dôležitejšie: presnosť modelu alebo výkon modelu?
  • Čo je podľa vás lepšie: 50 malých rozhodovacích stromov alebo veľký?
  • Napadá vás nejaký data science projekt v našej spoločnosti, ktorý by vás zaujal?
  • Môžete si spomenúť na niekoľko príkladov osvedčených postupov v oblasti dátovej vedy?

Zoznam otázok na rozhovory o dátovej vede: Otázky týkajúce sa technických zručností

Otázky technických zručností v pohovore o vede o údajoch sa používajú na posúdenie vašich vedomostí, zručností a schopností v oblasti vedy o údajoch. Tieto otázky budú súvisieť s konkrétnymi pracovnými povinnosťami na pozícii Data Scientist.

Otázky na pohovor v oblasti technických údajov môžu mať jednu správnu odpoveď alebo niekoľko možných riešení. Budete chcieť ukázať svoj myšlienkový proces pri riešení problémov a jasne vysvetliť, ako ste dospeli k odpovedi.

Príklady otázok na pohovor so zručnosťami v oblasti technických údajov:

Aké sú najlepšie nástroje a technické zručnosti pre dátových vedcov?

Dátová veda je vysoko technická oblasť a budete chcieť manažérovi náboru ukázať, že ovládate všetky najnovšie štandardné nástroje, softvér a programovacie jazyky. Z rôznych štatistických programovacích jazykov používaných v dátovej vede, R a Python najčastejšie používajú dátoví vedci. Obe môžu byť použité pre štatistické funkcie, ako je vytváranie nelineárneho alebo lineárneho modelu, regresná analýza, štatistické testy, dolovanie údajov a ďalšie. Ďalším dôležitým nástrojom pre dátovú vedu je RStudio Server, zatiaľ čo Jupyter Notebook sa často používa na štatistické modelovanie, vizualizáciu dát, funkcie strojového učenia atď. Samozrejme, existuje množstvo špecializovaných nástrojov na vizualizáciu dát, ktoré vo veľkej miere využívajú Data Scientists, vrátane Tableau, PowerBI , Bokeh, Plotly a Infogram. Data Scientists tiež potrebujú veľa skúseností s používaním SQL a Excel.

Vo vašej odpovedi by ste mali uviesť aj všetky špecifické nástroje alebo technické kompetencie, ktoré si vyžaduje práca, pre ktorú vediete pohovor. Preštudujte si popis práce a ak existujú nejaké nástroje alebo programy, ktoré ste nepoužili, možno stojí za to sa s nimi oboznámiť pred pohovorom.

Ako zaobchádzate s odľahlými hodnotami?

Niektoré typy odľahlých hodnôt je možné odstrániť. Hodnoty odpadu alebo hodnoty, o ktorých viete, že nemôžu byť pravdivé, môžu byť vypustené. Odľahlé hodnoty s extrémnymi hodnotami ďaleko mimo zvyšku údajových bodov zoskupených v množine možno tiež odstrániť. Ak nemôžete vypustiť odľahlé hodnoty, môžete prehodnotiť, či ste si vybrali správny model, mohli by ste použiť algoritmy (ako náhodné lesy), ktoré nebudú tak výrazne ovplyvnené odľahlými hodnotami, alebo môžete skúsiť normalizovať svoje údaje.

  • Povedzte nám o originálnom algoritme, ktorý ste vytvorili.
  • Aký je váš obľúbený štatistický softvér a prečo?
  • Pracovali ste na projekte vedy o údajoch, ktorý si vyžadoval podstatnú časť programovania? Čo ste si odniesli zo zážitku?
  • Opíšte, ako efektívne reprezentovať údaje s piatimi dimenziami.
  • Musíte vygenerovať prediktívny model pomocou viacnásobnej regresie. Aký je váš postup pri overovaní tohto modelu?
  • Ako zabezpečíte, aby zmeny, ktoré robíte v algoritme, boli zlepšením?
  • Uveďte svoju metódu spracovania nevyváženej množiny údajov, ktorá sa používa na predpovedanie (t. j. oveľa viac negatívnych tried ako pozitívnych tried).
  • Aký je váš prístup k overeniu modelu, ktorý ste vytvorili na vytvorenie prediktívneho modelu kvantitatívnej výslednej premennej pomocou viacnásobnej regresie?
  • Máte dva rôzne modely s porovnateľným výpočtovým výkonom a presnosťou. Vysvetlite, prosím, ako sa rozhodujete, ktoré si vybrať na výrobu a prečo.
  • Dostanete súbor údajov pozostávajúci z premenných, v ktorých z veľkej časti chýbajú hodnoty. Aký je váš prístup?

Zoznam otázok na pohovor o dátovej vede: Osobné otázky

Spolu s testovaním vašich vedomostí a zručností v oblasti vedy o údajoch vám budú zamestnávatelia pravdepodobne klásť aj všeobecné otázky, aby vás lepšie spoznali. Tieto otázky im pomôžu pochopiť váš pracovný štýl, osobnosť a ako by ste mohli zapadnúť do ich firemnej kultúry.

Otázky na pohovor s vedcom osobných údajov môžu zahŕňať:

Čo robí dobrého dátového vedca?

Vaša odpoveď na túto otázku prezradí náborovému manažérovi veľa o tom, ako vidíte svoju rolu a hodnotu, ktorú pre organizáciu prinášate. Vo svojej odpovedi by ste mohli hovoriť o tom, ako veda o údajoch vyžaduje vzácnu kombináciu kompetencií a zručností. Dobrý dátový vedec potrebuje skombinovať technické zručnosti potrebné na analýzu údajov a vytváranie modelov s obchodným zmyslom potrebným na pochopenie problémov, ktoré rieši, ako aj na rozpoznanie použiteľných poznatkov vo svojich údajoch. Vo svojej odpovedi by ste mohli diskutovať aj o dátovom vedcovi, ku ktorému vzhliadate, či už je to kolega, ktorého osobne poznáte, alebo bystrá osobnosť z odvetvia.

  • Prosím, povedz mi o sebe.
  • Aké sú vaše najlepšie profesionálne vlastnosti? Aké sú vaše slabé miesta?
  • Je jeden dátový vedec, ktorého najviac obdivujete?
  • Čo inšpirovalo váš záujem o dátovú vedu?
  • Aké jedinečné schopnosti alebo vlastnosti prinášate, ktoré by pomohli tímu?
  • Prečo ste sa rozhodli odísť z posledného zamestnania?
  • Akú úroveň odmeny od tejto práce očakávate?
  • Uprednostňujete prácu samostatne alebo ako súčasť tímu Data Scientists?
  • Kde vidíš svoju kariéru o päť rokov?
  • Aký je váš prístup k zvládaniu stresu v práci?
  • Ako nájdete motiváciu?
  • Aká je vaša metóda na meranie úspechu?
  • Ako by ste opísali svoje ideálne pracovné prostredie?
  • Aké sú vaše vášne alebo záľuby mimo dátovej vedy?

Zoznam otázok na pohovor o dátovej vede: Vedenie a komunikácia

Vedenie a komunikácia sú dve cenné zručnosti pre dátových vedcov. Zamestnávatelia si cenia kandidátov na prácu, ktorí dokážu prejaviť iniciatívu, podeliť sa o svoje odborné znalosti s členmi tímu a komunikovať ciele a stratégie dátovej vedy.

Tu je niekoľko príkladov otázok na pohovory týkajúce sa vedenia a komunikácie:

Čo sa vám páči na práci v multidisciplinárnom tíme?

Data Scientist spolupracuje so širokou škálou ľudí v technických a netechnických rolách. Nie je nezvyčajné, že Data Scientist spolupracuje s vývojármi, dizajnérmi, produktovými špecialistami, dátovými analytikmi, obchodnými a marketingovými tímami a vedúcimi pracovníkmi na najvyššej úrovni, nehovoriac o klientoch. Takže vo svojej odpovedi na túto otázku musíte ilustrovať, že ste tímovým hráčom, ktorý má rád príležitosť stretávať sa a spolupracovať s ľuďmi v celej organizácii. Vyberte si príklad situácie, v ktorej ste sa hlásili ľuďom na najvyššej úrovni v spoločnosti, aby ste ukázali nielen to, že vám vyhovuje komunikovať s kýmkoľvek, ale tiež aby ste ukázali, aké cenné boli vaše poznatky založené na údajoch v minulosti.

  • Spomeniete si na profesionálnu situáciu, kde ste mali možnosť preukázať vodcovstvo?
  • Aký je váš prístup k riešeniu konfliktov?
  • Aký je váš prístup k budovaniu profesionálnych vzťahov s kolegami?
  • Aký je príklad úspešnej prezentácie, ktorú ste poskytli? Prečo to bolo také presvedčivé?
  • Ak hovoríte s kolegom alebo klientom z netechnického prostredia, ako vysvetľujete zložité technické problémy alebo výzvy?
  • Pripomeňte si situáciu, keď ste museli narábať s citlivými informáciami. Ako ste sa k situácii postavili?
  • Ako by ste z vlastného pohľadu ohodnotili svoje komunikačné schopnosti?

Zoznam otázok na rozhovory o dátovej vede: Behaviorálne

Pomocou otázok týkajúcich sa behaviorálnych pohovorov zamestnávatelia hľadajú konkrétne situácie, ktoré ukazujú určité zručnosti. Anketár chce pochopiť, ako ste riešili situácie v minulosti, čo ste sa naučili a čo ste schopní priniesť ich spoločnosti.

Príklady behaviorálnych otázok v rozhovore o vede o údajoch zahŕňajú:

Spomínate si na situáciu, keď ste museli vyčistiť a usporiadať veľký súbor dát?

Štúdie ukázali, že Data Scientists trávia väčšinu času prípravou údajov, na rozdiel od dolovania údajov alebo modelovania. Takže ak máte nejaké skúsenosti ako Data Scientist, je takmer isté, že máte skúsenosti s čistením a organizovaním veľkého súboru údajov. Pravda je aj to, že je to úloha, ktorá málokoho naozaj baví. Čistenie dát je však tiež jedným z najdôležitejších krokov každej spoločnosti. Preto by ste mali náborového manažéra previesť procesom, ktorý sledujete pri príprave údajov: odstránenie duplicitných pozorovaní, oprava štrukturálnych chýb, filtrovanie odľahlých hodnôt, riešenie chýbajúcich údajov a overenie údajov.

  • Spomeňte si na dátový projekt, na ktorom ste pracovali, kde ste narazili na problém alebo výzvu. Aká bola situácia, aká bola prekážka a ako ste ju prekonali?
  • Uveďte konkrétny príklad použitia údajov na zlepšenie skúseností zákazníka alebo zainteresovanej strany?
  • Uveďte konkrétnu situáciu, kedy ste splnili cieľ. ako ste to dosiahli?
  • Uveďte konkrétnu situáciu, kedy sa vám nepodarilo splniť cieľ. Čo sa pokazilo?
  • Aký je váš prístup k riadeniu a dodržiavaniu prísnych termínov?
  • Spomeniete si na čas, keď ste čelili konfliktu v práci? Ako ste sa s tým vyrovnali?

Zoznam otázok na rozhovory o dátovej vede od popredných spoločností (Amazon, Google, Facebook, Microsoft)

Aby ste mali predstavu o niektorých ďalších otázkach, ktoré sa môžu objaviť v rozhovore, zostavili sme zoznam otázok na pohovory v oblasti dátovej vedy od niektorých špičkových technologických spoločností.

  • Aký je rozdiel medzi podporným vektorovým strojom a logistickou regresiou? Uveďte príklady situácií, v ktorých by ste sa rozhodli použiť radšej jeden ako druhý.
  • Ak odstránenie chýbajúcich hodnôt z množiny údajov spôsobí skreslenie, čo by ste urobili?
  • Aké metriky by ste hodnotili pri pohľade na zdravie, zapojenie alebo rast produktu?
  • Aké metriky by ste zhodnotili, keď sa pokúšate riešiť alebo riešiť obchodné problémy súvisiace s naším produktom?
  • Ako hodnotíte výkonnosť produktu?
  • Ako zistíte, či je nové pozorovanie odľahlé?
  • Ako by ste definovali kompromis medzi odchýlkou ​​a odchýlkou?
  • Aká je vaša metóda na náhodný výber vzorky z populácie používateľov produktov?
  • Aký je váš postup pri porovnávaní a čistení údajov pred použitím algoritmov strojového učenia?
  • Ako by ste pristúpili k nevyváženej binárnej klasifikácii?
  • Ako rozlišujete medzi dobrou a zlou vizualizáciou údajov?
  • Vytvorte funkciu, ktorá overí, či je slovo palindróm.

Kategori: Správy