10 dažniausiai užduodamų duomenų mokslininko interviu klausimų

Duomenų mokslo sritis nuolat vystosi, apimanti kelias pramonės šakas ir reikalaujanti didelių įgūdžių, apimančių matematiką, statistiką, programavimą ir rinkodarą. Taigi norint tapti duomenų mokslininku reikia įspūdingų techninių įgūdžių, kūrybiškumo ir bendravimo mišinio.

Duomenų mokslininkų darbo aprašymai gali labai skirtis, nors visi ieško kandidatų, turinčių ilgą sąrašą labiausiai pageidaujamų darbo įgūdžių, tokių kaip kritinis mąstymas, problemų sprendimas, duomenų analizė, emocinis intelektas, dėmesys detalėms ir komandinis darbas. Tai reiškia, kad interviu klausimai duomenų mokslininkams gali apimti keletą skirtingų temų ir svyruoti nuo tipiškų minkštųjų įgūdžių užklausų iki ypač techninių diskusijų.

Duomenų mokslo interviu reikalauja daug pasiruošimo. Nesvarbu, ar esate ką tik išėję iš aukščiausių informatikos mokyklų, ar ketinate pereiti prie kitos įmonės ar pramonės, turėtumėte skirti laiko peržvelgti pagrindines savo darbo idėjas. Kaip ir jūs žinote, kaip vairuoti, bet jums gali kilti sunkumų skaitant konkrečias kelių eismo taisykles, galite įstrigti interviu, bandydami paaiškinti, kaip veikia konkretus algoritmas.

Norėdami padėti jums pasiruošti, mes sudarėme 10 dažniausiai pasitaikančių duomenų mokslininkų interviu klausimų. Pradedant ankstyvomis atrankomis, baigiant antrojo ir trečiojo etapo vaizdo įrašais ir interviu vietoje, jūs patirsite daugybę įvairių egzaminų, tokių kaip jūsų techniniai įgūdžiai, bendravimo sugebėjimai ir darbo stilius.

1. „Papasakokite daugiau apie naujausią savo portfolio projektą“.

Duomenų mokslininkai yra paklausūs daugelyje skirtingų pramonės šakų, tačiau įmonės dažnai ieško žmogaus, turinčio labai specifinių įgūdžių ir tinkamų kultūrų. Išsamus internetinis aplankas, rodantis, kokį darbą galite atlikti, taip pat stiprus buvimas socialinėje žiniasklaidoje ir asmeninis prekės ženklas padeda išsiskirti iš kitų kandidatų, taip pat susisiekti su samdomais vadybininkais ir įdarbintojais, kad galėtumėte dirbti tobulai. tinka.

Būkite pasirengę bet kuriame duomenų mokslo interviu išsamiai pasikalbėti apie visus savo CV, aplanko ar svetainės elementus. Pritaikykite savo atsakymą apie projektą savo auditorijai. Jei tai yra pradinė atranka arba grupė, kurioje dalyvauja dalyviai iš įvairių departamentų, pagrindinis dėmesys turėtų būti kreipiamas į tai, kaip jūsų darbas davė teigiamų rezultatų klientui ir jo verslui.

Dalyvaujant apklausos proceso dalyje, kur jūs susitinkate su kitu duomenų mokslininku, inžinieriumi, analitiku ar kitu techniniu asmeniu, reikia išsamesnio duomenų ir procesų, susijusių su jūsų darbu, aprašymo.

2. „Kodėl norite dirbti šioje įmonėje?“

Net jei su jumis bus susisiekta tiesiogiai per savo internetinį portfelį ar „LinkedIn“ profilį ir pakviesta į pokalbį dėl atviros pozicijos, įmonė vis tiek norės žinoti, kodėl jūs sutikote ir kodėl, jūsų manymu, jums gerai tiktų darbas.

Pasiruošimas pokalbiui turėtų būti ne tik techninių įgūdžių tobulinimas, bet ir verslo, į kurį kreipiatės, tyrimai. Informacija apie jų pramonę, misiją, personalą, tiksliai tai, ką jie daro ir kaip gerai jiems sekasi, padės jums sukurti atsakymą į šį klausimą.

Paaiškinkite, kaip jūsų įgūdžių rinkinys padės jiems pasiekti savo tikslus. Raskite būdą, kaip išreikšti aistrą dėl vieno ar kelių jūsų darbo vaidmens aspektų, įskaitant įmonės misiją, filosofiją, inovacijas ar produktų liniją. Jei tai yra jūsų svajonių darbas, gali būti verta laiko prieš pokalbį suburti duomenų mokslo projektą, kuris išspręstų jiems iškilusią problemą - pavyzdžiui, kreiptis į naujus demografinius rodiklius ar efektyviau planuoti pristatymus.

3. „Nurodykite duomenis, kuriuos labiausiai žavite, ir paaiškinkite, kodėl.“

Nors tai yra labai asmeniškas klausimas, į kurį techniškai nėra teisingo atsakymo, jūsų pasirinkti atsakymai yra labai svarbūs. Jūsų ir bendrovės, taip pat ir apklausos skydelyje atlikti tyrimai gali padėti susidaryti gerą pirmą įspūdį vien dėl šio klausimo.

Žinodami iškilius šioje srityje žmones, taip pat tuos, kurie šiuo metu daro bangas, pašnekovams parodysite, kad esate išmanantis ir aistringas šios pramonės šakai. Naudinga aptarti duomenų mokslininkus, kurie yra vertinami konkrečioje karjeros srityje, į kurią kreipiatės, pavyzdžiui, finansų, medicinos ar akcijų rinkoje.

Šis klausimas yra ne tik įspūdingas vardų sąrašas. „Kodėl“ lygties dalis taip pat parodys jūsų būsimiems darbdaviams, ką vertinate savo srityje ir kaip suprasite savo darbą. Jei jūsų tyrimas parodė, kad įmonė vertina naujoves, vientisumą ar net tam tikrą statistinį metodą, tai yra puiki proga pranešti, kad dalijatės tomis pačiomis vertybėmis.

4. „Kaip jūs paaiškintumėte rekomendacijų kūrimo ką nors iš rinkodaros skyriaus?“

Viena iš svarbių savybių, išskiriančių duomenų mokslininkus nuo kitų techninių genijų, yra galimybė konvertuoti, atvaizduoti ir paaiškinti duomenis taip, kad žmonės juos suprastų. Taigi tokia užklausa yra viena iš svarbiausių duomenų mokslininko interviu klausimų, su kuriais susidursite. Pašnekovai nori sužinoti, kaip gerai bet kuriai auditorijai galite perduoti tokias sąvokas kaip duomenų modeliavimas, sprendimų medžiai ir tiesinė regresija.

Šiuo konkrečiu atveju pirmiausia norėsite paprastai paaiškinti, kaip veikia rekomendacijų variklis, pateikdami turinio ir bendro filtravimo pavyzdžius. Tuomet norėsite aptarti, kaip galite dirbti su rinkodaros skyriumi, kad suderintumėte jų patrauklumo klientams įgūdžius su algoritmo, naudojančio surinktus duomenis, galia siekiant tiksliai nustatyti, ko nori vartotojai.

5. 'Kuo skiriasi prižiūrimas ir neprižiūrimas mokymasis?'

Pradėkite apibendrindami, kad pagrindinis skirtumas tarp šių dviejų yra tas, kad prižiūrimas mokymasis turi mokymo duomenis, iš kurių algoritmas gali pasimokyti, ir pateikti atsakymus. Neprižiūrimas mokymasis reikalauja dalykų grupavimo pagal panašumus, bendras anomalijas ir kitus modelio ieškojimo procesus, o ne pagal sunkius ir greitus duomenis.

Pašnekovas norės, kad jūs įsigilintumėte į detales, todėl svarbu išvardyti konkrečius skirtumus ir mokėti kalbėti apie įvairius naudojamus algoritmus.

Prižiūrimas mokymasis

  • kaip įvestį naudoja žinomus ir pažymėtus duomenis
  • turi grįžtamojo ryšio mechanizmą
  • naudojami numatymui
  • jos paprasti algoritmai apima sprendimų medį, logistinę regresiją, tiesinę regresiją, atraminių vektorių mašiną ir atsitiktinį mišką

Neprižiūrimas mokymasis

  • kaip įvestį naudoja nepažymėtus duomenis
  • neturi grįžtamojo ryšio mechanizmo
  • naudojami analizei
  • į įprastus jos algoritmus įeina K reikšmių grupavimas, hierarchinis grupavimas, automatiniai kodavimo įrenginiai ir asociacijos taisyklės

Norėsite turėti keletą bendrų pavyzdžių arba iš konkretaus projekto, kuriame dirbote, pavyzdžių, skirtų paaiškinti šių dviejų mašininio mokymosi tipų skirtumus ir tai, kokiais atvejais kiekvienas gali būti naudojamas. Pavyzdžiui, neprižiūrimas mokymasis gali būti naudojamas išleidžiant naują produktą, kai nežinoma klientų, kuriems tai galėtų patikti, demografija.

Prenumeruoti

Prisijunkite prie mūsų informacinio biuletenio, kad gautumėte nuostabesnio turinio ir gaukite 20% NUOLAIDĄ mūsų karjeros testui!

Prenumeruoti

6. 'Kaip išvengti atrankos šališkumo?'

Šis klausimas gali būti įvairių formų duomenų mokslo interviu. Jūsų gali būti paprašyta apibrėžti atrankos šališkumą, kaip to išvengti arba pateikti konkretų pavyzdį, kaip tai vaidino projektą, kuriame dirbote.

Pagrindinė atrankos šališkumo problema yra ta, kad išvados buvo padarytos iš neatsitiktinės imties. Akivaizdu, kad lengviausias sprendimas yra visada pasirinkti iš atsitiktinės atrankos aiškiai apibrėžtos populiacijos. Turėsite išsiaiškinti, kodėl tai ne visada įmanoma.

Atminkite, kad atrankos šališkumas gali būti tyčinis - subjekto atranka arba duomenų pašalinimas tikslingai atliekamas siekiant įrodyti išankstinę teoriją ar projekciją - tai gali būti netiesioginis būdas samdančiai komisijai užduoti vieną iš tų sunkių interviu klausimų apie darbo etiką ir sąžiningumą. .

Galiausiai norėsite pabrėžti, kaip atrankos paklaida dažniausiai būna netyčinių ar neišvengiamai šališkų duomenų atveju. Būtinai aprašykite kai kurias sritis, kuriose gali pasireikšti atrankos paklaida, įskaitant mėginių ėmimą, laiko intervalą, duomenis ir dilimą. Tada pateikite keletą pavyzdžių, kaip sverto efektavimo metodai, pavyzdžiui, mėginių ėmimas ir didinimas, gali padėti jums išvengti atsitiktinių imčių.

Jei jūs kalbatės su mažiau techninių skyrių atstovais, naudokitės lengvai virškinamu pavyzdžiu, kuris aiškiai parodo atrankos šališkumą. Duomenų mokslininkas Ericas Hollingsworthas nurodo pamoką, įgytą po 2011 m. Paukščių gripo protrūkio, kai „patvirtinti atvejai“ buvo imami tik labai sergantys asmenys. Dėl to 80 proc. Mirčių procentas buvo toks baisus dėl atrankos šališkumo.

7. „Kaip galima traktuoti pašalines vertybes?“

Tai yra bendras duomenų mokslininkų pokalbio klausimas, nes paaiškėja, kaip naudojate duotus duomenis, metodus, kuriuos naudojate tiems duomenims tvarkyti, ir ar norite skirti laiko kiekvienam tų duomenų įvertinimui.

Pirmiausia norėsite pakalbėti apie tai, kas yra pašalinė reikšmė, nes skaičiai, esantys diagramoje, nesutampa su duomenų grupe, kaip 2–3 standartiniai nuokrypiai nuo vidurkio ir pan. Kitas žingsnis sprendžiant pašalinius dalykus yra įvertinti, kodėl jie įvyko.

Nedidelis kiekis pašalinių elementų, kuriuos galima priskirti paprastoms žmonių ar mašinų klaidoms, yra lengvai pašalinamas. Tačiau būtinai atkreipkite dėmesį, kad net ir viena pašalinė informacija gali būti svarbiausias duomenų taškas, o ne problema, nes tai gali parodyti vienos rinkodaros taktikos, naujo vaisto ingrediento ar produktų linijos sėkmę.

Toliau norėsite paaiškinti, kaip elgtis su daugybe pašalinių rodiklių, kuriems reikia sudėtingesnių sprendimų. Pvz., Gali tekti pakeisti naudojamą modelį, normalizuoti duomenis į vidurkį arba naudoti atsitiktinio miško algoritmą. Dar kartą pabandykite panaudoti realaus gyvenimo atvejį iš savo, kaip duomenų mokslininko, patirties, kad paaiškintumėte teisingą taktiką.

8. „Kodėl svarbu valyti duomenis?“

Duomenų rinkimas ir valymas yra pagrindinė jūsų, kaip duomenų mokslininko, darbo dalis, užimanti iki 80% jūsų laiko. Kad ir kokioje pramonės šakoje taikytumėtės, interviu klausimuose visada bus vienas klausimas, kodėl svarbu valyti duomenis. Pašnekovai taip pat paklaus apie jūsų pasirinktus valymo būdus ir programas.

Turėtumėte pabrėžti, kaip švarūs duomenys yra būtini norint padaryti teisingas išvadas, bet tai nėra vien tik skaičiai. Paaiškinkite, kaip pradėti nuo išsamių, tikslių, pagrįstų ir vienodų duomenų daro tiesioginį poveikį jų verslui. Pagrindiniai privalumai, kuriuos reikia aptarti:

  • patobulintas sprendimų dėl įmonės tikslų priėmimas
  • greitesnis klientų įgijimas ir ankstesnių klientų nukreipimas
  • laiko ir išteklių taupymas pašalinant netikslius ar dubliuotus duomenis
  • pagerėjęs produktyvumas
  • padidino komandos moralę dėka pakartotinų efektyvių ir tikslių rezultatų

9. 'Koks yra A / B testavimo tikslas?'

Klausimai apie A / B testavimą jūsų interviu duomenų mokslininko pozicijai gali prasidėti bendresnėmis nuorodomis, kaip naudoti eksperimentinį dizainą atsakant į vieną užklausą apie vartotojo elgesį ar nuostatas. Tikrinti svetainės, programos ar informacinio biuletenio kūrimo kintamąjį yra gana paprasta, norint įvertinti, ar pakeitus padidės susidomėjimas, įsitraukimas ir konversijų rodikliai.

Vienas iš būdų atsiriboti atsakant į tokio tipo interviu klausimus yra aptarti, kaip kiti duomenų mokslininkai gali padaryti klaidingas išvadas iš A / B bandymų. Tarp galimų spąstų yra:

  • nesurink pakankamai duomenų per pakankamai ilgą laiką
  • vienu metu išbandyti per daug kintamųjų
  • neatsižvelgiant į išorinius veiksnius, kurie bandymo laikotarpiu gali turėti įtakos srautui
  • nekreipti dėmesio į nedidelį pelną, kuris ilgainiui gali išaugti, ir derinti su kitais teigiamais pokyčiais, kad padidėtų pajamos
  • trūksta aiškių vaizdinių interpretacijų, tokių kaip grynasis finansinis pelnas ar nuostoliai, palyginti su perskaičiavimo kursais

Be to, kad nurodysite šias problemas, turėsite pasakyti, kaip jas spręstumėte - arba, dar geriau, kaip jūs jų jau išvengėte ankstesniuose duomenų mokslo projektuose.

10. „Jūs turite 48 valandas išspręsti šį kodavimo iššūkį“.

Kodavimo iššūkis gali būti pradinis būdas atrinkti potencialius duomenų mokslininkus arba tai gali būti antras pokalbio žingsnis po to, kai pašalinote pirmąją kliūtį su įdarbintoju ar įdarbinimo vadybininku. Tai gali būti testas vietoje, kuris užtrunka nuo 30 minučių iki 2 valandų, kai koduosite ant lentos arba klaviatūros, žiūrėdami pašnekovą. Jums dažnai suteikiama pasirinkimo kalba, tačiau būkite pasirengę koduoti SQL ar Python.

Kai kurios įmonės paskiria ilgesnes užduotis, kurių terminas baigiasi iki savaitės. Lentelės iššūkiams gali reikėti parašyti gana paprastas SQL užklausas, tačiau ilgesni testai, be abejo, yra sudėtingesni. Paprastai jums bus duoti duomenys ir paprašyta atlikti konkrečius numatymus, naudojant tuos duomenis, ir jūs turėsite parodyti savo darbą. Pavyzdžiui, naujausiam duomenų mokslininko interviu subjektui buvo duoti „Airbnb“ duomenys ir paprašyta numatyti būsto kainas pagal apgyvendinimo ypatybes.

Pašnekovai norės aptarti su jumis jūsų pasirinkimą, jūsų padarytas prielaidas, pasirinktas savybes, kodėl naudojote tam tikrus algoritmus ir dar daugiau. Dažnai jūsų pateiktas atsakymas yra mažiau svarbus nei jūsų procesas, kūrybiškumas, kodo skaitomumas ir dizainas.

Tai gali būti nervingą interviu patirtis, todėl pasiruoškite susikurdami ir atlikdami praktikos kodavimo iššūkius su draugais ar kolegomis duomenų mokslo srityje. Taip pat galite apsilankyti tokiose svetainėse kaip „Leetcode“ ir „SQLZOO“, kad atliktumėte kodavimo pratimus. „Interviewing.io“ nemokamai gali gauti tikrus interviu su algoritminėmis ir sistemų projektavimo problemomis.

Kaip matote, interviu klausimai duomenų mokslininkams gali būti sunkūs, o bendras procesas gali būti ilgas ir varginantis. Vienas iš svarbiausių interviu patarimų - išlikti pozityviam, net jei jaučiate, kad dalis pokalbio proceso praėjo prastai. Mes dažnai esame sunkesni nei kiti, ir jūs vis tiek galėjote nusileisti darbui, nepaisant to, kad negaunate kiekvieno atsakymo taip tobulai, kaip norėtumėte.

Jei praleidote galimybę, paprašykite atsiliepimo ir pasinaudokite juo, kad pagerintumėte savo kito interviu patirtį. Galų gale, daugelis nusistovėjusių duomenų mokslininkų buvo atmesti iš kelių pozicijų ir vis tiek sėkmingai tęsė darbus, kurie galiausiai buvo tinkamesni!

Su kokiais klausimais ir kodavimo iššūkiais susidūrėte bandant nusileisti duomenų mokslo darbui? Prisijunkite prie diskusijos, pateiktos žemiau esančiuose komentaruose, ir padėkite kolegoms duomenų mokslininkams pasiruošti kitam interviu!

Palikite Komentarą

Please enter your comment!
Please enter your name here