10 vanlige spørsmål om forskere fra dataforskere

Datavitenskapen utvikler seg stadig, og spenner over flere bransjer og krever et omfattende ferdighetssett som inkluderer matematikk, statistikk, programmering og markedsføring. Som sådan krever det å bli dataforsker en imponerende blanding av teknisk dyktighet, kreativitet og kommunikasjon.

Stillingsbeskrivelser for dataforskere kan variere veldig, selv om alle søker kandidater med en lang liste over de mest ønskelige jobbferdighetene som kritisk tenking, problemløsing, dataanalyse, emosjonell intelligens, oppmerksomhet på detaljer og teamarbeid. Dette betyr at intervjuspørsmål for dataforskere kan spenne over flere forskjellige emner og spenner fra typiske spørsmål om myke ferdigheter til ekstremt tekniske diskusjoner.

Datavitskapsintervjuer krever mye forberedelser. Enten du er frisk fra en topp datavitenskole eller du ønsker å skifte til et annet selskap eller bransje, bør du ta deg tid til å gå gjennom de viktigste begrepene i arbeidet ditt. Akkurat som du vet hvordan du skal kjøre, men kan ha problemer med å resitere bestemte regler for veien, kan du bli sittende fast i et intervju som prøver å formulere hvordan en spesifikk algoritme fungerer.

For å hjelpe deg med å forberede oss, har vi samlet 10 av de vanligste dataforskerens intervjuspørsmål. Fra tidlige visninger til andre- og tredje-trinns video- og stedintervjuer vil du møte et bredt utvalg av undersøkelser som disse av dine tekniske ferdigheter, kommunikasjonsevner og arbeidsstil.

1. 'Fortell oss mer om det nyeste prosjektet i porteføljen din.'

Dataforskere er etterspurt i mange forskjellige bransjer, men selskaper er ofte på jakt etter noen med veldig spesifikke ferdigheter så vel som en god kulturform. En detaljert online portefølje som viser hvilken type arbeid du er i stand til, så vel som en sterk tilstedeværelse i sosiale medier og personlig merkevare, hjelper deg å skille seg ut fra andre kandidater, samt koble deg til å ansette ledere og rekrutterere for jobber du er perfekt egnet til.

Vær forberedt på ethvert datavitenskapelig intervju for å snakke mye om alle elementene i CVen, porteføljen eller nettstedet ditt. Skreddersy svaret ditt om et prosjekt som passer ditt publikum. Hvis det er en første screening eller et panel med deltakere fra en rekke avdelinger, bør fokuset være på måtene arbeidet ditt skapte positive resultater for klienten og deres virksomhet.

Når du kommer til den delen av intervjuprosessen der du møter en annen dataforsker, ingeniør, analytiker eller annen teknisk person, kreves det en mer detaljert beskrivelse av dataene og prosessene som er involvert i arbeidet ditt.

2. 'Hvorfor vil du jobbe for dette selskapet?'

Selv om du ble kontaktet direkte gjennom din online portefølje eller LinkedIn-profil og invitert til å intervjue for en åpen stilling, vil selskapet fortsatt ønske å vite hvorfor du har akseptert, og hvorfor du tror du vil være en god passform for jobben.

Bortsett fra å pusse opp dine tekniske ferdigheter, bør forberedelsene dine til intervjuet omfatte forskning på virksomheten du søker på. Informasjon om deres bransje, oppdrag, ansatte, nøyaktig hva de gjør og hvor godt de gjør det, vil hjelpe deg med å lage et spesielt tilpasset svar på dette spørsmålet.

Ta opp hvordan ferdighetssettet ditt vil hjelpe dem å nå sine mål. Finn en måte å uttrykke lidenskap om en eller flere aspekter av din jobbrolle, inkludert selskapets oppgave, filosofi, innovasjon eller produktlinje. Hvis dette er din drømmejobb, kan det være verdt tiden å sette sammen et data science-prosjekt i forkant av intervjuet som løser et problem for dem - som å appellere til en ny demografisk eller planlegge leveranser mer effektivt.

3. 'Gi navn til forskerne du beundrer mest, og forklar hvorfor.'

Selv om dette er et veldig personlig spørsmål som ikke teknisk har riktig svar, er svarene du velger veldig viktige. Forskningen din om selskapet så vel som på intervjupanelet kan hjelpe deg med å gjøre et godt førsteinntrykk med dette spørsmålet alene.

Når du kjenner menneskene som er fremtredende i feltet så vel som de som for tiden lager bølger, vil det vise intervjuerne at du både er kunnskapsrik og brenner for bransjen. Det er nyttig å diskutere dataforskere som er verdsatt i den spesifikke karriererarenaen du søker på, som finans, medisin eller aksjemarkedet.

Dette spørsmålet er mer enn bare en imponerende navneliste. "Hvorfor" -delen av ligningen vil også vise dine potensielle arbeidsgivere hva du verdsetter i ditt felt og hvordan du kommer til å arbeide. Hvis forskningen din har vist at selskapet verdsetter innovasjon, integritet eller til og med en viss statistisk metode, er dette en flott mulighet til å fortelle dem at du deler de samme verdiene.

4. 'Hvordan vil du forklare en anbefalingsmotor til noen fra markedsavdelingen?'

En av de viktige egenskapene som skiller dataforskere fra andre tekniske genier, er muligheten til å konvertere, vise og forklare data på en måte som ikke-tekniske personer kan forstå. Det gjør et spørsmål som dette til et av de viktigste intervjuspørsmålene du vil møte. Intervjuer ønsker å se hvor godt du kan kommunisere konsepter som datamodellering, beslutningstrær og lineær regresjon til ethvert publikum.

I dette spesifikke tilfellet, vil du først forklare i enkle ord hvordan en anbefalingsmotor fungerer, med eksempler på både innholdsbasert filtrering og samarbeidsfiltrering. Så vil du diskutere hvordan du kan samarbeide med markedsavdelingen for å kombinere ferdighetene deres med å appellere til kunder med kraften i algoritmen som bruker innsamlede data for å finne ut hva kundene vil ha.

5. 'Hva er forskjellene mellom veiledet og uovervåket læring?'

Du kan begynne med å oppsummere at hovedforskjellen mellom disse to er at veiledet læring har treningsdata som algoritmen kan lære av og gi svar. Uovervåket læring krever gruppering av ting etter likheter, vanlige avvik og andre mønster-søkende prosesser i stedet for harde og raske data.

Intervjueren vil at du skal gå nærmere inn på, så det er viktig å liste opp de spesifikke forskjellene og kunne snakke om de forskjellige algoritmene som brukes.

Veiledet læring

  • bruker kjente og merkede data som input
  • har en tilbakemeldingsmekanisme
  • brukes til prediksjon
  • dets vanlige algoritmer inkluderer beslutnings tre, logistisk regresjon, lineær regresjon, støttevektormaskin og tilfeldig skog

Uovervåket læring

  • bruker umerkede data som input
  • har ingen tilbakemeldingsmekanisme
  • brukt til analyse
  • dets vanlige algoritmer inkluderer K-betyr klynging, hierarkisk klynging, autokodere og tilknytningsregler

Du vil ha noen eksempler, enten generiske eller fra et spesifikt prosjekt du har jobbet med, for å illustrere forskjellene mellom disse to typene maskinlæring og i hvilke tilfeller hver kan brukes. For eksempel kan uovervåket læring brukes når du lanserer et nytt produkt der demografien til kunden det kan appellere til er ukjent.

Abonnere

Registrer deg på nyhetsbrevet vårt for mer fantastisk innhold og få 20% AVSLAG på vår karriereprøve!

Abonnere

6. 'Hvordan unngår du valg av skjevhet?'

Dette spørsmålet kan ha mange former i et datavitenskapelig intervju. Du kan bli bedt om å definere seleksjonsskjevhet, hvordan du kan unngå det eller å gi et spesifikt eksempel på hvordan det spilte en rolle i et prosjekt du jobbet med.

Hovedproblemet med seleksjonsskjevhet er at konklusjoner er trukket fra et ikke-tilfeldig utvalg. Det er klart den enkleste løsningen er å alltid velge fra et tilfeldig utvalg av en tydelig definert populasjon. Du må utdype hvorfor det ikke alltid er mulig.

Vær klar over at siden seleksjonsskjevhet kan være forsettlig - med emnevalg eller dataeliminering målrettet gjort for å bevise en forutinntatt teori eller projeksjon - kan dette være en indirekte måte for ansettelsespanelet å stille et av de tøffe intervjuspørsmålene om etikk og integritet på jobben .

Til slutt vil du understreke hvordan valgskjevhet oftere er et tilfelle av utilsiktede eller uunngåelig partiske data. Sørg for å utdype noen av områdene der valgskjevhet kan oppstå, inkludert prøvetaking, tidsintervall, data og utmattelse. Gi deretter noen eksempler på hvordan utnyttelsesteknikker som resampling og boosting kan hjelpe deg med å jobbe rundt ikke-tilfeldige prøver.

Hvis du er i en del av et intervju når du snakker med representanter fra mindre tekniske avdelinger, kan du bruke et lett fordøyelig eksempel som tydelig illustrerer seleksjonsskjevhet. Datavitenskapsmannen Eric Hollingsworth refererer til en lærdom fra fugleinfluensautbruddet i 2011, der 'bare svært syke individer ble talt' i en statistisk prøve av 'bekreftede tilfeller'. De resulterende 80% rapporterte dødsraten, så alvorlig på grunn av seleksjonsskjevhet, skapte betydelig utbredt frykt.

7. 'Hvordan kan verdiforholdene behandles?'

Dette er et vanlig intervjuspørsmål for dataforskere, da det avslører hvordan du bruker dataene du har gitt, metodene du bruker for å behandle disse dataene og om du er villig til å sette av tid til å evaluere hver del av disse dataene.

Du vil først snakke om hva som utgjør en utligger, som tall som finnes langt utenfor klyngen av data på en graf, som 2-3 standardavvik bort fra gjennomsnittet, og så videre. Det neste trinnet for å håndtere outliers er å evaluere hvorfor de skjedde.

En liten mengde outliers som kan tilskrives enkel menneskelig eller maskinfeil elimineres lett. Vær imidlertid oppmerksom på at selv en enkelt outlier kan være et sentralt datapunkt i stedet for et problem, da det kan indikere suksessen med en enkelt markedsføringstaktikk, ny medikamentingrediens eller produktlinje.

Deretter ønsker du å forklare hvordan du skal takle et stort antall outliers, som krever mer komplekse løsninger. For eksempel kan det hende du må endre modellen du bruker, normalisere dataene til gjennomsnittet eller bruke en tilfeldig skogalgoritme. Prøv igjen å bruke en ekte sak fra din erfaring som dataforsker for å forklare riktig taktikk.

8. 'Hvorfor er rengjøring av data viktig?'

Datainnsamling og rengjøring er en dominerende del av jobben din som dataforsker, og tar opptil 80% av tiden din. Uansett hvilken bransje du søker på, vil intervjuspørsmålene alltid omfatte en om hvorfor rengjøring av data er viktig. Intervjuer vil også spørre om dine foretrukne renseteknikker og programmer.

Du bør understreke hvor rene data er nødvendige for å trekke de riktige konklusjonene, men det handler ikke bare om tallene. Forklar hvordan det å starte med komplette, nøyaktige, gyldige og ensartede data direkte påvirker deres virksomhet. Viktige fordeler å diskutere inkluderer:

  • forbedret beslutningstaking om selskapets mål
  • raskere kundetilskudd og målretting av tidligere kunder
  • tids- og ressursbesparelser på grunn av å eliminere unøyaktige eller dupliserte data
  • forbedret produktivitet
  • økt teammoral takket være gjentatte effektive og nøyaktige resultater

9. "Hva er målet med A / B-testing?"

Spørsmål om A / B-testing under intervjuet ditt for en dataforskerposisjon kan begynne med en mer generisk referanse til å bruke eksperimentell design for å svare på et enkelt spørsmål om brukeratferd eller preferanser. Målet med å teste en webside-, app- eller nyhetsbrevdesignvariabel er ganske enkelt å evaluere om en endring vil øke interessen, engasjementet og konverteringsfrekvensen.

En måte å skille deg ut når du svarer på denne typen intervjuspørsmål, er å diskutere hvordan andre dataforskere kan trekke gale konklusjoner fra A / B-testing. Mulige fallgruver inkluderer:

  • ikke samler inn nok data over lang tid
  • tester for mange variabler på en gang
  • ikke regnskap for eksterne faktorer som kan påvirke trafikken i testperioden
  • ignorere små gevinster som kan bygge over tid og kombinere med andre positive endringer for økte inntekter
  • mangler tolkninger i store bilder som netto økonomiske gevinster eller tap i forhold til konverteringsrater

Bortsett fra å peke på disse problemene, må du uttrykke hvordan du vil løse dem - eller enda bedre hvordan du allerede har unngått dem i dine tidligere datavitenskapelige prosjekter.

10. 'Du har 48 timer på å løse denne kodingsutfordringen.'

Kodingsutfordringen kan være en første måte å screene potensielle dataforskere, eller det kan være et andre trinn i intervjuprosessen etter at du har ryddet det første hinderet med en rekrutterer eller ansettelsesansvarlig. Dette kan være en test på stedet som tar 30 minutter til 2 timer, der du skal kode på en tavle eller på et tastatur innenfor synspunktet på intervjueren. Du får ofte valg av språk, men vær forberedt på å kode i SQL eller Python.

Noen selskaper tildeler lengre oppgaver, med frister opp til en uke. Tavleutfordringer kan kreve å skrive ganske enkle SQL-spørsmål, men lengre tester er selvfølgelig mer komplekse. Vanligvis får du data og blir bedt om å komme med spesifikke spådommer ved bruk av disse dataene, og du må vise arbeidet ditt. For eksempel ble et nylig datavitenskapelig intervjuobjekt gitt Airbnb-data og bedt om å forutsi boligprisene basert på overnattingsfunksjoner.

Intervjuene vil ønske å diskutere valgene dine med deg, antagelsene du gjorde, funksjonene du valgte, hvorfor du brukte visse algoritmer og mer. Ofte er svaret du kommer til mindre viktig enn prosessen, kreativiteten, kodelesbarheten og designen din.

Dette kan være en nervepirrende intervjuopplevelse, så forbered deg ved å lage og fullføre praksiskodingsutfordringer med venner eller kolleger innen datavitenskapsfeltet. Du kan også besøke nettsteder som Leetcode og SQLZOO for kodingsøvelser. Faktiske spotte intervjuer som involverer algoritmiske og systemdesignproblemer er gratis tilgjengelig gjennom Interviewing.io.

Som du kan se, kan intervjuspørsmål for dataforskere være vanskelig, og den totale prosessen kan være langvarig og utslettende. Et av de viktigste intervjutipene er å være positiv, selv om du føler at en del av intervjuprosessen gikk dårlig. Vi er ofte vanskeligere for oss selv enn andre, og du kan fremdeles lande jobben til tross for at du ikke fikk hvert svar så perfekt som du skulle ønske.

Hvis du går glipp av muligheten, kan du be om tilbakemelding og bruke den til å forbedre din neste intervjuopplevelse. Tross alt ble mange veletablerte dataforskere avvist fra flere stillinger og fortsatte fremdeles til suksess i jobbene som til syvende og sist passet bedre!

Hvilke spørsmål og kodingsutfordringer møtte du da du prøvde å lande en data science-jobb? Bli med i diskusjonen i kommentarfeltet nedenfor og hjelp dine stipendiatforskere til å forberede seg på deres neste intervju!

Legg Igjen Din Kommentar

Please enter your comment!
Please enter your name here