Introduksjon til datavitenskap (DAT540)

Kurset skal gi kunnskap og erfaring innen datavitenskapelige oppgaver og gjøre studenten kjent med datavitenskapelig prosjektsyklus.


Dette er emnebeskrivelsen for studieåret 2024-2025. Merk at det kan komme endringer.

Fakta

Emnekode

DAT540

Versjon

1

Vekting (stp)

10

Semester undervisningsstart

Høst

Antall semestre

1

Vurderingssemester

Høst

Undervisningsspråk

Engelsk

Innhold

Evnen til å innhente og analysere data har blitt en av de viktigste utfordringene i nesten alle fagområder, sektorer og næringer. I dette kurset blir studentene kjent med grunnleggende verktøy og prosesser som brukes i datavitenskap ("Data Science")

Studentene jobber gjennom hele dataflyten, fra innhenting, rensing og modellering, til lagring av dataene. Arbeidet utføres ved bruk av Python-stakken, som består av blant annet: IPython, NumPy, Pandas, Matplotlib og Jupyter Notebooks.

Studentene lærer å strukturere sitt arbeid ved hjelp av CRISP-DM og Data Science -prosessen ("Ask, Get, Explore, Model, Communicate and Visualize").

Læringsutbytte

Kunnskap:

  • Utvikle og kjøre programmer for å laste, analysere, rense, transformere, slå sammen, omforme og lagre data.
  • Sammenligne vanlige Python, NumPy og Pandas datastrukturer og bruke en av disse til en definert oppgave. Bruke IPython shell og Jupyter notebook for undersøkende databehandling.
  • Utvikle og kjøre enkle algoritmer for maskinlæring eller data mining.

Ferdigheter:

  • Gjøre dataanalyse etter CRiSP-DM og Data Science Prosess.
  • Lage gode visualiseringer av data analysen med bruk av matplotlib.
  • Optimalisere dataanalysen ved å bruke tilgjengelig struktur og metoder.
  • Evaluere, kommunisere og forsvare resultater fra dataanalysen.

Generelle kvalifikasjoner:

  • Løse dataanalyseoppgaver i sanntid ved bruk av en strukturert fremgangsmåte.

Forkunnskapskrav

10 studiepoeng i programmering, databaser eller programvareutvikling

Anbefalte forkunnskaper

DAT120 Grunnleggende programmering, STA500 Sannsynlighetsregning og statistikk 2

Eksamen / vurdering

Prosjektarbeid og skriftlig eksamen

Vurderingsform Vekting Varighet Karakter Hjelpemiddel
Prosjektarbeid i gruppe 3/5 Bokstavkarakterer
Skriftlig eksamen (Multiple Choice) 2/5 3 Timer Bokstavkarakterer

Skriftlig eksamen er digital.Prosjektarbeid i grupperProsjektet gjennomføres i grupper. Prosjektarbeid skal utføres i de gruppene som tildeles og publiseres. Fravær på grunn av sykdom eller andre årsaker skal snarest meldes til foreleser.En prosjektrapport, inkludert kildekode, inngår i vurderingen. Dersom en student stryker i prosjektarbeidet, må han/hun ta denne delen på nytt neste gang emnet foreleses.

Fagperson(er)

Instituttleder:

Tom Ryen

Arbeidsformer

Arbeidet vil bestå av 6 timer forelesning, laboratorium, veiledet gruppearbeid per uke.

Det forventes at studentene bruker ytterligere 6-8 timer i uken på selvstudium, gruppediskusjoner og utviklingsarbeid.

Åpent for

Data Science - master i teknologi/siv.ing. Datateknologi - master i teknologi/siv.ing.
Utveksling ved Det teknisk- naturvitenskapelige fakultet

Emneevaluering

Det skal være en tidligdialog mellom emneansvarlig, studenttillitsvalgt og studentene. Formålet er tilbakemelding fra studentene for endringer og justering i emnet inneværende semester.I tillegg skal det gjennomføres en digital emneevaluering minimum hvert tredje år. Den har som formål å innhente studentenes erfaringer med emnet.

Litteratur

Pensumlisten finner du i Leganto