Velkommen til HON2200 – data-drevne prosjekter#

I dette kurset skal vi trene på å bruke data til å trekke slutninger, og å finne fram til hvor i overgangen fra tall og data til beslutninger og politikk vi gjør en etisk vurdering.

Kurset består av to deler:

Del 1 – ferdighetstrening#

De første ukene skal vi trene på å laste inn, utforske og visualisere datasett. Vi skal også se litt på hvordan vi holder orden i datakoden vår, og hvordan vi skiller mellom kode vi skriver for å utforske, og kode vi skriver for å gjøre analyser vi kan putte inn i en rapport.

Så skal vi lære om hvordan vi evaluerer etiske sider ved algoritmer, og lære å identifisere hvor en etisk vurdering er nødvendig.

Del 2 – prosjekter#

Her skal vi jobbe med prosjekter der vi bruker datasett. Vi har laget noen forslag til prosjektoppgaver. Disse kan dere bruke som de er, eller dere kan modifisere dem, eller gjøre noe helt annet. Uansett hva slags prosjekt dere velger, må prosjektene være av en slik art at dere oppfyller kravene i emnebeskrivelsen. Dersom dere velger å gjøre et annet prosjekt enn de vi har foreslått må dert derfor godkjennes av emneansvarlig.

Dere skal jobbe med prosjekter i grupper på 3-4 studenter. Emneansvarlig deler dere inn i grupper basert på faglig bakgrunn.

Vi har laget følgende forslag til prosjekter (Beskrevet i større detalj om du klikker på dem i menyen). Dere skal gjennomføre 2 prosjekter, og dere må velge to prosjekter som er såpass forskjellige at dere får utforsket ev viss bredde av metoder. For eksempel kan dere velge ett prosjekt som primært handler om å modellere tabelldata, og et annet prosjekt som primært handler om å analysere/generere tekst.

Prediksjon av karakterer#

(Analyse av tabelldata) I denne oppgaven skal dere bruke et datasett til å lage en modell for prediksjon av fremtidige karakterer for videregående-elever.

Vurdering av COMPAS-algoritmen#

(Analyse av tabelldata) I denne oppgaven skal dere bruke statistikk til å vise eksplisitt hva som er diskriminerende med COMPAS-algoritmen.

Teste troverdigheten til et tekstgenereringssystem#

(Beregningsorientert lingvistikk) I denne oppgaven skal dere utforske egenskapene til ferdigtrente GPT-modeller, prøve å justere egenskapene og vurdere hva det er mulig og fosvarlig å bruke dem til.

Sentimentanalyse#

(Beregningsorientert lingvistikk)

Stiltransformasjon med dyp læring#

(Bildebehandling / kunst) Kombinere stilen i et bilde med innholdet fra et annet bilde.