Oppgaver om regresjon og train-test-split (forberedelse)
Contents
Oppgaver om regresjon og train-test-split (forberedelse)#
Vi minner om at dere kan bruke https://hon2200-discourse.uio.no til å få hjelp med oppgavene.
Kriminalitet og alder på bygninger#
Denne oppgaven er ment å gi mengdetrening fra det som ble gjennomgått i forrige undervisningstime.
Plott sammenhengen mellom andelen gamle bygninger og kriminalitetsraten i Boston Housing dataset.
Bruk lineær regresjon til å finne en modell for kriminalitetsraten som forklares av gamle bygninger.
Beregn “Coefficient of determination” (
model.score(X, Y)
).Gjør nå en ny lineær regresjon der du gjør train-test-split for å vurdere om modellen overtilpasser.
Varier andelen trenings- og testdata og se om det har en effekt på vurderingen av overtilpasning.
Gjør en fornuftig transformasjon av kriminalitetsraten slik at en lineær modell blir en mer plausibel modell en det den er på de utransformerte dataene. Gjenta steg 4 og 5.
Lag nå en spline-modell (slik som i forelesningen). Gjør train-test-split og vurder om modellen overtilpasser.
Variér kompleksiteten til spline-modellen systematisk og se hva det har å si for om modellen overtilpasser.
Eksponentialfunksjonen og den logistiske funksjonen#
Denne oppgaven kommer etter timen, ikke før slik som det stord tidligere