Forberedelser

Da vi begynte å se på lineær regresjon, viste vi at man får litt forskjellige regresjonskoeffisienter for hver gang man trekker nye tilfeldige samples fra samme fordeling. Nå skal vi se på såkalte resampling-metoder, som er avgjørende for å kunne estimere feilen vi gjør når vi trener modeller til å gjøre prediksjoner. Stikkord er treningsdata, valideringsdata, kryssvalidering, bias-varians-avveining, bootstrap.

Forberedelser til timen:

Vi kommer til å bruke et datasett i undervisningstimen, det er dette.