Forberedelser til første time#

Følg instruksjonene under for å være forberedt til første time. Merk at det er en oppgave nederst på siden som kommer til å ta litt tid.

Logge inn på diskusjonsforum#

Vi skal bruke et discourse-basert diskusjonsforum som heter discourse. Logg inn her før timen. Bruk dette forumet om du lurer på noe faglig eller praktisk i kurset. For kontakt om personlige forhold (f. eks. for fravær eller utsettelser) bruker du mail eller telefon.

Opprette en bruker på GitHub#

Når dere skal jobbe med programkode i grupper, trenger dere et sted å dele koden deres med hverandre. Standarden for å holde styr på kode er versjonskontrollsystemer slik som Git. Derfor trenger alle en bruker på GitHub. Inne på github kan dere opprette felles prosjekter. Når prosjektet deres skal leveres, kan dere enkelt laste det ned som en zip-fil og levere på Devilry. Dere trenger ikke øve så mye på å bruke github enda, men det kan være fint å opprette et repository og legge inn en fil der, bare for å komme litt i gang. Vi skal øve mer på dette senere.

Datasett#

Vi legger ut noen datasett til bruk i dette kurset på Zenodo.

Installere JupyterLab#

Vi skal bruke Python vha. Jupyter notebook i kurset. For å kunne gjøre datavitenskap trenger vi å installere noen pakker i python-installasjonen. I første omgang ønsker vi at dere skal kjøre JupyterLab på egen maskin. Dette kan installeres på flere forskjellige måter. Vi anbefaler å gjøre en av følgende:

  • Bruke Visual Studio Code med Jupyter-extension

  • Dersom du er komfortabel med terminalvinduet, og vet hva pip install er for noe, installer JupyterLab med kommandoen pip install jupyterlab. Vi anbefaler at du gjør dette i et virtual environment, for eksempel med pyenv-virtualenv.

  • Om du ikke er komfortabel med terminalen: Installer Anaconda. Der følger JupyterLab med, og fungerer fint.

Installere python-pakker og sjekke at de fungerer#

Enten kjøre følgende kommando i terminalen:

pip install pandas numpy matplotlib

eller følgende kommando inne i JupyterLab:

!pip install -q pandas numpy matplotlib
import pandas as pd 
file_name = "https://raw.githubusercontent.com/uiuc-cse/data-fa14/gh-pages/data/iris.csv"
df = pd.read_csv(file_name)
df.head()
sepal_length sepal_width petal_length petal_width species
0 5.1 3.5 1.4 0.2 setosa
1 4.9 3.0 1.4 0.2 setosa
2 4.7 3.2 1.3 0.2 setosa
3 4.6 3.1 1.5 0.2 setosa
4 5.0 3.6 1.4 0.2 setosa

Etter kommandoen over skal du se en tabell med data fra Iris-datasettet.

import matplotlib.pyplot as plt 
plt.scatter(df["sepal_length"], df["sepal_width"])
<matplotlib.collections.PathCollection at 0x13a14af40>
../../../_images/forberedelser_4_1.png
fig, ax = plt.subplots(figsize=(8,6))

for species, s_df in df.groupby("species"):
    ax.scatter(s_df["sepal_length"], s_df["sepal_width"], label=species)
plt.legend()
<matplotlib.legend.Legend at 0x13a2167f0>
../../../_images/forberedelser_5_1.png

Om alt dette fungerer, og du får opp noe som ligner på figurene over, er du klar for undervisningstime.

Data-dreven beslutning#

I fjor vår startet semesteret med antallsbegrensninger og barene stengte kl 23. Hele familier var uker i karantene. Man fryktet at omicron ville overbelaste helsevesenet. Men hadde vi noe å frykte? Les artiklene under og gjør deg opp en mening (ja / nei) om hvorvidt alle forskriftsfestede koronatiltak burde vært fjernet ved nyttår 2022. Vurder også om du synes det er nok data tilgjengelig for å ta en beslutning, og om samfunnet kunne gjort noe for å skaffe et bedre datagrunnlag.

Rådata fra UK: