# Intro til programmering i Python med Jupyter Notebook
Seminar 3 i FYS1035, høsten 2024. Anja Røyne, UiO



## 1. Bruk av Jupyter Notebook
### Du jobber i din egen kopi av dokumentet

Når du har åpnet dette dokumentet, kan du gjøre så mange endringer du vil. Du jobber i din egen kopi, og det får ingen konsekvenser for de andre studentene. Husk at du må trykke på "lagre" for at endringer skal lagres. 

### Celler og formater

Dette dokumentet er delt inn i celler, som kan ha to formater: tekst (Markdown) eller kode (code). Du kan se hvilken type en celle er i menyen på toppen. Bruk '+'-knappen i menyen til å sette inn nye celler, og 'cut' (saksen) for å slette celler. 

### Redigering av tekstceller

Du får tilgang på å redigere en tekstcelle ved å sette markøren i den og dobbeltklikke eller trykke Enter. Når du er ferdig med å redigere trykker du ctr+enter og cella går tilbake til å se "fin" ut. 

### Kjøring av kode

En kode er tekst som får datamaskinen til å gjøre et eller annet. Her brukes programmeringsspråket Python. For å få koden i en celle til å kjøre plasserer du markøren i kodecella og trykker på Run-knappen eller ctr+enter.

Her er et eksempel: 

In [None]:
print("Hello, world!")

Når du kjører cella over, skal teksten inne i parentesen dukke opp på en linje under. Du kan prøve å bytte ut teksten "Hello, world!" med noe annet og kjøre igjen. Husk at tekst må stå i "klammer" for at datamaskinen skal forstå at det er tekst. 

### Rekkefølgen på kodeceller

Når du kjører flere kodeceller etter hverandre, husker datamaskinen hva den gjorde sist. **Kjør cellene under i forskjellig rekkefølge for å se effekten:**

In [None]:
navnet_mitt = "Tom"

In [None]:
navnet_mitt = "Ole"

In [None]:
print("Jeg heter", navnet_mitt)

## 2. Python som kalkulator
Aller først skal vi importere noen pakker som Python kan bruke til å gjøre nyttig matematikk og til å plotte data i figurer. Kjør kodecella under, da fungerer resten av koden i dokumentet: 

In [None]:
from numpy import *
from pylab import *

Nå kan vi få til å gjøre utregninger for oss. La oss for eksempel regne ut hvor mye varme som kreves for å varme opp 0,72 liter vann fra 20 til 50 grader. Likningen for dette er

$Q = cm\Delta T$

der

$\Delta T = T_2-T_1$ 
er temperaturendringen (i celcius eller Kelvin, siden det gir det samme når vi ser på en differanse), $Q$ er varmen i joule, $c$ er varmekapasiteten til vann i (J/kg K), og $m$ er massen til vannet. 

Vi vet at 1 liter vann veier 1 kg, så 0,72 liter vann gir $m$ = 0,72 kg.  

Varmekapasiteten til vann er $c$ = 4183 J/kg K. 

Dette kan vi fortelle til datamaskinen og få den til å regne ut svaret. Det er gjort i cella under: 

In [None]:
# tegnet # gjør at Python ikke leser resten av linja. Dette brukes til å lage kommentarer i koden. 

# Oppgir tallene som skal brukes: 
c = 4183 # varmekapasiteten til vann, J/kg K
m = 0.72 # massen til vannet, kg
T1 = 20 # starttemperaturen, degC
T2 = 40 # sluttemperaturen, degC

# Definerer likningen som Python skal regne ut:
Q = c*m*(T2-T1)

# Skriver ut svaret:
print("Varmen er", format(Q,".2f"),"J")
# kommandoen format(Q,".2f") forteller Python at den skal skrive ut verdien av Q med to desimaler.

- **Kanskje er det bedre å oppgi varmen i kJ enn i J. Endre koden over til å gjøre dette.**

- **Hva skjer om du bytter ut massen og temperaturene med andre tall?**

Vi kan bruke samme fremgangsmåte til å regne ut hvor mye varme vi trenger for å smelte 2,3 kg is. Det er gitt av likningen

$Q = lm$

der $l$ er smeltevarmen til is, som er $3,34\cdot10^5$ J/kg. **Prøv selv i cella under:** 

In [None]:
l = 3.34e5 # smeltevarme for is, J/kg. Jeg skriver e5 for 10^5
m = 2.3 #kg
# fortsett her
Q = l*m
print("Varmen er", format(Q,".2f"),"J")

- **Endre koden over slik at varmen blir oppgitt med vitenskapelig notasjon og to sifre etter komma. Spør gjerne GPT UiO om hjelp.**

## 3. Plotting og dataanalyse

I mappen FYS1035 på jupyterhub finner du fila *gmst_changes_model_and_obs.csv*, som er [lastet ned herfra](https://catalogue.ceda.ac.uk/uuid/0b2759059ad6474098e40dad73e0a8ec/). Fila inneholder observerte globale temperaturavvik (i forhold til 1850-1990) i tillegg til en del andre data som er plottet i [panel b i IPCC WG1 figur SPM.1](https://www.ipcc.ch/report/ar6/wg1/figures/summary-for-policymakers/figure-spm-1). Vi er interessert i den svarte linja i plottet, som er observerte data. Du kan se innholdet i fila ved å trykke på den. 

I cella under ber vi Python om å lese fila og hente ut informasjonen i kolonne 1 (år) og 8 (temperaturavvik). Vi starter med å importere pakken **pandas**, som kan være nyttig for å lese datafiler og behandle datasett. Det finnes flere ulike metoder for å gjøre dette.

- **Åpne datafila og se på hvordan den er strukturert. Linjene til og med 34 kalles metadata. Hva finner du der?**
- **Se på hver av linjene i kodecella under. Kan du forstå hva de gjør? Be gjerne GPT UiO om å forklare dem.**
- **Hva må du gjøre dersom du vil ha ut data fra simuleringer, i stedet for observasjonsdata?**

In [None]:
import pandas as pd

# Oppgi navnet til fila som skal leses inn
fil = 'gmst_changes_model_and_obs.csv'

# Les fila, hopp over radene med metadata, bruk bare radene med årstall og kolonne 1+8
df = pd.read_csv(file_path, skiprows=35, nrows=170, usecols=['1', '8'])

# Gi kolonnene nye, selvforklarende navn
df = df.rename(columns={'1': 'År', '8': 'Temp-avvik'})

# Extract the data
x_data = df['År']
y_data = df['Temp-avvik']

print(df)

Nå kan vi få Python til å plotte dataene vi har lest inn. I cella under gjør vi det ved bruk av pandas-pakken vi allerede har importert. Det går også an å gjøre det med, for eksempel, en pakke som heter **matplotlib**. 
- **Se på koden under. Hva gjør den?**
- **Endre på plottet slik at du bare viser dataene mellom år 1975 og 2000. Be gjerne GPT UiO om hjelp.** 

In [None]:
# Plott dataene ved hjelp av pandas
ax = df.plot(x='År', y='Temp-avvik', figsize=(10, 6), title='Observert globalt avvik i overflatetemperatur som funksjon av år', legend=False)
ax.set_xlabel('År')
ax.set_ylabel('Temperaturavvik')
ax.grid(True)

- **Hvis du har tid:** Ofte brukes et glidende gjennomsnitt med tidsvindu på 10 år når man plotter historiske temperaturdata. Få hjelp fra GPT UiO til å endre koden over til å plotte et glidende gjennomsnitt, og prøv deg frem med å bruke tidsvinduer på 2, 5 og 10 år. Hva blir resultatet? Er det som forventet?