Statistical Analysis with R (5cr)
Course unit code: SMEN0319
General information
- Credits
- 5 cr
- Teaching language
- finnish
Objective
Opintojakson suoritettuaan opiskelija osaa
- hahmottaa R:n perusteet ja yleisimmät ohjelmointirakenteet
- ladata ja käyttää yleisimpiä tiedostotyyppejä R-ympäristössä
- käsitellä ja muokata aineiston analysoitavaan muotoon
- visualisoida aineistoja ja analyysien tuloksia ggplot2 -kirjaston avulla
- tehdä yleisimmät tilastolliset analyysit R:llä
- tuottaa toistettavan analyysin ja raportoinnin rmarkdownin avulla.
Content
Olio-ohjelmoinnin perusteet, yleisimmät datatyypit, matriisit ja datakehikot, RStudion perusteet, aineistojen käsittely ja visualisointi tidyverse-työkalujen avulla, aineiston käsittely eli ”data wrangling”, visualisointi, aineiston painottaminen, tilastolliset analyysit (varianssianalyysi, lineaarinen regressio, logistinen regressio), analyysien toistettavuus ja avoimen tieteen käytäntöjen soveltaminen. Kurssilla opitaan toteuttamaan tilastollinen analyysi R:n avulla ja tuottamaan raportti analyysistä rmarkdownin avulla.
Qualifications
TUTA0202 Kvantitatiivisen tutkimuksen perusteet tai vastaavat tiedot
Assessment criteria, satisfactory (1)
Hylätty: Harjoitustyö on erittäin puutteellinen tai virheellinen, tai sisältää huomattavia väärinkäsityksiä.
Välttävä ja tyydyttävä (1-2): Harjoitustyö on suppea, pintapuolinen tai vastaa heikosti tehtävänantoa. Harjoitustyössä tyydytään luettelemaan asioita irrallisesti, tai käsitellään asioita yksipuolisesti. Harjoitustyö voi sisältää virheitä tai epäselvyyksiä.
Assessment criteria, good (3)
Hyvä ja kiitettävä (3-4): Harjoitustyö vastaa tehtävänantoa, osoittaa ymmärtämistä sekä taitoa analysoida ja perustella. Harjoitustyössä muodostuu asiasta kokonaiskuva, mutta siinä saattaa olla puutteita.
Assessment criteria, excellent (5)
Erinomainen (5): Harjoitustyössä hahmotetaan laaja kokonaisuus ja tietoa osataan soveltaa moniulotteisesti tai sijoittaa eri konteksteihin. Harjoitustyö osoittaa itsenäistä otetta ja oivallusta. Harjoitustyö on ehjä kokonaisuus, joka sisältää perusteltua omaa ajattelua tai kriittistä pohdintaa. Harjoitustyö on hyvin kirjoitettu tai toteutettu.
Materials
Wickham, Hadley & Grolemund, Garrett (2017) R for Data Science. https://r4ds.had.co.nz/
Peng, Roger D. (2020) R Programming for Data Science. https://bookdown.org/rdpeng/rprogdatascience/
Further information
R on tilastolliseen laskentaan tehty avoimen lähdekoodin ohjelmointiympäristö ja ohjelmointikieli.
Execution methods
Luennot (n. 15 h) ja atk-harjoitukset (n. 30 h). Itsenäinen työskentely.
Accomplishment methods
Osallistuminen luentoihin ja harjoituksiin. Harjoitustyö.