Vahvistava oppiminen (5op)
Toteutuksen tunnus: R504D121-3002
Toteutuksen perustiedot
- Ilmoittautumisaika
- 06.10.2025 - 11.01.2026
- Ilmoittautuminen toteutukselle ei ole vielä alkanut.
- Ajoitus
- 12.01.2026 - 17.04.2026
- Toteutus ei ole vielä alkanut.
- Opintopistemäärä
- 5 op
- Toteutustapa
- Lähiopetus
- Opetuskielet
- Paikat
- 0 - 30
- Koulutus
- Machine Learning and Data Engineering
Arviointiasteikko
H-5
Sisällön jaksotus
- Vahvistavan oppimisen käsitteet (mm. tutkiskelu ja hyödyntäminen)
- Yleisiä vahvistavan oppimisen oppimismetodit ja prosessit
- Linjaus (policy): arviointi, kehittäminen, iterointi
- Perinteinen vahvistava oppiminen
- Syväoppiminen vahvistavassa oppimisessa
Tavoitteet
You understand the core principles behind reinforcement learning
You understand the differences of reinforcement learning regarding classic machine learning and conventional deep learning
You can use conventional reinforcement learning solutions to create an AI that functions in a limited moving space
You can use deep learning methods in order to create situational reinforcement learning solutions
You can share your results and exercises via a version control system.
Sisältö
Basics of reinforcement learning concepts (including exploration and exploitation)
Markov Decision Processes, Monte Carlo Methods, Bellman Equation
Policies: evaluation, improvement, iteration
Conventional Reinforcement learning
Deep Reinforcement Learning
Aika ja paikka
Opintojaksolla opiskellaan kampuksella luokkatilassa. Lapin ammattikorkeakoulu, Rantavitikan kampus, 12.1.2026 - 15.5.2026.
Oppimateriaalit
Opintojakson oppimateriaali löytyy opintojakson Moodle-työtilasta. Lisämateriaalia haetaan tarvittaessa internetissä. Opintojaksolla kannustetaan myös itsenäiseen tiedonhakuun ylimääräisen materiaalin etsimiseksi.
Opetusmenetelmät
Luennot, workshopit, esimerkit, harjoitukset ja itsenäinen työskentely.
Opintojaksolla hyödynnetään Arenen tekoälysuosituksia ja liikennevalomallia ammattikorkeakouluille. Tekoälyn käyttämisen mahdollisuus riippuu annetusta harjoitustehtävästä.
Harjoittelu- ja työelämäyhteistyö
Opintojakso on kytketty saman lukukauden lukukausiprojektiin. Opetettavat tekniikat sekä niitä koskevat esimerkit tulevat osittain lukukausiprojektissa mukana olevan työelämäedustajan / yrityksen tarpeista.
Tenttien ajankohdat ja uusintamahdollisuudet
Opintojakso arvioidaan henkilökohtaisen työn ja harjoitusten perusteella.
Kansainvälisyys
Opintojakso toteutetaan englannin kielellä.
Toteutuksen valinnaiset suoritustavat
Vaihtoehtoisista opintojakson suoritustavoista voi keskustella ohjaajan kanssa.
Opiskelijan ajankäyttö ja kuormitus
Opintojakso on laajuudeltaan 5 opintopistettä (ECTS), mikä tarkoittaa noin 135 tunnin kokonaistyömäärää. Työmääräsi jakautuu keskimäärin seuraavasti:
- Luennot ja workshopit: 50 h
- Itsenäinen oppiminen ja valmistautuminen: 45 h
- Arvioitavat tehtävät: 40h
Arviointikriteerit, tyydyttävä (1)
You can create a simple reinforcement application
You are aware of the basic principles behind reinforcement learning
You understand the difference of reinforcement learning when compared to other conventional machine learning technologies
You can share your results and exercises via a version control system.
Arviointikriteerit, hyvä (3)
You can create various reinforcement applications, using both conventional methods and deep learning methods
You understand the basic principles behind reinforcement learning on the general level
You understand the difference of reinforcement learning when compared to other conventional machine learning technologies
You can share your results and exercises via a version control system.
Arviointikriteerit, kiitettävä (5)
You can create various reinforcement applications, using both conventional methods and deep learning methods
You understand the basic principles behind reinforcement learning on the general level
You understand the difference of reinforcement learning when compared to other conventional machine learning technologies
You can optimize your reinforcement learning applications to improve performance
You can share your results and exercises via a version control system.
Esitietovaatimukset
Basics of programming
Basics of Python data analytics modules/libraries
Basics of conventional machine learning methods
Basics of Deep Learning