Sök Stäng
Kursplan

Grundläggande datorseende med djupinlärning, 5 hp

Fundamentals of Computer Vision with Deep Learning, 5 credits

Kurskod: DT8055

Akademin för informationsteknologi

Nivå: Avancerad nivå

Välj kursplan

Version
2025-01-20 - Tills vidare

Fastställd av: Forsknings- och utbildningsnämnden, 2024-09-18 och gäller studenter antagna vårterminen 2025.

Huvudområde med fördjupning

Datateknik, Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav. (A1N)

Behörighetskrav

Kandidatexamen eller högskoleingenjörsexamen i datateknik 180 hp. Kurser i programmering 7,5 hp och matematik (linjär algebra, flervariabelanalys) 7,5 hp. Engelska 6. Undantag ges för kravet på svenska.

Kursens inplacering i utbildningssystemet

Kursen ges som fristående kurs.

Mål

Kursen behandlar grundläggande begrepp och algoritmer inom datorseende och djupinlärning, både ur teoretiskt och praktiskt perspektiv. Via praktiska exempel och uppgifter ska studenter lära sig hur de presenterade begreppen kan omsättas i praktiken.


Efter avslutad kurs ska studenten kunna:

Kunskap och förståelse

  • beskriva grundläggande koncept och algoritmer inom datorseende och djupinlärning i tillämpningar som integrerar båda inklusive en informell förankring i den bakomliggande matematiska teorin
  • förklara styrkor och begränsningar för olika metoder inom datorseende och djupinlärning



Färdighet och förmåga

  • identifiera problem som kan lösas med datorseende metoder inklusive djupinlärning och välja en lämplig metod
  • tillämpa grundläggande datorseende metoder för att lösa problem som är relevanta inom industriella applikationer eller forskning
  • förklara, med rätt terminologi och på ett välstrukturerat sätt, lösningen av identifierade problem inom datorseende och djupinlärning



Värderingsförmåga och förhållningssätt

  • välja mellan olika datorseende metoder inbegripande djupinlärning för applikation och motivera valet
  • utforma ett datorseende system (på hög nivå) baserat på en uppsättning av krav för en viss applikation, välja mellan alternativ och motivera valet

Innehåll

Bildalstring inkluderande sampling (pixlar) och representation (histogram, färgrymder, representation i Fourierbasen).

Bildtransformationer: lokala och globala operatorer, faltning, filtrering (medelvärdesbildning, skärpning)

Lågnivåseende: kanter, hörn, linje och cirkeldetektering, skalärprodukt

Särdrag och klassificering:

  • Extraktion av särdrag
  • Djupinlärning och Transfer Learning
  • Bildmönsterklassificering


Datorseende tillämpningar:

  • Ansiktsanalys: lokalisering och igenkänning av personer i ansiktsbilder
  • Datorseende system i fordon: detektering av dåsighet hos förare
  • Datorseende system för robotar: känna igen känsla och avsikt hos människor

Undervisningsspråk

Undervisningen bedrivs på engelska.

Undervisning

Kursen undervisas via distansföreläsningar online, följt av praktiska uppgifter i Matlab/Python, som gör det möjligt för deltagarna att fördjupa sig i begrepp som presenteras i föreläsningar och att praktisera dem. Video av föreläsningar kommer också att läggas ut online för att stödja självstudier.

Laborationerna kommer att ha handledning online men också skriftliga guider för att stödja självstudier.

Betygsskala

Tvågradig skala (UG): Underkänd (U), Godkänd (G)

Examinationsformer

Kursen examineras genom tre praktiska uppgifter, som kräver inlämning av rapport och tillhörande programkod före en viss tidsfrist.

2201: Praktisk uppgift I - bildförvärv och analys, 1 hp
Tvågradig skala (UG): Underkänd (U), Godkänd (G)

2202: Praktisk uppgift II - funktionsextraktion och klassificering, 2 hp
Tvågradig skala (UG): Underkänd (U), Godkänd (G)

2203: Praktisk uppgift III - datorvisionsapplikationer, 2 hp
Tvågradig skala (UG): Underkänd (U), Godkänd (G)

Undantag från angiven examinationsform

Om särskilda skäl finns får examinator göra undantag från angiven examinationsform och medge att en student examineras på annat sätt. Särskilda skäl kan till exempel vara beslut om riktat pedagogiskt stöd.

Kursvärdering

I kursen ingår kursvärdering. Denna är vägledande för utveckling och planering av kursen. Kursvärderingen dokumenteras och redovisas för studenterna.

Kurslitteratur och övriga läromedel

Välj litteraturlista
2025-01-20 – Tills vidare

Litteraturlista 2025-01-20Tills vidare

Rafael C. Gonzalez, Richard E. Woods. Digital Image Processing, Global Edition, 4th Edition, Pearson 2018. ISBN 9780133356724


R. Szeliski, “Computer Vision: Algorithms and Applications”, 2nd ed., Springer 2021 (available online: http://szeliski.org/Book)


Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. MIT Press 2016. https://www.deeplearningbook.org/


PyImageSearch. https://www.pyimagesearch.com/