Grundläggande datorseende med djupinlärning, 5 hp
Fundamentals of Computer Vision with Deep Learning, 5 credits
Kurskod: DT8055
Akademin för informationsteknologi
Nivå: Avancerad nivå
Välj kursplan
Fastställd av: Forsknings- och utbildningsnämnden, 2024-09-18 och gäller studenter antagna vårterminen 2025.
Huvudområde med fördjupning
Datateknik, Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav. (A1N)Behörighetskrav
Kandidatexamen eller högskoleingenjörsexamen i datateknik 180 hp. Kurser i programmering 7,5 hp och matematik (linjär algebra, flervariabelanalys) 7,5 hp. Engelska 6. Undantag ges för kravet på svenska.
Kursens inplacering i utbildningssystemet
Kursen ges som fristående kurs.
Mål
Kursen behandlar grundläggande begrepp och algoritmer inom datorseende och djupinlärning, både ur teoretiskt och praktiskt perspektiv. Via praktiska exempel och uppgifter ska studenter lära sig hur de presenterade begreppen kan omsättas i praktiken.
Efter avslutad kurs ska studenten kunna:
Kunskap och förståelse
- beskriva grundläggande koncept och algoritmer inom datorseende och djupinlärning i tillämpningar som integrerar båda inklusive en informell förankring i den bakomliggande matematiska teorin
- förklara styrkor och begränsningar för olika metoder inom datorseende och djupinlärning
Färdighet och förmåga
- identifiera problem som kan lösas med datorseende metoder inklusive djupinlärning och välja en lämplig metod
- tillämpa grundläggande datorseende metoder för att lösa problem som är relevanta inom industriella applikationer eller forskning
- förklara, med rätt terminologi och på ett välstrukturerat sätt, lösningen av identifierade problem inom datorseende och djupinlärning
Värderingsförmåga och förhållningssätt
- välja mellan olika datorseende metoder inbegripande djupinlärning för applikation och motivera valet
- utforma ett datorseende system (på hög nivå) baserat på en uppsättning av krav för en viss applikation, välja mellan alternativ och motivera valet
Innehåll
Bildalstring inkluderande sampling (pixlar) och representation (histogram, färgrymder, representation i Fourierbasen).
Bildtransformationer: lokala och globala operatorer, faltning, filtrering (medelvärdesbildning, skärpning)
Lågnivåseende: kanter, hörn, linje och cirkeldetektering, skalärprodukt
Särdrag och klassificering:
- Extraktion av särdrag
- Djupinlärning och Transfer Learning
- Bildmönsterklassificering
Datorseende tillämpningar:
- Ansiktsanalys: lokalisering och igenkänning av personer i ansiktsbilder
- Datorseende system i fordon: detektering av dåsighet hos förare
- Datorseende system för robotar: känna igen känsla och avsikt hos människor
Undervisningsspråk
Undervisning
Kursen undervisas via distansföreläsningar online, följt av praktiska uppgifter i Matlab/Python, som gör det möjligt för deltagarna att fördjupa sig i begrepp som presenteras i föreläsningar och att praktisera dem. Video av föreläsningar kommer också att läggas ut online för att stödja självstudier.
Laborationerna kommer att ha handledning online men också skriftliga guider för att stödja självstudier.
Betygsskala
Examinationsformer
Kursen examineras genom tre praktiska uppgifter, som kräver inlämning av rapport och tillhörande programkod före en viss tidsfrist.
2201: Praktisk uppgift I - bildförvärv och analys, 1 hp
Tvågradig skala (UG): Underkänd (U), Godkänd (G)
2202: Praktisk uppgift II - funktionsextraktion och klassificering, 2 hp
Tvågradig skala (UG): Underkänd (U), Godkänd (G)
2203: Praktisk uppgift III - datorvisionsapplikationer, 2 hp
Tvågradig skala (UG): Underkänd (U), Godkänd (G)
Undantag från angiven examinationsform
Om särskilda skäl finns får examinator göra undantag från angiven examinationsform och medge att en student examineras på annat sätt. Särskilda skäl kan till exempel vara beslut om riktat pedagogiskt stöd.
Kursvärdering
I kursen ingår kursvärdering. Denna är vägledande för utveckling och planering av kursen. Kursvärderingen dokumenteras och redovisas för studenterna.
Kurslitteratur och övriga läromedel
Litteraturlista 2025-01-20 – Tills vidare
Rafael C. Gonzalez, Richard E. Woods. Digital Image Processing, Global Edition, 4th Edition, Pearson 2018. ISBN 9780133356724
R. Szeliski, “Computer Vision: Algorithms and Applications”, 2nd ed., Springer 2021 (available online: http://szeliski.org/Book)
Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. MIT Press 2016. https://www.deeplearningbook.org/
PyImageSearch. https://www.pyimagesearch.com/