DIFFUSE: Uppdelning av funktioner för användning i systematisk utvärdering
Utbildning och validering av maskininlärningsbaserade metoder kräver vanligtvis stora datamängder. Dessa datauppsättningar kan tyvärr bara approximera verkligheten och är i många fall inte globalt tillämpliga – det vill säga data som samlats in på en plats i världen kanske inte nödvändigtvis är representativ globalt. Ambitionen med DIFFUSE-projektet är att utveckla metoder för generationer av data för att möjliggöra en ökad kontroll av vad datamängder innehåller och i förlängningen vad de validerar.
En utmaning som fortfarande finns kvar i genereringen av datamängder är att skapa en bra kombination av realism, kontroll och variation. I DIFFUSE-projektet föreslår vi en förbättring av nuvarande algoritmer för datagenerering genom att utveckla deras förmåga att distrahera funktioner i indata. Detta innebär med andra ord att en specifik del av inmatningen ska styra en specifik och begriplig del av utdata. Det i sin tur gör det möjligt att öka förståelsen för vad en genererad datauppsättning innehåller för att ge en tydligare bild av i vilka situationer ett nätverk som tränats på den kan förväntas fungera.
Arbetet är uppdelat i fem arbetspaket: administration och spridning, funktionsuppdelning, autentisering, datagenerering och utvärdering.
Om projektet
Projektperiod
April 2022–Augusti 2024
Finansiär
Vinnova
Projektledare
RISE Research Institutes of Sweden AB
Andra deltagande forskare
Fernando Alonso-Fernandez, universitetslektor
Samarbetspartner
Smart Eye AB