Data og algoritmer skal hjælpe med at vedligeholde vores kloakker
Netop i disse dage offentliggøres unikt datasæt med 1,3 millioner billeder fra danske kloakker. Det skal gøre vedligehold af rørene nemmere.
kloak-fejlklasse_algoritmer_computer vision

Et stort, dansk datasæt skal gøre det nemmere at identificere, hvor der er fejl i kloaksystemet. På dette foto, der er taget af en robot, er to rør forskudt for hinanden. Det er kendetegnet ved den lyse halvmåde, som pilen peger på, og kaldes forskudt samling (Foto: Sewer-ML)

Et stort, dansk datasæt skal gøre det nemmere at identificere, hvor der er fejl i kloaksystemet. På dette foto, der er taget af en robot, er to rør forskudt for hinanden. Det er kendetegnet ved den lyse halvmåde, som pilen peger på, og kaldes forskudt samling (Foto: Sewer-ML)

Du har nok ikke rigtig skænket den en tanke, udover hvis den lugter eller stopper til.

Kloakkerne er imidlertid en af de vigtigste infrastrukturer i det moderne samfund. Men hvad sker der, når kloakkerne ikke virker, som de skal?

Er det frem med den store svupper og håbe på det bedste?

Ikke helt. I virkeligheden kræver det uddannede kloakinspektører, som er eksperter i at manøvrere en fjernstyret robot igennem kloakkerne, mens de kigger efter fejl på et tv-billede fra robotten.

Der er dog langt flere kloakker, end der er kloakinspektører, hvilket betyder, at der kan gå lang tid mellem inspektioner. Derfor øges risikoen for, at noget kan gå galt med kloakken. Noget, der både kan være dyrt at reparere og have store konsekvenser for vores miljø og sundhed.

Derfor er der i mere end 30 år blevet forsket i automatisering af kloakinspektion i form af automatisk navigation af robotter og automatisk fejlgenkendelse ved brug af billeder.

I vores forskning i Visual Analysis and Perception (VAP) laboratoriet ved Aalborg Universitet har vi taget det første spadestik ved at udgive verdens første og mest diverse dataset til genkendelse af fejl i kloakker ud fra billeder. 

De tre store forhindringer

Fakta
Forskerzonen

Denne artikel er en del af Forskerzonen, som er stedet, hvor forskerne selv kommer direkte til orde.

Her skriver de om deres forskning og forskningsfelt, bringer relevant viden ind i den offentlige debat og formidler til et bredt publikum.

Forskerzonen er støttet af Lundbeckfonden.

Selvom man har forsøgt at automatisere kloakinspektioner i mere end 30 år, er vi endnu ikke nået til et punkt, hvor teknologien er god nok til at blive anvendt i praksis.

Med det sidste årtis fremskridt i computer vision (automatisk forståelse af indholdet i et billede) og kunstig intelligens, er der blevet kastet brænde på fejlgenkendelses-bålet. Bålet kan dog kun brænde ordentligt, hvis tre store forhindringer overkommes:

  • Mangel på et datasæt, som alle har ligelig adgang til.
  • Manglende fælles tilgang til, hvordan algoritmerne bliver bedømt.
  • En tendens til ikke at dele kode og trænede algoritmer.

Disse tre forhindringer gør det svært for udefrakommende fagfolk at blive del af et meget specialiseret forskningsområde.

    Der er dog tegn på fremgang. Frit tilgængelige datasæt og tilhørende konkurrencer, såsom ImageNet, COCO, og MOTChallenge, har nemlig været en essentiel del af computer vision-miljøets fremgang det seneste årti.

    Hvis de tre nævnte forhindringer kan overkommes, er drømmen om automatiserede kloakinspektioner en tak tættere på.

    I VAP-laboratoriet arbejder vi ikke bare med at forbedre kloakinspektioner ved brug af moderne og nye computer vision-algoritmer, vi arbejder også for at gøre dette forskningsfelt mere tilgængeligt for alle.

    robot-kloak

    Fjernstyret robot, der bruges til kloakinspektioner. (Foto: Automated Sewer Inspection Robot (ASIR))

    1,3 millioner danske kloakbilleder

    I VAP-laboratoriet har vi derfor samlet et kæmpe datasæt med fokus på at genkende fejl i kloakker bestående af 1,3 millioner unikke billeder.

    kloak

    På dette billede er der to fejlklasser revner/brud (RB) og påhugning (PH). Påhugning en metode til at samle to rør ved at hugge hul i hovedrøret for at tilslutte et tilstødende rør. Denne metode må ikke længere bruges.
    (Foto: Sewer-ML)

    Datasættet tager afsæt i 75.618 forskellige inspektioner foretaget for tre danske vandforsyninger over en periode på ni år. Dette giver et helt unikt datasæt med en kæmpe diversitet af kloaktyper, former, og materialer.

    Et stort datasæt er dog intet værd, hvis ikke der er gode annoteringer, det vil sige beskrivelser af, hvad der er i billederne.

    Derfor er alle billederne set igennem af professionelle kloakinspektører i henhold til den danske standard for kloakinspektioner, Fotomanualen, udarbejdet af Dansk Vand- og Spildevandsforening (DANVA).

    Ved at følge Fotomanualen bliver der tilskrevet nul, en, eller flere observationsklasser, uformelt kaldet fejlklasser, ud af i alt 17 forskellige muligheder til hvert billede.  

    Alle fejlklasser forekommer dog ikke lige hyppigt. Vi kan ud fra vores data se, at der er en stor skævvridning mellem de 690.722 normale kloakbilleder uden nogle fejlklasser, den oftest forekomne klasse forskudt samling (FS) med 355.982 billeder og den sjældneste klasse 'Opskæring af stik' (OS) med 5.612 billeder.

    figur-kloak

    Fejlklassen forskudt samling (FS) er den hyppigste fejl, der bliver fundet i kloakkerne. Opskæring af stik (OS), der er den næstmest alvorlige fejlklasse, er den mest sjældne. (Kilde: Joakim Bruslund Haurum, Thomas B. Moeslund).  

    Denne skævvridning af data gør datasættet unikt, da man i forbindelse med automatisering af kloakinspektioner typisk arbejder med antagelsen om, at de forskellige kloak-fejlklasser forekommer ensartet.

    Hyppigheden af en fejl er dog ikke direkte forbundet med, hvor alvorlig den er.

    Alle fejlklasserne er ikke lige alvorlige

    Selvom det endelige mål er at kunne genkende alle fejlklasser hver gang, er dette umuligt i øjeblikket grundet problemets enorme kompleksitet.

    Derfor er det nødvendigt, at vi målretter vores energi på de fejlklasser, som har størst betydning.

    Dansk Vand- og Spildevandsforening har udarbejdet et struktureret pointsystem, hvor hver fejlklasse er tildelt en pointværdi, der repræsenterer alvorligheden af fejlklassen.

    Ved hjælp af pointværdier er det muligt at sammenligne de forskellige fejlklassers genkendelsesrate i forhold til deres alvorlighed.

    Ved at lave denne kommer vi frem til, at:

    • De alvorlige fejlklasser er ikke altid de hyppigste
    • De alvorlige fejlklasser er nogle af de sværeste at genkende

    I boksen under artiklen dykker vi mere ned i, hvilke fejltyper der er de mest almindelige og mest alvorlige.  

    Årsagen til den lave genkendelsesrate skyldes dog ikke kun hyppigheden af de forskellige fejlklasser.

    Enorm visuel variation i de forskellige fejlklasser

    De 17 forskellige fejlklasser dækker over alt, hvad der tænkes relevant at dokumentere under en kloakinspektion. Fejlklasserne dækker dog over mange forskellige scenarier, som ser ud på vidt forskellige måder i kloakkerne.

    Det er i denne variation i udseende af hver fejlklasse, og til dels hvor ens forskellige fejlklasser kan se ud, at forskellen i genkendelsesraten skal findes.

    revner-brud-kloak

    Et eksempel på fejlklassen Revner/Brud (RB). (Foto: Sewer-ML)

    Den hyppigste fejlklasse, forskudt samling (FS), er også den med højeste genkendelsesrate. Det er dog også en af de mest visuelt ensartede fejlklasser, der forekommer i kloakkerne. De forskudte samlinger er nemlig kendetegnet ved en tydelig kant mellem rørene, hvilket gør det nemt at genkende denne fejlklasse (se foto øverst i artiklen). Når rørene er forskudte kan dette lede til at kloakvand kan sive ud i jorden og potentielt ned i grundvandet.

    Modsat er der en meget stor variation i, hvordan den alvorligste fejlklasse 'Revner/brud' (RB) ser ud. RB-fejlklassen dækker nemlig over de fejl, hvor selve røret er fysisk brudt, hvilket kan ske på mange forskellige måder.

    Denne store variation, samt den lave forekomst af denne type fejl, resulterer i, at det er svært at genkende forekomster af denne fejlklasse.

    For at inspektionsprocessen af kloakker kan blive automatiseret, skal denne variation i de mest alvorlige fejlklasser håndteres.

    Verdens første frie kloakdatasæt

    Derfor har vi i VAP-laboratoriet valgt - som de første i verden - at gøre vores datasæt frit tilgængeligt for alle, der er interesserede i at forske i automatisk genkendelse af kloakfejl i håbet om at overkomme de tre store forhindringer (mangel på lige adgang til data, manglende fælles tilgang til, hvordan algoritmerne bliver bedømt og tendens til ikke at dele kode)

    Det har allerede resulteret i flere henvendelser fra forskere på tværs af hele kloden.

    Ud over datasættet sammenligner vi 12 moderne algoritmer. Vi foreslår en struktureret proces, hvor algoritmerne vurderes baseret på fejlklassernes alvorlighed, og vi offentliggør vores kode og de trænede algoritmer.

    Disse resultater præsenteres på konferencen Computer Vision and Pattern Recognition (CVPR) i juni 2021, og den tilhørende videnskabelige artikel kan læses her.

    Selvom vores datasæt er det mest diverse datasæt i øjeblikket, håber vi, at offentliggørelsen kan lede til en større interesse og åbenhed inden for dette forskningsområde.

    Vi håber også, at det vil lede til flere åbne datasæt fra forskellige steder i verden, sådan at geografisk skævvridning kan omgås, og fejl i kloakker kan blive genkendt automatisk på tværs af hele kloden.

    Forskningen, som denne artikel bygger på, er støttet af Innovationsfonden og er en del af projektet 'Automated Sewer Inspection Robot (ASIR)' (Grant 8055-00015A).

    De mest typiske fejl i kloakken

    De fejl, der kan opstå i kloakker, inddeles i 17 fejlklasser, som enten beskriver en decideret fejl eller skade i kloakrøret, eller beskriver ændringer i konstruktionen af kloakken.

    Fejlklasserne er udarbejdet af Dansk Vand- og Spildevandsforening Fotomanualgruppe.

    Opdeling af data i forskellige klasser gør, at man, ved brug af computer vision og kunstig intelligens, kan lære en computer at genkende de forskellige fejlklasser.

    Fejlklasserne er for nemheds skyld alle forkortet med to bogstaver. De mest almindelige fejlklasser i vores kloakker er:

    • Forskudt samling (FS). Når to rør sidder forskudt for hinanden.
    • Overfladebeskadigelse (OB). Når der er skade på indersiden af røret.
    • Overgang ved konstruktionsændring (OK). Når der er en overgang mellem to rør og materialet, størrelsen, formen eller retning ændres.

    De mest alvorlige fejlklasser i vores kloakker er:

    • Revner/brud (RB). Når der er brud i rørmaterialet.
    • Opskæring ved stik (OS). Når et kloakrør er blevet repareret med en 'strømpeforing', og der skal skæres adgang til tilstødende (stik) rør.
    • Forskudt samling (FS). Når to rør sidder forskudt for hinanden.
    Alle må bruge og viderebringe Forskerzonens artikler

    På Forskerzonen skriver forskere selv om deres forskning. Vi mener, det er vigtigt, at alle får mulighed for at læse om forskning fra forskerens egen hånd.

    Alle må derfor bruge, kopiere og viderebringe Forskerzonens artikler udfra følgende enkle krav:

    • Det skal krediteres: 'Artiklen er oprindelig bragt på Videnskab.dk’s Forskerzonen, hvor forskerne selv formidler'. Hvis artiklen bringes på web, skal der linkes til artiklen på Forskerzonen.
    • Artiklen må ikke redigeres og skal bringes i fuld længde (medmindre andet aftales med forskeren).
    • Du skal give forskeren besked om, at du genpublicerer.
    • Artikler, som er oversat fra The Conversation, skal have indsat en HTML-kode til indsamling af statistik i bunden. HTML-koden finder du i den originale artikel på The Conversations hjemmeside ved at klikke på knappen "Republish this article" ude til højre, derefter klikke på 'Advanced' og kopiere koden. Du finder linket til artiklen på The Conversation i bunden af Forskerzonens oversatte artikel. 

    Det er ikke et krav, men vi sætter pris på, at du giver os besked, hvis du publicerer vores indhold (undtaget indhold fra The Conversation). Skriv til redaktør Anders Høeg Lammers på ahl@videnskab.dk.

    Læs mere om Forskerzonen i Forskerzonens redaktionelle retningslinjer.

    Hej! Vi vil gerne fortælle dig lidt om os selv

    Nu hvor du er nået helt herned på vores hjemmeside, er det vist på tide, at vi introducerer os.

    Vi hedder Videnskab.dk, kom til verden i 2008 og er siden vokset til at blive Danmarks største videnskabsmedie med 1 million brugere om måneden.

    Vores uafhængige redaktion leverer dagligt gratis forskningsnyheder og andet prisvindende indhold, der med solidt afsæt i videnskabens verden forsøger at give dig aha-oplevelser og væbne dig mod misinformation.

    Vores journalister fortæller historier om både kultur, astronomi, sundhed, klima, filosofi og al anden god videnskab indimellem - i form af artikler, podcasts, YouTube-videoer og indhold på sociale medier.

    Vi stiller meget høje krav til, hvordan vi finder og laver vores historier. Vi har lavet et manifest med gode råd til at finde troværdig information, og vi modtog i 2021 en fornem pris for vores guide til god, kritisk videnskabsjournalistik.

    Vores redaktion gør en dyd ud af at få uafhængige forskere til at bedømme betydningen af nye studier, og alle interviewede forskere citat- og faktatjekker vores artikler før publicering.

    Hvis du går rundt og undrer dig over stort eller småt, vil vi elske at høre fra dig og forsøge at give dig svar med forskernes hjælp. Send bare dit spørgsmål til vores brevkasse Spørg Videnskaben.

    Vi håber, at du vil følge med i forskningens forunderlige opdagelser her på Videnskab.dk.

    Få et af vores gratis nyhedsbreve sendt til din indbakke. Du kan også følge os på sociale medier: Facebook, Twitter, Instagram, YouTube eller LinkedIn.

    Med venlig hilsen

    Videnskab.dk

    Videnskab.dk Podcast

    Lyt til vores seneste podcast herunder eller via en podcast-app på din smartphone.

    Danske corona-tal

    Videnskab.dk går i dybden med den seneste corona-forskning. Læs vores artikler i temaet her.

    Hver dag opdaterer vi også de seneste tal.

    Dyk ned i grafer om udviklingen i antal smittede, indlagte og døde i Danmark og alle andre lande.

    Ny video fra Tjek

    Tjek er en YouTube-kanal om videnskab henvendt til unge.

    Indholdet på kanalen bliver produceret af Videnskab.dk's videojournalister med samme journalistiske arbejdsgange, som bliver anvendt på Videnskab.dk.