Når man udvikler et computerprogram (algoritme) i en maskine, der kan analysere data, som den kan lære fra, kaldes det: "machine learning" – på dansk maskinlæring. Maskinen bruger analyserne til at forudsige eller gætte på udfald af noget i den virkelige verden.
Når man programmerer en computer, fortæller man den helt præcist hvad den skal gøre. Programmet gør kun det, programmøren har instrueret den til.
Maskinlæring består grundlæggende også af et computerprogram, der er lavet af en programmør. Programmet indholder en algoritme.
Når algoritmen fodres med data, er den programmeret til at finde mønstre i disse data og placere dem i nogle kategorier.
Undervejs bygger computerprogrammet selv en model for, hvordan nye data skal behandles og placeres i kategorier.
Det er således IKKE programmøren, der har kodet hvordan programmet skal placere nye data i kategorier. Programmet har på baggrund af træningsdata selv bygget en model for, hvordan nye data skal placeres i kategorier.
EKSEMPEL:
Modermærkekræft
En algoritme bliver bedt om at analysere 2 forskellige kategorier af billeder af modermærker:
Kategori 1: Billeder MED kræftceller
Kategori 2: Billeder UDEN kræftceller.
Algoritmen trænes med tusindvis af billeder i de 2 kategorier. Efterhånden bliver modellen i stand til at forudsige, om der er kræft i nye billeder af modermærker med større præcision end et menneske.
DATA: Er det man træner en maskinlæringsalgoritme med. Dataene er digitale og kan f.eks. være billeder, sensor data (tal), tekst eller lyd
ALGORITME: En del af et computerprogram, der er skabt af mennesker. Programmet analyserer data og bygger selv en "model" for mønstergenkendelse.
MØNSTRE: Algoritmen er lavet sådan, at den prøver at finde ud af, hvad der er "særligt" ved lige præcis de data den bliver præsenteret for. Det kan f.eks. være det særlige ved et billede af en løve i forhold til en hund. Det der går igen (f.eks. at en del løver har en manke), kalder man et mønster. Formålet er i dette simple eksempel er, at kunne kende forskel på en løve og en hund.
MASKINLÆRINGSMODEL: Når man træner en algoritme med data, bygger programmet løbende en model, der bliver i stand til at genkende mønstre i nye tilfælde. Man kan altid forbedre modellen ved at fodre den med mere eller bedre data.
KATEGORI: Kategorier bruges både når man træner en maskinlæringsmodel og når modellen skal genkende nye tilfælde. Man kan f.eks. oprette 2 kategorier i computerprogrammet : Løver og hunde. Disse kategorier kan man træne med 1000 vis af billeder af hunde og løver. Når man træner, bygger programmet selv løbende en model. Modellen "ser" efter mønstre i hvad det særlige er ved billederne i 2 kategorier: hunde og løver. Bliver modellen udsat for en nyt tilfælde (et billede), vil modellen forsøge at se efter mønstre og placere det nye tilfælde i en af de kategorier den kender.
COMPUTER VISION: Når man anvender maskinlæring til at træne en maskine til at kunne forudsige hvilke motiver/elementer/personer der er på billeder og video. Maskinlæring bruges til mange andre ting - f.eks. er algoritmerne der forudsiger brugsmønstre på sociale medier også en form maskinlæring. Store sprogmodeller som ChatGPT er også bygget på maskinlæringsprincipper.
PRØV SELV.
Her kan du selv afprøve og træne en maskinlæringsmodel og se nogle af begreberne i spil.
Supervised learning:
Læring med eksempler på inputs og outputs (facitliste). Kategorierne, der skal sorteres i, er givet på forhånd. Algoritmen trænes med data inden for kategorierne.
Unsupervised learning:
At finde mønstre i ustrukturerede data. Algoritmen kender ikke nogen kategorier på forhånd, men opretter dem selv baseret på mønstre i data.
Reinforcement learning:
Systemer der bliver bedre gennem belønning og straf. Algoritmen kender succeskriterierne. Gennem mange gentagelser bliver modellen bedre til at foretage de valg, der medfører succes. Jo flere gentagelser, des dygtiger bliver computeren til at "vinde".
Eksempel: Google Deep Mind , Mario Reinforcement Learing, Slå krokodillen!
Diagnosticering af modermærkekræft. Algortimen kan genkende møsntre i modermærker med og uden kræft.
Ukrudtbekæmpelse med udkrudsbrænder frem for sprøjtemidler. Algoritmen kan adskille afgrøder fra ukrudt og brænder kun ukrudtet.
Algoritmen genkender mønstre i trafikintensitet og indstiller optimal regulering af trafiklys.
Ansigtgenkendelsesalgoritmer genkender mønstre i ansigtstræk og kan anvendes til optimering af digital sikkerhed.
Begræns svindel i online tjenester, hvor der overføres penge. Algoritmer overvåger brugerens handlinger, og kan forudsige om brugeren er ved at foretage svindel.
I kina kan overvågning af elever, afsløre om de er opmærksomme i timerne. Gaber de? Eller kigger de væk?
Vi vil gerne have glade medarbejedere, for det virker godt på kunderne. Derfor scannes medarbejder for om de ser glade ud. Hvis ikke, kan de miste nogle privilegier på deres arbejde!
Borgere overvåges og genkendes. Hvis de begår en forseelse, bliver der trukket point på deres "borgerkort" og mister evt. nogle privilegier.