Hva er egentlig en språkmodell?

Kort fortalt, når folk flest snakker om at en AI har skrevet noe, så er det de egentlig mener at en språkmodell har generert teksten. Inntil svært nylig var AI for folk flest enten noe man spilte mot i dataspill, eller noe fra Science fiction. Men det er noe annet enn en chatbot eller?

På slutten av 2022 skjedde det noe som endret spillereglene totalt: ChatGPT ble lansert. Plutselig hadde vi ikke en dum robot som fulgte et manus, men en samtalepartner som kunne skrive en bursdagssang til bestemor (med innmari dårlige rim), forklare kvantefysikk som om du var fem år, og til og med skrive fungerende datakode. Motoren bak dette kalles en språkmodell.

Men hva ER det? Tenk på en språkmodell på denne måten: Se for deg en person som har lest absolutt alt. Hver eneste bok som noensinne er skrevet, alle Wikipedia-sider på alle språk, alle nyhetsartikler, alle blogginnlegg og alle diskusjoner på alle nettforum. Etter å ha slukt all denne informasjonen, har ikke denne personen “forstått” verden som et menneske, men den har blitt en mester i mønstre. Den vet, med skremmende høy nøyaktighet, hvilket ord som mest sannsynlig kommer etter et annet i enhver tenkelig setning.

En språkmodell er i bunn og grunn en ekstremt avansert, statistisk mønstergjenkjenner. Den genererer ikke tekst basert på en bevissthet eller en forståelse av verden, men ved å kontinuerlig beregne hva som er den mest logiske og sannsynlige fortsettelsen på teksten så langt. De blir ofte beskrevet som “veldig avansert autokorrektur”, og det er egentlig en grei oppsummering av hvordan det funker.

Forskjellen fra tidligere chatboter at datamengden den er trent på, og den underliggende teknologien (såkalte Transformers, en arkitektur Google fant opp), er så vanvittig mye kraftigere. Det gjør at den kan holde en rød tråd gjennom lange samtaler, fange opp nyanser og skape originalt innhold som er nesten umulig å skille fra noe et menneske har skrevet.

Vi er ikke helt i en science fiction-fremtid enda. Dagens språkmodeller finner opp flere fakta enn Donald Trump, misforstår instruksjoner og mangler ekte resonneringsevne. Foreløpig fungerer de ikke selvstendig. Men de er allerede utrolig effektive som verktøy. På denne nettsiden skal jeg dele tips og idéer til hva man kan bruke disse språkmodellene til.



De mest interessante språkmodellene:

Gemini - Som nevnt handler språkmodeller om å bruke store mengder data, og ingen sitter på mer data enn Google. Gemini er spesielt overlegen på grunn av det vesentlig større kontekstvinduet, det vil si at den kan ta inn og ut mye større mengder tekst uten å “glemme” noe.


Gemini AI studio - Det er samme språkmodell som over, men her får du tilgang til litt finjustering. Irriterer du deg over at språkmodeller tar i deg med silkehansker og nærmest sleiker deg i rævva? Skru ned vennligheten i AI studio. Da får du svaret du ber om uten noe pynt.

ChatGPT - Originalen. Teknisk sett var det google som oppfant teknologien, men ChatGPT var de som definerte standarden for hva en språkmodell skal være. De er fortsatt i eliten, og ender opp med å være den jeg bruker mest - bare av gammel vane.

Claude - Mest “personlighet” og visstnok best på programmering. Anthropic som står bak Claude gjør mye interessant forskning, og har blant annet laget en versjon av Claude som tror den er Golden Gate-broa i San Fransisco.

Deepseek - Denne har havnet langt bak, men var svært spennende da den kom, siden den var nesten like god som State of the art-modellene fra OpenAI til en liten brøkdel av prisen. I dag synes jeg den er mest interessant fordi den er kinesisk, og det kan være ganske gøy å prøve å få den til å snakke om kinesisk politikk. Det nekter den!

Gemini Diffusion - Denne er mest interessant fordi det er en helt annen bakenliggende teknologi enn de andre modellene, som gjør den opp til 20x raskere enn konkurrentene.

Previous
Previous

KI = Kanskje Indere

Next
Next

Gemini Diffusion: En ny type språkmodell