Oversettelse: For alle samiske språk gjelder fortsatt den gamle regla: Få alltid noen til å sjekke over at det du skriver er riktig, om du ikke kan språket, skriver innsenderne.(Foto: Privat)
Ikke oversett til samisk med ChatGPT
KRONIKK: Flere ønsker å ta i bruk samisk, og ny teknologi gjør det tilsynelatende enkelt. Men resultatet blir ofte et språk som er uforståelig eller misvisende, skriver innsenderne.
Thomas Brevik KjærstadThomas BrevikKjærstadThomas Brevik KjærstadStipendiat i samisk leksikografi, UiT Norges arktiske universitet
Helen Margaret MurrayHelen MargaretMurrayHelen Margaret MurrayMedleder i Team Saepmie, NTNU felleskap
Publisert
Forskersonen er forskning.nos side for debatt og forskernes egne tekster. Meninger i tekstene gir uttrykk for skribentenes holdninger. Hvis du ønsker å delta i debatten, kan du lese hvordan her.
I det siste har flere kolleger vist interesse for å bruke
samiske språk i forskningsformidlingen sin. Det er gledelig å se at stadig flere får øynene opp for samisk og ønsker å bruke det, men jobben må gjøres manuelt. Det er fortsatt store
utfordringer i maskinoversettelse for små språk.
Finner på svar
For store språk
finnes det digitale oversettelseshjelpemidler: Google Translate, ChatGPT og
lignende verktøy kan gi
brukbare oversettelser av korte tekster. Nordsamisk er nylig lagt til i Google
Translate, med varierende resultat. Situasjonen er enda verre for sørsamisk og lulesamisk, som
fortsatt mangler gode oversettelsestjenester.
Det ganske artige ordet «naamne» viser hvordan ChatGPT helt på egen hånd lager et sørsamisk ord av et norsk ord.
Flere av dem som tar kontakt, har forsøkt å bruke ChatGPT til oversettelser. Problemet er at ChatGPT alltid
er programmert til å gi et svar – også
når den ikke kan. Den har
ingen mulighet til å si at den ikke behersker språket du spør om, og prøver
derfor å «lage» et språk basert på mønstre den har sett i kilder.
Resultatet
kan virke overbevisende for den som ikke kan språket, men det har ofte lite til felles med ekte samisk.
Eksempler:
Setning som skal oversettes: «Mitt navn er Helen og jeg
bor i Trondheim»
ChatGPT (sørsamisk): «Mov naamne Helen jïh bijjem
Trondheimisne»
Riktig sørsamisk: «Mov nomme Helen jïh manne Tråantesne årroeminie»
ChatGPT
(lulesamisk): «Mån namma
li Helen ja mån várrám Trondheimin»
Riktig lulesamisk: «Muv namma l Helen ja årov Roandemin»
Annonse
Det sørsamiske
ordet «bijjem» eksisterer ikke, men er lagd med assossiasjon til «jeg bor», fordi slike setninger ofte har samsvar mellom -r i norsk
og -em i sørsamisk. Men det
hjelper ikke når ordet er
oppfunnet for anledningen.
Det ganske artige ordet «naamne» viser
også hvordan ChatGPT helt på egen hånd lager et sørsamisk ord av et norsk ord.
Vil alltid forsvare egne valg
I begge eksemplene ser vi at ChatGPT klarer å finne
enkelte riktige ord, men bommer totalt på andre. Den gjenkjenner noen
grammatiske former, men bruker dem ikke korrekt. Ved mer komplekse setninger
blir resultatet enda dårligere
– ofte til det punktet at teksten blir uforståelig eller villedende.
For mer avanserte setninger er resultatet så dårlig at vi lar være å ta dem med her, for å unngå å få det på trykk. Man kan i noen tilfeller komme nærmere en korrekt oversettelse ved å
utfordre ChatGPT, for eksempel ved å be den forklare ordvalg eller grammatiske
former, men dette krever at brukeren allerede har gode kunnskaper i språket.
Som oftest vil ChatGPT
forsvare sine egne valg, selv om de mangler rot i virkeligheten.
For kvensk ser det ut til å være litt annerledes. Her
finner ChatGPT langt oftere et ord som gir mening, i hvert fall på finsk. Det
ser ut til å være verre med grammatikken og det kvenske bøyingssystemet.
Skriv manuelt
Annonse
For små språk
er det derfor fortsatt manuell skriving som gjelder. Giellatekno og Divvun ved
UiT har utviklet ordbok, stavekontroll og grammatikkontroll som gjør det enklere å skrive for dem som
allerede kan språket.
Oversettelsestjenesten Giellatekno Apertium ble utviklet
med mål om å gjøre det enklere for folk å skrive på
nordsamisk, for eksempel i sosiale medier.
Den som ikke forstår, kan bruke oversetteren for å få teksten
oversatt fra nordsamisk til norsk, men ikke motsatt vei.
Sjekk med noen som kan språket
Giellatekno har bevisst latt være å publisere oversettere som produserer
dårlig samisk. Store mengder
tullespråk på internett kan være ødeleggende. Nylig ble den grønlandske Wikipedia-siden foreslått nedlagt fordi velmenende brukere oversvømte sidene med dårlige maskinoversatte tekster.
Det finnes likevel maskinoversettere til sørsamisk og lulesamisk, som den estiske
oversettelsestjenesten Neurotõlge,
utviklet av Universitetet i Tartu. Den oversetter med noe bedre resultat enn
ChatGPT.
Men for alle samiske språk
gjelder fortsatt den gamle regla: Få alltid noen til å sjekke over at det du
skriver er riktig, om du ikke kan språket!
TA KONTAKT HER Har du en tilbakemelding på denne kronikken. Eller spørsmål, ros eller kritikk til Forskersonen/forskning.no? Eller tips om en viktig debatt?