Språkkodförvirring

Per-Åke Lindblom upprörs på Språkförsvarets blogg över att Skolverket har "infört engelskspråkiga kurskoder" för språkämnena på gymnasiet. Man kallar till exempel tyska för "ModGer" och franska för "ModFre" där "Mod" står för "moderna språk". Skolverkets representant säger att man följer "internationell standard (ISO 639) för kodsättning av språk", men Per-Åke tycker inte att detta är en godtagbar förklaring och undrar vad det kan finnas för "tungt vägande skäl för denna "reform"".

Nu kan man till att börja med konstatera att ISO 639 faktiskt är den internationella standarden för språkkoder, och jag har lite svårt att förstå att det kan vara fel att använda den, lika lite som andra liknande internationella koder, som till exempel de som finns för länder. Man kan inte heller säga att de här koderna är "engelskspråkiga". Enligt Skolverkets webbsida är den kodtabell som man utgår ifrån ISO 639-3, d.v.s. samma koder som används t.ex. av Ethnologue (i själva verket är det samma organisation, SIL International, som ligger bakom både Ethnologue och koderna, men i det senare fallet har man alltså fått dem antagna (fast med en massa ändringar) av den internationella standardiseringsorganisationen. Tabellen innehåller trebokstavskoder för alla de ca 7000 språk som återfinns i Ethnologue och några till. En trebokstavskod är rimligtvis varken "engelskspråkig" eller någotannatspråkig. Många koder är visserligen inspirerade av språkets vanliga namn, ofta på engelska men också ofta på språket självt (som "kal" för grönländska (kalaallisut) eller "vls" för flamländska (vlaams)). Men eftersom det bara finns 17576 trebokstavskombinationer om man använder 26 bokstäver så blir en stor del av koderna tämligen godtyckliga, som till exempel när det afrikanska språket berta får heta "wti". Man kan förstås genmäla att engelskan ändå dominerar som inspirationsspråk, något som i och för sig är naturligt eftersom SIL är en amerikansk organisation men som ändå kan ses som olyckligt. Frågan är dock om det är allvarligt nog för att man ska bojkotta de här koderna helt. Personligen har jag lite svårt att se att Per-Åkes kritik är befogad. Jag tycker faktiskt det är ganska framsynt av Skolverket att välja ett heltäckande kodsystem med tanke på att ingen vet vilka modersmål som kan dyka upp i skolorna i framtiden.

Skolverkets genomförande av kodprojektet lämnar emellertid en del övrigt att önska. Till att börja med säger man som sagt att man följer ISO 639-3, men det stämmer inte särskilt väl, utan man har blandat olika kodtabeller och dessutom gjort några mer självsvåldiga saker. Mest uppenbart i det här sammanhanget är att "ger" inte återfinns i 639-3 som kod för tyska (eller för något annat språk), utan tyska ska faktiskt heta "deu", alltså tysk- och inte engelskinspirerat. På den här punkten kan man alltså ge Per-Åke rätt i att man har varit onödigt anglifierad. "Ger" finns däremot i kodtabellen 639-2 som används av bibliotek. När det gäller svenska har man gått åt andra hållet och uppger "sve" som kod, vilket inte stämmer med någon nu gällande tabell — i 639-3 står det "swe". "Sve" är koden för serili, ett austronesiskt språk med 330 talare i Indonesien. Om någon av dem kommer till Sverige och vill ha modersmålsundervisning kan det alltså hända att de får en svensktalande lärare. Svenskt teckenspråk har en internationell kod, "swl", men av någon anledning tycker Skolverket att det bär vara "svk", vilket enligt 639-3 är kod för det slovakiska teckenspråket. Det kanske mest uppseendeväckande kodbytet gäller koden "fss" som i 639-3 är finlandssvenskt teckenspråk men som Skolverket menar betyder finlandssvenska, alltså rimligtvis talspråket. Härigenom blir Skolverket den första statliga eller icke-statliga organisation som erkänner finlandssvenskan som eget språk, förmodligen utan större påtryckningar från talarna. Jag vet inte om undervisning i finlandssvenska som modersmål eller främmande språk förekommer i svenska skolor, men detta är möjligen ett tidens tecken.

Och om man sen går över till benämningarna i klarspråk i Skolverkets tabell, så… Uppenbarligen har någon översatt ISO-tabellen rakt upp och ner men dessvärre inte alltid besvärat sig med att kolla vad språken i fråga heter på svenska, och det har inte blivit lyckat. Man har nästan en hel sida med arabiska varieteter, vilket inte är något att säga något om, men många har märkliga namn såsom "Arabiska, South levantiska" och "Arabiska, Uzbekistans". Men det som faktiskt är lite allvarligt är att den högsta skolmyndigheten i Sverige inte har koll på landets nationella minoritetsspråk. Så här ser det ut för romani:

ROM    Romani
RMN    Romani, Balkan
RML    Romani, Baltic
RMC    Romani, Carpathian
RMF    Romani, Kalo finska
RMO    Romani, Sinte
RMU    Romani, Tavringer
RMW    Romani, walesiska
RMY    Romani, Vlax

och för samiska:

SME    Samiska, Norra
SJE    Samiska, Piteå
SMS    Samiska, skolt
SMA    Samiska, Södra
SMJ    Samiska, Luleå
SJT    Samiska, Tornedalen
SJU    Samiska, Umeå

Enligt språkrådet finns i Sverige följande romanivarieteter: arli, kale, kalderaš, lovara och resanderomani — kale är väl samma som "Romani, Kalo finska" och resanderomani är nog "Romani, Tavringer". De samiska varieteterna i Sverige enligt samma myndighet är sydsamiska, umesamiska,  arjeplogssamiska, lulesamiska och nordsamiska — där kan man visserligen se vilken som är vilken, mer eller mindre, men ändå: samtidigt som Nyamko Sabuni delar ut pengar för att stödja sydsamiskans överlevnad, får språket i Skolverkets dokument heta "Samiska, Södra", vilket inte låter som ett språk utan som en järnvägsstation.

Jag tänkte skriva till Skolverket om detta. Alltid roligt att få besserwissra mot ett statligt verk.

Det här inlägget postades i Okategoriserade. Bokmärk permalänken.

13 kommentarer till Språkkodförvirring

  1. Edvin skriver:

    "Romani, walesiska"??  Vad är det för underlig dialekt?  Pinsamt.

  2. Östen Dahl skriver:

    Språket har funnits

    Det är nog i och för sig en verklig romanivarietet med ISO-koden rmv, och om man kallar det "walesisk romani" i stället för "romani, walesiska" så finns det ingenting att anmärka förutom att det knappast torde komma dyka upp några modersmålstalare av detta språk i svenska skolor, eftersom det är mer eller mindre utdött redan.

  3. Jan-Olof skriver:

    Själv tycker jag … kanske något känslomässigt … att det är lite bekymmersamt att den amerikanska missionärsorgisationen SIL som har ett ganska så tvivelaktigt förflutet, tex. från vietnamkriget,  och som uppträder under diverse förklädnande som Wycliffe-bibelöversättarna där det passar dom, ligger bakom de flesta av språkkoderna. Utan att vara speciellet konspirationsteoretiskt lagt måste man ju konstatera att SIL har som uppgift att sprida kristna och speciellt amerikanska högerkristna värden bland världens folk och språk. Många SIL-representanter som jag har talat med har kanske inte varit så medvetna om detta utan snarare tagit för givet att detta är det enda naturliga förhållningssättet här i världen. Iofs kanske det inte spelar så stor roll när det gäller kodingen av världens språk, men SILs underliggande ideer tycker jag måste motarbetas.

  4. Tolken skriver:

    Tack för länken till ISO koderna. Har nu äntligen fattat att EU använder ISO 639-1 på sina tolkkabiner. Men var kommer egentligen SE ifrån, det där som skulle användas före postnumret för några år sen?

  5. Östen Dahl skriver:

    Svar till Jan-Olof

    Det är inte bara så att SIL som Jan-Olof säger ligger bakom de flesta av språkkoderna, de har också av ISO anförtrotts att förvalta dem i egenskap av "Registration Authority". Jag vet inte vad det finns för kriterier för att en organisation ska kunna få ett sådant uppdrag, men jag håller med om att det känns lite märkligt att det kan ges till en "a faith-based nonprofit organization" som SIL International kallar sig själva. Å andra sidan var SIL först ute med själva idén, vilket länder dem till heder, och vi övriga får väl stå där med vår tvättade hals. Sen kan man ha en del synpunkter på hur koderna fungerar, och jag kan tänka mig att ansvaret så småningom tas över av någon neutral organisation.

  6. Östen Dahl skriver:

    Om koden SE

    SE är en landskod och bör alltså inte blandas ihop med språkkoderna. Det finns som bekant flera uppsättningar landskoder men de sorterar alla under ISO 3611.

  7. Skolverket har fortfarande inte motiverat sin "reform"

    För det första: Vad har den internationella standarden för språkkoder och kurskoder på gymnasienivå med varandra att göra?
    För det andra: Kurt Nilsson, undervisningsråd, skrev så här: ” Skolverket har valt att följa internationell standard (ISO 639) för kodsättning av språk. Koden talar också om inom vilket ämne kursen har lästs.” Dessa satser konstaterar bara fakta; de förklarar inte varför dessa språkkoder införts. Om någon frågar mig, varför jag har besvarat detta inlägg av Östen Dahl och jag svarar ”jag valde att besvara Östens inlägg”, så blir ingen blir klokare av detta svar. Om jag däremot svarar att jag anser att skälet är att Östen sår förvirring, så har jag åtminstone angett mitt motiv.
    För det tredje: Samtliga kurskoder, även i språkämnena, på grundskolan liksom alla ämnen förutom språkämnena på gymnasiet är fortfarande svenskspråkiga. Förändringen vad gäller språkämnena på gymnasiet inträffade i år. Se nedanstående exempel:
    Kurskod i gymnasiet fram till 2011                            Kurskod i gymnasium 2011
    (bas: svenska)                                                             (bas: engelska , MOD= modern)
     
    Kinesiska steg 1                  KI1301                               MODCHI01
    Ryska steg 2                      RY1302                               MODRUS02
    Franska steg 3                     FR1303                             MODFRE03
    Tyska steg 4                       TY1304                               MODGER04
    För det fjärde: Östen Dahl tar själv upp andra exempel och påvisar Skolverkets inkonsekvens.
    För det femte: Det vore en annan sak om det fanns ett tvingande, praktiskt skäl för denna ”reform”.  Min fråga är: Kräver utländska universitet fr.o.m. 2011 att svenska studenter på sina ansökningshandlingar och i bifogade betygsdokument ska ange kurskoderna enligt ovan? Vad säger MODGER04  ett tyskt universitet eller MODFRE03 ett franskt universitet? Har Tyskland  och Frankrike ens samma stegsystem som i Sverige? Om jag inte är helt felunderrättad måste svenska studenter som söker sig till amerikanska och brittiska universitet under alla förhållanden genomföra språktester, oavsett vad deras svenska betyg, med eller utan internationella språkkoder, säger. Det var i och för sig några år sedan, men min mellandotter var i varje fall tvungen att klara ett språktest innan hon kunde börja studera vid en engelsk högskola.
    Summa summarum: Om Skolverket kan prestera ett bärande skäl, så måste kanske jag och andra bita i det sura äpplet.

  8. Östen Dahl skriver:

    Jag förstår inte riktigt varför jag sår förvirring, men vad jag menade var så här: Grundtanken, att använda de internationella språkkoderna både för modersmålsundervisning och främmandespråkundervisning är god. Eftersom det i princip finns koder för alla världens språk (eller nästan) så har man därmed beredskap för alla nya språk som kan dyka upp. Men då bör man förstås vara konsekvent och inte blanda olika listor. Och dessutom bör man ta reda på hur språken vanligtvis benämns på svenska, i synnerhet när det gäller våra inhemska språk. 
    Men dessutom gjorde jag en miss igår — nämligen att jag förbisåg att inte bara koden för tyska är tagen från 639-2 och inte från 639-3 som Skolverket hävdar, utan också koden för franska, som faktiskt är "fra" och inte "fre" i den senare tabellen. Så kanske Per-Åke och jag kan komma överens här. När vi nu ser att ISO 639-3 är mindre engelskbaserad än det verkade så kanske Per-Åke kan fås att hålla med om att det kan finnas en poäng med att använda ISO-koderna. Och Skolverket bör tas i örat, men inte för att de använder ISO-koder, utan för att de gör det på ett inkompetent sätt.

  9. Den springande punkten

    Östen,
    det där med "så förvirring" var ju mer för att illustrera att Skolverket inte har gett någon förklaring till varför de har övergått till detta sammelsurium av språkkoder. Du behöver inte ta åt dig! Enligt mina exempel ovan är det uppenbart att de har utgått från engelska.
    Dessutom har du inte kommenterat mitt femte argument. Denna fråga är den springande punkten. Fram till år har det gått alldeles utmärkt att använda kurskoder baserade på svenska. Vad har inträffat, som motiverar förändringen?

  10. Östen Dahl skriver:

    Jag har ingen särskild informationskanal till Skolverket, så jag vet inte vad som har inträffat där. Du kanske vet mer, eftersom du säger att det har "gått alldeles utmärkt att använda kurskoder baserade på svenska". Men med risk att upprepa vad jag har sagt två gånger redan: min känsla är att införandet av de här koderna i första hand motiveras av det stora antalet språk i modersmålsundervisningen. Om du har information om vilka svenskbaserade koder man tidigare har använt för dessa, får du gärna berätta om det. Som språktypolog har jag en del erfarenhet av problemen med att identifiera och benämna språk och kan intyga att man verkligen behöver ett generellt system för språkkoder. Som sagt, jag lyssnar gärna om du känner till något alternativt, svenskbaserat kodsystem. Men jag misstänker att även vi svensktalande hedningar får stå ut med att det som finns är uppfunnet av amerikanska "evangelicals". Och jag skulle gärna se att Skolverket konsekvent höll sig till ISO 639-3 i stället för det som nu finns — jag håller gärna med om att det är ett sammelsurium.

  11. Stefan Holm skriver:

    Att kalla en spade för en spade

    Förlåt en okunnig men vad fyller kurskoderna alls för funktion? Per-Åke säger, att de inte förstås utomlands och Östen att de inte följer ISO-standard. Med koder eller förkortningar vill man väl…
     
    …antingen externt kommunicera (med dem det gäller) – då kan man beteckna ’tyska steg 4’ med klartexten ’Tyska 4’ i st.f. en 8-ställig kufisk kod som ’MODGER04’?
    …eller internt effektivisera dokumentation, analys, statistik, databehandling etc. – då är en (matematisk) matrisform att föredra alla dar i veckan.
     
    Mina erfarenheter är, att hemmasnickrad nomenklatur med ambition att samtidigt vara (1) självförklarande (2) maskinellt behandlingsbar (3) heltäckande och (4) stå sig över tid oftast redan vid sitt sjösättande är obsolet i en föränderlig värld.
     
    Är det månne chefen, major Björklund, man vill behaga med militärinspirerade förkortningar och, enligt dennes kända preferenser, ge en doft av det ledande NATO-språket?

  12. Östen Dahl skriver:

    Koders förgänglighet m m

    Stefan, kan du förklara vad du menar med "matematisk matrisform"? 
    De flesta läroanstalter håller sig numera med kurskoder. Om man ska läsa på vår institution börjar man till exempel med Introduktion till lingvistik som har koden LIN111. Man kan fråga sig varför, men utbildningsbyråkraterna verkar tycka att det ska vara på det viset. Sen ingår det förstås i byråkratin att man måste byta ut alla koder mot nya så där vartannat år eller så. Det gäller ju att hålla folk sysselsatta.
    I lingvistiken är poängen med språkkoderna bland annat att man ska ha ett entydigt sätt att referera till språk. Det brukar ju finnas ett otal namn på varje språk och samma namn kan stå för helt olika språk och språkvarieteter. Men även i lingvistiken råkar vi ut för reformraseriet. När Ethnologues koder skulle upphöjas till internationell standard ändrade man samtidigt på ungefär 25 procent av koderna vilket gjorde alla gamla tabeller värdelösa. Intet är beständigt inte ens ISO-standarder.

  13. Stefan Holm skriver:

    Led överhoppat

    Oj, jag hoppade visst över ett tankeled och jämförde äpplen med päron. Klartext ska alla ha såväl internt som externt. Det jag tänkte på var, hur man bygger sin databas. Utan att vara insatt i sak kan jag inbilla mig, att Skolverket vill länka ’Tyska 4’ till ’humaniora’, ’språk’, ’moderna språk’, ’hemspråk’, ’nivå’, ’institutioner’, ’lärarantal’, ’antagningskrav’, ’arbetsmarknad’, ’historik’ och – ja, gud vet vad. I datorer betyder detta trädstrukturer och matriser. Sedan är ju allt under skalet på en dator matematik, så det var ett överflödigt ord från min sida.
     
    Poängen var, att det som i programkod kan heta t.ex. ’hum.ling.mod[ej_hem].ger[4]’ inte behöver presenteras för andra än datanördar på motsvarande formelspråk.
     
    Ethnologues treställiga koder är något helt annat: de är (faktiska och praktiska) förkortningar; de är internationellt accepterade; de behöver (väl?) bara justeras, när språk dör eller dialekter får språkstatus och; de är i huvudsak till för fackfolk.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *


*

Följande HTML-taggar och attribut är tillåtna: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>