Varifrån kommer den indo-europeiska språkfamiljen?

Nya spännande rön om den indo-europeiska språkfamiljens ursprung! Vad som är ovanligt denna gång är att författarna också producerat en sajt som förklarar projektet för allmänheten och i detalj redovisar data och metod! Historisk lingvistik är ett av de områden i lingvistik där vågorna i debatten går ovanligt höga och också ett område som överlappar med biologi, arkeologi och genetik. Denna artikel har knappat stått oemotsagt och debatten är långt från avslutad. Men det är genom kritik, konflikt och kamp som vetenskapen går vidare, inte sant?

Den vetenskapliga tidskriften Science publicerade nyligen en artikel med nya bevis som stödjer teorin om att den indo-europeiska språkfamiljen kommer från en del av den anatoliska halvön (nutida Turkiet) och inte från pontiska stäppen (nutida Urkaina & Ryssland). Artikeln heter "Mapping the origins and expansion of the Indo-European language family" och är skriven av Bouckaert, Lemey, Dunn, Greenhill, Alekseyenko, Drummond, Gray, Suchard & Atkinson. Artikeln finns tillgänlig i pdf-format på projekets hemsida.

Den indo-europeiska språkfamiljen innehåller bland annat de germanska språken (tyska, svenska, engelska, iständska osv) men även de indo-ariska språken (bengali, hindi, nepali, punjabi osv). Den indo-europeiska språkfamiljens ursprung är mycket kontroversiellt, de två ledande hypoteserna är den anatoliska och den såkallade Kurgan-hypotesen (det finns också en armeniskhypotes). Ett av argumentet  bakom Kurganhypotesen bland annat är spridningen av viss teknologi (t.ex. vagnar) och termer för dessa.

Kurganhypotesen (Bild hämtad från Wikipedia (CC))

Anatolienhypotesen (Bild är en stillbild från en animation från projektets hemsida, © 2012 Mapping the origin of Indo-European)

Här är en illustration från Mapping the indo-european origin-projektet som illustrerar det två olika områdena i fråga. Lägg märke till att de delat upp Kurganhypotesen i två olika områden, de testar två olika versioner av kurganhypotesen.

De som ligger bakom artikeln har alltså också skapat en sajt med fantastiskt fina illustrationer och animationer, men framförallt så har de publicerat mycket av datan som artikeln bygger på och detaljer om vilka metoder de använt. Sådan genomskinlighet gör mig nästan tårögd.

Sajten är riktad till allmänheten och de har lagt energi på att vara lättbegripliga. Jag rekommenderar sektionen "What we did" mycket varmt.

Vad de har gjort

Det har använt sig av data från 103 indo-europeiska språk (varav 20 antika, i.e. förmodligen döda) och de har också valt ut 207 betydelser att jämföra. Målet är att hitta kognater, ord som har ett gemensamt ursprung. Kognater behöver nödvändigtvis inte låta väldigt lika (jmfr Holländksa vijf och Engelska 'five') eller betyda exakt samma sak. För att kunna skilja lån från kognater har de valt att inrikta sig på en del av vokabulären som troligen väldigt sällan utsätts för lånande (släkttermer, kropppsdelar "basverb" och ting som existerar nästan överallt i naturen).

Det här är en sk Swadeshlista som ni kan läsa mer om på wiki. Den första och mest kända listan författades av Morris Swadesh på 50-talet. Den innehöll 100 ord, t.ex. knä, rött, hand och sten. Swadeshlistor kritiseras ofta för att vara eurocentriska eller på andra sätt otillräckliga och/eller obalanserade.

Mer info om språken och kognaterna finns här.

Vad det sen har gjort är att mappa språkens geografiska utspridning (bild) och sedan applicera Bayesian sannolikhetsmodeller för fylogenetik som t.ex. används för att spåra virusutbrott. De har också inkluderat känd information om tidpunkter då man tror att ett språk har splittrats, t.ex. brottet mellan Rumänska och de andra romanska språken när romerska trupper drog tillbaka 270 e.kr. Efter allt detta har de jämfört sannolikheten för att de indo-euopeiska språken kom från anatolien versus pontiska stäppen.

Detta var en mycket kort och inte genomförklarande beskrivning, läs gärna som sagt deras "What we did" samt kommentarerna till detta inlägg. Jag misstänker nämligen att det finns minst två läsare av denna blogg som kan förklara Bayesian modeller för icke-matematiker.

Motargument
Ett av de främsta argumentet för Kurganhypotesen och mot den anatoliska  är att många indo-eurpeiska språk delar en vokabulär för vagnar och kärror. Vagnar tros ha uppkommit 3500 f.kr och sedan ha spritt sig. Detta går inte ihop med den anatoliska hypotesen eftersom den postulerar att IE började sprida sig vid 8000-9500 f.kr.

För mer om argumenet fram och tillbaka rekommenderar jag en artikeln i New York Times och dessa inlägg på GeoCurrents  "Mismodeling Indo-European Origin and Expansion" och "Quentin Atkinson’s Nonsensical Maps of Indo-European Expansion". (Tack Vera och Jenny för länkar.)


Värt att tänka på

Som en icke-ännu-färdigbakad forskare vill jag inte säga för mycket, men det framstår som värt att nämna att många som är involverade i denna debatten inte är lingvister utan t.ex. biologer eller arkeologer. IEs ursprung är sammanfältat med folkvandringar, genetik och spridning av teknik men det kan ibland vara värt att hålla i bakhuvudet vilken doktorsexamen debattörerna har när det utalar sig om språk.

Dessutom är det intressant att fundera över den underliggande konflikten mellan sk kvalitativa versus kvantitativa studier som man ibland kan ana. Det får mig osökt att tänka på Culturomics-inlägget för ett tag sedan och de fördelar och nackdelar som finns med big time data crunching, de motsättning som finns emot sådana metoder och vilka det är som är mest entusiastiska.

Perspektiv
Vad som kan vara bra att påminna sig om i stunder som denna är att den indo-europeiska språkfamiljen är bara en bland många. Ethnologue räknar med att det finns 116 familjer och WALS räknar till 212. Ethnologue räknar med att IE har 426 språk och 2 721 969 619 L1-talare. Den afro-asiatiska språkfamiljen klår oss med 359 495 289 L1-talare och Niger-Kongo klår oss i antal språk, 1 510.

Vi må alltså sitta inne på mycket makt och många L2-talare bland annat pga av vår roll som kolonisatörer, men det finns andra giganter där ute. Alla mår gott av lite perspektiv.

För mer kalldushar rekommderar jag Ethnologues statistiska rapporter, det är korta, lättlästa och mycket uppfriskande. Det är inte alltid okontroverisella eller baserade på pinfärsk data men när det kommer till data över L1-talare och klassificering av alla världens språk är det en av de bästa källor vi har.

För mer om kontroversiella klassifikationer, besök Linguist Lists fantastiska verktyg MultiTree! Där kan du jämföra olika forskares hypoteser om språksläktskap.

Länkar
Orignalartikeln i Science
http://www.sciencemag.org/content/337/6097/957.abstract?sid=192102e8-a5bc-4744-ac5a-5500338ab381

Hela artikeln i pdf-format finns på projektets hemsida
http://language.cs.auckland.ac.nz/

New York Times
http://www.nytimes.com/2012/08/24/science/indo-european-languages-originated-in-anatolia-analysis-suggests.html?pagewanted=all

Washington Post
http://www.washingtonpost.com/national/health-science/researchers-identify-present-day-turkey-as-origin-of-indo-european-languages/2012/08/23/6133c564-ed3e-11e1-b09d-07d971dee30a_story.html

Language log
http://languagelog.ldc.upenn.edu/nll/?p=4142

Det här inlägget postades i Okategoriserade. Bokmärk permalänken.

11 kommentarer till Varifrån kommer den indo-europeiska språkfamiljen?

  1. Stefan Holm skriver:

     
    I grunden är det glottokronologi, som Atkinson et al. ägnat sig åt men en erkänt förfinad sådan: Hänsyn har tagits till fysiska hinder för språkspridning som bergskedjor och vatten (eller avsaknad av vatten) och till kända hållpunkter i tid och rum för dokumenterade indoeuropeiska språk (sanskrit, grekiska, latin, hettitiska, gotiska etc.).
     
    I ’bayesisk fylogenetik’ kan man stoppa in sådana faktorer för att korrigera matematiska funktioner, vilka ju till sin natur är strikt kontinuerliga. Metoden har visat sig mycket framgångsrik vid spårandet av källan till influensaepidemier och till djurarters spridning (i fr.a. Nya världen).
     
    Men nu är det så, att viruspartiklar kommer i enorma mängder, vilket är smaskens inom sannolikhetsläran. Det är också så, att de sprids oerhört snabbt, vilket tillika är smaskens. Språk sprids däremot av relativt få individer och dessutom långsamt (århundraden?). Under tiden inträffar yttre saker av avgörande betydelse i form av naturkatastrofer, klimat- och miljöförändringar, krig, farsoter, övergång till jordbruk osv. – saker flunsaviruset, som ’dansade en sommar’, inte påverkas av.
     
    Språkhistorikerna delar därför bekymmer med meteorologerna: indata är för många och för spretiga för att låta sig inordnas i nå’n känd fördelningsfunktion över sannolikheter. Men stoppar Atkinson m. fl. tålmodigt in ytterligare parametrar i sina bayesiska modeller, så kommer gåta efter gåta att knäckas. I den pontisk-anatoliska diskussionen tänker jag t.ex. på den momentana höjning av Svarta havets yta (över 100 meter), som inträffade c:a 5500 f. Kr. (syndafloden?). Jag tänker också på den klimatförändring, som runt 3000 f. Kr. förvandlade stora delar av ’the fertile crescent’ till den öken den är än idag.
     
    Likt Hedvig inväntar jag spänt kritiken – men undrar samtidigt, varför Atkinson et al. har Sir Colin (Renfrew) som referens men samtidigt inte ’anatolikernas’ lingvistiska förgrundsgestalter Tamaz Gamkrelidze och Vjateslav Ivanov.

  2. Hedvig Skirgård skriver:

    Vetenskapsnyhetskanal på tuberna

    Kan för övrigt tillägga att jag först fick reda på om denna här nya publikationen via en kanal på the tubes som heter "scishow". Där kan man också följa alla senasre uppdateringar om marsexpeditionen och annat gött – dock oftast endast naturvetenskap.
    http://www.youtube.com/watch?v=GWBmBhzbaRY
    Samma gäng driver även en kanal som heter "crashcourse" som har en förträfflig serie om världshistoria
    http://www.youtube.com/user/crashcourse/videos

    Eftersom språkintresserade brukar vara allmänt allmänbildningsintresserade tänkte jag att dessa kanaler kunde vara av intresse.

  3. Jan Wiklund skriver:

    Ständigt denna indoeuropeiska...

    Kul inte minst med det kronologiska stamträdet – men hur är det med alla andra språkfamiljer? Har någon lekt lika ambitiöst med dom? Hur många år är det mellan de västafrikanska språken? Kinesiska och tibetanska? Finska och ungerska?

  4. Stefan Holm skriver:

    Några försöker allt

     
    Jan W. - det finns dom, som jobbar på det. Här är kronologin för flertalet språk norr om ekvatorn. Schemat är hämtat från ’nostratikerna’ vid Moskvauniversitetet (med kompisar vid holländska Leidenuniversitet,  några amerikanska universitet och delvis tyska Max Planck-institutet). Eldsjälen Sergej Starostin gick tyvärr bort alltför ung (52 år) 2005.
    I Sverige var väl en gång fr.a. uralisten Björn Collinder engagerad i diskussionen om ett gemensamt ursprung till världens språk men medgav det vanskliga i att dra slutsatser utifrån en enskild konsonant. Men drömmen finns där – kanske illustrerad av logotypen till denna förnämliga blogg.

  5. Jan Wiklund skriver:

    Kul!

    … men dom här forskarnas karta blir jag inte klok på. Nog talade man väl indoeuropeiska i Norden längre tillbaka än för bara 1000 år sen???

  6. Jan Wiklund skriver:

    PS

    Vad betyder beteckningarna -14.00 etc i nostratikernas diagram? Inte 140.000 år sen väl? För vad betyder då +2.00? Om 20.000 år?

  7. Stefan Holm skriver:

    Rent rysk tideräkning

    I denna egenartade notation betyder -14.00 och +2.00 uppenbarligen 14000 f.Kr. resp. 2000 e.Kr. (dvs. nu). Fattar jag rätt, så avses i diagrammet, att 'boreanska' och 'nostratiska' upphörde att talas som icke uppsplittrade dialekter 13500 f.Kr. medan burushaski, baskiska och aleutiska än idag saknar dialektsyskon, -kusiner, -sysslingar eller -bryllingar. Bevisen för dessa släktskap och tidsspann är givetvis ytterst bräckliga men det är ingen tvekan om, att forskningen som sådan bedrivs högst seriöst av moskoviterna m.fl.    

  8. Jan Wiklund skriver:

    Så färskt?

    Det verkar ju i så fall som om människorna hade börjat sprida sig först i går – eller i alla fall för bara ca 15.000 år sen. Jag hade annars för mig att dom utvandrade från Afrika för minst 50.000 år sen, se http://en.wikipedia.org/wiki/Recent_single_origin_hypothesis
    Vad pratade dom under hela denna tid?

  9. Philip I.K skriver:

    Problematiken med Anatoliska hypotesen är inte bara teknologin av hjul och vagnar. Det är framför allt tidsperioden! Även om alla Indo-Europeiska språk förändrades lika långsamt som Isländskan, så skulle det finnas flera Indo-Europeiska språk idag. PIE delades upp i dialekter, dialekter blev språk, språk delades upp i dialekter igen osv. 

     

    Sen finns det ett annat problem. I Anatolien pratades vissa språk som är inte Indo-Europeiska. Framför allt Hattiska, Kashkiska (om det språket inte var en Hatti dialekt, se Itamar Singer 2007) och Hurritiska bl.a. Om dessa Anatoliska jordbrukare pratade ett Indo-Europeiskt språk, så hade man förväntat sig att a) Språk som Minoiska och Eteo-Cypriotiska skulle likna ett Indo-Europeiskt språk, b) Grekiskan skulle dela massa Indo-Europeiska isoglosser med de IE Anatoliska språken. Istället, så verkar Grekiskan ha ett substratum från Anatolien som liknar ej dessa Indo-Europeiska språk (dvs Hettitiskan, Luviskan, Lydiskan osv). Några exempel (Gk τιτάν ~ Hattiska tittah, Gk τάλα, Άτλας osv ~ Hurriska ta-la[-mi], Gk κοκύαι ~ Hattiska kuka, Gk δεύω ~ Hattiska tewu – för att nämna några). Att jobba endast med gloser räcker inte, men i de fallet verkar även fonologin stämma överens. En bra överblick av den beskrivs av Beekes (2008).

     

    Man vet även rent historiskt, att centrala Anatolien övertogs av Hittiterna runt 1700 f.kr, då Hatti-folket tog deras Siu (stormgudens staty). Innan dess så levde Hittiterna i en begränsad region och bland Assyriska kolonier. 

     

     

  10. Gemene man skriver:

    Språknamn skrivs inte med inledande versal.

  11. Philip I.K skriver:

    @Gemene man: Det var du rätt i, men diskuterar man aldrig lingvistik på svenska, så blir det fel när man ska ställa om från engelskan.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *


*

Följande HTML-taggar och attribut är tillåtna: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>