Språk i siffror: alla & topp-8

Som Östen Dahl rapportera om här så har Ethnologe kommit ut i en ny utgåva. Hemsidan har fått en makeover och de har skaffat sig en blogg! Varje språk ackompangeras också av ett diagram över språkets position i ett det så kallade "språkmolnet".

Som Mikael och Östen diskuterade i kommentarerna så är Ethnologue knappast en perfekt källa, men den är bra som översikt över världens språk ändå och intressant att jämföra med andra klassificieringar av släktskap och språkgränser.

Om man är nyfiken på att jämföra olika släktskapsklassificieringar med varandra vill jag rekommendera LinguistLists MultiTree, där kan man se hur olika forskare har delat upp språk och familjer.

Jag har haft anledning att använda mig av en del uppgifter från Ethnologue i en föreläsning och uppdaterade därför nyligen en del uppgifter till denna nya utgåva. Jag tänkte dela med mig av lite intressanta saker jag la märke till i några inlägg. Det kommer bli lite siffertungt, men intressant! Kom alltid ihåg att Ethnologue inte är prefekt.

Språk i världen
Det här är alltså det totala antalet språk som Ethnologue innehåller data om. Observera att ethnologue t.ex. räknar "arabiska" som 30 språk, "samiska" som 14, spanska som ett och portugisiska som ett. Om man vill tala om arabiska eller samiska som ett språk använder Ethnologue termen "makrospråk", en grupp språk som i vissa kontexter anses vara ett.

Ethnologue 2005: 6912
Ethnologue 2009: 6909
Ethnologue 2013: 7105

Upp och nergångar i antal språk kan bero på andra bedömningar mellan vad som är språk respektive dialekt eller att de faktiskt hittat nya språk som de inte inkluderat tidigare. 

Ethnologue ska innehålla kända levande språk, men om man läser i deras tabell över antalet talare av olika språk så finns det 188 med 0 talare och 286 med okänt antal talare. Latin finns till exempel med i ethnologue, listat som havandes noll modersmålstalare. Om tar bort språk med okänt antal talare eller inga får vi kvar 6 631.

Om man är nyfiken på hur många av dessa språk det finns minst en grammatika på så kan jag upplysa om att det i LangDoc cirka 2 580 språk som det finns en grammatika över. 1161 finns det minst en grammatikskiss av. (Tack Harald Hammarström för den här infon.)

Topp-8
Ethnologue räknar väldigt sällan antalet talare själv, de förlitar sig på folkräkningar och liknande för sina siffror. Eftersom de inkluderar så fasansfullt många språk, 7 105, så blir det garanterat fel ibland.

Enligt 2013 års urgåva har 393 av 7 105 språk har mer än 1 miljoner talare var, 85 språk i världen har mer än 10 miljoner talare, 24 har mer än 50 miljoner och 8 språk har mer än 100 miljoner. Här är ethnologues sidor för den här informationen. 

Det här betyder alltså att väldigt många talar väldigt få språk, och att de flesta språk talas av väldigt få. Dessutom så talas vissa språkfamiljer väldigt mycket mer än andra, men mer om det i språkfamilj-inlägget.

Här är topp-8 från ethnologue 2013 med makrospråk inräknade. Makrospråken har citattecken runt sig.

1. ”Kinesiska”   1,197 miljoner
2. Spanska  406 miljoner
3. Engelska   335 miljoner
4. Hindi   260 miljoner
5. ”Arabiska”   223 miljoner
6. Portugisiska   202 miljoner
7. Bengali   193 miljoner
8. Ryska   162 miljoner

Utan makrospåk:

1. Mandarin  848 miljoner

2. Spanska  406 miljoner

3. Engelska   335 miljoner

4. Hindi   260 miljoner

5. Portugisiska   202 miljoner

6. Bengali   193 miljoner

7. Ryska   162 miljoner

8. Japanska 122 miljoner

 

Det största arabiska är språket egyptisk arabiska. Det hamnar, om vi räknar utan makrospråk, på plats 23 med 54 miljoner talare.


Skillnader i topp-8 mellan Ethnologue 2012 och 2009
Portugisiska har gått om Bengali och knipt plats 5. 2009 låg Portugisiska på plats 6 med 178 miljoner och Bengali på plats 5 med 181.
 
** edit. topp-listan utan makrospråk hade fel i sig, det är rättat nu. Uppgifter hämtade från ethnologue, här.
Det här inlägget postades i Okategoriserade. Bokmärk permalänken.

16 kommentarer till Språk i siffror: alla & topp-8

  1. Östen Dahl skriver:

    "… kan jag upplysa om att det i LangDoc cirka 2 580 språk som det finns en grammatika över. 1161 finns det minst en grammatikbeskrivning av." 
    Svårt att förstå! Är "grammatikbeskrivning" möjligen vad de kallar "grammar sketch" i LangDoc? Det borde väl vara "grammatikskiss" på svenska även om det kanske inte är en vedertagen beteckning. 

  2. Hedvig Skirgård skriver:

    @ Östen Ja, det var skiss det skulle var såklart Tack!

  3. Stefan Holm skriver:

    Sagt mir wo die Deutschen sind?

    Vart tog tyskan vägen, Hedvig? Räknar Ethnologue den som ett makrospråk? De sisådär 90 miljoner modersmålstalarna ha varit åtta på din lista. Med annan logik tycker jag både spanskan, engelskan och portugisiskan borde kvala in som makrospråk.
    Ger Ethnologue annars någon förklaring till, varför de portugisisktalande på tre år ökat med 24 miljoner och de bengalidito med 12? Befolkningsexplosion? Slumpmässigt räknefel? Om det senare är fallet, så säger en mattenörd, att skillnaden inte är signifikant. Ett x²-test (chi-kvadrat) ger p=0,67, dvs. lååångt från de 0,05, som är standard i sammanhang som dessa. Dvs. är det osäkerhet i räknandet, så var säkert den inbördes placeringen likadan 2009.

  4. Hedvig Skirgård skriver:

    Hej Stefan
    Ethnologue räknar inte tyska som ett makrospråk, däremot räknas tyska i Saxon och Pennsylvanien som varsinna egna språk osv, allt går att läsa om man påtar runt i familjeträdet för "German" http://www.ethnologue.com/family/17-209
    Jag har inte sett några förklaringar till varför portugisiska är ett, spanska ett, osv. De går säkert att få om man frågar, men sanningen är nog den att man inte ska gå så benhårt på ethnologues klassificeringar. Deras distinktioner mellan vad som räknas som makrospråk och skillnaden inhemskt/invandrat är minst sagt inte superstrikta.
    Kommentarer på ökningar står inte heller de att finna, men om vi överväger att siffrorna baserar sig på b.la folkräkningar i olika länder kan de helt enkelt bero på att ett stort land just gjort en ny folkräkning.
    Det är klart att tyska ska vara med, jag hade gjort ett fruktansvärt misstag och bara räknat de språk som ingick under makrospråken i topp 8, det var inte alls meningen och jag ber så hemskt mycket om ursäkt.
    Om vi tar bort alla makrospråk ska listan se ut så här:
     
    1. Mandarin  848 miljoner
    2. Spanska  406 miljoner
    3. Engelska   335 miljoner
    4. Hindi   260 miljoner
    5. Portugisiska   202 miljoner
    6. Bengali   193 miljoner
    7. Ryska   162 miljoner
    8. Japanska  122 miljoner
    9. Javanesiska 84.3 miljoner

    10. Tyska 83.8 miljoner
     
    Då kommer wu på plats 12 och egyptisk arabiska på plats 23.

  5. Stefan Holm skriver:

    Stå på dig, Hedvig!

    Du ska inte be om ursäkt för någonting, Hedvig! Och du har ingalunda begått något  ’fruktansvärt misstag’, om man inte menar, att vi på ett blogginlägg ska ställa samma krav som på ett vetenskapligt arbete (och då är, så här på långa fredag, mina fruktansvärda misstag oräkneliga). Den, som så vill, kan dela in tyskan i låg-, hög-, schweizisk, österrikisk etc. tyska. Men allesammans begriper de varann, vilket är mer än vi kan säga om skåningar kontra älvdalingar (om de ensturigt håller på sitt uttal).
     
    ’Sagt mir wo die Deutschen sind’  i min rubrik var naturligtvis  en anspelning på Pete Seegers klassiker Where have all the Flowers gone (med hänsyn taget till en parallell tråd här textad på – tror jag – occitanska). Den blev faktiskt än bättre i tysk översättning och är enligt Pete Seeger själv inspirerad av en passage i nobelpristagaren Michail Sjolochovs Stilla flyter Don (Tichij Don).

  6. Erik S skriver:

    Portugisiska

    Den enda anledning som jag kan se till portugisiskans dramatiska utveckling de senaste tre åren är att man tidigare måste gjort något allvarligt fel när det gäller modersmål i Brasilien. Exempelvis att man jämställt "etnicitet" i någon folkräkning med "modersmål" eller att man använt 30 år gamla siffror för folkmängden. En sån här stor skillnad kan i varje fall inte förklaras enbart med vilka afrikanska kreolspråk man betraktar som portugisiska.
    Generellt sett har jag tidigare tyckt att Ethnologue varit ganska uselt som källmaterial. I någon slags jakt på en allt högre totalsiffra har man uppfunnit språk där det inte finns några och presenterat data som känns helt otroliga för den som rör sig ute i den verkliga världen. Men nu kanske dom bättrat sig till den senaste upplagan? Får sätta mig och titta någon gång när jag har tid, om inte annat så ser kartorna väldigt intressanta ut.

  7. Hedvig Skirgård skriver:

    Åter igen; det finns många problem med ethnologue och man ska inte använda den som källa hursomhelst.
    Jag har alltid inbillar mig att ethnologue är så glada i splitting (dela upp språk i flera) och att ta med språk som vi vet oerhört mycket lite om för att de har ambitionen att ha med så många detaljer som möjligt så att användarna senare kan klumpa ihop som de behagar. Jag föredrar det synsättet framför att de ska ha gjort en mer grovkorning uppdelning enligt deras tycke och smak.
    Om man är intresserad av hur olika forskare delar upp språkfamiljer kan jag rekommendera http://multitree.org/.
    Det är klart att det finns många problem med folkräkningar, och säkert ännu mer problem med de andra källorna ethnologue använder och de som vi inte får reda på. Termen makrospråk är ett sätt att försöka hantera de problemen, om folk nu bara svarat "kinesiska" så kan man hantera det samtidigt som man kan ha med de som svara mandarin osv.

  8. Mikael Parkvall skriver:

     
    Som jag tidigare nämnt för Hed så har jag betydligt bättre siffror än vad Ethnologuen har, ifall nån skulle behöva dem.
     
    Annars vet jag inte om en kraftig ökning av portugisiska är särskilt fövånande. Förutom folkökning i Brasilien och Portugal, så expanderar språket extremt snabbt i Afrika, där det numer finns åtskilliga miljoner modersmålstalare.
     
    Och Brailien är extremt lätthanterligt vad gäller skillnader mellan etnicitet och L1, eftersom det faktiskt är ett av världens absolut mest språkligt homogena länder. Off the top of my head vill jag minnas att andeln portugisisktalade är i krokarna av 99%.
     
    Och problemet att skilja portugisiska och kreolportugisiska, slutligen, finns bara på Kap Verde-öarna, som ju under alla omständigheter inte har särskilt stor befolkning.

  9. Östen Dahl skriver:

    Konstig statistik i Ethnologue

    Det är förstås lite oväntat att Brasilien är så språkligt homogent, fast 99 procent portugisisktalande är nog ändå lite i högsta laget med tanke på att 2,36 procent av befolkningen 2009 var född utomlands, enligt Wikipedia.
    Men jag tror Stefan har rätt i sin skepsis mot Ethnologues siffror om portugisiskan. Eftersom Ethnologues tidigare versioner fortfarande är tillgängliga, kan man kontrollera vad som står där och då ser det ut så här:
    Ethnologue uppl Brasilien folkmängd Portugisiska talare i Bras.
    14 (2000) 165,851,000 (1998 UN) 158,000,000 (1997 UBS)
    15 (2005) 184,101,109   163,153,389 (1998) 
    16 (2009) 186,831,000         163,000,000 (1998)
    17 (2013) 190,756,000         187,000,000 (1998)
    (ursäkta ful tabell!)
    Här finns en del märkliga saker. För det första sägs talarsiffrorna alla vara från 1998, men den senaste är mycket högre än de andra. För det andra var det i de tidigare upplagorna en stor diskrepans mellan befolkningen i Brasilien och talarna av portugisiska. Eventuellt är det detta man har upptäckt och försökt rätta till, men utan att ändra året för källan. Befolkningssiffran verkar vara från folkräkningen 2010, men med en egendomlig diskrepans på 25000 personer. Nu finns det några miljoner till. 
    Som tidigare har påpekats har Ethnologue ofta siffror från olika år och det blir särskilt konstigt när man försöker jämka ihop dom med varandra.

  10. Mikael Parkvall skriver:

     
    ”Based on the information about the place of birth of the persons enumerated, data from the 2000 Census sample reveal that there were 510,068 foreigners living in Brazil in 2000.
    (http://www.ibge.gov.br/english/presidencia/noticias/20122002censo.shtm)
     
    Av dessa var mer än en tredjedel portugiser (och Portugal är ju i sig rätt homogent). Vartill förstås kommer en del afrikaner.
     
    Hittade inte motsvarande data från 2010 års folkräkning, trots att jag var duktig och sökte på portugisiska.
     
    Med en befolkning på 200 mille blir ju detta 0,25% utlandsfödda, varav kanske 60% är L1-talare av portugisiska. Det blir bra nära 99% lusofoner i landet.

  11. Stefan Holm skriver:

    Inte ens i de bästa familjer...

    Nu ska väl Ethnologue inte dömas alltför hårt med tanke på, att inte ens vi i husförhörets, folkskolans, personnumrens, folkbokföringens och Statistisk Årsboks förlovade land har någon riktig ordning på antalet modersmålstalare av inomgränses språk – inte ens det svenska! Eller rättare sagt inte hade, förrän en herr Parkvall presenterade sitt gedigna grävande i frågan. Men om Ethnologuerna kommer med misstänkt stora förändringar, så tycker man, att de åtminstone kunde fotnota om varför.
    Och alla omhuldade folk i det gigantiska Amazonas, som saknar tempus, räkneord och färger – är de så förtvivlat få, att de inte ens syns i statistiken? 

  12. Östen Dahl skriver:

    Wikipedia kan också vara ute och cykla ibland

    Det verkar som om uppgiften som jag citerade från Wikipedia om hur många utlandsfödda det finns i Brasilien är helt hämtad ur luften. Siffrorna från 2010 års folkräkning finns här och det framgår att den korrekta siffran – om nu folkräkningen är tillförlitlig – är 592 570.  
    Så Mickes enprocentare kan mycket väl stämma. Men samtidigt är det märkligt att Brasilien har så få invandrare idag med tanke på landets förflutna som invandrarland. Till och med ett land som Finland som har tagit emot jämförelsevis få invandrare har ändå nästan tio gånger så stor andel utlandsfödda. 
    De brasilianare som talar pirahã och andra prekolumbianska språk är inte fler än sådär 150 000, tycks det som. Sen finns det också en del tysktalande och talare av andra europeiska språk men de är inte heller så många. 

     

     

  13. Mikael Parkvall skriver:

     
    Det där med ”att Brasilien har så få invandrare idag med tanke på landets förflutna som invandrarland” är lite intressant – om än huvudsakligen på den ickelingvistiska fronten.
     
    Nu har ju kanske inte just Brasilien (längre?) nån aura av tokharmoniskt bevis på smältdeglandets välsignelser, men det har onekligen invandrarlandet par excellence, alltså USA (exemplifierat av att det just framhölls om sådant på det krogbesök jag just återvänt från).
     
    Nå, i det sammanhanget är det lite kul att nämna att USA inte har en större andel utrikes födda än vad Sverige har.
     
    Må så vara, men vi vet väl alla att på KarlOskar-å-Kristinas tid var ju typ alla jänkare födda i Småland, Kalabrien eller Hessen.
     
    Eller?
     
    Nu till poängen: Kul triviafakta är att andelen utrikes födda typiskt har legat kring 10-15% i USA (vilket också är fallet dagens Sverige) sedan 1685, vilket är en mansålder efter den första permanenta engelskspråkiga bosättningen i landet.
     
    USA har sedan sin tillblivelse aldrig haft en (annat än marginellt) större andel utrikes födda än vad det har idag, och denna andel är lika stor som vad det tråkhomogena lagomlandet Sverige också har.
     
    So much for traditionellt (och tillåtande och öppet) invandrarland kontra yrvaket (och mellanmjölkande och inskränkt) invandrarland.
     
    Och vad det språkliga beträffar har USA inte särskilt mycket fler icke-engelskspråkiga än vad Sverige har icke svenskspråkiga. Vilket inte hindrar at jag rutinmässigt hör (senast i den gångna veckan) hör språkvetare, no less, tala om hur Staterna är på väg att få en spanskspråkig majoritet.
     
    (Ovanstående är dessvärre citerat ur minnet eftersom jag skriver från en reservdator efter att min ordinarie förefaller ha tagits över av Onda Makter. Därav evidensens anekdotiska karaktär).

  14. Stefan Holm skriver:

    Krogsnack

    Nu får du ransonera dina krogbesök, Mikael! Det vet väl varenda människa, att om en generation kommer USA att vara spansk- och Europa arabisktalande.
     
    Fokusera istället på nästa steg: Som barn lärde jag, att I Kina går kinesen / med långa bamburör / och fångar missionärerna / och steker dom i smör. Från äldre, kloka människor hörde jag, att ’en dag står dom i Göteborgs frihamn’ eller ’snart kommer dom med sina spjut’ -  de asiatiska horderna.
     
    Sant, sant! Idag är de i min hemstads hamn. Varenda klädpalta vi bär – från kalsipperna till sviden med det luxuösa (franska, italienska eller svenska) varumärket – har förfärdigats av dessa barbarers kvinnor. Det gäller även datorn och  mobiltelefonen jag knappar på. Och våra vägars vanligaste voiture har de som bekant satt klorna i (gudskepris har den fått behålla det äktsvenskt klingande namnet Volvo).
     
    Så tänk ett steg längre  – spanskan och arabiskan kommer efter ytterligare en generation att vara ersatt av mandarin. Eller kanske något annat: Med lömskt bistånd från kineserna går idag t.ex. Angola (där det, ve och fasa, bor n-gr-r!!!) som en raket och har erbjudit Portugal sina judaspengar för att betala hyggliga tyska bankirers rättmätiga räntekrav. Det kan, hemska tanke, bli en inkörsport för portugisiskan in i vår hävdvunna del av Europa!
     
    Så, snälla Mikael, kom inte och stör vår nattsömn med nå’t vetenskapligt statistiktjafs. Svenskan, och den stackars engelskan, är utsatta – punkt slut!

  15. inga johanson skriver:

    nyheter från Kina om NordKorea

    Stefan! Det finns kineser som är smarta att använda esperanto, för dom har inte tid att vänta på att vi ska lära oss kinesiska. Här får vi deras version av vad som händer i Nord-Korea
    http://www.youtube.com/watch?v=X7N8sO2K6o8

  16. Pingback: Rött, vitt och svart i Nya Världen | LINGVISTBLOGGEN

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *


*

Följande HTML-taggar och attribut är tillåtna: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>