Konstiga partiledarfrekvenser

 

Är det någon annan som tycker att de listor över partiledarnas vanligaste ord som publicerades i DN idag ser lite konstiga ut?

 

Så här beskrivs listorna i tidningen: 

Vi har undersökt samtliga citat från partiledare som har publicerats i DN, SVD, Expressen och Aftonbladet sedan valet 2010 (eller sedan partiledaren tillträdde). Vi har dessutom analyserat allt som sagts i riksdagens talarstol under perioden. Vi har sedan skapat topp-20-listor över de mest använda orden och ordkombinationerna. Vi har tagit bort de 200 vanligaste orden (exempelvis ”och”, ”eller” och ”att”).

Men ska man då tolka det så att "Europa" är ord nr 201 för Reinfeldt och "offentliga" är nr 213? Även om man tar bort de 200 vanligaste orden är det misstänkt få funktionsord. Så här ser Språkbankens lista över intervallet 201-220 i tidningstext ut:

201 5355 REGERINGEN

202 5325 SENASTE

203 5305 SAMTIDIGT

204 5271 ANNAN

205 5250 ÄNNU

206 5233 THE

207 5178 21

208 5138 0

209 5135 BLIVIT

210 5132 FALL

211 5086 TALET

212 5081 EXEMPEL

213 5054 GAMLA

214 5030 DERAS

215 5019 TIDEN

216 5005 30

217 4998 MIN

218 4997 HENNES

219 4996 SISTA

220 4959 KOMMA

– en betydligt mindre sexig lista än DN:s. Kanske det inte är de vanligaste orden utan de som är överrepresenterade?  Men i så fall borde man väl säga det. Men kanske det blir så här när man undersöker en viss persons språk? Flera metodologiska frågor anmäler sig, men jag tror jag väntar med dem. Det vore i alla fall bra att få reda på mer detaljer om hur uträkningen går till för att man ska kunna ta ställning till om siffrorna verkligen kan användas för att analysera partiledarnas ideologi och retorik. 

 

Det här inlägget postades i Okategoriserade. Bokmärk permalänken.

6 kommentarer till Konstiga partiledarfrekvenser

  1. Stefan Holm skriver:

    Mördande reklam

    DNs statistik kan stämma. Fattar jag rätt, så har de tittat på tal och Språkbanken på texter. I politiken är det ju spökskrivare och – reklambyråer – som står för talen. Det gäller att trumma in ett enkelt reklambudskap: Topporden Europa (Reinfeldt), skolan (Björklund) och företag (Lööf) stämmer gott med, vad resp. vill ha intrummat. Vad man säger i dessa ämnen är en andraplansfråga. Det viktiga är, att åhörarna går hem förvissade om att just dessa saker är partiets hjärtefrågor. Funktionsord och ’öh’ används (sedan Thorbjörn Fälldins dagar) bara av levande talare som Östen Dahl.

  2. Mikael Parkvall skriver:

    Jag har svårt att tänka mig annat än att det är överrepresentation som avses.

  3. Östen Dahl skriver:

    Det finns diverse sajter där man kan tillverka "taggmoln" av texter som grafiskt visar vilka ord som är vanligast. Jag gjorde en sån av en text av Reinfeldt som jag hittade på moderaternas hemsida. Så här blev det:

     

    Som synes finns det några ord som är gemensamma med DN:s lista (arbetsmarknad) men inte så många. Jag lutar åt att DN:s listor bygger på faktiska frekvenser men att dessa är föremål för stora slumpmässiga svängningar, som alla frekvenslistor, i synnerhet sådana som bygger på små korpora.
    Sajten jag använde för att tillverka julgranen heter Tagzedo. Det finns flera andra också – sök på "tag cloud". Det är ganska roligt att leka med de här molnen, fast sajterna fungerar bäst på engelska.

  4. JP skriver:

    Överrepresentation av \'och\' vore intressant

    Om det är överrepresentation som avses, varför har man då tagit bort de 200 vanligaste orden? Jag skulle definitivt tycka att det vore intressant att se graden av överrepresentation av t.ex. och.

  5. Henrik skriver:

    Underligt också att några av "orden" är ordpar som "viktigt att", "vad som", "den nya".

  6. Anita Hallberg skriver:

    Inte tal vare sig här eller där

    Kan inte motstå frestelsen att påpeka att både riksdagens protokoll och tidningarnas "citat" består av text som är redigerad. Riksdagsprotokollet är redigerat av stenografer och tidningstexten av journalister. Som var och en borde inse är det fullständigt meningslöst att räkna antalet "och" i text som består av redigerat tal. Om det finns några ord som man stryker lika mycket som "och" vid redigeringen så skulle det möjligen vara "ju" och "väl", och då talar jag framför allt om riksdagsprotokollet, som jag har lång egen erfarenhet av. Journalistisk redigering är enligt min erfarenhet mycket mer långtgående och kan handla om ren komprimering av budskapet.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *


*

Följande HTML-taggar och attribut är tillåtna: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>