Sammanfattning

2012 var året när Twitter slog igenom brett i Sverige. Under året registrerades 190 000 nya konton, fler än något år tidigare.

Totalt har vi identifierat 475 000 svenskspråkiga konton. Från knappt hälften av kontona, 219 732, har det skickats minst ett tweet de senaste 30 dagarna. De mest aktiva – de som skrivit minst ett tweet om dagen – ökar också och är i dag 80 000.

Median och medelantalet följare, konton som följs och antalet statusuppdateringar har alla ökat sen förra Twittercensus (mätning mars-april 2012).

Bakgrund

2011 presenterade Intellecta Corporate den första systematiska genomgången av svenskspråkiga twitterkonton. Tidigare fanns estimat på antalet konton baserade på svar i enkätundersökningar. Något mindre försök med manuell datainsamling hade också gjorts. Resultaten från dessa olika mätningar skiljde sig mycket åt. Därför beslutade vi oss för att genomföra en undersökning med målet att kunna presentera en någorlunda tillförlitlig siffra på antalet svenskspråkiga twitterkonton. Mätningen genomfördes under december 2010 och resultaten presenterades i början av 2011. Under mars-april 2012 gjordes en ny mätning med samma metod. Då sparades även relationerna, med och en graf över svenska twitter kunde skapas.

Metod

På ett twitterkonto behöver det inte anges om kontot är svenskt, registrerat i Sverige eller om innehållet i meddelanden är på svenska. Användaren kan manuellt ange en geografisk plats, och det finns en ”språkinställning” för användaren som bland annat styr vilket språk twitter.com ska visas på. Standardinställningen har länge varit engelska och det är bara en minoritet av de konton vi identifierat som svenskspråkiga som faktiskt har svensk språkinställning på twitter. Vad gäller ”plats” är den ett fritextfält och det går utmärkt att fylla med vad som helst: ”Södermalm” går lika bra som ”Stockholm” eller för den delen ”hemma” eller ”universum”. Cirka hälften av de konton vi har identifierat som svenska har inte angivit någon plats.

Att använda angiven ort eller språkinställning är alltså i sig själv inte en tillräcklig metod för att hitta alla svenskspråkiga twittrare. Istället valde vi en metod som bygger på språkigenkänning. Metoden har visat sig fungera bra vid språkidentifiering i stora datamängder, och anses vara tolerant mot felaktigheter.[1]

För varje twitterkonto vi identifierade som svenskspråkigt hämtades alla konton som följer eller följs av det konto. För var och en av dessa analyserades[2] de 100 senaste tweetsen med avseende på språk (om kontot hade skrivit färre än 100 tweets analyserades de tweets som fanns tillgängliga). De konton som twittrade på svenska fick sedermera sina följare analyserade på samma sätt. Om kontot i fråga inte hade tweets på svenska flyttades det till en blockeringslista för att undvika att analyserades igen.

Mätningen gjordes under 24 januari och 14 februari. Totalt analyserades 6 171 929 twitterkonton, och för varje konto lästes de senaste 100 tweetsen in. De som valt att skydda sina statusuppdateringar kunde, av naturliga skäl, inte analyseras. Inte heller de som registrerat ett konto men inte gjort några uppdateringar analyserades. Av de skannade kontona hade 15 procent inte skrivit några meddelanden alls och 4 procent har valt att vara skyddade. Hur många av dessa som är svenskar går dock inte att säga, men vart och ett av dessa konton följdes eller följde åtminstone ett svenskspråkigt konto. Värt att notera är att spamkonton inte sällan är ”tomma”, och det är möjligt att de står för en större eller mindre del av dessa 15%. 1% av kontona har identifierats som avstänga, vilket exempelvis sker när twitter hittar spam-konton. Siffran är anmärkningsvärd eftersom de stängts av under den korta period mellan att vi hittat ett konto (som följer/följs av ett annat konto) och att själva analysen av kontot sker.

inga tweets

15%

skyddad

4%

avstängd

1%

 

Konton som inte följs av någon, och inte heller följer någon har inte analyserats.

Metoden som har använts är samma som vid tidigare mätningar. De förändringar som har gjorts har varit av optimeringsskäl, och vissa delar av insamlingskoden har förändrats för att kunna hantera den större datamängden. Även vissa kodändringar för att kunna möta förändringar i Twitters API har genomförts. I 2012 och 2013 års datainsamling har även relationer mellan konton sparats vilket möjliggör nya former av nätverksanalyser.

Ett problem med den använda metoden är att om en grupp konton på twitter bara följer varandra och inte heller följs av någon annan, så upptäcks inte dessa konton. Det kan alltså förekomma mindre eller större grupper av konton som inte har någon kontakt med de konton som finns med i denna datamängd. Storleken eller omfattningen av sådana grupper är okänd, men efter förra Twittercensus gjordes ett stickprov där alla som skrev under hashtaggen #melfest (melodifestivalen) under några timmar kontrollerades automatiskt. Inga ytterligare konton hittades då.

Resultaten

Hur många twittrar?

Med den definition som använts vid tidigare mätningar, det vill säga de som skriver på svenska och som gjort minst en uppdatering, så blir siffran 475 000 (475 474). Detta är alltså bruttoantalet svenskspråkiga twitterkonton[3]. Aktivitetsgraden på dessa, och när de senaste uppdaterade sitt konto, varierar. Förra mätningen gav 298 819 konton.

Antalet aktiva

Om vi definierar en aktiv twittrare som någon som skrivit ett tweet under de senaste 30 dagarna så blir siffran 219 732 (164 000 år 2011). Vi vet inte i vilken utsträckning en användare läser tweets. Denna siffra är inte direkt jämförbar med exempelvis Facebooks användarstatistik som presenterar antal inloggade under den senaste månaden.

Grupp som skrivit minst ett tweet den senaste månaden refereras nedan till som “aktiva twittrare”. Om man tillämpar ett ännu hårdare kriterium, att man ska ha twittrar i snitt minst en gång per dag blev antalet förra mätningen 53 000, 2010 års siffra 11 000. 2013 är siffran 80 000. Dessa refereras nedan till som de ”mycket aktiva”.

Andelarna aktiva och mycket aktiva är inte mycket högre nu än vid förra mätningen. Detta kan möjligen förklaras av att twitter vid förra mätningen till till större del bestod av väldigt nyregistrerade konton, eftersom mätningen gjordes i samband med en stor tillväxtpeak.

Förändring över tid

 

Som synes är registreringstakten, och alltså tillväxttakten, just nu väldigt hög. Det totala antalet konton växer väldigt snabbt och på ett år har antalet konton dubblerats.

 

Figur 2 antal konton

Aktivitet

Det är svårt att avgöra när ett konto inte längre är aktivt. Ett konto kan skicka ett twittermeddelande, sedan vara tyst i månader och år och sedan skicka ett nytt meddelande. Grafen nedan visar antal konton som skickat senaste meddelandet de senaste 30 dagarna.

Jämförelse mellan nordiska länder

De nordiska länderna skiljer sig väldigt mycket åt i Twitteranvändare. Sverige och Norge utmärker sig med avsevärt högre användning, medan Danmark och Finland har lägre användning. Klusterkartor har i skrivande stund tagits fram för Finland och Danmark, och trots att de är mindre är de huvudsakliga klustren och deras inbördes relation ungefär de samma (teknik, opinionsbildare, sport, kändisar).

Finland Sverige Norge (’12) Danmark
Total 63 632 475 474 228 915 92 594
Snitt uppdateringar 283 480 368 281
Snitt följer 71 73 125 87
Snitt följare 70 77 120 70
Median uppdateringar 10 33 33 9
Median följer 17 29 49 21
Median följare 6 11 23 7
Aktiva (twittra senaste 30 dagarna) 25 965 219 732 110 390 28 851
Twittrat >1ggr dag 5 234 79 516 32 691 6 534
Twittrat 1ggr per dag och senaste 30 dagarna 4 945 75 205 31 147 5 609
Geo aktiv på profilen 9 477 92 447 40 992 16 057

 

Hur mycket twittrar vi?

Antalet tweets olika konton skrivit fördelar sig ojämnt. Som tidigare är det en mycket liten andel som står för den absoluta majoriteten av twittermeddelanden. Detta är genomgående i alla undersökta länder.

Figur 3 Andel av konton som skrivit ett visst antal tweets

Hur många följer och följs?

Figur 4 Andel med visst antal följare

Den stora mängden följer alltså mindre än 100 personer. Värt att notera är att antalet följare i Norge är mycket högre än i Sverige (medel 120, median 23).

Figur 5 Andel som följer visst antal

Kluster

En klusteranalys har gjorts på de mest aktiva twitterkontona[4]. En sökbar och interaktiv visualisering/karta finns på twittercensus.se/graph2013.

Ett kluster är en grupp av konton som delar egenskaper – de följer och följs av samma konton i högre utsträckning än andra konton. Tydliga kluster träder fram när man tittar på de mest aktiva twitterkontona, men att tolka innebörden av dem (vad de olika klustren ”är”) är en subjektiv övning. Att tillhöra ett visst kluster innebär inte att kontona delar andra egenskaper.

Mer information om de olika klustern kommer att publiceras på twittercensus.se.

Kön

Genom att matcha de 500 vanligaste namnen på män respektive kvinnor mot det angivna namnet på Twitter kan ett estimat om kön göras.

Observera att en 28% av twitterkontona inte kunnat analyseras. Detta kan bero, bland annat, på att konton inte anger namn, att namnet inte finns bland de vanligaste namnen eller att kontot är ett företags- eller organisationskonto.

Okänd

28%

Man

37%

Kvinna

35%

 

I grupperna aktiva respektive mycket aktiva är förhållandena snarlika.

Figur 6 fördelning antal konton, per kön

Intressant är att män har fler följare i snitt (se graf nedan) men medianvärdet är det samma. Detta förklaras av att bland de konton med absolut flest följare är den absoluta majoriteten män. Inga stora skillnader ses i antalet de följer.

Figur 7 Män och kvinnor, snittantal följare

 

Twitterklient

Varje twittermeddelande identifieras med vilken enhet de skrivits på (totalt finns 5242 olika källor registrerade).

Uppdateringar via mobila enheter utgör tillsammans över 50 % av tweetsen.

Tittar vi specifikt på 2013 står appen ”Twitter för Iphone” ensam för mer än 50%.

Twitter for iPhone 53.7%
web 14.5%
Twitter for Android 12.3%
Instagram 3.3%
Twitter for iPad 2.2%
Facebook 1.7%
TweetDeck 1.6%
Tweet Button 1.3%
Tweetbot for iOS 1.3%
Echofon 0.8%
iOS 0.8%
Twitter for Mac 0.7%
twitterfeed 0.6%
Mobile Web (M5) 0.4%
TweetCaster for Android 0.3%
Google 0.2%
WordPress.com 0.2%
Photos on iOS 0.2%
Twitter for Windows Phone 0.2%
dlvr.it 0.2%
Mobile Web (M2) 0.2%
Tweetbot for Mac 0.1%
Camera on iOS 0.1%
HootSuite 0.1%
Instagram 0.1%
Twitterrific 0.1%
Tumblr 0.1%
TweetCaster for iOS 0.1%
foursquare 0.1%
FunBeat 0.1%
Övriga 2.2%

 

Platsangivelse

Geokodning med GPS eller liknande av tweets stöds av twitter, men används bara i liten utsträckning. I dag har 5% av twittermeddelandena ha platsinformation Endast tweets skrivna 2013 är analyserade, max tweets 100 per konto.

Vid förra mätningen var siffran 4 % av tweetsen (endast tweets 2012).

 

Diskussion

Diskussionen kommer att publiceras i formen av en rad bloggposter på twittercensus.se.

Kort om några begrepp

Twittermeddelande, tweets och uppdateringar används liktydigt och syftar på ett skrivet meddelande på twitter.

Twitteranvändare, twittrare, person, användare och konton refererar alla till en unika registrerade konton på twitter.com.

Svenska, svenska, svenskar på twitter refererar alla till de som i den här undersökningen identifierats som twittrande på svenska.

Frågor?

Kontakta Hampus Brynolf, hampus.brynolf@intellecta.se eller på telefon 0708-73 33 34. Eller förstås på twitter: @hampusbrynolf.

 


[1] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.53.9367

[2] Språkanalysen gjordes med N-gram-baserad textkategorisering. Cavnar & Trenkle (1994): ”N-Gram-Based Text Categorization”.

[3] För diskussion om vilka som exkluderas från denna siffra, se metodavsnittet.

[4] För beskrivning av metoden, se http://arxiv.org/abs/0803.0476

Lämna ett svar

obligatoriskt

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>