Sammanfattning
2012 var året när Twitter slog igenom brett i Sverige. Under året registrerades 190 000 nya konton, fler än något år tidigare.
Totalt har vi identifierat 475 000 svenskspråkiga konton. Från knappt hälften av kontona, 219 732, har det skickats minst ett tweet de senaste 30 dagarna. De mest aktiva – de som skrivit minst ett tweet om dagen – ökar också och är i dag 80 000.
Median och medelantalet följare, konton som följs och antalet statusuppdateringar har alla ökat sen förra Twittercensus (mätning mars-april 2012).
Bakgrund
2011 presenterade Intellecta Corporate den första systematiska genomgången av svenskspråkiga twitterkonton. Tidigare fanns estimat på antalet konton baserade på svar i enkätundersökningar. Något mindre försök med manuell datainsamling hade också gjorts. Resultaten från dessa olika mätningar skiljde sig mycket åt. Därför beslutade vi oss för att genomföra en undersökning med målet att kunna presentera en någorlunda tillförlitlig siffra på antalet svenskspråkiga twitterkonton. Mätningen genomfördes under december 2010 och resultaten presenterades i början av 2011. Under mars-april 2012 gjordes en ny mätning med samma metod. Då sparades även relationerna, med och en graf över svenska twitter kunde skapas.
Metod
På ett twitterkonto behöver det inte anges om kontot är svenskt, registrerat i Sverige eller om innehållet i meddelanden är på svenska. Användaren kan manuellt ange en geografisk plats, och det finns en ”språkinställning” för användaren som bland annat styr vilket språk twitter.com ska visas på. Standardinställningen har länge varit engelska och det är bara en minoritet av de konton vi identifierat som svenskspråkiga som faktiskt har svensk språkinställning på twitter. Vad gäller ”plats” är den ett fritextfält och det går utmärkt att fylla med vad som helst: ”Södermalm” går lika bra som ”Stockholm” eller för den delen ”hemma” eller ”universum”. Cirka hälften av de konton vi har identifierat som svenska har inte angivit någon plats.
Att använda angiven ort eller språkinställning är alltså i sig själv inte en tillräcklig metod för att hitta alla svenskspråkiga twittrare. Istället valde vi en metod som bygger på språkigenkänning. Metoden har visat sig fungera bra vid språkidentifiering i stora datamängder, och anses vara tolerant mot felaktigheter.[1]
För varje twitterkonto vi identifierade som svenskspråkigt hämtades alla konton som följer eller följs av det konto. För var och en av dessa analyserades[2] de 100 senaste tweetsen med avseende på språk (om kontot hade skrivit färre än 100 tweets analyserades de tweets som fanns tillgängliga). De konton som twittrade på svenska fick sedermera sina följare analyserade på samma sätt. Om kontot i fråga inte hade tweets på svenska flyttades det till en blockeringslista för att undvika att analyserades igen.
Mätningen gjordes under 24 januari och 14 februari. Totalt analyserades 6 171 929 twitterkonton, och för varje konto lästes de senaste 100 tweetsen in. De som valt att skydda sina statusuppdateringar kunde, av naturliga skäl, inte analyseras. Inte heller de som registrerat ett konto men inte gjort några uppdateringar analyserades. Av de skannade kontona hade 15 procent inte skrivit några meddelanden alls och 4 procent har valt att vara skyddade. Hur många av dessa som är svenskar går dock inte att säga, men vart och ett av dessa konton följdes eller följde åtminstone ett svenskspråkigt konto. Värt att notera är att spamkonton inte sällan är ”tomma”, och det är möjligt att de står för en större eller mindre del av dessa 15%. 1% av kontona har identifierats som avstänga, vilket exempelvis sker när twitter hittar spam-konton. Siffran är anmärkningsvärd eftersom de stängts av under den korta period mellan att vi hittat ett konto (som följer/följs av ett annat konto) och att själva analysen av kontot sker.
inga tweets |
15% |
skyddad |
4% |
avstängd |
1% |
Konton som inte följs av någon, och inte heller följer någon har inte analyserats.
Metoden som har använts är samma som vid tidigare mätningar. De förändringar som har gjorts har varit av optimeringsskäl, och vissa delar av insamlingskoden har förändrats för att kunna hantera den större datamängden. Även vissa kodändringar för att kunna möta förändringar i Twitters API har genomförts. I 2012 och 2013 års datainsamling har även relationer mellan konton sparats vilket möjliggör nya former av nätverksanalyser.
Ett problem med den använda metoden är att om en grupp konton på twitter bara följer varandra och inte heller följs av någon annan, så upptäcks inte dessa konton. Det kan alltså förekomma mindre eller större grupper av konton som inte har någon kontakt med de konton som finns med i denna datamängd. Storleken eller omfattningen av sådana grupper är okänd, men efter förra Twittercensus gjordes ett stickprov där alla som skrev under hashtaggen #melfest (melodifestivalen) under några timmar kontrollerades automatiskt. Inga ytterligare konton hittades då.
Resultaten
Hur många twittrar?
Med den definition som använts vid tidigare mätningar, det vill säga de som skriver på svenska och som gjort minst en uppdatering, så blir siffran 475 000 (475 474). Detta är alltså bruttoantalet svenskspråkiga twitterkonton[3]. Aktivitetsgraden på dessa, och när de senaste uppdaterade sitt konto, varierar. Förra mätningen gav 298 819 konton.
Antalet aktiva
Om vi definierar en aktiv twittrare som någon som skrivit ett tweet under de senaste 30 dagarna så blir siffran 219 732 (164 000 år 2011). Vi vet inte i vilken utsträckning en användare läser tweets. Denna siffra är inte direkt jämförbar med exempelvis Facebooks användarstatistik som presenterar antal inloggade under den senaste månaden.
Grupp som skrivit minst ett tweet den senaste månaden refereras nedan till som “aktiva twittrare”. Om man tillämpar ett ännu hårdare kriterium, att man ska ha twittrar i snitt minst en gång per dag blev antalet förra mätningen 53 000, 2010 års siffra 11 000. 2013 är siffran 80 000. Dessa refereras nedan till som de ”mycket aktiva”.
Andelarna aktiva och mycket aktiva är inte mycket högre nu än vid förra mätningen. Detta kan möjligen förklaras av att twitter vid förra mätningen till till större del bestod av väldigt nyregistrerade konton, eftersom mätningen gjordes i samband med en stor tillväxtpeak.
Förändring över tid
Som synes är registreringstakten, och alltså tillväxttakten, just nu väldigt hög. Det totala antalet konton växer väldigt snabbt och på ett år har antalet konton dubblerats.
Figur 2 antal konton
Aktivitet
Det är svårt att avgöra när ett konto inte längre är aktivt. Ett konto kan skicka ett twittermeddelande, sedan vara tyst i månader och år och sedan skicka ett nytt meddelande. Grafen nedan visar antal konton som skickat senaste meddelandet de senaste 30 dagarna.
Jämförelse mellan nordiska länder
De nordiska länderna skiljer sig väldigt mycket åt i Twitteranvändare. Sverige och Norge utmärker sig med avsevärt högre användning, medan Danmark och Finland har lägre användning. Klusterkartor har i skrivande stund tagits fram för Finland och Danmark, och trots att de är mindre är de huvudsakliga klustren och deras inbördes relation ungefär de samma (teknik, opinionsbildare, sport, kändisar).
Finland | Sverige | Norge (’12) | Danmark | |
Total | 63 632 | 475 474 | 228 915 | 92 594 |
Snitt uppdateringar | 283 | 480 | 368 | 281 |
Snitt följer | 71 | 73 | 125 | 87 |
Snitt följare | 70 | 77 | 120 | 70 |
Median uppdateringar | 10 | 33 | 33 | 9 |
Median följer | 17 | 29 | 49 | 21 |
Median följare | 6 | 11 | 23 | 7 |
Aktiva (twittra senaste 30 dagarna) | 25 965 | 219 732 | 110 390 | 28 851 |
Twittrat >1ggr dag | 5 234 | 79 516 | 32 691 | 6 534 |
Twittrat 1ggr per dag och senaste 30 dagarna | 4 945 | 75 205 | 31 147 | 5 609 |
Geo aktiv på profilen | 9 477 | 92 447 | 40 992 | 16 057 |
Hur mycket twittrar vi?
Antalet tweets olika konton skrivit fördelar sig ojämnt. Som tidigare är det en mycket liten andel som står för den absoluta majoriteten av twittermeddelanden. Detta är genomgående i alla undersökta länder.
Figur 3 Andel av konton som skrivit ett visst antal tweets
Hur många följer och följs?
Figur 4 Andel med visst antal följare
Den stora mängden följer alltså mindre än 100 personer. Värt att notera är att antalet följare i Norge är mycket högre än i Sverige (medel 120, median 23).
Figur 5 Andel som följer visst antal
Kluster
En klusteranalys har gjorts på de mest aktiva twitterkontona[4]. En sökbar och interaktiv visualisering/karta finns på twittercensus.se/graph2013.
Ett kluster är en grupp av konton som delar egenskaper – de följer och följs av samma konton i högre utsträckning än andra konton. Tydliga kluster träder fram när man tittar på de mest aktiva twitterkontona, men att tolka innebörden av dem (vad de olika klustren ”är”) är en subjektiv övning. Att tillhöra ett visst kluster innebär inte att kontona delar andra egenskaper.
Mer information om de olika klustern kommer att publiceras på twittercensus.se.
Kön
Genom att matcha de 500 vanligaste namnen på män respektive kvinnor mot det angivna namnet på Twitter kan ett estimat om kön göras.
Observera att en 28% av twitterkontona inte kunnat analyseras. Detta kan bero, bland annat, på att konton inte anger namn, att namnet inte finns bland de vanligaste namnen eller att kontot är ett företags- eller organisationskonto.
Okänd |
28% |
Man |
37% |
Kvinna |
35% |
I grupperna aktiva respektive mycket aktiva är förhållandena snarlika.
Figur 6 fördelning antal konton, per kön
Intressant är att män har fler följare i snitt (se graf nedan) men medianvärdet är det samma. Detta förklaras av att bland de konton med absolut flest följare är den absoluta majoriteten män. Inga stora skillnader ses i antalet de följer.
Figur 7 Män och kvinnor, snittantal följare
Twitterklient
Varje twittermeddelande identifieras med vilken enhet de skrivits på (totalt finns 5242 olika källor registrerade).
Uppdateringar via mobila enheter utgör tillsammans över 50 % av tweetsen.
Tittar vi specifikt på 2013 står appen ”Twitter för Iphone” ensam för mer än 50%.
Twitter for iPhone | 53.7% |
web | 14.5% |
Twitter for Android | 12.3% |
3.3% | |
Twitter for iPad | 2.2% |
1.7% | |
TweetDeck | 1.6% |
Tweet Button | 1.3% |
Tweetbot for iOS | 1.3% |
Echofon | 0.8% |
iOS | 0.8% |
Twitter for Mac | 0.7% |
twitterfeed | 0.6% |
Mobile Web (M5) | 0.4% |
TweetCaster for Android | 0.3% |
0.2% | |
WordPress.com | 0.2% |
Photos on iOS | 0.2% |
Twitter for Windows Phone | 0.2% |
dlvr.it | 0.2% |
Mobile Web (M2) | 0.2% |
Tweetbot for Mac | 0.1% |
Camera on iOS | 0.1% |
HootSuite | 0.1% |
0.1% | |
Twitterrific | 0.1% |
Tumblr | 0.1% |
TweetCaster for iOS | 0.1% |
foursquare | 0.1% |
FunBeat | 0.1% |
Övriga | 2.2% |
Platsangivelse
Geokodning med GPS eller liknande av tweets stöds av twitter, men används bara i liten utsträckning. I dag har 5% av twittermeddelandena ha platsinformation Endast tweets skrivna 2013 är analyserade, max tweets 100 per konto.
Vid förra mätningen var siffran 4 % av tweetsen (endast tweets 2012).
Diskussion
Diskussionen kommer att publiceras i formen av en rad bloggposter på twittercensus.se.
Kort om några begrepp
Twittermeddelande, tweets och uppdateringar används liktydigt och syftar på ett skrivet meddelande på twitter.
Twitteranvändare, twittrare, person, användare och konton refererar alla till en unika registrerade konton på twitter.com.
Svenska, svenska, svenskar på twitter refererar alla till de som i den här undersökningen identifierats som twittrande på svenska.
Frågor?
Kontakta Hampus Brynolf, hampus.brynolf@intellecta.se eller på telefon 0708-73 33 34. Eller förstås på twitter: @hampusbrynolf.
[1] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.53.9367
[2] Språkanalysen gjordes med N-gram-baserad textkategorisering. Cavnar & Trenkle (1994): ”N-Gram-Based Text Categorization”.
[3] För diskussion om vilka som exkluderas från denna siffra, se metodavsnittet.
[4] För beskrivning av metoden, se http://arxiv.org/abs/0803.0476
Pingback: Jag är längst upp till vänster – Liffemans fria tankar
Pingback: Hampus och den magiska kartan » Jonas Andersson Schwarz
Pingback: Twitter är svårt » JMW
Pingback: Emelie Fågelstedt » Därför väljer jag #Twitter före alla andra
Pingback: Jämställdhet och sociala medier | Allt kommunicerar.