Svenskspråkiga twitter ökar snabbt. Av de 299 000 konton vi kunnat identifiera har mer än hälften registrerats det senaste året. Från majoriteten av kontona, 171 000, har det skickats minst ett tweet den senaste månaden. De mest aktiva – de som skrivit minst ett tweet om dagen – ökar också och är i dag 53 000.

Median och medelantalet följare, konton som följs och antalet statusuppdateringar har alla ökat sen förra Twittercensus (mätning december 2010).

Nya grupper har börjat twittra och den tidigare starka medie- och journalistnärvaron håller på att spädas ut. Bland de grupper som ökar de senaste åren återfinns sportkluster, kändiskluster såväl som olika geografiska kluster – åtminstone bland de mer aktiva twittrarna.

Läs hela rapporten Twittercensus 2012 [pdf]

Layout

Hur krafter verkar på noder

För layouten av grafen används ”Force Atlas 2″, en kraft-baserad algoritm. I grafen tilldelas varje nod (twitterkonto) en tilldragande och en bortskjutande kraft. Noden kommer att attrahera andra konton den har relation till (följer/följs av). Omvänt kommer noder utan relationer att stötas bort. Om två konton ömsesidigt följer varandra är den attraherande kraften dubbelt så stark som om bara en av dem följer varandra. Hur krafterna verkar kan ses i bilderna där twitterkontona som med relationer (A och B) dras till varandra, medan det andra kontot (C) skjuts bort. Krafterna är markerade med röda pilar. Därtill kommer en gravitation som drar noderna mot mitten.

Den stora grafen fungerar på precis samma sätt som illustrationen, men är förstås väldigt mycket mer komplicerad med miljontals relationer mellan de drygt 50 000 kontona. Men principen är den samma – konton som följer varandra dras till varandra, medan andra konton skjuts bort.

Kluster

För att identifiera  kluster använder vi ”Modularity” i GephiBeräkningen [pdf]  söker efter delnätverk (kluster) med hög modularitet – det vill säga med stor andel kopplingar (följer/följs) mellan twitterkontona inom klustret och låg andel kopplingar till twitterkonton i andra kluster. Den här beräkningen görs i flera steg. När de olika klustrena skapats tilldelas varje kluster en slumpmässig färg. Att två färger är snarlika (ljusgrön och mörkgrön) betyder ingenting. En del konton blir ensamma i sina kluster, medan andra kluster består av väldigt många konton, allt beroende på vilket som ger högst modularitet.

Det är viktigt att komma ihåg att de kluster vi har pratat om är tolkningar av resultaten av en beräkning. Det är inte jag, eller någon annan, som stoppat in konto x i kategori y. Det är en framräknad tillhörighet för det enskilda kontot baserat på, något förenklat, att relationerna till andra konton inom subnätverket större än till de utanför. Etiketterna på klustren (”bubblan”, ”sport”, etc) är etiketter jag (och andra) satt på de olika kluster efter att ha tittat på vilka som ingår och inte. Andra personer kan anse att ett kluster borde kallas för något annat.

Varför hamnar en del konton i andra kluster?

Som beskrivits ovan är det två olika metoder som används för att göra klusterindelningen och för att göra layouten av grafen. Layouten tar inte hänsyn till kluster på något sätt, utan använder sig bara av de ovan beskrivna krafterna. För den som tittar på grafen så är det dock tydligt att olika kluster (färger) i stor utsträckning hamnar tillsammans. En annan skillnad är att kluster är ”antingen eller” – antingen tillhör ett konto kluster X eller kluster Y. I layouten finns en hel skala däremellan. Om man tittar på det orangea klustret är det exempelvis tydlig skillnad mellan de högra delarna som innehåller många journalister och politiker, och de vänstra som är mer teknikorienterade. Ett konto som ligger mellan två kluster, alltså har många relationer i båda, ska också hamna i gränslandet.

Men alla konton måste hamna någonstans, och konton med få relationer kan finna att de blir bortskjutna till en position snarare än att de dras till den. Konton som inte har en relation till konto Z skjuter alltså bort kontot, och även om kontot följer ett annat konto så kommer det kontots ”grannar” att trycka bort noden. På så sätt kan konton hamna långt bort från andra det följer. Detta kan illustreras med den röda noden som i grafen nedan ”skjuts bort” av de båda lila. Trots att den röda bara har en relation (till den gröna noden) hamnar den inte granne med denna – utan hamnar istället närmre de båda lila, som den alltså inte har relationer till.

 

 

 

Jag kommer att skriva ett mer omfattande inlägg om det här, men eftersom det kommer många frågor så ska jag göra en snabb förklaring. Enklast att förklara kluster och hur grafen är uppbyggd är med ett en enkel bild på ett mycket mindre nätverk. Färgerna representerar ”kluster”, alltså samhällen av noder (twitteranvändare) som följer varandra. Vilken färg ett kluster får har ingen betydelse utan är slumpmässigt.

Som också syns i bilden så hamnar noder som har relationer (följs/följer varandra) dras till varandra. De har en attraktion. Omvänt finns en kraft som verkar åt andra hållet – noder som inte följer varandra ”skjuter ifrån” varandra. Så uppstår själva layouten – följare dras till varandra, icke-följare skjuts bort från varandra.

Den stora grafen fungerar precis likadant som denna lilla, förutom att den är väldigt mycket mer komplex. Storleken representerar auktoritet och beräknas på antalet relationer (och relationernas relationer). Men mer om detta vid ett senare tillfälle.

Wikipedia har en text om hur kluster räknas fram.

Läs mer om kraftbaserade visualiseringar.

I vintras presenterade vi Twittercensus – den mest omfattande kartläggningen av Twitter i Sverige. Sedan dess har vi grävt ytterligare i vårt data – material som blanda annat presenterats på SSMX, Webcoast och vid ett antal andra tillfällen. Nu har vi tagit ett nytt grepp och sammanställt den uppdaterade informationen.

Under maj har vi även kompletterat den kvantitativa inhämtningen med att crowdsourca kategorisering av twitterkonton. Syftet med denna kategoriseringen är att undersöka vem som står bakom de olika twitterkontona: är det personer, företag eller organisationer? Tisdagen de 21:e 09:30 presenterar vi de uppdaterade resultaten under ett enkelt webbseminarium. Mer information kommer att publiceras här på bloggen, och under hashtaggen #twittercensus på Twitter.

Under presentationen av Intellecta twittermätning – Twittercensus – i januari februari väcktes frågor om förhållandet mellan konton och personer. Hur stor andel av de identifierade kontona är företag, organisationer, personer eller kanske något annat? För att bringa klarhet i saken ber vi nu alla att hjälpa oss att kategorisera de svenskspråkiga twitterkonton. Välkommen att hjälpa till på www.twittercensus.se. Resultaten kommer att presenteras löpande på webbplatsen, samt på denna blogg.