TYVÄRR ÄR SEMINARIET FULLT. Följ livesändningen här på twittercensus.se

Nu är det äntligen dags för årets presentation av Intellectas Twittercensus – den mest omfattande mätningen av svenska Twitter. Hur ser användargrupperna ut idag och hur förändras deras beteende? Var sker de största förändringarna? Detaljerad statistik på makro- och mikronivå ger svar på frågorna om Twitters utveckling och användande i Sverige. För första gången kommer vi också att presentera jämförelsedata från Norge, Danmark och Finland.

  • Hampus Brynolf, chef för digital strategi på Intellecta Corporate, berättar om trender och analyserar resultaten av årets genomlysning.
  • Presentationen äger rum tisdagen den 12 mars klockan 15.00-16.30 på Birger Jarlsgatan 57B, Spårvagnshallarna.
  • Mingel från 16.30.
  • Obligatorisk anmälan nedan.

Press, media och bloggare kan höra av sig till hampus.brynolf@intellecta.se för bokning av intervjuer eller fördjupande presentation av datan.

Finnish twittercensus live on finnishtwitter.com 10.00 CET

Twittercensus 2013 will be presented in February and March. First – the Finnish analysis will be presented the 19th on finnishtwitter.com, followed by the Danish Twittercensus hosted by Bysted on the 21st.  The Swedish Twittercensus 2013 will be presented at Intellecta the 13th of March.

The three presentations will all contain information about active users, total number of accounts, graphs over registration dates as well as cluster graphs of the active twitter user.

Finnish twittercensus can be found on finnishtwitter.com

Layout

Hur krafter verkar på noder

För layouten av grafen används ”Force Atlas 2″, en kraft-baserad algoritm. I grafen tilldelas varje nod (twitterkonto) en tilldragande och en bortskjutande kraft. Noden kommer att attrahera andra konton den har relation till (följer/följs av). Omvänt kommer noder utan relationer att stötas bort. Om två konton ömsesidigt följer varandra är den attraherande kraften dubbelt så stark som om bara en av dem följer varandra. Hur krafterna verkar kan ses i bilderna där twitterkontona som med relationer (A och B) dras till varandra, medan det andra kontot (C) skjuts bort. Krafterna är markerade med röda pilar. Därtill kommer en gravitation som drar noderna mot mitten.

Den stora grafen fungerar på precis samma sätt som illustrationen, men är förstås väldigt mycket mer komplicerad med miljontals relationer mellan de drygt 50 000 kontona. Men principen är den samma – konton som följer varandra dras till varandra, medan andra konton skjuts bort.

Kluster

För att identifiera  kluster använder vi ”Modularity” i GephiBeräkningen [pdf]  söker efter delnätverk (kluster) med hög modularitet – det vill säga med stor andel kopplingar (följer/följs) mellan twitterkontona inom klustret och låg andel kopplingar till twitterkonton i andra kluster. Den här beräkningen görs i flera steg. När de olika klustrena skapats tilldelas varje kluster en slumpmässig färg. Att två färger är snarlika (ljusgrön och mörkgrön) betyder ingenting. En del konton blir ensamma i sina kluster, medan andra kluster består av väldigt många konton, allt beroende på vilket som ger högst modularitet.

Det är viktigt att komma ihåg att de kluster vi har pratat om är tolkningar av resultaten av en beräkning. Det är inte jag, eller någon annan, som stoppat in konto x i kategori y. Det är en framräknad tillhörighet för det enskilda kontot baserat på, något förenklat, att relationerna till andra konton inom subnätverket större än till de utanför. Etiketterna på klustren (”bubblan”, ”sport”, etc) är etiketter jag (och andra) satt på de olika kluster efter att ha tittat på vilka som ingår och inte. Andra personer kan anse att ett kluster borde kallas för något annat.

Varför hamnar en del konton i andra kluster?

Som beskrivits ovan är det två olika metoder som används för att göra klusterindelningen och för att göra layouten av grafen. Layouten tar inte hänsyn till kluster på något sätt, utan använder sig bara av de ovan beskrivna krafterna. För den som tittar på grafen så är det dock tydligt att olika kluster (färger) i stor utsträckning hamnar tillsammans. En annan skillnad är att kluster är ”antingen eller” – antingen tillhör ett konto kluster X eller kluster Y. I layouten finns en hel skala däremellan. Om man tittar på det orangea klustret är det exempelvis tydlig skillnad mellan de högra delarna som innehåller många journalister och politiker, och de vänstra som är mer teknikorienterade. Ett konto som ligger mellan två kluster, alltså har många relationer i båda, ska också hamna i gränslandet.

Men alla konton måste hamna någonstans, och konton med få relationer kan finna att de blir bortskjutna till en position snarare än att de dras till den. Konton som inte har en relation till konto Z skjuter alltså bort kontot, och även om kontot följer ett annat konto så kommer det kontots ”grannar” att trycka bort noden. På så sätt kan konton hamna långt bort från andra det följer. Detta kan illustreras med den röda noden som i grafen nedan ”skjuts bort” av de båda lila. Trots att den röda bara har en relation (till den gröna noden) hamnar den inte granne med denna – utan hamnar istället närmre de båda lila, som den alltså inte har relationer till.

 

 

 

Jag kommer att skriva ett mer omfattande inlägg om det här, men eftersom det kommer många frågor så ska jag göra en snabb förklaring. Enklast att förklara kluster och hur grafen är uppbyggd är med ett en enkel bild på ett mycket mindre nätverk. Färgerna representerar ”kluster”, alltså samhällen av noder (twitteranvändare) som följer varandra. Vilken färg ett kluster får har ingen betydelse utan är slumpmässigt.

Som också syns i bilden så hamnar noder som har relationer (följs/följer varandra) dras till varandra. De har en attraktion. Omvänt finns en kraft som verkar åt andra hållet – noder som inte följer varandra ”skjuter ifrån” varandra. Så uppstår själva layouten – följare dras till varandra, icke-följare skjuts bort från varandra.

Den stora grafen fungerar precis likadant som denna lilla, förutom att den är väldigt mycket mer komplex. Storleken representerar auktoritet och beräknas på antalet relationer (och relationernas relationer). Men mer om detta vid ett senare tillfälle.

Wikipedia har en text om hur kluster räknas fram.

Läs mer om kraftbaserade visualiseringar.

Svenskspråkiga twitter ökar snabbt. Av de 299 000 konton vi kunnat identifiera har mer än hälften registrerats det senaste året. Från majoriteten av kontona, 171 000, har det skickats minst ett tweet den senaste månaden. De mest aktiva – de som skrivit minst ett tweet om dagen – ökar också och är i dag 53 000.

Median och medelantalet följare, konton som följs och antalet statusuppdateringar har alla ökat sen förra Twittercensus (mätning december 2010).

Nya grupper har börjat twittra och den tidigare starka medie- och journalistnärvaron håller på att spädas ut. Bland de grupper som ökar de senaste åren återfinns sportkluster, kändiskluster såväl som olika geografiska kluster – åtminstone bland de mer aktiva twittrarna.

Läs hela rapporten Twittercensus 2012 [pdf]