Layout

Hur krafter verkar på noder

För layouten av grafen används “Force Atlas 2″, en kraft-baserad algoritm. I grafen tilldelas varje nod (twitterkonto) en tilldragande och en bortskjutande kraft. Noden kommer att attrahera andra konton den har relation till (följer/följs av). Omvänt kommer noder utan relationer att stötas bort. Om två konton ömsesidigt följer varandra är den attraherande kraften dubbelt så stark som om bara en av dem följer varandra. Hur krafterna verkar kan ses i bilderna där twitterkontona som med relationer (A och B) dras till varandra, medan det andra kontot (C) skjuts bort. Krafterna är markerade med röda pilar. Därtill kommer en gravitation som drar noderna mot mitten.

Den stora grafen fungerar på precis samma sätt som illustrationen, men är förstås väldigt mycket mer komplicerad med miljontals relationer mellan de drygt 50 000 kontona. Men principen är den samma – konton som följer varandra dras till varandra, medan andra konton skjuts bort.

Kluster

För att identifiera  kluster använder vi “Modularity” i GephiBeräkningen [pdf]  söker efter delnätverk (kluster) med hög modularitet – det vill säga med stor andel kopplingar (följer/följs) mellan twitterkontona inom klustret och låg andel kopplingar till twitterkonton i andra kluster. Den här beräkningen görs i flera steg. När de olika klustrena skapats tilldelas varje kluster en slumpmässig färg. Att två färger är snarlika (ljusgrön och mörkgrön) betyder ingenting. En del konton blir ensamma i sina kluster, medan andra kluster består av väldigt många konton, allt beroende på vilket som ger högst modularitet.

Det är viktigt att komma ihåg att de kluster vi har pratat om är tolkningar av resultaten av en beräkning. Det är inte jag, eller någon annan, som stoppat in konto x i kategori y. Det är en framräknad tillhörighet för det enskilda kontot baserat på, något förenklat, att relationerna till andra konton inom subnätverket större än till de utanför. Etiketterna på klustren (“bubblan”, “sport”, etc) är etiketter jag (och andra) satt på de olika kluster efter att ha tittat på vilka som ingår och inte. Andra personer kan anse att ett kluster borde kallas för något annat.

Varför hamnar en del konton i andra kluster?

Som beskrivits ovan är det två olika metoder som används för att göra klusterindelningen och för att göra layouten av grafen. Layouten tar inte hänsyn till kluster på något sätt, utan använder sig bara av de ovan beskrivna krafterna. För den som tittar på grafen så är det dock tydligt att olika kluster (färger) i stor utsträckning hamnar tillsammans. En annan skillnad är att kluster är “antingen eller” – antingen tillhör ett konto kluster X eller kluster Y. I layouten finns en hel skala däremellan. Om man tittar på det orangea klustret är det exempelvis tydlig skillnad mellan de högra delarna som innehåller många journalister och politiker, och de vänstra som är mer teknikorienterade. Ett konto som ligger mellan två kluster, alltså har många relationer i båda, ska också hamna i gränslandet.

Men alla konton måste hamna någonstans, och konton med få relationer kan finna att de blir bortskjutna till en position snarare än att de dras till den. Konton som inte har en relation till konto Z skjuter alltså bort kontot, och även om kontot följer ett annat konto så kommer det kontots “grannar” att trycka bort noden. På så sätt kan konton hamna långt bort från andra det följer. Detta kan illustreras med den röda noden som i grafen nedan “skjuts bort” av de båda lila. Trots att den röda bara har en relation (till den gröna noden) hamnar den inte granne med denna – utan hamnar istället närmre de båda lila, som den alltså inte har relationer till.

 

 

 

Leave a reply

required

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>