Analýza sociální sítě
Jedním z nástrojů integrovaných v produktu i2 Analyst´s Notebook je tzv. Analýza sociální sítě. Analýza sociální sítě je poměrně složitý a komplexní proces, v článku se zaměříme pouze na vysvětlení jejích základních principů využívaných v produktech i2.
Použít, či nepoužít?
Analýza sociální sítě (dále ASS) pomáhá při zkoumání síťových struktur, umožňuje nám pochopit, jak se sítě chovají jako celky, a identifikovat charakteristické prvky v nich obsažené. Poskytuje jak vizuální, tak matematickou analýzu vztahů.
ASS je integrovaná v klíčovém produktu i2 – programu i2 Analyst´s Notebook (ANB). Praxe ukazuje, že ASS nepatří mezi nejpoužívanější funkce. Mnoho uživatelů odrazuje již její název v záložce, a tak se jí raději obloukem vyhýbají.
Ale upřímně, není to škoda si tento nástroj nezkusit, když skrývá tolik potenciálu? Zkusme si pěkně srozumitelně (nematematicky) vysvětlit, k čemu by nám mohla být analýza sociální sítě dobrá.
ASS zkoumá sociální síť jako skupinu navzájem propojených uzlů, mezi nimiž jsou určité vztahy znázorněné hranami. V prostředí ANB uzly a hrany odpovídají termínům „objekt“ a „vazba“.
Objekty v sítích nemusí být pouze jednotlivci (lidé, včely), ale i entity (URL, akcie) nebo skupiny (obchodní firmy, státy). Zásadou je, že se v rámci sítě jedná o objekty stejného typu, které lze modelovat – díky jejich vztahům a interakcím – do sítě. Zkoumat lze vše od mravenišť, přes obchodní vztahy firem až po šíření přenosných nemocí (klidně i v těch mraveništích). ASS má nezastupitelné místo v boji proti praní peněz, organizovanému zločinu nebo terorismu.
Nenechme se tedy zmást pojmenováním analýzy, ASS se neomezuje pouze na sociální vazby (mezilidské vztahy, komunikace ve skupině), ale nabízí vhled i do ekonomických relací (bankovní transakce), informačních a komunikačních technologií (internetový provoz), geografických studií (dopravní infrastruktura) nebo třeba fungování biologických struktur (nervový systém).
U ASS jsou často důležité dva aspekty, které při zahrnutí do výpočtů ovlivní výsledky – zda jsou vazby orientované (a v jakém směru; např. přátelství mezi uživateli sociální sítě Facebook je obousměrnou vazbou, platbu za zboží chápeme jako jednosměrnou vazbu od kupujícího k prodávajícímu) a jestli mají různé váhy (můžou se lišit např. na základě počtu provedených transakcí nebo podle hloubky vztahu mezi dvěma osobami).
ASS v i2
Funkce Analýza sociální sítě integrovaná v ANB pomáhá vyšetřovatelům dešifrovat síťovou strukturu pomocí výpočtu skóre klastrování a centrality.
Klastrování
Klastrování (shlukování) slouží k setřídění objektů sítě do skupin – klastrů. Může nám pomoci identifikovat silně propojené skupiny v rámci sítě. ANB využívá k identifikaci skupin v rámci sítě metriku K-Core (k-jádra). Hodnota K-Core (hodnota jádra skupiny) je maximální skupina objektů, které jsou všechny spojeny s alespoň „k“ dalšími objekty v klastru.
Na obrázku je zobrazena jednoduchá síť s maximální hodnotou jádra skupiny 3. Jejími členy jsou Stanislava, Šárka, Uršula a Tadeáš – každá z těchto osob je totiž propojena třemi vazbami na další členy této konkrétní skupiny. Pokud snížíme hodnotu jádra skupiny na 2, skupina se rozroste o osoby, které jsou napojeny minimálně dvěma vazbami na některého člena dvoujádrového klastru…:
Zobrazený diagram ANB tedy obsahuje vnořenou hierarchii klastrů – začíná skupinou s jedním jádrem (k = 1), která v sobě obsahuje skupinu s dvěma jádry (k = 2), v té je vnořena skupina s třemi jádry (k = 3; v diagramu se jedná o nejvyšší hodnotu, tedy nejkompaktnější klastr).
Centralita
Centralita kvantifikuje důležitost a vlivnost konkrétního objektu pro celou síť, popisuje jeho míru propojenosti a začlenění.
Pokud je v síti dominantní jeden objekt, jedná se o vysoce centralizovanou síť. Takový objekt je nazýván jediným bodem selhání; dojde-li k jeho eliminaci, síť se rozpadne na menší nepropojené podsítě. Méně centralizovaná síť, která nemá jediný bod selhání, je odolnější vůči snaze o její rozbití – i při blokaci některých objektů a vazeb je stále schopna fungovat.
Velmi nízké skóre centrality mají objekty na periférii sítě. Na periferní objekty je často nutné pohlížet jako na ty, které nejsou aktuálně mapované, ale mohou být důležité z pohledu vnějších kontaktů.
Existuje několik měřítek centrality. ANB nabízí z pohledu centrality čtyři základní přístupy: mezilehlost, dosažitelnost, stupeň a vlastní vektor.
Nejjednodušeji lze rozdíl mezi základními měřítky centrality ukázat na tzv. Kite Network (volně přeloženo síť papírového draka) autora Davida Krackhardta. V jednoduchém modelu s deseti objekty jsou propojeny vazbami ty osoby, které spolu pravidelně interagují. Např. Adam komunikuje s Bedřichem, ale ne s Hanou:
Hana je jediným bodem selhání, protože její eliminací by byli Igor a Jarmila odříznuti od informací, kterými disponuje shluk vytvořený kolem Daniely. Ztrátou Hany by se síť rozpadla:
Pojďme se nyní podívat, jak nám jednotlivé metriky centrality pomohou v síti identifikovat objekty zájmu.
Mezilehlost odkryje strážce
Mezilehlost je míra centrality založená na nejkratších cestách. Výpočet se odvíjí od toho, kolikrát může konkrétní objekt přerušit nejkratší cestu mezi všemi dvojicemi objektů v síti.
Pomocí mezilehlosti mohou být v síti identifikování tzv. strážci. Jde o objekty, které jsou nejdůležitější pro propojování podsítí. Eliminací těchto objektů (nebo vazeb z nich vycházejících) dochází k izolaci podsítí. Strážci mohou fungovat jako závora při kontrole toku v síti (např. kontrolovat komunikaci mezi ostatními uživateli v sociální síti).
V ukázkové „Kite Network“ má největší hodnotu mezilehlosti Hana, i když nemá tolik přímých propojení jako mnoho dalších objektů (Hana má 3, zatímco např. Bedřich má 4). Hana se ovšem nejčastěji nachází na nejkratší cestě mezi dvojicemi objektů (vede přes ni nejkratší cesta mezi Františkem a Jarmilou, Františkem a Igorem, Cecílií a Jarmilou atd.). Hana i přesto, že nemá vysoké množství přímých vazeb, zaujímá v rámci sítě jedno z nejlepších míst. Informace může díky velkému množství procházejících cest předávat většině osob v síti:
ANB nabízí posouzení měřítka mezilehlosti nejen pro objekty, ale i pro vazby. Mezilehlost vazeb pomáhá identifikovat nejvlivnější propojení v síti (např. významnou trasu pro výměnu informací).
Dosažitelnost ukáže influencery
Dosažitelnost se určuje ze součtu nejkratších vzdáleností objektu ke všem ostatním objektům. Čím má objekt vyšší hodnotu dosažitelnosti, tím je blíže všem ostatním objektům. Díky tomu lehce přijímá a přenáší informace a má velký vliv na dění v síti.
V našem modelu mají František a Gabriela takovou strukturu vazeb k dalším objektům, že k nim v rámci sítě mohou přistupovat rychleji než kdokoli jiný. Mají nejmenší vzdálenost ke všem ostatním uzlům, jsou tedy ve vynikající pozici pro monitorování toku informací v síti – mají nejlepší přehled o tom, co se v síti děje. Osoby s vysokým skórem dosažitelnosti jsou v ASS někdy označovány jako influenceři.
Při porovnání součtu nejkratších vazeb vedoucích od Františka (5.1 + 3.2 + 1.3 = 14) a od Daniely (6.1 + 1.2 + 1.3 + 1.4 = 15) vidíme, že František má blíže ke všem ostatním objektům než Daniela i přesto, že ta má nejvíce přímých vazeb:
Je důležité, zda se u orientovaných vazeb zohledňují ve výpočtech jejich směry. U stejného objektu může být značný rozdíl v měření vzdáleností příchozích a odchozích cest – objekty mohou mít významně odlišnou schopnost mezi přijímáním a distribuováním informací.
Stupeň zvýrazní spojky
Stupeň centrality je výpočetně nejjednodušší metrika. Měří propojenost objektu z počtu přímých vazeb spojujících zkoumaný objekt s dalšími objekty, naznačuje jeho aktivitu v síti. Objekty s vysokým skórem stupně centrality jsou označovány v síti jako tzv. spojky.
Objekty s vysokým stupněm mají nejlepší spojení s okolními objekty, často se objevují uprostřed shluků. Nemusí být však zákonitě vlivné nebo populární, mohou být pouze strategicky dobře umístěné.
V použitém modelu má nejvíce přímých propojení Daniela (celkem 6), je tedy nejaktivnějším objektem v síti:
V případě existence orientovaných vazeb lze rozdělit výpočet na „stupeň dovnitř“ pro celkový počet příchozích vazeb a „stupeň ven“ pro odchozí vazby. Skóre stupně mohou ovlivnit i váhy vazeb.
Vlastní vektor odhalí autoritu/rozbočovač
Vlastní vektor měří propojenost objektu a jeho přímý vliv na ostatní propojené objekty v síti. Čím více silně propojených objektů daný objekt propojuje, tím je pokládán za významnější.
Vlastní vektor nám poskytuje informace o relativní míře důležitosti konkrétního objektu v síti. Připojení k objektům s vysokým skóre stupně centrality přispívají ke skóre sledovaného objektu více než stejná připojení k objektům s nízkým skóre.
Ukažme si rozdíl ve vlastním vektoru na našem příkladu, soustřeďme se na Cecílii a Hanu. Mají stejné stupně centrality (každá má 3 přímé vazby na další osoby), vlastní vektor je však odlišný. Ten Hanin je nižší proto, že osoby, se kterými je spojená, jsou v rámci celé sítě méně aktivní (František a Gabriela mají sice 5 přímých vazeb, Igor však pouze 2) než osoby, na něž je napojená Cecílie:
Osoba s vysokým skóre vlastního vektoru je často situována ve středu klastru klíčových objektů, se kterými může přímo komunikovat.
Při diferenciaci směru vazeb lze u vlastního vektoru rozlišit míru propojení objektů na „autority“ podle počtu příchozích vazeb a „rozbočovače“ pro odchozí vazby. Na výsledné skóre vlastního vektoru má vliv i případné započítání váhy vazeb.
Závěr
Při použití ASS k analýze sítí je třeba mít na paměti limitující faktor: analýza bude vycházet z dat, která jsou k dispozici. Ta mohou být neúplná nebo nepřesná, kontroverzní může být validita jejich měření, přiřazení směrů a vah, odpovídající určení hranic sítě atd. Proto je třeba dbát zvýšené pozornosti při interpretaci výstupu, aby nedošlo k vyvození mylných závěrů. Výsledky ASS by měly být posuzovány v kombinaci s dalšími zdroji informací.
Analýza sociální sítě je mocný nástroj, který při správné interpretaci a zohlednění všech limitů může poskytnout velmi cenné výsledky.
Zdroje
https://docs.i2group.com/anb/9.4.0/about_social_network_analysis.html
https://en.wikipedia.org/wiki/Social_network_analysis
http://www.orgnet.com/sna.html
https://en.wikipedia.org/wiki/Krackhardt_kite_graph
https://www.researchgate.net/publication/239228599_The_Development_of_Social_Network_Analysis
https://socilyzer.com/guide/network-roles
https://assets.publishing.service.gov.uk/media/5a819b0640f0b62305b8fdb6/socnet_howto.pdf
https://syntagmatic.github.io/exposedata/marvel/data/hero-network.csv