Tmavé pozadí

Analýza sociální sítě

Linda Dittrichová
Linda Dittrichová 24. 1. 2024
Analýza sociální sítě

Jedním z nástrojů integrovaných v produktu i2 Analyst´s Notebook je tzv. Analýza sociální sítě. Analýza sociální sítě je poměrně složitý a komplexní proces, v článku se zaměříme pouze na vysvětlení jejích základních principů využívaných v produktech i2.

Použít, či nepoužít?

Analýza sociální sítě (dále ASS) pomáhá při zkoumání síťových struktur, umožňuje nám pochopit, jak se sítě chovají jako celky, a identifikovat charakteristické prvky v nich obsažené. Poskytuje jak vizuální, tak matematickou analýzu vztahů.

ASS je integrovaná v klíčovém produktu i2 – programu i2 Analyst´s Notebook (ANB). Praxe ukazuje, že ASS nepatří mezi nejpoužívanější funkce. Mnoho uživatelů odrazuje již její název v záložce, a tak se jí raději obloukem vyhýbají. 

Ziskat_vhled.jpg

Ale upřímně, není to škoda si tento nástroj nezkusit, když skrývá tolik potenciálu? Zkusme si pěkně srozumitelně (nematematicky) vysvětlit, k čemu by nám mohla být analýza sociální sítě dobrá.

ASS zkoumá sociální síť jako skupinu navzájem propojených uzlů, mezi nimiž jsou určité vztahy znázorněné hranami. V prostředí ANB uzly a hrany odpovídají termínům „objekt“ a „vazba“. 

Objekty v sítích nemusí být pouze jednotlivci (lidé, včely), ale i entity (URL, akcie) nebo skupiny (obchodní firmy, státy). Zásadou je, že se v rámci sítě jedná o objekty stejného typu, které lze modelovat – díky jejich vztahům a interakcím – do sítě. Zkoumat lze vše od mravenišť, přes obchodní vztahy firem až po šíření přenosných nemocí (klidně i v těch mraveništích). ASS má nezastupitelné místo v boji proti praní peněz, organizovanému zločinu nebo terorismu.

Nenechme se tedy zmást pojmenováním analýzy, ASS se neomezuje pouze na sociální vazby (mezilidské vztahy, komunikace ve skupině), ale nabízí vhled i do ekonomických relací (bankovní transakce), informačních a komunikačních technologií (internetový provoz), geografických studií (dopravní infrastruktura) nebo třeba fungování biologických struktur (nervový systém).

U ASS jsou často důležité dva aspekty, které při zahrnutí do výpočtů ovlivní výsledky – zda jsou vazby orientované (a v jakém směru; např. přátelství mezi uživateli sociální sítě Facebook je obousměrnou vazbou, platbu za zboží chápeme jako jednosměrnou vazbu od kupujícího k prodávajícímu) a jestli mají různé váhy (můžou se lišit např. na základě počtu provedených transakcí nebo podle hloubky vztahu mezi dvěma osobami). 

ASS v i2

Funkce Analýza sociální sítě integrovaná v ANB pomáhá vyšetřovatelům dešifrovat síťovou strukturu pomocí výpočtu skóre klastrování a centrality.

Klastrování

Klastrování (shlukování) slouží k setřídění objektů sítě do skupin – klastrů. Může nám pomoci identifikovat silně propojené skupiny v rámci sítě. ANB využívá k identifikaci skupin v rámci sítě metriku K-Core (k-jádra). Hodnota K-Core (hodnota jádra skupiny) je maximální skupina objektů, které jsou všechny spojeny s alespoň „k“ dalšími objekty v klastru. 

Na obrázku je zobrazena jednoduchá síť s maximální hodnotou jádra skupiny 3. Jejími členy jsou Stanislava, Šárka, Uršula a Tadeáš – každá z těchto osob je totiž propojena třemi vazbami na další členy této konkrétní skupiny. Pokud snížíme hodnotu jádra skupiny na 2, skupina se rozroste o osoby, které jsou napojeny minimálně dvěma vazbami na některého člena dvoujádrového klastru…:

K_Core.jpg

Zobrazený diagram ANB tedy obsahuje vnořenou hierarchii klastrů – začíná skupinou s jedním jádrem (k = 1), která v sobě obsahuje skupinu s dvěma jádry (k = 2), v té je vnořena skupina s třemi jádry (k = 3; v diagramu se jedná o nejvyšší hodnotu, tedy nejkompaktnější klastr). 

Centralita

Centralita kvantifikuje důležitost a vlivnost konkrétního objektu pro celou síť, popisuje jeho míru propojenosti a začlenění. 

Pokud je v síti dominantní jeden objekt, jedná se o vysoce centralizovanou síť. Takový objekt je nazýván jediným bodem selhání; dojde-li k jeho eliminaci, síť se rozpadne na menší nepropojené podsítě. Méně centralizovaná síť, která nemá jediný bod selhání, je odolnější vůči snaze o její rozbití – i při blokaci některých objektů a vazeb je stále schopna fungovat.

Velmi nízké skóre centrality mají objekty na periférii sítě. Na periferní objekty je často nutné pohlížet jako na ty, které nejsou aktuálně mapované, ale mohou být důležité z pohledu vnějších kontaktů.

Existuje několik měřítek centrality. ANB nabízí z pohledu centrality čtyři základní přístupy: mezilehlost, dosažitelnost, stupeň a vlastní vektor.

Nejjednodušeji lze rozdíl mezi základními měřítky centrality ukázat na tzv. Kite Network (volně přeloženo síť papírového draka) autora Davida Krackhardta. V jednoduchém modelu s deseti objekty jsou propojeny vazbami ty osoby, které spolu pravidelně interagují. Např. Adam komunikuje s Bedřichem, ale ne s Hanou:

Kite_Network.jpg

Hana je jediným bodem selhání, protože její eliminací by byli Igor a Jarmila odříznuti od informací, kterými disponuje shluk vytvořený kolem Daniely. Ztrátou Hany by se síť rozpadla:

SPoF.jpg

Pojďme se nyní podívat, jak nám jednotlivé metriky centrality pomohou v síti identifikovat objekty zájmu. 

Mezilehlost odkryje strážce

Mezilehlost je míra centrality založená na nejkratších cestách. Výpočet se odvíjí od toho, kolikrát může konkrétní objekt přerušit nejkratší cestu mezi všemi dvojicemi objektů v síti. 

Pomocí mezilehlosti mohou být v síti identifikování tzv. strážci. Jde o objekty, které jsou nejdůležitější pro propojování podsítí. Eliminací těchto objektů (nebo vazeb z nich vycházejících) dochází k izolaci podsítí. Strážci mohou fungovat jako závora při kontrole toku v síti (např. kontrolovat komunikaci mezi ostatními uživateli v sociální síti).

V ukázkové „Kite Network“ má největší hodnotu mezilehlosti Hana, i když nemá tolik přímých propojení jako mnoho dalších objektů (Hana má 3, zatímco např. Bedřich má 4). Hana se ovšem nejčastěji nachází na nejkratší cestě mezi dvojicemi objektů (vede přes ni nejkratší cesta mezi Františkem a Jarmilou, Františkem a Igorem, Cecílií a Jarmilou atd.). Hana i přesto, že nemá vysoké množství přímých vazeb, zaujímá v rámci sítě jedno z nejlepších míst. Informace může díky velkému množství procházejících cest předávat většině osob v síti:

Mezilehlost.jpg

ANB nabízí posouzení měřítka mezilehlosti nejen pro objekty, ale i pro vazby. Mezilehlost vazeb pomáhá identifikovat nejvlivnější propojení v síti (např. významnou trasu pro výměnu informací).

Dosažitelnost ukáže influencery

Dosažitelnost se určuje ze součtu nejkratších vzdáleností objektu ke všem ostatním objektům. Čím má objekt vyšší hodnotu dosažitelnosti, tím je blíže všem ostatním objektům. Díky tomu lehce přijímá a přenáší informace a má velký vliv na dění v síti. 

V našem modelu mají František a Gabriela takovou strukturu vazeb k dalším objektům, že k nim v rámci sítě mohou přistupovat rychleji než kdokoli jiný. Mají nejmenší vzdálenost ke všem ostatním uzlům, jsou tedy ve vynikající pozici pro monitorování toku informací v síti – mají nejlepší přehled o tom, co se v síti děje. Osoby s vysokým skórem dosažitelnosti jsou v ASS někdy označovány jako influenceři. 

Dosazitelnost.jpg

Při porovnání součtu nejkratších vazeb vedoucích od Františka (5.1 + 3.2 + 1.3 = 14) a od Daniely (6.1 + 1.2 + 1.3 + 1.4 = 15) vidíme, že František má blíže ke všem ostatním objektům než Daniela i přesto, že ta má nejvíce přímých vazeb: 

Porovnani.jpg

Je důležité, zda se u orientovaných vazeb zohledňují ve výpočtech jejich směry. U stejného objektu může být značný rozdíl v měření vzdáleností příchozích a odchozích cest – objekty mohou mít významně odlišnou schopnost mezi přijímáním a distribuováním informací. 

Stupeň zvýrazní spojky

Stupeň centrality je výpočetně nejjednodušší metrika. Měří propojenost objektu z počtu přímých vazeb spojujících zkoumaný objekt s dalšími objekty, naznačuje jeho aktivitu v síti. Objekty s vysokým skórem stupně centrality jsou označovány v síti jako tzv. spojky. 

Objekty s vysokým stupněm mají nejlepší spojení s okolními objekty, často se objevují uprostřed shluků. Nemusí být však zákonitě vlivné nebo populární, mohou být pouze strategicky dobře umístěné.

V použitém modelu má nejvíce přímých propojení Daniela (celkem 6), je tedy nejaktivnějším objektem v síti:  

Stupen.jpg

V případě existence orientovaných vazeb lze rozdělit výpočet na „stupeň dovnitř“ pro celkový počet příchozích vazeb a „stupeň ven“ pro odchozí vazby. Skóre stupně mohou ovlivnit i váhy vazeb.

Vlastní vektor odhalí autoritu/rozbočovač

Vlastní vektor měří propojenost objektu a jeho přímý vliv na ostatní propojené objekty v síti. Čím více silně propojených objektů daný objekt propojuje, tím je pokládán za významnější.

Vlastní vektor nám poskytuje informace o relativní míře důležitosti konkrétního objektu v síti. Připojení k objektům s vysokým skóre stupně centrality přispívají ke skóre sledovaného objektu více než stejná připojení k objektům s nízkým skóre. 

Ukažme si rozdíl ve vlastním vektoru na našem příkladu, soustřeďme se na Cecílii a Hanu. Mají stejné stupně centrality (každá má 3 přímé vazby na další osoby), vlastní vektor je však odlišný. Ten Hanin je nižší proto, že osoby, se kterými je spojená, jsou v rámci celé sítě méně aktivní (František a Gabriela mají sice 5 přímých vazeb, Igor však pouze 2) než osoby, na něž je napojená Cecílie:

Vlastni_vektor.jpg

Osoba s vysokým skóre vlastního vektoru je často situována ve středu klastru klíčových objektů, se kterými může přímo komunikovat.

Při diferenciaci směru vazeb lze u vlastního vektoru rozlišit míru propojení objektů na „autority“ podle počtu příchozích vazeb a „rozbočovače“ pro odchozí vazby. Na výsledné skóre vlastního vektoru má vliv i případné započítání váhy vazeb.

Závěr

Při použití ASS k analýze sítí je třeba mít na paměti limitující faktor: analýza bude vycházet z dat, která jsou k dispozici. Ta mohou být neúplná nebo nepřesná, kontroverzní může být validita jejich měření, přiřazení směrů a vah, odpovídající určení hranic sítě atd. Proto je třeba dbát zvýšené pozornosti při interpretaci výstupu, aby nedošlo k vyvození mylných závěrů. Výsledky ASS by měly být posuzovány v kombinaci s dalšími zdroji informací. 

Analýza sociální sítě je mocný nástroj, který při správné interpretaci a zohlednění všech limitů může poskytnout velmi cenné výsledky. 

 

Zdroje

https://docs.i2group.com/anb/9.4.0/about_social_network_analysis.html

https://en.wikipedia.org/wiki/Social_network_analysis

http://www.orgnet.com/sna.html

https://en.wikipedia.org/wiki/Krackhardt_kite_graph

https://www.researchgate.net/publication/239228599_The_Development_of_Social_Network_Analysis

https://socilyzer.com/guide/network-roles 

https://assets.publishing.service.gov.uk/media/5a819b0640f0b62305b8fdb6/socnet_howto.pdf 

https://syntagmatic.github.io/exposedata/marvel/data/hero-network.csv 

Linda Dittrichová
Linda Dittrichová 24. 1. 2024