-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy path03-centralidad.Rmd
752 lines (613 loc) · 42 KB
/
03-centralidad.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
---
output:
word_document: default
html_document: default
---
```{r setup, include=FALSE}
library(kableExtra)
library(igraph)
```
# Centralidad
La centralidad es uno de los conceptos más antiguos del ARSo. Un actor central puede ser alguien que tiene numerosos vínculos con otros actores (grado), alguien que está más cerca (en términos de distancia del camino) a todos los demás (cercanía), alguien que se encuentra en el camino más corto (geodésico) entre dos actores cualesquiera (intermediación), o alguien que tiene vínculos con otros actores muy centrales (eigenvector). En algunas redes, los mismos actores obtienen una puntuación alta en las cuatro medidas, en otras no.
Por supuesto, hay más de cuatro medidas de centralidad. UCINET implementa más de 20, el programa R CINNA incluye más de 40, y [David Schoch ha creado una tabla periódica interactiva de más de 100 medidas de centralidad](http://schochastics.net/sna/periodic.html).
Aquí discutiremos las tres centralidades más comunes, originalmente desarrolladas por Freeman [-@Freeman1979], es decir: grado, cercanía e intermediación. Además, otras medidas importantes serán introducidas como eigenvector [@Bonacich1987], grados de entrada y salida [@Wasserman1994] y centros de actividad y autoridades [@Kleinberg1999]. Para diferenciar entre medidas destinadas para datos dirigidos y no-dirigidos, dividiremos el capítulo en dos secciones. Adicionalmente, utilizaremos el marco teórico, originalmente postulado por Freeman [-@Freeman1979], utilizado en @Cunningham2016 para clasificar las medidas de centralidad en tres familias: medidas basadas en frecuencia, medidas basadas en distancia y medidas basadas en caminos. Como en todos los capítulos, este concluirá con un ejercicio práctico en Gephi.
## Datos No Dirigidos: Centralidad y Poder
Aquí consideramos algunas de las medidas de centralidad apropiadas para trabajar con datos no dirigidos. Para clarificar algunas de las similitudes y diferencias entre estas medidas, serán presentadas utilizando el sistema de clasificación en @Cunningham2016. Específicamente, en tres secciones:
- Basadas en frecuencia: la característica unificadora de estas es el enfoque en la frecuencia con la que un actor tiene vínculos con otros en la red. Por ello, estas suponen que la alta frecuencia de enlaces es correspondiente a poder o importancia en la red.
- Basadas en distancia: estas asumen que las distancias entre actores es el factor principal en determinar la centralidad y poder de cada nodo.
- Basadas en caminos: estas se basan en la ubicación de un nodo en la red, principalmente si esta ubicación es una posición de corretaje o intermediación.
### Medidas Basadas en Frecuencia
#### Centralidad de Grado
La centralidad de grado es la medida más simple y fácil de calcular y entender, por ello comisaremos aquí. Esta medida se define como el conteo de vínculos de un actor. En una red no dirigida, no tomamos en cuenta si estos enlaces son “de” o “hacia” el nodo. Con esto en mente, para una red binaria la centralidad de grado se define formalmente como:
$$
C_i^{deg} = \sum\limits_{j=1}^n x_{ij}
$$
Donde la medida se calcula para todos los nodos en un grafo. Es decir, el grado se define como la suma de los vínculos entre un nodo ($i$) hacia actores adyacentes ($x_{ij}$). Por ejemplo, el grado de centralidad de los nodos en la Figura \@ref(fig:3-3-degree) aparecen en la Tabla \@ref(tab:3-3-dscores). El nodo con mayor grado en este grafo es A puesto a que se encuentra enlazado con cuatro otros, D y E tienen un grado de centralidad de dos y finalmente C y B tienen un grado de uno.
```{r 3-3-degree, fig.cap = "Grafo no dirigido"}
g <- graph_from_literal(A--B, A--C, A--D, A--E, E--D)
g %>% my_igraph()
```
```{r 3-3-dscores}
g %>%
set_vertex_attr(name = "grado", value = degree(.)) %>%
get.data.frame(what = "vertices") %>%
kableExtra::kbl(., caption = "Tabla de índices, grado", booktabs = TRUE,
row.names = FALSE, col.names = c("Nombre", "Grado")) %>%
kable_styling(latex_options = "striped", position = 'center',
full_width = TRUE)
```
Existen múltiples maneras de calcular esta medida de manera programática. Sin embargo, el método más simple es multiplicar la matriz de adyacencia por un vector de unos, donde el largo del vector es correspondiente a el número de vértices en el grafo [@Meghanathan2016]. La siguiente operación ilustra como computar dicho índice.
$$
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 1 \\
B & 1 & 0 & 0 & 0 & 0 \\
C & 1 & 0 & 0 & 0 & 0 \\
D & 1 & 0 & 0 & 0 & 1 \\
E & 1 & 0 & 0 & 1 & 0
\end{matrix}
\enspace\times\enspace
\begin{matrix}
\\ 1 \\ 1 \\ 1 \\ 1 \\ 1
\end{matrix}
\enspace=\enspace
\begin{matrix}
& C_i^{deg} \\ A & 4 \\ B & 1 \\ C & 1 \\ D & 2 \\ E & 2
\end{matrix}
(\#eq:3-3-calcdeg)
$$
Como todas las medidas en esta sección, la manera en la que se calcula el grado de centralidad es indicativo del objetivo de la medida y como se debe interpretar. @Cunningham2016 postulan que el grado mide la popularidad de un actor en términos de influencia directa entre este y otros nodos directamente adyacentes [@Cunningham2016, 147]. La idea principal aquí es que los vínculos sirven como canales para el flujo de influencia, materiales, ideas, etc. Por consiguiente, un nodo como A en la Figura \@ref(fig:3-3-degree) que ha invertido su tiempo y recursos en enlazarse con cuatro otros nodos en una red, es posiblemente más activo en la red que un actor como B conexo solo a un nodo.
Similarmente, los nodos con alto grado de centralidad tienden a ser más visibles en la red. Si asumimos que ciertos bienes – por ejemplo, información – tienden a difundirse en una red por medio de los enlaces, entonces podemos asumir que aquellos nodos con alto grado de centralidad estarán bien informados [@Borgatti2018]. Por ejemplo, en la Figura \@ref(fig:3-3-degree) el nodo A puede recibir información de tres ubicaciones aisladas, de los nodos B o C, y de la tríada compuesta con D y E. En contraste, B y C solo pueden acceder a información de la red a través de A. Similarmente, D y B dependen de A para acceder a recursos no redundantes en la tríada.
#### Centralidad de Eigenvector
La centralidad de eigenvector, o centralidad de auto vector (“eigen” significa “propio”), puede ser descrita de múltiples maneras. Aquí la categorizamos como una medida basada en frecuencia de vínculos similar a la centralidad de grado, pero con una variación clave, en esta medida ponderamos el grado de cada nodo por la centralidad de los nodos adyacentes [@Borgatti2018]. Esta medida asume que los enlaces a actores altamente centrales son más importantes que los enlaces a nodos en la periferia [@Cunningham2016]. En otras palabras, es preferible tener conexiones a nodos bien conectados. Por ejemplo, en la Figura \@ref(fig:3-3-evexample) los nodos A y F tienen la misma centralidad de grado (2). Sin embargo, A se encuentra conectado a nodos quienes a su vez tienen un numero de enlaces limitado. En contraste, F se encuentra conectado a G y H los cuales son adyacentes a tres otros nodos. En este ejemplo, si el analista enfoca su análisis en centralidad de grado, que mide actividad directa, A y F son equivalentes. Sin embargo, si expandimos el enfoque del análisis para considerar la influencia indirecta, es aparente que F se encuentra en una posición superior al nodo A en base al alcance de sus conexiones indirectas.
```{r 3-3-evexample, fig.cap = "Comparación de nodos (A y F) con el mismo grado"}
tree <- graph_from_literal(A--B, A--C, B--D, C--E, F--G, F--H, G--I, G--J, G--K, H--L, H--M, H--N) %>%
set_vertex_attr(., name = "color",
value = ifelse(V(.)$name %in% c("A", "F"), "red", "lightblue"))
plot.igraph(tree,
layout = layout_as_tree(tree, root = c("A", "F")),
vertex.size = 20,
edges.color = "grey",
asp = .30,
margin = 0)
```
De manera formal, Bonacich [-@Bonacich1987] postula que la centralidad de eigenvector para cada nodo ($i$) corresponde a:
$$
e_i = \frac{1}{\lambda} \sum_j R_{ij}e_j
$$
Donde $R$ corresponde a la matriz de adyacencia, la cual es usualmente (pero no obligatoriamente) simétrica y los elementos de la diagonal son iguales a cero. Además, $\lambda$ es la constante llamada eigenvalor requerido. Por convención, el eigenvalor más grande es preferido. Para determinar el eigenvalor principal de una red podemos emplear una serie de herramientas de software (Gephi calcula este valor en segundos) o el método de las potencias [@Meghanathan2016]. Las siguientes operaciones representan el proceso de calcular la centralidad de eigenvector para el gráfico en la Figura \@ref(fig:3-3-ev).
```{r 3-3-ev, fig.cap = "Grafo no dirigido"}
g <- data.frame(
from = c("A", "A", "A", "B", "C", "B"),
to = c("B", "C", "D", "C", "D", "E")) %>%
graph_from_data_frame(directed = FALSE)
g %>% my_igraph(.vertex.size = 50)
```
$$
\begin{split}
Primera\ Iteración: \\&
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 0 \\
B & 1 & 0 & 1 & 0 & 1 \\
C & 1 & 1 & 0 & 1 & 0 \\
D & 1 & 0 & 1 & 0 & 0 \\
E & 0 & 1 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 1 \\ 1 \\ 1 \\ 1 \\ 1
\end{matrix}
\enspace=\enspace
\begin{matrix}
\\ 3 \\ 3 \\ 3 \\ 2 \\ 1
\end{matrix}
\equiv
\begin{matrix}
\\ 0.5303\\ 0.5303 \\ 0.5303 \\ 0.3535 \\ 0.1768
\end{matrix}\\
&Vector\ normalizado = 5.6569
\end{split}
$$
$$
\begin{split}
Segunda\ Iteración:\\&
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 0 \\
B & 1 & 0 & 1 & 0 & 1 \\
C & 1 & 1 & 0 & 1 & 0 \\
D & 1 & 0 & 1 & 0 & 0 \\
E & 0 & 1 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 0.5303\\ 0.5303 \\ 0.5303 \\ 0.3535 \\ 0.1768
\end{matrix}
\enspace=\enspace
\begin{matrix}
\\ 1.4142 \\ 1.2374 \\ 1.4142 \\ 1.0606 \\ 0.5303
\end{matrix}
\equiv
\begin{matrix}
\\ 0.6365 \\ 0.5569 \\ 0.6365 \\ 0.4773 \\ 0.2387
\end{matrix}
\\
&Vector\ normalizado = 2.221984
\end{split}
$$
$$
\begin{split}
Tercera\ Iteración: \\&
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 0 \\
B & 1 & 0 & 1 & 0 & 1 \\
C & 1 & 1 & 0 & 1 & 0 \\
D & 1 & 0 & 1 & 0 & 0 \\
E & 0 & 1 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 0.6365 \\ 0.5569 \\ 0.6365 \\ 0.4773 \\ 0.2387
\end{matrix}
\enspace=\enspace
\begin{matrix}
\\ 1.6707 \\ 1.5117 \\ 1.6707 \\ 1.273 \\ 0.5569
\end{matrix}
\equiv
\begin{matrix}
\\ 0.5337 \\ 0.4829 \\ 0.5337 \\ 0.4067 \\ 0.1779
\end{matrix}
\\
&Vector\ normalizado = 3.130236
\end{split}
$$
$$
\begin{split}
Cuarta\ Iteración: \\&
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 0 \\
B & 1 & 0 & 1 & 0 & 1 \\
C & 1 & 1 & 0 & 1 & 0 \\
D & 1 & 0 & 1 & 0 & 0 \\
E & 0 & 1 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 0.5337 \\ 0.4829 \\ 0.5337 \\ 0.4067 \\ 0.1779
\end{matrix}
\enspace=\enspace
\begin{matrix}
\\ 1.4233 \\ 1.2454 \\ 1.4233 \\ 1.0675 \\ 0.4829
\end{matrix}
\equiv
\begin{matrix}
\\ 0.5389 \\ 0.4715 \\ 0.5389 \\ 0.4041 \\ 0.1828
\end{matrix}
\\
&Vector\ normalizado = 2.641108
\end{split}
$$
$$
\begin{split}
Quinta\ Iteración: \\&
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 0 \\
B & 1 & 0 & 1 & 0 & 1 \\
C & 1 & 1 & 0 & 1 & 0 \\
D & 1 & 0 & 1 & 0 & 0 \\
E & 0 & 1 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 0.5389 \\ 0.4715 \\ 0.5389 \\ 0.4041 \\ 0.1828
\end{matrix}
\enspace=\enspace
\begin{matrix}
\\ 1.4146 \\ 1.2607 \\ 1.4146 \\ 1.0778 \\ 0.4715
\end{matrix}
\equiv
\begin{matrix}
\\ 0.5356 \\ 0.4773 \\ 0.5356 \\ 0.4081 \\ 0.1785
\end{matrix}
\\
&Vector\ normalizado = 2.641162
\end{split}
$$
$$
\begin{split}
Sexta\ Iteración: \\&
\begin{matrix}
& A & B & C & D & E \\
A & 0 & 1 & 1 & 1 & 0 \\
B & 1 & 0 & 1 & 0 & 1 \\
C & 1 & 1 & 0 & 1 & 0 \\
D & 1 & 0 & 1 & 0 & 0 \\
E & 0 & 1 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 0.5356 \\ 0.4773 \\ 0.5356 \\ 0.4081 \\ 0.1785
\end{matrix}
\enspace=\enspace
\begin{matrix}
\\ 1.4210 \\ 1.2497 \\ 1.4210 \\ 1.0712 \\ 0.4773
\end{matrix}
\equiv
\begin{matrix}
\\ 0.5380 \\ 0.4731 \\ 0.5380 \\ 0.4055 \\ 0.1807
\end{matrix}
\\
&Vector\ normalizado = 2.641176
\end{split}
$$
$$
...
$$
$$
\begin{split}
Decimonovena\ Iteración: \\&
\begin{matrix}
Nodo & A & B & C & D & E \\
Eigenvector & 0.537 & 0.475 & 0.537 & 0.407 & 0.179
\end{matrix}
\\
&Vector\ normalizado = 2.641186
\\
\end{split}
(\#eq:3-3-evprocess)
$$
Como puede ver, el método de las potencias es un proceso iterativo. Comienza al multiplicar la matriz por un vector con valores de uno, el cual produce el grado de centralidad. Normalizamos los valores de dicho vector, en la primera ronda 5.6569, y dividimos el producto de la multiplicación de matriz por el valor normalizado, esto produce un eigenvector tentativo. La siguiente ronda comienza multiplicando la matriz de adyacencia por el eigenvector tentativo de la ronda previa. Una vez más normalizamos el vector resultante de la multiplicación y dividimos dichos valores por el valor normalizado. Esencialmente este proceso continua hasta que el producto de la normalización del vector converge [@Meghanathan2016]. En el ejemplo previo, este proceso toma 19 iteraciones para concluir. Sin embargo, alrededor de la cuarta iteración empezamos a ver un valor similar a el valor convergente de en la última y penúltima ronda.
Después de tanta aritmética, se ha de estar preguntando ¿cómo interpreto los índices de centralidad resultantes? Como se mencionó previamente, esta medida de centralidad toma en cuenta los enlaces de cada nodo, así como los enlaces de sus vecinos. En términos prácticos el software habitualmente genera una serie de valores donde los índices más grandes representan nodos con mayor influencia indirecta. Como dice el dicho, “lo importante no es lo que sepas, sino a quien conozcas”. La centralidad de eigenvector toma esta idea y la cuantifica en términos matemáticos.
### Medidas Basadas en Distancia
#### Centralidad de Cercanía
La medida más común basada en distancia entre nodos es la centralidad de cercanía definida por Freeman [-@Freeman1979] como la distancia geodésica entre un nodo y los demás en una red. Se calcula sumando las distancias geodésicas entre cada nodo y los demás y después invirtiendo el valor para cambiar el índice de una medida de distancia a cercanía [@Valente2010, 85]. Es común calcular la centralidad de cercanía como un índice normalizado (con valores de 0 a 1) de la siguiente manera:
$$C_i^{clo} = \frac{N-1}{\sum\limits_{j = 1}^{n}d_{ij}}$$
Donde $d_{ij}$ es la distancia geodésica entre dos nodos. Adicionalmente, el número máximo teórico de cercanía en cualquier red es $N-1$, por lo tanto, al dividir el numerador por las distancias sumadas generamos un valor normalizado. El dividir el valor máximo por la suma de las distancias genera un índice donde los valores grandes corresponden a nodos más centrales [@Borgatti2018, 199].
Calcular esta medida es simple, el grafo \@ref(fig:3-3-clo) servirá como ejemplo. Comenzaremos por encontrar los caminos geodésicos entre todos los nodos, presentados en la siguiente matriz de distancias. El siguiente paso consiste en sumar las distancias para cada nodo. Finalmente, dividimos el número máximo teórico de cercanía ($N-1$) por la suma de las distancias de cada nodo. Por ejemplo, el nodo A tiene una distancia cumulativa de 15 y el valor teórico máximo de cercanía es 6. Por lo tanto, la cercanía normalizada del nodo A es equivalente a $\frac{6}{15} = 0.4$.
```{r 3-3-clo, fig.cap = "Grafo no dirigido"}
g <- graph_from_literal(A--C, C--B, C--D, D--E, D--F, E--F, E--G, G--F)
g %>% my_igraph()
```
$$
\begin{matrix}
& A & B & C & D & E & F & G \\
A & 0 & 2 & 1 & 2 & 3 & 3 & 4 \\
B & 2 & 0 & 1 & 2 & 3 & 3 & 4 \\
C & 1 & 1 & 0 & 1 & 2 & 2 & 3 \\
D & 2 & 2 & 1 & 0 & 1 & 1 & 2 \\
E & 3 & 3 & 2 & 1 & 0 & 1 & 1 \\
F & 3 & 3 & 2 & 1 & 1 & 0 & 1 \\
G & 4 & 4 & 3 & 2 & 1 & 1 & 0
\end{matrix}
\quad
\begin{matrix}
Suma \\ 15 \\ 15 \\ 10 \\ 9 \\ 11 \\ 11 \\ 15
\end{matrix}
\qquad
\begin{matrix}
Cercanía\ Normalizada \\ 0.4 \\ 0.4 \\ 0.6 \\ 0.667 \\ 0.545 \\ 0.545 \\ 0.4
\end{matrix}
(\#eq:3-3-clomeasure)
$$
La centralidad de cercanía es una medida intuitiva. @Borgatti2018 sugieren que en términos de flujo de recursos los nodos más cercanos a menudo reciben materiales, recursos o información rápidamente [@Borgatti2018, 199]. Esto es significativo puesto que los recursos tienden a perder fidelidad a lo largo de distancias de camino largas. Por ejemplo, la información tiende a ser distorsionada conforme cambia de manos en una red o la transferencia de fondos financieros tiende a acumular costos con cada brinco entre nodos. Es por ello que los nodos centrales en términos de cercanía no solo tienden a recibir información, recursos o materiales de manera acelerada, sino también de alta fidelidad.
Antes de concluir la discusión de centralidad de cercanía, es importante entender una de las limitaciones clave de esta medida. Principalmente, el hecho que esta medida no debe ser aplicada al trabajar con grafos con componentes no conexos, por ejemplo, aquel con múltiples componentes. En estas situaciones @Cunningham2016 sugieren aislar el componente principal antes de calcular la centralidad de cercanía.
### Medidas Basadas en Caminos
#### Centralidad de Intermediación
La tercera medida de Freeman [-@Freeman1979] que consideraremos en este capítulo mide la frecuencia con la que un nodo se encuentra en los caminos más cortos conectando a todos los demás en la red. La centralidad de intermediación es comúnmente utilizada por los analistas de redes puesto que identifica actores en posiciones de corretaje claves. @Wasserman1994 recalcan que interacciones de dos actores no adyacentes pueden depender de aquellos que se encuentran entre esos dos; es decir, los intermediarios que podrían, potencialmente, tener algún control sobre las interacciones entre nodos no adyacentes, o podríamos también decir, tener más influencia interpersonal sobre otros [@Wasserman1994].
Calcularemos centralidad de intermediación con la definición formal de Freeman [-@Freeman1979], quien fue uno de los primeros investigadores en cuantificar esta idea. Donde $g_{jk}$ es el número de caminos más cortos, geodésicos, que unen a dos actores. En un grafo donde los vínculos tienen el mismo peso, es probable que existan múltiples geodésicos entre dos nodos, por ello asumimos que todos los caminos geodésicos tienen la misma probabilidad de ser elegidos, simplemente podemos articular esta idea en términos matemáticos como $\frac{1}{g_{jk}}$. Puesto que el objetivo es identificar el índice de intermediación de un nodo ($i$), $g_{jk}(n_i)$ representa la porción de los caminos geodésicos que conectan a dos actores $g_{jk}$ y que contienen al actor $i$. Freeman define el índice de intermediación de cualquier actor ($n_i$) en un grafo como la suma de todas las probabilidades estimadas para todos los pares de nodos en la red sin incluir al actor $i$ [@Wasserman1994]:
$$
C_B(n_i) = \sum_{j<k} \frac{g_{jk}(n_i)}{g_{jk}}
$$
El índice alcanza su valor máximo cuando el nodo $n_i$ se encuentra en todas las distancias geodésicas. Por lo tanto, el valor máximo es $\frac{(n-1)(n-2)}{2}$ que corresponde a el número de actores sin incluir $n_1$. Podemos utilizar el valor máximo para normalizar el índice a una medida con valores entre 0 y 1, lo cual facilita la comparación con otros índices. Por lo tanto, la centralidad de intermediación normalizada se puede calcular como:
$$
C'_B(n_i) = \frac{\sum_{j<k} \frac{g_{jk}(n_i)}{g_{jk}}}{\frac{(n-1)(n-2)}{2}}
$$
Pongamos esta ecuación en práctica. La Figura \@ref(fig:3-3-betw) incluye un grafo no dirigido. ¿Qué nodo tendrá la centralidad de intermediación más alta? En este ejemplo le presentamos el cálculo de la centralidad de intermediación de los vértices en el gráfico. Para esta operación el valor máximo es 6 (o $\frac{(5-1)(5-2)}{2}$). Los índices presentados han sido normalizados.
```{r 3-3-betw, fig.cap = "Grafo no dirigido simple."}
g <- graph_from_literal(A--D, A--C, B--C, B--D, C--D, D--E)
g %>% my_igraph()
```
\break
$Intermediación\ del\ nodo\ A: 0$
$Intermediación\ del\ nodo\ B: 0$
$Intermediación\ del\ nodo\ C: 0.083$
$$
Par\ (A, B) = 1/2
$$
$$
\frac{0.5}{6} = 0.083
$$
$Intermediación\ del\ nodo\ D: 0.583$
$$
Par\ (A, B) = 1/2
$$
$$
Par\ (A, E) = 1/1 \\
$$
$$
Par\ (B, E) = 1/1 \\
$$
$$
Par\ (C, E) = 1/1 \\
$$
$$
\frac{0.5+1+1+1}{6} = 0.583
$$
$Intermediación\ del\ nodo\ E: 0$
Note que en este índice un nodo puede tener un valor nulo, por ejemplo {A, B, E}. Esto ocurre pues estos nodos no se encuentran en ningún camino geodésico entre otros nodos. El ejemplo más sencillo es el nodo E, que no se encuentra en ningún camino entre nodos pues es un pendiente en la red. Los nodos A y B son redundantes para los demás nodos pues no caen en un camino geodésico, es decir, si E quiere navegar a C la ruta procedería de E a B y luego a C. Otros nodos sirven como posibles intermediadores, por ejemplo C. Este se encuentra en un camino entre A y B. Sin embargo, puesto que existen dos caminos geodésicos entre estos nodos, la porción de caminos entre A y B en la que encontramos a C es solo 0.5. Finalmente, algunos nodos son cruciales para el flujo de la red. Por ejemplo, el nodo D es el punto de acceso a E y se localiza en la mitad de los caminos geodésicos entre A y B.
El proceso demostrado en esta sección es largo y un poco tedioso, sin embargo, los programas de software utilizados por analistas de ARSo producen estos índices con bastante rapidez. Esperamos que pueda ver el valor de esta medida como analista de redes. Simplemente permite identificar nodos cuyo potencial como corredores es mayor en base a su ubicación estructural en una red de nodos. Antes de concluir con esta sección es importante recalcar un punto clave presentado por @Cunningham2016. Los autores notan que no existe ninguna garantía que dos nodos elijan tomar el camino más corto entre estos en la red [@Cunningham2016]. En ciertos contextos sociales, el camino más largo puede ser preferible. Por ejemplo, una ruta larga puede ser la única ruta conocida por un par de actores y por lo tanto el camino preferido. Esto no quiere decir que la centralidad de intermediación no tiene valor para el analista de redes, esta medida es útil y comúnmente utilizada pues a menudo aporta nueva información, pero esta debe ser evaluada a par con el contexto de la red.
## Datos Dirigidos: Centralidad y Prestigio
### Medidas Basadas en Frecuencia
#### Centralidad de Grado: Entrada y Salida
Retornemos por un segundo a la idea de grados de centralidad, previamente definida en una red no dirigida como el conteo de vínculos de un actor. En un grafo dirigido podemos expandir este concepto para captar la dirección del vínculo adyacente a cada nodo. Específicamente, podemos enfocarnos en los vínculos adyacentes hacia o desde el nodo, que de manera formal llamamos grado de entrada o de salida. @Wasserman1994 postula que es necesario considerar ambos por separado pues uno cuantifica la tendencia de los nodos a forjar vínculos mientras que el otro la tendencia de recibirlos [@Wasserman1994, 151].
Considere la Figura \@ref(fig:3-3-directed) que incluye un grafo dirigido. La dirección de la flecha indica el nodo que recibe un enlace, del otro lado de la flecha encontramos a aquel nodo que envía dicho arco. La interpretación del grado de entrada o salida depende del contexto del grafo. Por ejemplo, supongamos que los vínculos en la Figura \@ref(fig:3-3-directed) representan enlaces de confianza; es decir, cada nodo nomina a otros en la red en quien confía. En esta situación interpretaríamos a un nodo con alto grado de entrada como alguien confiable y un nodo con alto grado de salida como alguien confiado.
```{r 3-3-directed, fig.cap = "Datos dirigidos"}
graph_from_literal(A-+B, B-+C, D-+ C, E-+D, C-+E, C-+A, E-+B, A-+D) %>%
plot.igraph(vertex.color = "lightblue",
vertex.size = 30,
edges.color = "grey",
layout = layout_in_circle)
```
@Wasserman1994 definen el grado de entrada hacia un nodo $n_i$ como $d_I(n_i)$, donde el grado de entrada es igual al número de arcos que terminan en $n_i$ ($l_k = <n_j, n_i>$) para todos los arcos ($l_k\ \epsilon\ L$) y nodos ($n_j\ \epsilon\ N$) en el grafo ($G(N, L)$). Similarmente, el grado de salida de un nodo $d_O(n_i)$ es el número de nodos adyacentes desde $n_i$. Es decir, todos los enlaces que comienzan en $n_i$ ($l_k = <n_i, n_j>$) para todos los arcos ($l_k\ \epsilon\ L$) y nodos ($n_j\ \epsilon\ N$) en el grafo [@Wasserman1994]. En una matriz de adyacencia, la suma de las filas para cada nodo es equivalente a el grado de salida, y los totales de las columnas es igual al grado de entrada. Definimos estas ecuaciones como:
$$
d_O(n_i) = \sum^g_{j=1} x_{ij} = x_{i+},
$$
y
$$
d_O(n_i) = \sum^g_{j=1} x_{ij} = x_{+i}.
$$
En términos prácticos el calcular estos valores es simple. La matriz siguiente contiene los datos dirigidos. En este ejemplo, hemos agregados una fila ($d_I(n_i)$) y columna ($d_O(n_i)$) adicional con los valores de centralidad de entrada y salida. Para calcular dichos índices hemos sumado los valores en la sociomatriz. El sumar las filas, de arriba hacia abajo, resulta en el grado de entrada para cada nodo. Similarmente, el sumar las columnas, de izquierda a derecha produce el grado de salida.
$$
\begin{matrix}
& A & B & C & D & E & d_O(n_i) \\
A & 0 & 1 & 0 & 1 & 0 & 2 \\
B & 0 & 0 & 1 & 0 & 0 & 1 \\
C & 1 & 0 & 0 & 1 & 0 & 2 \\
D & 0 & 0 & 1 & 0 & 0 & 1 \\
E & 0 & 1 & 0 & 1 & 0 & 2 \\ \\
d_I(n_i) & 1 & 2 & 2 & 3 & 0
\end{matrix}
(\#eq:3-3-measures)
$$
Noté que algunos nodos no reciben ningún enlace, por ejemplo, E tiene un grado de entrada de cero $d_I(n_E) = 0$. Sin embargo, esta falta de vínculos hacia E no impacta de manera directa el número de enlaces que comienzan con E, $d_O(n_E) = 2$. El punto clave en interpretar estos índices es el contextualizar las medidas, es decir, hacerse la pregunta como analista: ¿Qué significa un alto grado de entrada o salida con las relaciones presentes?
#### Centros de Actividad y Autoridades
El último algoritmo que exploraremos en esta sección es centros de actividad, o hubs, y autoridades, comúnmente conocido como “hubs and authorities” en inglés o simplemente HITS. Su autor, Kleinberg [-@Kleinberg1999], originalmente desarrolló esta rutina para clasificar sitios de web. Este algoritmo es similar a la centralidad de eigenvector [@Cunningham2016], sin embargo, tiene diferencias cruciales. Fue diseñado para trabajar con datos dirigidos, por lo tanto, genera dos medidas, un índice de centro de actividad y otro de autoridad.
Kleinberg [-@Kleinberg1999] postula que un centro de actividad sería un nodo enlazado a múltiples autoridades. Es decir, los centros de autoridad actúan como portales que dirigen el tráfico de enlaces hacia nodos eminentes en un tema. Estos últimos son las autoridades, quienes reciben el tráfico de los centros de actividad [@Monge2003]. Recuerde que este algoritmo fue diseñado para categorizar sitos de web, es por ello que podemos pensar en centros de actividad como sitios de web a los que acuden las personas buscando información sobre un tema, por ejemplo, Wikipedia. Las autoridades en este contexto serían los sitios de web en la sección de referencias de un tema.
Antes de proceder a calcular los índices, piense ¿En qué contextos sociales piensa usted que un analista de ARSo utilizaría el algoritmo de HITS? Es importante recalcar que, aunque el algoritmo fue diseñado para clasificar sitios de web, tiene múltiples aplicaciones en contextos sociales. Por ejemplo, en una red de comunicación dirigida entre miembros de una organización podemos aislar quienes son los centros de actividad o los nodos que representan las autoridades de la red. En este ejemplo, el localizar un centro de autoridad seria valioso pues, como mencionamos, estos sirven como portales comúnmente utilizados en la red para acceder a autoridades. Similarmente, dependiendo de nuestro objetivo, un nodo en posición de autoridad se encuentra en una posición estructural prestigiosa de la red en cuestión.
En términos prácticos, el calcular los índices para cada nodo de centro de actividad y autoridad es relativamente simple. Observe la red \@ref(fig:3-3-directedg), los centros de actividad apuntan a las autoridades, esto sucede por la relación mutuamente reforzada donde un buen centro de actividad apunta a muchas buenas autoridades y del otro lado de la moneda una buena autoridad es aquel nodo que recibe múltiples vínculos de buenos centros de actividad [@Kleinberg1999].
```{r 3-3-directedg, fig.cap = "Grafo dirigido"}
g <- graph_from_literal(A-+E, A-+F, B-+E, B-+F, B-+G, C-+E, C-+G, C-+H, D-+F, D-+H)
g %>% plot.igraph(
layout = layout_in_circle,
vertex.color = "lightblue",
vertex.size = 30,
edges.color = "grey"
)
```
Suponga que el nodo $i$ tiene un índice de autoridad de $a_i$ y de centro de actividad $h_i$ donde i es equivalente a $1:n$. Asuma que la autoridad y centro de actividad inicial de cada nodo $i$ será $a_{i}^0$ y $h_{i}^0$. El método iterativo HITS actualizará los valores iniciales con las siguientes sumas:
$$
a_{i}^k = \sum_{j} h_{j}^{(k-1)}
$$
$$
h_{i}^k = \sum_{j} a_{j}^{(k-1)}
$$
Como proceso iterativo, podemos seleccionar el número de iteraciones $k$, en este ejemplo utilizaremos $k=1$. Podemos reescribir las ecuaciones previas como multiplicaciones de matriz:
$$
a^k = A^{T}h_{(k-1)},\ h^k = Aa_{k}
$$
Para calcular el primer vector de autoridad $a^1$, primero debemos transponer la matriz de adyacencia ($A^T$) y multiplicarla por el vector inicial de centros de actividad $h^0$ de valor uno:
$$
\begin{matrix}
& A & B & C & D & E & F & G & H \\
A & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
B & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
C & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
D & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
E & 1 & 1 & 1 & 0 & 0 & 0 & 0 & 0 \\
F & 1 & 1 & 0 & 1 & 0 & 0 & 0 & 0 \\
G & 0 & 1 & 1 & 0 & 0 & 0 & 0 & 0 \\
H & 0 & 0 & 1 & 1 & 0 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 1 \\ 1 \\ 1 \\ 1 \\ 1 \\ 1 \\ 1 \\ 1
\end{matrix}
=
\begin{matrix}
a^1 \\ 0 \\ 0 \\ 0 \\ 0 \\ 3 \\ 3 \\ 2 \\ 2
\end{matrix}
(\#eq:3-3-hits2)
$$
Con el vector de autoridad resultante $a^1$, calcularemos centros de actividad $h^1$ al multiplicar la matriz de adyacencia $A$ por el vector de autoridad:
$$
\begin{matrix}
& A & B & C & D & E & F & G & H \\
A & 0 & 0 & 0 & 0 & 1 & 1 & 0 & 0 \\
B & 0 & 0 & 0 & 0 & 1 & 1 & 1 & 0 \\
C & 0 & 0 & 0 & 0 & 1 & 0 & 1 & 1 \\
D & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 1 \\
E & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
F & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
G & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
H & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
\end{matrix}
\quad \times \quad
\begin{matrix}
\\ 0 \\ 0 \\ 0 \\ 0 \\ 3 \\ 3 \\ 2 \\ 2
\end{matrix}
=
\begin{matrix}
h^1 \\ 6 \\ 8 \\ 7 \\ 5 \\ 0 \\ 0 \\ 0 \\ 0
\end{matrix}
(\#eq:3-3-hits3)
$$
Para concluir la primera iteración $k=1$ de este algoritmo, calculamos los eigenvectores normalizados $||a||$ y $||v||$ y dividimos cada índice por el valor normalizado. De la siguiente manera:
$$
||v|| = \sqrt{0^2 + 0^2 + 0^2 + 0^2 + 3^2 + 3^2 + 2^2 + 2^2} = 3.605551
$$
$$
||u|| = \sqrt{6^2 + 8^2 + 7^2 + 5^2 + 0^2 + 0^2 + 0^2 + 0^2} = 13.19091
$$
$$
\begin{matrix}
& a^1 & h^1 \\
A & \frac{0}{3.6056} = 0 & \frac{6}{13.1909} = 0.4549\\
B & \frac{0}{3.6056} = 0 & \frac{8}{13.1909} = 0.6065\\
C & \frac{0}{3.6056} = 0 & \frac{7}{13.1909} = 0.5307\\
D & \frac{0}{3.6056} = 0 & \frac{5}{13.1909} = 0.379\\
E & \frac{3}{3.6056} = 0.832 & \frac{0}{13.1909} = 0 \\
F & \frac{3}{3.6056} = 0.832 & \frac{0}{13.1909} = 0 \\
G & \frac{2}{3.6056} = 0.5467 & \frac{0}{13.1909} = 0 \\
H & \frac{2}{3.6056} = 0.5467 & \frac{0}{13.1909} = 0 \\
\end{matrix}
(\#eq:3-3-hits4)
$$
<!-- El siguiente ciclo $k=2$, comenzamos utilizando los valores de centros de actividad ($h^1$) y autoridades ($h^1$) del ciclo previo. Una vez más, normalizaremos ambos vectores y dividiremos los valores en estos por el producto de la normalización. -->
<!-- \begin{equation} -->
<!-- ||a|| = \sqrt{0^2 + 0^2 + 0^2 + 0^2 + 0.832^2 + 0.832^2 + 0.5467^2 + 0.5467^2} = 1.407906 \\ -->
<!-- ||h|| = \sqrt{0.4549^2 + 0.6065^2 + 0.5307^2 + 0.379^2 + 0^2 + 0^2 + 0^2 + 0^2} = 1.000039 -->
<!-- \\~\\ -->
<!-- \begin{matrix} -->
<!-- & a^2 & h^2 \\ -->
<!-- A & \frac{0}{1.4079} = 0 & \frac{0.4549}{1.000039} = 0.4549\\ -->
<!-- B & \frac{0}{1.4079} = 0 & \frac{0.6065}{1.000039} = 0.6065\\ -->
<!-- C & \frac{0}{1.4079} = 0 & \frac{0.5307}{1.000039} = 0.5307\\ -->
<!-- D & \frac{0}{1.4079} = 0 & \frac{0.379}{1.000039} = 0.379\\ -->
<!-- E & \frac{0.832}{1.4079} = 0.5909 & \frac{0}{1.000039} = 0 \\ -->
<!-- F & \frac{0.832}{1.4079} = 0.5909 & \frac{0}{1.000039} = 0 \\ -->
<!-- G & \frac{0.5467}{1.4079} = 0.3883 & \frac{0}{1.000039} = 0 \\ -->
<!-- H & \frac{0.5467}{1.4079} = 0.3883 & \frac{0}{1.000039} = 0 \\ -->
<!-- \end{matrix} -->
<!-- (\#eq:hits5) -->
<!-- \end{equation} -->
El siguiente ciclo $k=2$, comenzará utilizando los valores de centros de actividad ($h^1$) y autoridades ($a^1$) del ciclo previo. El proceso repite una y otra vez dependiente en el número de iteraciones.
Los resultados previos deben corresponder con nuestra intuición, E y F son los nodos más autoritarios, puesto que reciben la mayoría de los enlaces de entrada. Similarmente, B y C son los centros de actividad más activos pues envían la mayor porción de vínculos. El algoritmo HITS nos permite cuantificar que nodos ocupan que posición.
<!-- \begin{equation} -->
<!-- v = 0^2 + 0^2 + 0^2 + 0^2 + 0.5909^2 + 0.5909^2 + 0.3883^2 + 0.3883^2 = \sqrt{0.9998794} = 0.9999397 \\ -->
<!-- u = 0.4549^2 + 0.6065^2 + 0.5307^2 + 0.379^2 + 0^2 + 0^2 + 0^2 + 0^2 = \sqrt{1.000078} = 1.000039 -->
<!-- \\~\\ -->
<!-- \begin{matrix} -->
<!-- & v_3 & u_3 \\ -->
<!-- A & \frac{0}{0.9999} = 0 & \frac{0.4549}{1.000039} = 0.4549\\ -->
<!-- B & \frac{0}{0.9999} = 0 & \frac{0.6065}{1.000039} = 0.6065\\ -->
<!-- C & \frac{0}{0.9999} = 0 & \frac{0.5307}{1.000039} = 0.5307\\ -->
<!-- D & \frac{0}{0.9999} = 0 & \frac{0.379}{1.000039} = 0.379\\ -->
<!-- E & \frac{0.5909}{0.9999} = 0.5909 & \frac{0}{1.000039} = 0 \\ -->
<!-- F & \frac{0.5909}{0.9999} = 0.5909 & \frac{0}{1.000039} = 0 \\ -->
<!-- G & \frac{0.3883}{0.9999} = 0.3883 & \frac{0}{1.000039} = 0 \\ -->
<!-- H & \frac{0.3883}{0.9999} = 0.3883 & \frac{0}{1.000039} = 0 \\ -->
<!-- \end{matrix} -->
<!-- (\#eq:hits6) -->
<!-- \end{equation} -->
<!-- \begin{equation} -->
<!-- v = 0^2 + 0^2 + 0^2 + 0^2 + 0.5909^2 + 0.5909^2 + 0.3883^2 + 0.3883^2 = \sqrt{0.9998794} = 0.9999397 \\ -->
<!-- u = 0.4549^2 + 0.6065^2 + 0.5307^2 + 0.379^2 + 0^2 + 0^2 + 0^2 + 0^2 = \sqrt{1.000078} = 1.000039 -->
<!-- \\~\\ -->
<!-- \begin{matrix} -->
<!-- & v_3 & u_3 \\ -->
<!-- A & \frac{0}{0.9999} = 0 & \frac{0.4549}{1.000039} = 0.4549\\ -->
<!-- B & \frac{0}{0.9999} = 0 & \frac{0.6065}{1.000039} = 0.6065\\ -->
<!-- C & \frac{0}{0.9999} = 0 & \frac{0.5307}{1.000039} = 0.5307\\ -->
<!-- D & \frac{0}{0.9999} = 0 & \frac{0.379}{1.000039} = 0.379\\ -->
<!-- E & \frac{0.5909}{0.9999} = 0.5909 & \frac{0}{1.000039} = 0 \\ -->
<!-- F & \frac{0.5909}{0.9999} = 0.5909 & \frac{0}{1.000039} = 0 \\ -->
<!-- G & \frac{0.3883}{0.9999} = 0.3883 & \frac{0}{1.000039} = 0 \\ -->
<!-- H & \frac{0.3883}{0.9999} = 0.3883 & \frac{0}{1.000039} = 0 \\ -->
<!-- \end{matrix} -->
<!-- (\#eq:hits7) -->
<!-- \end{equation} -->
## Ejercicio Práctico
En este ejercicio practicaremos algunas de las medidas de centralidad presentes en Gephi. Para ello necesitara descargar el conjunto de datos titulado: [`alive_combined_network.gephi`](https://github.com/cjcallag/arso/blob/main/data/centrality/alive%20_combined_network.gephi?raw=true).
### Centralidad en Gephi
:::{.row}
:::{.lcolumn-20 data-latex="{0.18\\textwidth}"}
*[Gephi]*
*Archivo > Abrir*
*[Vista general]*
*Estadísticas > Grado medio > Ejecutar*
:::
:::{.col data-latex="{0.04\\textwidth}"}
\ <!-- an empty Div (with a white space), serving as
a column separator for tex -->
:::
:::{.rcolumn-80 data-latex="{0.78\\textwidth}"}
1. Abra `alive_combined_network.gephi`, que puede descargar [del sitio que acompaña este manual](https://cjcallag.github.io/arso-materiales-educativos/). Los colores de los nodos de la red reflejan los subgrupos de acuerdo con el algoritmo de Louvain. Gephi implementa un puñado de medidas de centralidad. La medida más común de centralidad es el grado, que en una red no dirigida y binaria es simplemente un recuento del número de vínculos de cada actor (es decir, el número de vecinos). Los vínculos en una red son ponderados cuando los actores comparten múltiples entre sí, por un par de actores puede compartir más de un vínculo, como parentesco, religioso, escolar. Para la centralidad de grado, Gephi ofrece la opción de tomar en cuenta el peso de los vínculos o ignorarlo. Para calcular la centralidad de grado no ponderada, ubique la opción *Grado medio* en la pestaña *Estadísticas* y haga clic en *Ejecutar*. Esto genera un informe, que hemos visto antes, que le presenta la centralidad de grado medio y produce un gráfico que indica la distribución de los valores de grado.
:::
:::
\newline
:::{.row}
:::{.lcolumn-20 data-latex="{0.18\\textwidth}"}
*[Laboratorio de datos]*
*Tabla de datos > Nodos*
:::
:::{.col data-latex="{0.04\\textwidth}"}
\ <!-- an empty Div (with a white space), serving as
a column separator for tex -->
:::
:::{.rcolumn-80 data-latex="{0.78\\textwidth}"}
2. En este ejercicio nuestro interés es capturar los puntajes de centralidad de grado de cada actor. Para hacer esto, cambie a la ventana *Laboratorio de datos*, haga clic en *Nodos* en la pestaña *Tabla de datos*, y verá una columna en el extremo derecho con la etiqueta *Grado* (Figura \@ref(fig:3-3-1)). Puede ordenar los actores por grado (ya sea ascendente o descendente) haciendo clic en la etiqueta. Por lo tanto, con un par de clics, puede determinar qué actores son más o menos influentes en términos de grado. Si observa la Figura \@ref(fig:3-3-1), puede ver que Noordin Top ocupa el primer lugar (46), seguido de Suramto (28), Ubeid (27), Abdullah Sunata (25) e Iwan Dharmawan (25). Si desea puede exportar esta tabla y manipular la información en Excel.
:::
:::
```{r 3-3-1, fig.cap="Red combinada de nodos vivos, Laboratorio de datos"}
knitr::include_graphics("images/03-10-01.png")
```
:::{.row}
:::{.lcolumn-20 data-latex="{0.18\\textwidth}"}
*Apariencia > Nodos Tamaño > Ranking > Aplicar*
:::
:::{.col data-latex="{0.04\\textwidth}"}
\ <!-- an empty Div (with a white space), serving as
a column separator for tex -->
:::
:::{.rcolumn-80 data-latex="{0.78\\textwidth}"}
3. Para visualizar la red donde el tamaño del nodo refleja el grado de centralidad, en la pestaña *Apariencia*, seleccione *Nodos*, *Tamaño* y elija *Ranking*. En el menú desplegable, elija *Grado*. Haga clic en *Aplicar*. El gráfico de red resultante debe tener un aspecto similar al de la Figura \@ref(fig:3-3-2).
:::
:::
```{r 3-3-2, fig.cap="Red combinada de nodos vivos, el tamaño refleja el grado de centralidad"}
knitr::include_graphics("images/03-10-02.png")
```
:::{.row}
:::{.lcolumn-20 data-latex="{0.18\\textwidth}"}
*[Vista general]*
*Estadísticas > Grado medio con pesos > Ejecutar*
:::
:::{.col data-latex="{0.04\\textwidth}"}
\ <!-- an empty Div (with a white space), serving as
a column separator for tex -->
:::
:::{.rcolumn-80 data-latex="{0.78\\textwidth}"}
4. Ahora, repita el proceso excepto que esta vez use *Grado medio con pesos* en lugar de *Grado medio*. Mire los resultados en la ventana *Laboratorio de datos*. **¿Qué actor ocupa el puesto más alto? ¿Cuál es su puntuación? ¿Cómo se comparan las clasificaciones con las anteriores que no tenían en cuenta el peso del enlace?**
:::
:::
\newline
:::{.row}
:::{.lcolumn-20 data-latex="{0.18\\textwidth}"}
*Estadísticas > Longitud media de camino > Ejecutar*
:::
:::{.col data-latex="{0.04\\textwidth}"}
\ <!-- an empty Div (with a white space), serving as
a column separator for tex -->
:::
:::{.rcolumn-80 data-latex="{0.78\\textwidth}"}
5. Para obtener la centralidad de cercanía e intermediación en Gephi, podemos usar *Longitud media de camino* en la pestaña *Estadísticas*. Al hacer clic en *Ejecutar*, aparece un cuadro de diálogo (Figura \@ref(fig:3-3-3)), que presenta un par de opciones para tratar la red como dirigida o no dirigida (aquí, detecta correctamente que la red no es dirigida). Seleccione la opción para normalizar las centralidades en el rango. La normalización es buena para comparar diferentes medidas. Note que esta opción también calcula la centralidad de excentricidad, que (como indica el cuadro de diálogo) es la distancia desde un nodo en particular hasta el nodo más lejano en la red. Haga clic en *Aceptar* y Gephi producirá un informe, en el que verá que Gephi calcula dos medidas de proximidad: proximidad (Freeman) y proximidad armónica. Dado que se trata de una red desconectada, utilizaremos la segunda. Como hicimos anteriormente, cambie a la ventana *Laboratorio de datos* y vea que actores obtienen la puntuación más alta en términos de centralidad de intermediación y cercanía armónica (Harmonic Closeness Centrality).
:::
:::
```{r 3-3-3, fig.cap="Diámetro de red/distancia promedio de camino"}
knitr::include_graphics("images/03-10-03.png")
```
:::{.row}
:::{.lcolumn-20 data-latex="{0.18\\textwidth}"}
*Estadísticas > Centralidad del vector propio > Ejecutar*
:::
:::{.col data-latex="{0.04\\textwidth}"}
\ <!-- an empty Div (with a white space), serving as
a column separator for tex -->
:::
:::{.rcolumn-80 data-latex="{0.78\\textwidth}"}
6. Finalmente, para estimar la centralidad de eigenvector, usamos la función *Centralidad del vector propio* de Gephi. En el cuadro de diálogo, indique si la red es dirigida o no y haga clic en *Aceptar*. Al igual que con las otras funciones de centralidad, genera un informe y almacena las puntuaciones de centralidad para cada actor en la tabla de nodos.
:::
:::