Мажорування стресу

Мажорування стресу — це стратегія оптимізації, використовувана в багатовимірному шкалюванні, де для набору з n елементів розмірності m шукається конфігурація X n точок у r(<<m)-вимірному просторі, яка мінімізує так звану функцію мажорування $\sigma (X)$ . Зазвичай r дорівнює 2 або 3, тобто (n x r) матриця X перераховує точки в 2- або 3-вимірному евклідовому просторі, так що результат можна відобразити візуально. Функція $\sigma$ є ціною або функцією втрат, яка вимірює квадрат різниці між ідеальною ( $m$ -вимірною) відстанню і актуальною відстанню в r-вимірному просторі. Вона визначається як:

\sigma (X)=\sum _{i<j\leqslant n}w_{ij}(d_{ij}(X)-\delta _{ij})^{2}

,

де $w_{ij}\geqslant 0$ — вага для мір між парами точок $(i,j)$ , $d_{ij}(X)$ — евклідова відстань між $i$ і $j$ , а $\delta _{ij}$ — ідеальна відстань між точками в $m$ -вимірному просторі. Зауважимо, що $w_{ij}$ можна використати для задання ступеня довіри в схожості точок (наприклад, можна вказати 0, якщо для конкретної пари немає ніякої інформації).

Конфігурація $X$ , яка мінімізує $\sigma (X)$ , дає графік, на якому близькі точки відповідають близьким точкам у початковому $m$ -вимірному просторі.

Існує багато шляхів мінімізації $\sigma (X)$ . Наприклад, Крускал^[1] рекомендує ітеративний підхід найшвидшого спуску. Однак істотно кращий (у термінах гарантованості і швидкості збіжності) метод мінімізації стресу запропонував Ян де Лейв^[2]. Метод ітеративного мажорування де Лейва на кожному кроці мінімізує просту опуклу функцію, яка обмежує $\sigma$ зверху і дотикається до поверхні $\sigma$ в точці $Z$ , яку називають опорною точкою. В опуклому аналізі таку функцію називають мажорувальною функцією. Цей ітеративний процес мажорування також відомий як алгоритм SMACOF (англ. Scaling by MAjorizing a COmplicated Function).

Алгоритм SMACOF[ред. | ред. код]

Функцію стресу $\sigma$ можна розкласти так:

\sigma (X)=\sum _{i<j\leqslant n}w_{ij}(d_{ij}(X)-\delta _{ij})^{2}=\sum _{i<j}w_{ij}\delta _{ij}^{2}+\sum _{i<j}w_{ij}d_{ij}^{2}(X)-2\sum _{i<j}w_{ij}\delta _{ij}d_{ij}(X)

Зауважимо, що перший член є константою $C$ , а другий залежить квадратично від X (тобто для матриці Гесе V другий член еквівалентний tr $X'VX$ ), а тому відносно просто обчислюється. Третій член обмежений величиною

\sum _{i<j}w_{ij}\delta _{ij}d_{ij}(X)=\,\operatorname {tr} \,X'B(X)X\geqslant \,\operatorname {tr} \,X'B(Z)Z

,

де $B(Z)$ має елементи

b_{ij}=-{\frac {w_{ij}\delta _{ij}}{d_{ij}(Z)}}

для

d_{ij}(Z)\neq 0,i\neq j

$b_{ij}=0$ для $d_{ij}(Z)=0,i\neq j$

$b_{ii}=-\sum _{j=1,j\neq i}^{n}b_{ij}$ .

Ця нерівність доводиться через нерівність Коші — Буняковського (див. статтю Борга^[3]).

Таким чином, ми маємо просту квадратичну функцію $\tau (X,Z)$ , яка мажорує стрес:

\sigma (X)=C+\,\operatorname {tr} \,X'VX-2\,\operatorname {tr} \,X'B(X)X

\leqslant C+\,\operatorname {tr} \,X'VX-2\,\operatorname {tr} \,X'B(Z)Z=\tau (X,Z)

Тоді ітеративна процедура мажорування робить таке:

на кроці k ми приймаємо $Z\leftarrow X^{k-1}$
$X^{k}\leftarrow \min _{X}\tau (X,Z)$
зупиняємося, якщо $\sigma (X^{k-1})-\sigma (X^{k})<\epsilon$ , в іншому випадку повертаємося на початок.

Показано, що цей алгоритм зменшує стрес монотонно (див. статтю де Лейва^[2]).

Використання у візуалізації графів[ред. | ред. код]

Мажорування стресу і алгоритми, подібні SMACOF, застосовуються також у галузі візуалізації графів^[4]^[5]. Тобто, завдякимінімізації функції стресу, можна знайти більш-менш естетичне розташування вершин для мережі або графа. В цьому випадку $\delta _{ij}$ зазвичай береться як відстань (у сенсі теорії графів) між вузлами (вершинами) i і j, а ваги $w_{ij}$ беруться рівними $\delta _{ij}^{-\alpha }$ . Тут $\alpha$ вибирається як компроміс між збереженням великих і малих ідеальних відстаней. Хороші результати отримано для $\alpha =2$ ^[6].

Примітки[ред. | ред. код]

↑ Kruskal, 1964, с. 1–27.
↑ ^а ^б de Leeuw, 1977, с. 133–145.
↑ Borg, Groenen, 1997, с. 152–153.
↑ Michailidis, de Leeuw, 2001, с. 435–450.
↑ Gansner, Koren, North, 2004, с. 239–250.
↑ Cohen, 1997, с. 197–229.

Література[ред. | ред. код]

Kruskal J. B. Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis // Psychometrika. — 1964. — Т. 29, вип. 1. — С. 1–27. — DOI:10.1007/BF02289565.
de Leeuw J. Applications of convex analysis to multidimensional scaling // Recent developments in statistics / Barra J. R., Brodeau F., Romie G., van Cutsem B. — 1977. — С. 133–145.
Borg I., Groenen P.,. Modern Multidimensional Scaling: theory and applications. — New York : Springer-Verlag, 1997.
Michailidis G., de Leeuw J. Data visualization through graph drawing // Computation Stat.. — 2001. — Т. 16, вип. 3. — С. 435–450. — DOI:10.1007/s001800100077.
Gansner E., Koren Y., North S. Graph Drawing by Stress Majorization // Proceedings of 12th Int. Symp. Graph Drawing (GD'04). — Springer-Verlag, 2004. — Т. 3383. — С. 239–250. — (Lecture Notes in Computer Science)
Cohen J. Drawing graphs to convey proximity: an incremental arrangement method // ACM Transactions on Computer-Human Interaction. — 1997. — Т. 4, вип. 3. — С. 197–229. — DOI:10.1145/264645.264657.

[FOOTNOTEKruskal19641–27-1] Kruskal, 1964, с. 1–27.

[FOOTNOTEde_Leeuw1977133–145-2] а ^б de Leeuw, 1977, с. 133–145.

[FOOTNOTEBorg,_Groenen1997152–153-3] Borg, Groenen, 1997, с. 152–153.

[FOOTNOTEMichailidis,_de_Leeuw2001435–450-4] Michailidis, de Leeuw, 2001, с. 435–450.

[FOOTNOTEGansner,_Koren,_North2004239–250-5] Gansner, Koren, North, 2004, с. 239–250.

[FOOTNOTECohen1997197–229-6] Cohen, 1997, с. 197–229.

[1]

[2]

[3]

[4]

[5]

[6]

Мажорування стресу

Алгоритм SMACOF[ред. | ред. код]

Використання у візуалізації графів[ред. | ред. код]

Примітки[ред. | ред. код]

Література[ред. | ред. код]

€4.95