Fundación BBVA

Multivariate Statistics

Reduced-Dimension Biplots

Summary

1. Reduced dimension biplots rely on approximating a matrix of high dimensionality by a matrix of lower dimensionality. The matrix of low dimensionality is then the target matrix for the biplot.

2. If approximation of a matrix is performed using a least-squares objective, then the singular value decomposition (SVD) provides the solution in a very convenient form as the product of three matrices: the left and right matrices of the biplot are then provided by distributing the second matrix of the SVD (the diagonal matrix of singular values) to the first and third matrices (of singular vectors).

3. The objective of least-squares matrix approximation can be generalized to include weights for the rows and the columns. This leads to a simple modification of the SVD, called the generalized SVD, involving pre-transformation of the matrix to be approximated and post-transformation of the singular vectors.

4. Generalized principal component analysis (PCA) is a geometric version of matrix approximation, where a set of n vectors in m-dimensional space is projected onto a subspace of lower dimensionality. The resultant reduced dimension biplot depicts the approximate positions of the n points along with m directions showing the biplot axes.

5. Multidimensional scaling (MDS), including the general case where points have any positive weights, can also be formulated as an eigenvalue/eigenvector special case of the SVD problem, because the matrix decomposed is square and symmetric. The resultant coordinates are identical to those found in generalized PCA, if the interpoint distances are defined using the same metric.

Biplots de dimensiones reducidas

Resumen Capítulo 5

1. Los biplots en dimensión reducida dependen de la aproximación de baja dimensionalidad a la matriz de alta dimensionalidad estudiada. La matriz de baja dimensionalidad es la matriz objetivo del biplot.

2. Si realizamos la aproximación a la matriz mediante mínimos-cuadrados, la posterior descomposición en valores singulares (DVS) da una buena solución consistente en el producto de tres matrices: obtenemos las matrices de la izquierda y de la derecha del biplot, distribuyendo los valores de la segunda matriz de la DVS (la matriz diagonal de valores singulares) a las matrices primera y tercera (de vectores singulares).

3. Podemos generalizar la aproximación mínimo-cuadrática a la matriz considerando los pesos de filas y columnas. Ello conduce a una modificación simple de la DVS, llamada DVS generalizada. Implica una pretransformación de la matriz que queramos aproximar y una postransformación de los vectores singulares.

4. El análisis de componentes principales generalizado (ACP) es una versión geométrica de aproximación matricial. Proyectamos n vectores de un espacio de dimensión m sobre un subespacio de menor dimensión. El biplot resultante de dimensión reducida representa las posiciones aproximadas de los n puntos junto con las m direcciones mostrando los ejes del biplot.

5.También podemos formular el escalado multidimensional (EMD) con puntos ponderados, como un caso especial del DVS en términos de valores y vectores propios, ya que la matriz descompuesta es cuadrada y simétrica. Si utilizamos la misma escala de medida, las coordenadas resultantes son idénticas a las obtenidas con el ACP generalizado.

[back]