Capítulo 8 — Ortogonalidad y Proyecciones

1. Vectores ortogonales

Dos vectores $x, y$ en un espacio de Hilbert $H$ se dicen ortogonales, y se denota $x \\perp y$, si su producto interno es nulo:

$$ x \\perp y \\quad \\Longleftrightarrow \\quad \\langle x, y \\rangle = 0 $$

La relación de ortogonalidad es simétrica ($x \\perp y \\iff y \\perp x$) porque $\\langle y, x \\rangle = \\overline{\\langle x, y \\rangle} = 0$. El vector nulo es el único vector ortogonal a todo elemento del espacio.

La consecuencia más importante de la ortogonalidad es el Teorema de Pitágoras en espacios de Hilbert:

Teorema de Pitágoras (en espacios de Hilbert)

Si $x, y \\in H$ con $x \\perp y$, entonces

$$ \\|x + y\\|^2 = \\|x\\|^2 + \\|y\\|^2 $$

Demostración: $\\|x + y\\|^2 = \\langle x + y, x + y \\rangle = \\langle x, x \\rangle + \\langle x, y \\rangle + \\langle y, x \\rangle + \\langle y, y \\rangle = \\|x\\|^2 + 0 + 0 + \\|y\\|^2 = \\|x\\|^2 + \\|y\\|^2$.

El Teorema de Pitágoras se generaliza por inducción a cualquier conjunto finito de vectores mutuamente ortogonales:

$$ \\left\\| \\sum_{k=1}^{n} x_k \\right\\|^2 = \\sum_{k=1}^{n} \\|x_k\\|^2 \\qquad \\text{si } x_i \\perp x_j \\text{ para } i \\neq j $$

Este resultado se extiende a sumas infinitas (series) cuando la sucesión de sumas parciales converge, como veremos en el Capítulo 9 al estudiar bases ortonormales.

2. Conjuntos ortonormales

Un conjunto $\\{e_\\alpha\\}_{\\alpha \\in A} \\subseteq H$ se dice ortonormal si sus elementos son mutuamente ortogonales y tienen norma unitaria:

$$ \\langle e_\\alpha, e_\\beta \\rangle = \\delta_{\\alpha\\beta} = \\begin{cases} 1 & \\text{si } \\alpha = \\beta \\\\ 0 & \\text{si } \\alpha \\neq \\beta \\end{cases} $$

donde $\\delta_{\\alpha\\beta}$ es la delta de Kronecker.

Todo conjunto ortonormal es linealmente independiente. En efecto, si $\\sum_{k=1}^{n} c_k e_{\\alpha_k} = 0$, tomando producto interno con $e_{\\alpha_j}$ se obtiene $c_j = 0$ para cada $j$. Esta propiedad es fundamental: los conjuntos ortonormales proporcionan sistemas coordenados naturales en los que las coordenadas se obtienen simplemente mediante producto interno, sin necesidad de resolver sistemas de ecuaciones lineales.

Un conjunto ortonormal se dice maximal (o completo) si no está contenido propiamente en ningún otro conjunto ortonormal. Los conjuntos ortonormales maximales (también llamados bases ortonormales) serán estudiados en profundidad en el Capítulo 9.

Ejemplo canónico

En $\\mathbb{R}^3$ con el producto interno euclídeo, la base canónica $\\{e_1 = (1, 0, 0),\\; e_2 = (0, 1, 0),\\; e_3 = (0, 0, 1)\\}$ es un conjunto ortonormal maximal. En $\\ell^2$, el conjunto $\\{e_n\\}_{n=1}^{\\infty}$ donde $e_n$ tiene $1$ en la posición $n$ y $0$ en las demás es ortonormal maximal.

3. Proceso de Gram–Schmidt

El proceso de ortogonalización de Gram–Schmidt es un algoritmo que transforma cualquier conjunto finito o infinito numerable de vectores linealmente independientes en un conjunto ortonormal que genera el mismo subespacio.

Dado un conjunto linealmente independiente $\\{v_1, v_2, \\dots\\}$, el algoritmo construye recursivamente vectores ortogonales $u_k$ y luego los normaliza para obtener $e_k$:

Algoritmo de Gram–Schmidt

Paso 1 (ortogonalización): Para $k = 1, 2, \\dots$

$$ u_1 = v_1, \\qquad u_k = v_k - \\sum_{j=1}^{k-1} \\frac{\\langle v_k, u_j \\rangle}{\\langle u_j, u_j \\rangle} \\, u_j \\quad (k \\geq 2) $$

Paso 2 (normalización):

$$ e_k = \\frac{u_k}{\\|u_k\\|} \\qquad (k = 1, 2, \\dots) $$

El conjunto $\\{e_1, e_2, \\dots\\}$ es ortonormal y $\\operatorname{span}\\{e_1, \\dots, e_k\\} = \\operatorname{span}\\{v_1, \\dots, v_k\\}$ para cada $k$.

Un ejemplo clásico de aplicación del proceso de Gram–Schmidt es la construcción de los polinomios de Legendre en $L^2[-1, 1]$. Partiendo de la base canónica de polinomios $\\{1, x, x^2, x^3, \\dots\\}$ y aplicando el algoritmo con el producto interno $\\langle f, g \\rangle = \\int_{-1}^{1} f(x) g(x) \\, dx$, se obtiene la familia de polinomios ortogonales de Legendre:

$$ P_0(x) = 1, \\quad P_1(x) = x, \\quad P_2(x) = \\frac{1}{2}(3x^2 - 1), \\quad P_3(x) = \\frac{1}{2}(5x^3 - 3x), \\quad \\dots $$

Los polinomios de Legendre satisfacen $\\int_{-1}^{1} P_m(x) P_n(x) \\, dx = 0$ para $m \\neq n$ y $\\int_{-1}^{1} P_n(x)^2 \\, dx = \\frac{2}{2n+1}$, por lo que normalizando adecuadamente se obtiene un conjunto ortonormal en $L^2[-1, 1]$.

El proceso de Gram–Schmidt también tiene una interpretación geométrica directa: en cada paso $k$, se resta al vector $v_k$ sus proyecciones sobre los vectores ya ortogonalizados $u_1, \\dots, u_{k-1}$, garantizando así que $u_k$ sea ortogonal a todos ellos.

4. Proyección ortogonal sobre subespacios cerrados

Sea $M$ un subespacio cerrado de un espacio de Hilbert $H$. Para cada $x \\in H$, el Teorema de la Proyección (caso particular del teorema general para convexos cerrados) garantiza la existencia de un único elemento de mejor aproximación $m_0 \\in M$:

$$ \\|x - m_0\\| = \\min_{m \\in M} \\|x - m\\| = d(x, M) $$

El vector $m_0$ se denomina la proyección ortogonal de $x$ sobre $M$ y se denota $P_M(x)$. El operador $P_M: H \\to M$ definido por $x \\mapsto P_M(x)$ es un operador lineal, continuo, idempotente ($P_M^2 = P_M$) y autoadjunto ($P_M^* = P_M$), con norma $\\|P_M\\| = 1$ (salvo el caso trivial $M = \\{0\\}$ donde $P_M = 0$).

La proyección ortogonal se caracteriza por la condición de ortogonalidad del residuo:

$$ x - P_M(x) \\in M^{\\perp} $$

donde $M^{\\perp}$ es el complemento ortogonal de $M$ que definiremos en la Sección 6.

Si $M$ es de dimensión finita y $\\{e_1, \\dots, e_n\\}$ es una base ortonormal de $M$, la proyección ortogonal adopta una expresión explícita muy simple:

$$ P_M(x) = \\sum_{k=1}^{n} \\langle x, e_k \\rangle \\, e_k $$

Los coeficientes $\\langle x, e_k \\rangle$ se denominan coeficientes de Fourier de $x$ respecto a la base ortonormal $\\{e_k\\}$, un concepto que será central en el Capítulo 9.

5. Descomposición ortogonal

La combinación del Teorema de la Proyección y la noción de complemento ortogonal da lugar a uno de los resultados estructurales más importantes de la teoría de espacios de Hilbert: la descomposición ortogonal.

Teorema de Descomposición Ortogonal

Sea $M$ un subespacio cerrado de un espacio de Hilbert $H$. Entonces

$$ H = M \\oplus M^{\\perp} $$

Es decir, todo vector $x \\in H$ se escribe de manera única como

$$ x = m + n, \\qquad m \\in M, \\; n \\in M^{\\perp} $$

donde $m = P_M(x)$ es la proyección ortogonal de $x$ sobre $M$ y $n = x - P_M(x) \\in M^{\\perp}$.

La descomposición es única porque si $x = m_1 + n_1 = m_2 + n_2$ con $m_i \\in M$, $n_i \\in M^{\\perp}$, entonces $m_1 - m_2 = n_2 - n_1 \\in M \\cap M^{\\perp} = \\{0\\}$, de donde $m_1 = m_2$ y $n_1 = n_2$. La igualdad $M \\cap M^{\\perp} = \\{0\\}$ se sigue de que si $x \\in M \\cap M^{\\perp}$, entonces $\\langle x, x \\rangle = 0$ y por tanto $x = 0$.

La notación $H = M \\oplus M^{\\perp}$ indica que $H$ es la suma directa ortogonal de $M$ y $M^{\\perp}$: cada elemento de $H$ se descompone como suma de un elemento de $M$ y uno de $M^{\\perp}$, y estos subespacios son ortogonales entre sí. Como consecuencia del Teorema de Pitágoras generalizado, se verifica:

$$ \\|x\\|^2 = \\|P_M(x)\\|^2 + \\|x - P_M(x)\\|^2 \\qquad \\forall x \\in H $$

Esta identidad muestra que la proyección ortogonal $P_M(x)$ es efectivamente la componente de $x$ en la dirección de $M$, y el residuo es ortogonal a $M$.

6. Complemento ortogonal

Dado un subconjunto $S \\subseteq H$, su complemento ortogonal se define como:

$$ S^{\\perp} = \\{ x \\in H : \\langle x, s \\rangle = 0 \\; \\forall s \\in S \\} $$

Las propiedades fundamentales del complemento ortogonal son las siguientes:

$S^{\\perp}$ es siempre un subespacio cerrado de $H$, independientemente de si $S$ es cerrado o no. Esto se debe a que $S^{\\perp} = \\bigcap_{s \\in S} \\ker(\\varphi_s)$ donde $\\varphi_s(x) = \\langle x, s \\rangle$ es una funcional lineal continua.
Si $S \\subseteq T$, entonces $T^{\\perp} \\subseteq S^{\\perp}$.
$S \\subseteq (S^{\\perp})^{\\perp}$. Esta inclusión puede ser estricta si $S$ no es un subespacio cerrado.
Para un subespacio cerrado $M$, se verifica $(M^{\\perp})^{\\perp} = M$.
En general, para cualquier subconjunto $S$, $(S^{\\perp})^{\\perp} = \\overline{\\operatorname{span}}(S)$, la clausura del subespacio generado por $S$.

La propiedad (4) es de particular importancia: establece que la operación de tomar complemento ortogonal es una involución sobre la familia de subespacios cerrados de $H$. Esto refleja una dualidad geométrica perfecta entre un subespacio cerrado y su complemento ortogonal.

Como aplicación inmediata de estas propiedades, se tiene que un subespacio $M$ es denso en $H$ si y solo si $M^{\\perp} = \\{0\\}$. En efecto, si $M$ es denso, entonces $\\overline{M} = H$, luego $M^{\\perp} = (\\overline{M})^{\\perp} = H^{\\perp} = \\{0\\}$. Recíprocamente, si $M^{\\perp} = \\{0\\}$, entonces $(M^{\\perp})^{\\perp} = \\{0\\}^{\\perp} = H$, pero $(M^{\\perp})^{\\perp} = \\overline{M}$, de donde $\\overline{M} = H$.