Mínimos cuadrados aplicados a datos reales: Análisis de tendencias en series climáticas
Planteamiento del problema
Consideramos una serie de datos sobre la temperatura global del planeta a lo largo del tiempo (fuente NOAA).
Calculamos la tendencia de la temperatura media global aplicando el método de mínimos cuadrados:
- Regresión lineal simple.El modelo matemático viene dado por:
$$
y(t_i) =a·t_i+b
$$siendo \(t_i\) el tiempo (en años), \(y(t_i)\) la temperatura (en ºC) y, en este caso, las incógnitas \(a\) y \(b\) denotan las incógnitas. Expresado matricialmente:
$$
\mathbf{y} = \mathbf{Ax}
$$con \(\mathbf{y}\) el vector columna \(m\)-dimensional de observación; \(\mathbf{x}\) el vector 2-dimensional de incógnitas y la matriz de coeficientes \(\mathbf{A}\) de tamaño \(m\times 2\), contiene en su primera columna el vector de tiempos y es la segunda un vector de unos. Podemos calcular la solución mínimos cuadrados a partir de:
- Calculando, la solución del sistema de ecuaciones normales asociado (ver mínimos cuadrados ordinarios):
$$
\mathbf{ \widehat{x}=(A’A)^{-1}A’y}
$$- Calculando la pseudoinversa mediante la Descomposición el Valores singulares.
- Regresión lineal múltiple.Consideramos el modelo
$$
y(t_i) =a·(t_i)^2+b·t_i+c
$$En este caso la matriz de coeficientes \(\mathbf{A}\) tendrá tamaño \(m\times 3\) siendo \(n=3\) el número de incógnitas.