Tu salario, tus años de educación y la econometría: todo tiene una línea que los une

¿Por qué sube el precio del pan? ¿Por qué una persona con más años de estudio, en promedio, gana más dinero? ¿Qué determina que un alfajor se venda más en una ciudad que en otra? Estas preguntas tienen algo en común: todas suponen una relación entre variables.

En economía —y en muchas charlas de sobremesa también— nos la pasamos buscando explicaciones. ¿Subió el precio? Debe haber más demanda. ¿Aumentó el salario? Seguro es por la antigüedad. ¿Subieron las ventas? Capaz hubo una promoción. Estas relaciones, que a veces intuimos, tienen un nombre técnico: dependencia estadística. Y si queremos medir cuán fuerte es esa relación, y si de verdad existe, ahí es donde entra nuestra estrella: la regresión. Formalmente, un modelo de regresión intenta representar una relación funcional entre una variable dependiente —la que queremos explicar o predecir— y una o más variables independientes —las que creemos que influyen sobre ella—. En criollo: queremos saber cómo cambia, en promedio, algo (el precio del pan) cuando cambia otra cosa (el costo de la harina, por ejemplo), manteniendo todo lo demás constante (sí, incluso el dólar blue).

La versión más simple de este enfoque se llama regresión lineal, y su magia está en trazar una línea recta lo más cerca posible de todos los puntos que representan nuestros datos. Esa línea es como un resumen: te dice, en promedio, qué tendencia siguen los datos. Algo así como un «más o menos» con fundamento estadístico.

Y si bien todo esto suena muy técnico, también tiene una dimensión profundamente cotidiana. Cada vez que decís «Mejor llevo paraguas porque el cielo está nublado”, estás haciendo una predicción basada en una relación. La diferencia es que la regresión la hace con números, no con corazonadas.

En esta primera edición de Econometría para no economistas, vamos a explorar cómo funciona una regresión, qué puede (y qué no puede) decirnos, y por qué —a pesar de lo que digan algunos amigos contadores— es una de las herramientas más poderosas para pensar en economía con datos y no solo con intuición.

Imagina que tenés un conjunto de datos: por ejemplo, los años de estudio y el salario de distintas personas. Cada dato es un punto en un gráfico: en el eje horizontal (eje X) ponemos los años de educación, y en el eje vertical (eje Y), el salario mensual. Si miras el gráfico, vas a ver una nube de puntos dispersos, que no forman una línea perfecta, pero que —a simple vista— parecen seguir una cierta tendencia: cuanto más estudió alguien, más gana.

Acá es donde entra la regresión. Podes pensarla como una regla, literalmente: una recta que intentamos ajustar para que pase lo más cerca posible de todos esos puntos, tal como la recta roja de la ilustración. Esa línea resume el patrón general que observamos entre ambas variables. No se ajusta a cada caso particular (porque siempre hay excepciones), pero sí nos dice qué pasa en promedio.

Formalmente, hablamos de regresión lineal cuando usamos una recta para modelar la relación entre una variable dependiente 

Y y una independiente X. El modelo más básico se escribe así:

Y=0+1X+ϵ

Donde:

  • Y es la variable que queremos explicar (como el salario).
  • X es la variable que creemos que lo afecta (por ejemplo, los años de educación).
  • 0​ es la ordenada al origen: el valor de Y cuando X=0.
  • 0​ es la pendiente: nos dice cuánto cambia Y cuando X aumenta una unidad.
  • es el término de error, que capta lo que el modelo no explica (porque la vida, como los datos, nunca es perfecta).

Si la pendiente 1​ es positiva, significa que, a más años de educación, mayor salario. Si es negativa, la relación es inversa: por ejemplo, más kilómetros recorridos por un auto, menor valor de reventa. Lo importante es que está pendiente no sale de una corazonada, sino de los datos. Y la regresión se encarga de encontrar la recta que minimiza los errores de predicción: busca que la distancia entre los puntos observados y la línea que trazamos sea lo más chica posible, en promedio.

Entonces, ¿qué hace la regresión? Dibuja una línea en medio del caos, y nos dice: “esto es lo que suele pasar, en general”. A partir de ahí, podemos analizar, predecir o tomar decisiones. No te da certezas absolutas, pero sí una base sólida para pensar con evidencia.

Ahora que ya sabemos qué es una regresión lineal y cómo funciona, vale la pena preguntarse: ¿para qué sirve todo esto? ¿Por qué debería importarte, aunque no seas economista ni te gusten los números?

La respuesta corta es: porque está en todas partes. La regresión se usa para predecir, para entender relaciones y para tomar decisiones mejor fundamentadas. Veamos algunos ejemplos:

  • Predicción: Supongamos que el Ministerio de Educación quiere saber cuánto aumentaría el ingreso promedio si se extiende un año más la educación obligatoria. Con una regresión entre años de estudio e ingresos, se puede estimar ese impacto. No es magia, es estadística aplicada.
  • Análisis de impacto: Imaginá que un gobierno lanza un subsidio a las tarifas de luz. ¿Sirvió para reducir los gastos del hogar? ¿Tuvo más efecto en las familias con menores ingresos? Una regresión puede ayudar a responder estas preguntas, midiendo cuánto cambió una variable (el gasto) cuando cambió otra (la política).
  • Comprender relaciones: A veces no queremos predecir nada, solo entender. ¿Qué factores influyen en el precio del alquiler en una ciudad? ¿Importa más la cercanía al centro, la cantidad de ambientes o si tiene balcón? Una regresión permite separar el efecto de cada variable, aislando su impacto promedio.

Y esto no se limita a la economía. Se usa en medicina (para ver si un tratamiento reduce la presión arterial), en sociología (para analizar cómo influye el entorno en el rendimiento escolar), en marketing (para estimar cómo afectan las promociones a las ventas), en el deporte, en la política, en la vida cotidiana.

En definitiva, la regresión es como una lupa estadística: te ayuda a ver con claridad qué relación hay entre las cosas, sin quedarte solo con la intuición. Te da números donde antes había suposiciones, y eso —en un mundo saturado de opiniones— no es poca cosa

Hasta acá, descubrimos que una regresión lineal es como una regla que trata de encontrar el patrón general entre dos variables. Si algo crece junto con otra cosa (como el salario y la educación), la regresión lo captura con una línea recta. Esa línea tiene una pendiente (que nos dice si sube o baja) y un margen de error (porque nadie es perfecto).

Vimos que este modelo no intenta explicar cada caso particular —ni al que gana millones sin haber terminado el secundario, ni al que estudió tres carreras y cobra el salario mínimo—, sino que busca entender qué pasa en promedio. Es una herramienta poderosa porque nos da pistas, estimaciones y sobre todo, una manera de pensar con datos sin necesidad de ser una calculadora humana.

Pero ahora que ya somos amigos de la recta, viene la gran pregunta:

¿Y si la relación entre las variables no es lineal?
¿Y si el salario no sube igual por cada año de estudio, sino que después de cierto punto se ameseta? ¿O si el efecto de una política económica no es constante, sino que depende del contexto?

Ahí es donde la regresión lineal empieza a quedar chica. Y para eso, existen otros modelos que permiten curvas, quiebres, giros y más flexibilidad. En el próximo capítulo de Econometría para no economistas, nos metemos con esos casos donde la realidad se tuerce y la línea recta no alcanza.