Un parámetro basta para ajustar cualquier cosa .Anxo Sànchez

"Elegir un modelo u otro para describir un fenómeno que da lugar a unos datos en función de que tenga más o menos parámetros no es una buena idea. Como acabamos de ver, siempre podemos construir un modelo con un único parámetro y, por tanto, tendría todas las papeletas para ser el seleccionado. Piense, sin embargo, que la ecuación logística estaría entonces describiendo prácticamente cualquier cosa, lo que obviamente no puede ser verdad. Así que cuidado con este tipo de argumentos" Anxo Sánchez.

Un parámetro basta para ajustar cualquier cosa

Uno de los temas recurrentes de este blog es el de los modelos matemáticos y su comparación con los fenómenos que intentan describir. Siguiendo la navaja de Ockham, se suele considerar que el modelo con menos parámetros libres, al ser más simple, es el que seguramente sea más correcto. En este post, con el que intento retomar este blog después de un año de silencio, traigo un ejemplo recientemente publicado que muestra que cualquier cosa, literalmente cualquier cosa, se puede ajustar con un único parámetro libre, siendo el modelo que hay detrás totalmente irrelevante en cuanto a descubrir los mecanismos del fenómeno. Así que cuidado con usar el número de parámetros de un modelo alegremente para tirar otros que puedan ser más informativos a la basura.

Como decía antes, he estado demasiado tiempo sin ocuparme de este blog por múltiples razones, entre las que el haber asumido la dirección de mi departamento en la Universidad y el tener que cerrar un proyecto europeo que coordinaba han influido más que ninguna otra. Como además aquí soy mi propio jefe y no tengo editores que me persiguen como en Nada es Gratis, pues claro, al final lo paga mi dedicación a este blog. Bueno, pues acabado con excelentes resultados el proyecto (gracias por preguntar) y a mitad de mi mandato como director, vuelvo a buscar dragones en el proceloso océano de la física y la matemática de los sistemas complejos. Y para esta nueva etapa, he querido traer un ejemplo de simplicidad engañosa que creo que puede ser interesante para muchas aplicaciones.

El ejemplo en cuestión es un artículo aparecido hace pocos meses y titulado "One parameter is always enough" (Un parámetro siempre es bastante), de Steven T. Piantadosi, de la Universidad de California en Berkeley. El artículo comienza citando nada menos que a John von Neumann, cuando decía que "con cuatro parámetros libres podía hacer un elefante, y con cinco que moviera la trompa", para enseguida ir a su propósito: mostrar que es posible ajustar modelos elementales con un único parámetro a conjuntos con un número arbitrariamente grande de puntos y con la precisión que se desee. Y, como vamos a ver, lo más sorprendente es que esto es una consecuencia de las propiedades de los sistemas dinámicos caóticos. Como dice el propio autor, no hay ninguna técnica matemática nueva en el artículo, pero esta consecuencia de la dinámica caótica no había sido puesta de manifiesto hasta ahora y, como discutiré al final, tiene consecuencias relevantes.

220px-Scatter_diagram_for_quality_characteristic_XXX.svg.png

La idea para construir un modelo que ajuste cualquier cosa con un parámetro empieza por la descripción de lo que queremos ajustar. Vamos a centrarnos en un scatterplot, o sea, un conjunto de puntos definidos por coordenadas x e y en el plano, donde podemos considerar que x es la variable independiente y que y es la dependiente. En la figura adjunta podemos ver un ejemplo. Por sencillez, vamos a suponer que los valores que toma x son los números naturales 0, 1, 2. 3, ... La herramienta que utilizaremos es la función logística, de la que ya hablé aquí, y que viene dada por m(z)=4z(1-z). Sin entrar en detalles que el lector interesado puede encontrar en el artículo de Piantadosi, esta función está muy relacionada (técnicamente, es topológicamente conjugada) con la de Bernoulli, que se define como
Captura de pantalla 2019-01-31 a las 9.58.35.png

Captura de pantalla 2019-01-31 a las 9.58.35.png

La relación entre ambas funciones es que una se transforma en la otra mediante un cambio de variable, y lo interesante de la función de Bernoulli es que si escribimos el número z en el sistema binario, el resultado de S(z) es simplemente eliminar el primer digito justo antes de la coma (recordemos que estamos en el intervalo entre 0 y 1) y correr los demás hacia la izquierda. Este es el punto clave del argumento, porque ahora lo que hacemos es coger los valores de y que queremos aproximar, en orden, escribirlos con la precisión que queramos (pero eso sí la misma para todos, digamos r dígitos) en binario y formar un número w poniendo todos esos dígitos uno detras de otro. Ese número coincide con el primer y, y₁, en sus primeros r dígitos. Si ahora le aplicamos la función S r veces, obtendremos un número que coincide con y₂ en sus primeros r dígitos, y así sucesivamente. Si, finalmente, utilizamos la función que transforma la de Bernoulli en la logística, podemos pasar el número w, que estábamos utilizando como condición inicial para generar los y's, a una condición inicial w' para la función logística m(z). De esta manera, obtenemos un modelo que consiste en la función m, que es infinitamente diferenciable, además, y una condición inicial w' que nos ajusta tantos cuantos puntos queramos y con la precisión que queramos. Piantadosi nos presenta en su artículo dos ejemplos impresionantes, calculando la condición inicial necesaria para ambos. Concretamente, son un elefante (como le gustaría a von Neumann)

Captura de pantalla 2019-01-31 a las 10.15.52.png

y la firma de Miró

Captura de pantalla 2019-01-31 a las 10.16.02.png

Si usted, amigo lector, se ha perdido un poco (o mucho) en el resumen del procedimiento, no se preocupe: en primer lugar, seguramente es culpa mía que he querido volar muy rápido sobre algunos de los detalles, y en segundo lugar, si quiere ajustar su propia figura solo tiene que ir al artículo dónde se describe todo el proceso sin omisiones. Quédese solo con la copla de que hemos demostrado que se puede ajustar cualquier conjunto de puntos en el plano con la precisión que se desee con la función logística y un único parámetro, calculable a partir de los datos de manera fácil, y que se usa como condición inicial para las iteraciones de la función logística. Suficiente con esto.

Lo importante son las conclusiones y las precauciones que se desprenden de esto. En primer lugar, la conclusión que adelantaba al principio: elegir un modelo u otro para describir un fenómeno que da lugar a unos datos en función de que tenga más o menos parámetros no es una buena idea. Como acabamos de ver, siempre podemos construir un modelo con un único parámetro y, por tanto, tendría todas las papeletas para ser el seleccionado. Piense, sin embargo, que la ecuación logística estaría entonces describiendo prácticamente cualquier cosa, lo que obviamente no puede ser verdad. Así que cuidado con este tipo de argumentos.

Por otro lado, podría usted pensar que ahora que tiene esta función para cualquier conjunto de puntos, puede usarla para extrapolar, es decir, para obtener valores de y en puntos intermedios entre los x, los naturales. Desafortunadamente, esto no es así, porque entre los x la función oscila salvajemente ya que hay funciones sinusoidales involucradas, y lo que tendríamos es un típico ejemplo de sobreajuste (overfitting). Lo interesante aquí es que normalmente el sobreajuste se asocia a usar demasiados parámetros, pero lo que hemos visto es que podemos estar en esta situación incluso en un modelo con un solo parámetro. Sorprendente, ¿no?

Como conclusión final, vista la potencia que tiene un único número real (nuestra condición inicial w') para codificar o recoger la información de muchísimos datos, nos debería hacer desconfiar de los procedimientos de selección de modelos que sean totalmente agnósticos, es decir, que no hagan hipótesis sobre la clase concreta de modelos en la que se quiere trabajar. A la hora de intentar encontrar modelos es necesario basarse en teorías concretas que restrinjan el tipo de modelos a utilizar (lo que normalmente excluirá a nuestra función logística y a otras similares sobre las que se podría basar otro ajuste uniparamétrico). Como siempre, solo una correcta combinación de potencia de cálculo e intuición humana nos permitirá extraer conocimiento de los datos.

No hay comentarios:

Publicar un comentario

Brújula Ciencia-Economia-Sociedad