"Elegir un modelo u otro para describir un fenómeno que da lugar a unos
datos en función de que tenga más o menos parámetros no es una buena
idea. Como acabamos de ver, siempre podemos construir un modelo con un
único parámetro y, por tanto, tendría todas las papeletas para ser el
seleccionado. Piense, sin embargo, que la ecuación logística estaría
entonces describiendo prácticamente cualquier cosa, lo que obviamente no
puede ser verdad. Así que cuidado con este tipo de argumentos" Anxo
Sánchez.
Un parámetro basta para ajustar cualquier cosa
Uno
de los temas recurrentes de este blog es el de los modelos matemáticos y
su comparación con los fenómenos que intentan describir. Siguiendo la navaja de Ockham,
se suele considerar que el modelo con menos parámetros libres, al ser
más simple, es el que seguramente sea más correcto. En este post, con el
que intento retomar este blog después de un año de silencio, traigo un
ejemplo recientemente publicado que muestra que cualquier cosa,
literalmente cualquier cosa, se puede ajustar con un único parámetro
libre, siendo el modelo que hay detrás totalmente irrelevante en cuanto a
descubrir los mecanismos del fenómeno. Así que cuidado con usar el
número de parámetros de un modelo alegremente para tirar otros que
puedan ser más informativos a la basura.
Como
decía antes, he estado demasiado tiempo sin ocuparme de este blog por
múltiples razones, entre las que el haber asumido la dirección de mi departamento en la Universidad y el tener que cerrar un proyecto europeo
que coordinaba han influido más que ninguna otra. Como además aquí soy
mi propio jefe y no tengo editores que me persiguen como en Nada es Gratis, pues claro, al final lo paga mi dedicación a este blog. Bueno, pues acabado con excelentes resultados
el proyecto (gracias por preguntar) y a mitad de mi mandato como
director, vuelvo a buscar dragones en el proceloso océano de la física y
la matemática de los sistemas complejos. Y para esta nueva etapa, he
querido traer un ejemplo de simplicidad engañosa que creo que puede ser
interesante para muchas aplicaciones.
El ejemplo en cuestión es un artículo aparecido hace pocos meses y titulado "One parameter is always enough" (Un parámetro siempre es bastante), de Steven T. Piantadosi, de la Universidad de California en Berkeley. El artículo comienza citando nada menos que a John von Neumann,
cuando decía que "con cuatro parámetros libres podía hacer un elefante,
y con cinco que moviera la trompa", para enseguida ir a su propósito:
mostrar que es posible ajustar modelos elementales con un único
parámetro a conjuntos con un número arbitrariamente grande de puntos y
con la precisión que se desee. Y, como vamos a ver, lo más sorprendente
es que esto es una consecuencia de las propiedades de los sistemas dinámicos caóticos.
Como dice el propio autor, no hay ninguna técnica matemática nueva en
el artículo, pero esta consecuencia de la dinámica caótica no había sido
puesta de manifiesto hasta ahora y, como discutiré al final, tiene
consecuencias relevantes.
La idea para construir un modelo que ajuste cualquier cosa con un parámetro empieza por la descripción de lo que queremos ajustar. Vamos a centrarnos en un scatterplot, o sea, un conjunto de puntos definidos por coordenadas x e y en el plano, donde podemos considerar que x es la variable independiente y que y es la dependiente. En la figura adjunta podemos ver un ejemplo. Por sencillez, vamos a suponer que los valores que toma x son los números naturales 0, 1, 2. 3, ... La herramienta que utilizaremos es la función logística, de la que ya hablé aquí, y que viene dada por m(z)=4z(1-z). Sin entrar en detalles que el lector interesado puede encontrar en el artículo de Piantadosi, esta función está muy relacionada (técnicamente, es topológicamente conjugada) con la de Bernoulli, que se define como
La relación entre ambas funciones es que una se transforma en la otra
mediante un cambio de variable, y lo interesante de la función de
Bernoulli es que si escribimos el número z en el sistema binario, el resultado de S(z)
es simplemente eliminar el primer digito justo antes de la coma
(recordemos que estamos en el intervalo entre 0 y 1) y correr los demás
hacia la izquierda. Este es el punto clave del argumento, porque ahora
lo que hacemos es coger los valores de y que queremos aproximar, en orden, escribirlos con la precisión que queramos (pero eso sí la misma para todos, digamos r dígitos) en binario y formar un número w poniendo todos esos dígitos uno detras de otro. Ese número coincide con el primer y, y1, en sus primeros r dígitos. Si ahora le aplicamos la función S r veces, obtendremos un número que coincide con y2 en sus primeros r
dígitos, y así sucesivamente. Si, finalmente, utilizamos la función que
transforma la de Bernoulli en la logística, podemos pasar el número w, que estábamos utilizando como condición inicial para generar los y's, a una condición inicial w' para la función logística m(z). De esta manera, obtenemos un modelo que consiste en la función m, que es infinitamente diferenciable, además, y una condición inicial w'
que nos ajusta tantos cuantos puntos queramos y con la precisión que
queramos. Piantadosi nos presenta en su artículo dos ejemplos
impresionantes, calculando la condición inicial necesaria para ambos.
Concretamente, son un elefante (como le gustaría a von Neumann)
y la firma de Miró
Si usted, amigo lector, se ha perdido un poco (o mucho) en el resumen
del procedimiento, no se preocupe: en primer lugar, seguramente es
culpa mía que he querido volar muy rápido sobre algunos de los detalles,
y en segundo lugar, si quiere ajustar su propia figura solo tiene que
ir al artículo dónde se describe todo el proceso sin omisiones. Quédese
solo con la copla de que hemos demostrado que se puede ajustar cualquier
conjunto de puntos en el plano con la precisión que se desee con la
función logística y un único parámetro, calculable a partir de los datos
de manera fácil, y que se usa como condición inicial para las
iteraciones de la función logística. Suficiente con esto.
Lo
importante son las conclusiones y las precauciones que se desprenden de
esto. En primer lugar, la conclusión que adelantaba al principio:
elegir un modelo u otro para describir un fenómeno que da lugar a unos
datos en función de que tenga más o menos parámetros no es una buena
idea. Como acabamos de ver, siempre podemos construir un modelo con un
único parámetro y, por tanto, tendría todas las papeletas para ser el
seleccionado. Piense, sin embargo, que la ecuación logística estaría
entonces describiendo prácticamente cualquier cosa, lo que obviamente no
puede ser verdad. Así que cuidado con este tipo de argumentos.
Por otro lado, podría usted pensar que ahora que tiene esta función
para cualquier conjunto de puntos, puede usarla para extrapolar, es
decir, para obtener valores de y en puntos intermedios entre los x, los naturales. Desafortunadamente, esto no es así, porque entre los x la función oscila salvajemente ya que hay funciones sinusoidales involucradas, y lo que tendríamos es un típico ejemplo de sobreajuste (overfitting).
Lo interesante aquí es que normalmente el sobreajuste se asocia a usar
demasiados parámetros, pero lo que hemos visto es que podemos estar en
esta situación incluso en un modelo con un solo parámetro. Sorprendente,
¿no?
Como conclusión final, vista la potencia que tiene un único número real (nuestra condición inicial w')
para codificar o recoger la información de muchísimos datos, nos
debería hacer desconfiar de los procedimientos de selección de modelos
que sean totalmente agnósticos, es decir, que no hagan hipótesis sobre
la clase concreta de modelos en la que se quiere trabajar. A la hora de
intentar encontrar modelos es necesario basarse en teorías concretas que
restrinjan el tipo de modelos a utilizar (lo que normalmente excluirá a
nuestra función logística y a otras similares sobre las que se podría
basar otro ajuste uniparamétrico). Como siempre, solo una correcta
combinación de potencia de cálculo e intuición humana nos permitirá
extraer conocimiento de los datos.
No hay comentarios:
Publicar un comentario