SEGUNDA Y ÚLTIMA PARTE

David Duvenaud, investigador de la Universidad de Toronto, en Canadá, y sus colaboradores del Instituto Vector, rompieron con el hallazgo con el que se ha ido construyendo la inteligencia artificial actual tal y como la conocemos desde hace 30 años, y rediseñaron por entero las redes neuronales para no dejar resquicio por donde se pueda fugar el libre albedrío.

Las redes neuronales artificiales (RNA) son el ingrediente principal para que el aprendizaje profundo sea tan potente, señalan los especialistas. Los sistemas de Inteligencia Artificial (IA) utilizan algoritmos y modelos para analizar, organizar, procesar y convertir datos, en tanto las redes neuronales se diferencian de otros modelos de la IA en poseer la capacidad de aprender en forma automática. Este proceso se le conoce como machine learning o aprendizaje de máquina.

Una red neuronal tradicional está formada por capas de nodos (elementos de proceso) computacionales y conexiones (enlaces) que trabajan juntos para encontrar patrones en los datos. El modelo de capas ha funcionado muy bien en el campo de la IA; sin embargo, presenta inconvenientes cuando si lo que deseamos modelar se transforma continuamente con el tiempo, como lo es predecir la evolución de un paciente en un lapso determinado.

Predicción híbrida

En el artículo, Descubre la relación entre las redes neuronales artificiales, la inteligencia artificial y el eHealth, publicado en la plataforma Think Big, Carlos Rebato –quien laboró en el departamento de Global Digital Comms de Telefónica–, apunta que las RNA procesan entradas y generan salidas que ayudan a resolver problemas.

En finanzas, ejemplifica, investigadores de la Universidad de Stanford en Palo Alto, California, han aplicado para esta tarea sistemas de predicción híbridos. “Combinan redes neuronales artificiales y varias modalidades para mejorar la predicción del valor futuro de bonos y otros instrumentos de inversión.

“Las mejoras se reflejan en obtener predicciones con un margen de error de tan sólo 78 céntimos de euro –montos que se traducen en miles de millones de billetes cuando se toma en cuenta que es común que se sucedan una cantidad similar de transacciones por sesión–, con cálculos que apenas requieren segundos. Las predicciones sin uso de RNA a disposición de un agente de bolsa pueden llegar a tardar hasta 15 minutos luego de una transacción”, señala. 

En este marco, ya no resulta sorprendente destacar su proverbial utilidad en la construcción de aplicaciones generales típicas orientadas a crear sistemas inteligentes para la toma de decisiones en la gestión empresarial; ocuparlas en actividades de predicción; reconocer tendencias; identificar patrones y gestionar riesgos aplicados en la detección de fraudes.

Asimismo, se cuentan el desarrollo de artefactos inteligentes con capacidad de aprendizaje, como los homePods o los altavoces inteligentes; el establecimiento de hogares inteligentes (domótica); la creación de sistemas de visión computacional y detección; la fabricación de vehículos autónomos; así como idear herramientas para la explotación de las energías renovables, enumera Rebato.

Inteligencia bajo entrenamiento

Como algoritmos, las RNA pueden llegar a resolver problemas muy complejos de una forma muy atinada, pero no podemos desestimar que para ello necesitan un considerable esfuerzo computacional a la hora de entrenarlas. “El principal reto de las empresas a la hora de realizar estos algoritmos es disponer de la cantidad y calidad de datos para construir una red neuronal”, advierte Celsa Pardo Araujo, Consultant Artificial Intelligence, de Enzyme Advising Group.

Si bien las aplicaciones de las redes neuronales parecen muy generosas, están sujetas a un entrenamiento intenso para que puedan arrojar los resultados deseados. ”Dependiendo del tipo de aprendizaje, estos algoritmos se clasifican en tres grandes grupos: supervisado, no supervisado y reforzado”, explica la consultora.

En el primer caso, se “etiquetan” los datos de entrada para ayudar a los algoritmos a valorarlos correctamente y asignar un valor de salida. Es un método de aprendizaje muy empleado para clasificaciones y regresiones.

“El aprendizaje no supervisado se basa en dejar que el algoritmo encuentre variantes de patrones y correlaciones. Se utiliza para descubrir qué hay detrás de los datos para perfilado o `clustering´ de clientes –refiere. El aprendizaje reforzado, por su parte, se sustenta en la técnica de ensayo y error. Cuanto más compleja sea la red neuronal, mayor será la cantidad de datos de entrenamiento necesaria para entrenarla.” 

Herramienta deficiente

En el caso de la salud, la obtención de predicciones se complica al tratar de agrupar los informes médicos en periodos definidos como años o meses. Al común de las RNA los datos de los registros médicos les resultan un poco confusos, pues “a lo largo de nuestra vida visitamos al médico en diferentes momentos y por distintos motivos, generando unas cuantas mediciones en intervalos arbitrarios”, apunta Karen Hao, en el revelador artículo Inteligencia Artificial, La red neuronal que quiere solucionar los grandes problemas de la IA, que apareció en MIT Technology Review.

“Por ejemplo, si se acudió al médico el 11 de enero y se volvió hasta el 16 de noviembre, los datos de ambas visitas se agruparán en el mismo año. Una red neuronal tradicional tiene problemas para gestionar este hecho. Su diseño requiere un aprendizaje de los datos con etapas claras de observación. Por tanto, es una herramienta deficiente para hacer un modelo de procesos continuos, especialmente aquellos que se miden de manera irregular a lo largo del tiempo.”

Romper con el hallazgo

Hao narra que David Duvenaud, investigador de la Universidad de Toronto, Canadá, colaboraba en un proyecto relacionado con datos médicos cuando descubrió un defecto importante en la IA, al tratar de desarrollar un modelo de aprendizaje profundo que pudiera predecir la salud de un paciente en un lapso determinado.

Este reto llevó a Duvenaud y a sus colaboradores del Instituto Vector a romper con el hallazgo en el que se basa toda la inteligencia artificial actual, y a rediseñar por entero las redes neuronales tal y como las conocemos desde hace 30 años. No por casualidad, su investigación fue considerada en 2019 una de “las mejores publicaciones” en la Conferencia sobre Sistemas de procesamiento de información neuronal (NIPS por sus siglas en inglés), uno de los eventos más importantes sobre investigación de la IA a escala global.

La suma de las capas

Como se ha mencionado párrafos atrás, una red neuronal tradicional está formada por capas de sencillos nodos computacionales que trabajan juntas para encontrar patrones en los datos. Las capas dividen el proceso de transformación en pasos y permiten que la red descubra una serie de fórmulas que describen cada una de las etapas del proceso.

La primera capa puede analizar todos los píxeles y utilizar una fórmula para elegir cuáles son más relevantes; una segunda, usar otra fórmula para encontrar patrones; cada capa subsiguiente identificaría características cada vez más complejas, hasta que la capa final decida basándose en todos los cálculos, establece Karen Hao.

Tal desglose permite que una red neuronal desarrolle modelos más sofisticados. Por ello, la mejor manera de hacer un modelo de la realidad de la forma más exacta posible y permitir que las predicciones sean más precisas, es añadir más capas para aumentar el nivel de detalle.

En el ejemplo médico la mejor red neuronal para este trabajo tendría un número infinito de capas para modelar cambios infinitesimales porque podríamos haber ido al médico dos veces en un día. Para solucionarlo, este equipo de investigación eliminó las capas sin miramientos y por completo, destaca Hao.

La magia de Duvenaud

“Precisamente –asegura Karen Hao– el modelo matemático ofrece las ecuaciones necesarias para calcular esta serie de cambios a pasos infinitesimales. Es decir, ahorra el problema de tener que saltar a un modelo continuo a partir de unidades discretas. Esta es la magia del trabajo de Duvenaud y de sus colaboradores: reemplazar las capas discretas por ecuaciones diferenciales.

Atrás de izq. a der.: Jordan Jacobs, Ed Clark, Geoffrey Hinton, Sanja Fidler and Tomi Poutanen; adelante de izq. a der.: Roger Grosse, Richard Zemel, Brendan Frey, Raquel Urtasun, del Instituto Vector, y David Duvenaud. (Foto: Johnny Guatto)

El resultado final ni siquiera es una red. No. En el camino, David Duvenaud y su ejército de matemáticos se desprendieron de nodos y conexiones, tan sólo dejaron un bloque de computación continuo; por eso, los investigadores llamaron a este diseño una red EDO (Ecuaciones Diferenciales Ordinarias) o Neural Ordinary Differential Equations, en inglés.

El violín o el piano

Duvenaud, que como se aprecia piensa en todo, utiliza una buena analogía para explicar su trabajo: en un violín, se pueden deslizar los dedos de la mano a lo largo de la cuerda para tocar la frecuencia que se desee; a diferencia, un piano tiene un número limitado de teclas por lo que nadie puede deslizarse entre frecuencias sino tocar un número fijo de ellas.

“Una red neuronal tradicional es como un piano: y cambiar a una red EDO es como cambiar el piano por un violín. No siempre es la herramienta correcta, pero es la más adecuada para ciertas tareas”, dice Hao.

Además, una red EDO también modifica ciertos aspectos del aprendizaje. Con una red neuronal tradicional, al comienzo se debe especificar el número de capas que deseamos en la red y después esperar hasta que se complete el aprendizaje para averiguar la precisión que arroja el modelo. “El nuevo método permite especificar primero la precisión deseada y encontrar la manera más eficiente de entrenamiento sólo dentro de cierto margen de error”, completa la periodista.

Al igual que cualquier técnica inicial propuesta en el campo, aún debe desarrollarse, experimentarse y mejorarse. Pero el método tiene el potencial de revolucionar el campo. Por lo pronto, David Duvenaud y su grupo de genios han dado el siguiente paso para no dejar resquicio donde el libre albedrío encuentre salida. Las redes neuronales no sólo nos tienen en su poder sino cada día adquieren mayor control de nuestras vidas. Cada vez menos lo dudan.