El pasado 7 de Julio defendí mi tesis doctoral en Tecnologías Informáticas Avanzadas
Images
El pasado viernes 7 de Julio de 2023 defendí mi tesis doctoral titulada “Machine learning methods applied to transport demand modelling”, dirigida por los profesores Ricardo García Ródenas y Luis Rodríguez Benítez. La tesis doctoral, la cual cuenta con la mencion de Doctorado Internacional, ha sido calificada por el tribunal con la máxima calificación, sobresaliente cum laude por unanimidad.
Resumen
La modelización de la demanda de transporte juega un papel fundamen- tal en la planificación del transporte, permitiendo la estimación precisa de la demanda y la evaluación de políticas de transporte como el beneficio social de la creación de nuevas infraestructuras. Sin embargo, a medida que los sistemas de transporte se vuelven cada vez más complejos y los avances tecnológicos recientes permiten una mayor recolección de datos, los métodos analíticos tradicionales como los modelos de utilidad aleato- ria (RUM, por sus siglas en inglés) ya no son suficientes para manejar esta complejidad. Por lo tanto, es necesario incorporar nuevas técnicas que permitan resolver estas limitaciones. Para ello, esta tesis doctoral investiga el potencial de los métodos de aprendizaje automático (ML, por sus siglas en inglés) en este contexto.
En primer lugar, se analiza si los modelos de ML del estado del arte, como las redes neuronales artificiales, las máquinas de vectores de soporte y los métodos basados en ensamble de modelos (como los random forest o los gradient boosting decision trees), mejoran a los RUM en este campo de investigación. Para ello, se comparan estos modelos respecto a su capacidad predictiva y también en cuanto a la posibilidad de derivar indicadores econométricos, aplicados al contexto de la modelización de la demanda de transporte.
Los resultados obtenidos muestran que las técnicas clásicas son superadas por los modelos de ML desde el punto de vista de la calidad de las clasificaciones, sin embargo, estos últimos tienen dificultades para calcular indicadores econométricos confiables. Por ello, se propone un modelo de ML llamado Kernel Logistic Regression (KLR) como alternativa para modelar las funciones de utilidad de los RUM, lo que permite la derivación de indicadores econométricos. Los experimentos realizados demuestran que el KLR proporciona buenos resultados en conjuntos de datos utilizados en otras comparativas de la literatura, al tiempo que proporciona estimaciones insesgadas de los indicadores econométricos.
Además, se propone ampliar la aplicación del KLR a una gama de problemas de clasificación mediante una extensión de los modelos KLR llamada Generalized Kernel Logistic Regression (GKLR). Por ejemplo, la teoría del GKLR ha permitido la derivación de un modelo novedoso llamado Nested Kernel Logistic Regression (NKLR), que permite la aplicación del KLR a conjuntos de datos estructurados jerárquicamente.
Finalmente, esta tesis aborda una de las principales limitaciones del método KLR, que es la alta complejidad computacional y de almacenamiento cuando se aplica a problemas de gran escala. Para superar esta limitación, se sugiere el uso de métodos Nyström y de una novedosa propuesta para acelerar los métodos de entrenamiento de búsqueda lineal. Los resultados demuestran que al incorporar estas técnicas, el KLR puede abordar de manera eficiente problemas a gran escala que involucran cientos de miles de datos.