GRUPO DE INVESTIGACIÓN
Business Analytics & Data Science (BADS)
Investigadores
Carla Vairetti
Facultad de Ingeniería y Ciencias Aplicadas, Universidad de los Andes, Chile.
Sebastián Maldonado
Departamento de Control de Gestión y Sistemas de Información,
Universidad de Chile.
Alumnos
Juan Pablo Karmy
Catalina Sánchez
Angeles Aldunate
MAGÍSTER
José Luis Assadi
Matias Canepa
Ignacio Figueroa
MAGÍSTER
Maximiliano García
Katherine Jara
Sofia Valdivieso
MAGÍSTER
Ignacio Mayer
MAGÍSTER
Facultad de Ingeniería y Ciencias Aplicadas, Universidad de los Andes, Chile
Alonso Leal
MAGÍSTER
Macarena Espinoza
Alfonso Zúñiga
Colaboradores nacionales e internacionales
Faculty of Economics and Business, KU Leuven,
Bélgica.
Departamento de Estadística e Investigación
Operativa, Universidad de Sevilla, España.
Business School, University of Lancaster,
Inglaterra.
Department Computer Science and Artificial
Intelligence ETS de Ingenieria University of
Granada, E-18071 Granada, Spain
Department Computer Science and Artificial
Intelligence ETS de Ingenieria University of
Granada, E-18071 Granada, Spain
Departamento de Ingeniera Industrial, Universidad
de Chile, Chile.
Escuela de Ingeniería, Pontificia Universidad
Católica de Chile, Chile.
Prof. Wouter Verbeke
Faculty of Economics and Business, KU Leuven,
Bélgica.
Líneas de Investigación
Las bases de datos han crecido significativamente en tamaño y complejidad en los últimos años. Si bien es positivo contar con grandes volúmenes de datos al momento de predecir, esto presenta desafíos importantes. Cómo paralelizar procesos y/o hacerlos más eficientes son tareas relevantes en esta área.
En muchas tareas predictivas ocurre que una o más clases se encuentran subrepresentadas en relación a las otras. Por ejemplo, una tarea predictiva relevante en las empresas es determinar mes a mes qué clientes se encuentran insatisfechos y con una probabilidad alta se "fugarán" de la empresa. Los clientes fugados son, sin embargo, un porcentaje muy bajo (incluso menor al 1% en algunos casos). Construir modelos predictivos robustos frente a este problema es un desafío metodológico importante.
Uno de los modelos más populares de la inteligencia artificial (IA) se conoce como Máquinas de Soporte Vectorial (SVM en base a sus siglas en inglés). Este modelo no solo tiene un desempeño predictivo muy positivo, sino también ofrece flexibilidad para ajustar sus objetivos y lidiar con diferentes problemas que se pueden encontrar en los datos.
Una de las fuentes más relevantes de información para la inteligencia artificial es el texto. En empresas, por ejemplo, los clientes suelen generar mucha información textual en formas de reclamos, sugerencias, reviews y encuestas. Analizar esta información de forma automática y encontrar patrones que ayuden a la toma de decisiones es clave, y los recientes avances en IA han permitido llegar a excelentes resultados.
Las medidas estadísticas para evaluar modelos predictivos no son siempre la mejor opción para elegir entre una solución u otra. Muchas veces tenemos un objetivo claro con el cual medir el desempeño de un modelo. En fuga de clientes, por ejemplo, se busca maximizar la utilidad que genera una campaña de retención de clientes.
En las tareas predictivas no necesariamente se persigue identificar lo que ocurrirá, sino más bien medir el impacto de una acción en base a un modelo. Volviendo a la fuga de clientes, el objetivo es identificar aquellos clientes que la empresa pueda convencer de quedarse, y no identificar simplemente aquellos con mayor probabilidad de fuga. Estos últimos pueden ser muy difíciles de retener. Esta es la base del aprendizaje causal.
La IA se puede aplicar a diferentes tareas de interés público, como lo es, por ejemplo, la prevención de la delincuencia. Contamos con valiosa información textual, como por ejemplo reportes de incidentes de usuarios de la aplicación móvil SOSAFE o las causas contra imputados que cuenta el ministerio público, e información geo-referenciada de delitos que permiten entender el fenómeno y modelarlo.
La IA puede ayudar también en temas jurídicos. Una aplicación en la cual se trabaja es el desarrollo de una herramienta tecnológica que permita identificar, procesar y priorizar la información jurídica relevante, y así garantizar que proyectos se ajusten a normativa (certeza jurídica).
Una de las áreas más populares de aplicación de la IA es medicina, gracias a los avances recientes de procesamiento de imágenes. Una de las investigaciones vigentes se relaciona con el área de la oftalmología, y busca la predicción de daño retinal en tomografías oculares utilizando técnicas de deep learning.