En esta sección se presentan todos los proyectos de investigación aplicada realizados durante el funcionamiento del centro. Entre ellos se destacan 3 por su alto impacto y envergadura: El Proyecto Mobility en el área de Telecomunicaciones, con la colaboración de Telefónica Chile S.A; el Proyecto Almohoadita, en el área de e-Health, con el apoyo del Hospital Exequiel González Cortés y financiado por CONICYT; y el Proyecto de Market Basket Analysis, en el área de Retail, gracias al apoyo de una de las principales cadenas de supermercados en Chile. Cabe destacar que si bien los proyectos están clasificados por industrias, las problemáticas resueltas y las técnicas aplicadas en ellos son mayoritariamente transversales a las distintas industrias presentes en Chile. Si estás interesado en alguno de los proyectos, contáctanos o escribenos al contacto@ceine.cl
Proyectos en Curso

El proyecto Mobility desarrollado por Telefónica S.A. Chile, en conjunto con CEINE, busca aprovechar la enorme cantidad de datos del tráfico producidos por los usuarios de teléfonos móviles con el fin de extraer información relevante acerca del comportamiento de sus clientes. La información obtenida a través del cruce del tráfico móvil con la ubicación geo-referenciada de las antenas telefónicas permite determinar la ubicación de sus clientes a lo largo del día. Con lo anterior se puede estudiar a nivel agregado el comportamiento urbano, determinar patrones de movimiento y predecir el comportamiento vial.
A nivel de usuario, este proyecto consiste en la creación de una nueva línea de negocios enfocada en el ofrecimiento de servicios y publicidad digital basada en localización y desplazamiento. Se busca entregar valor real al usuario combinando los gustos, deseos, comportamiento histórico y datos demográficos con la localización para brindar una experiencia superlativa de publicidad personalizada. Este es el primero de muchos servicios inteligentes intensivos en big data que redefinirán el futuro de los servicios de valor agregado en las empresas de telecomunicaciones.

Debido a enfermedades genéticas o a un parto problemático, ciertos niños padecen de enfermedades crónicas que requieren de un monitoreo ambulatorio periódico por parte del personal médico a cargo. Dicho monitoreo consiste de visitas a domicilio, durante las cuales se miden signos vitales como saturación de oxígeno, temperatura corporal, frecuencia cardíaca y frecuencia respiratoria. El problema consiste en que el personal médico desconoce estas variables entre visitas, por lo que su capacidad de prevención es limitada.
Por un lado, al tener un monitoreo en tiempo continuo, el personal médico podría contar con un mayor control sobre el estado de salud de los pacientes ambulatorios. Por otro lado, al contar con un sistema que clasifica automáticamente los signos vitales del paciente y predice el riesgo de crisis en éstos, se podría anticipar la ocurrencia de crisis como desaturación, fiebre, alteraciones en la frecuencia cardíaca y alteraciones en la frecuencia respiratoria. Al mismo tiempo, con esta nueva información, es posible monitorear más pacientes al mismo tiempo y por lo tanto, ampliar la capacidad de atención del sistema.
La solución propuesta consiste en medir en el hospital o en el hogar los signos vitales antes mencionados en forma continua, gracias a una plataforma de sensores experimental. Ésta envía por la Internet la información recolectada a un servidor central. Una vez almacenados los datos en el servidor central, éstos son analizados y clasificados mediante algoritmos y modelos de minería de datos. De esta forma, se obtiene un indicador del riesgo de crisis para cada paciente, el cual es desplegado en tiempo real a un sitio web de uso exclusivo para el personal médico.
Monitoreo por Teledetección de recursos forrajeros en la Región de la Araucanía – Andrea Perry
Design of an Algorithm to predict respiratory crisis in chronic lung diseases patients with ambulatory domiciliary hospitalization – Fabián García
El objetivo de este trabajo es diseñar y desarrollar un conjunto de algoritmos capaces de predecir crisis respiratoria desde señales capturadas en tiempo real por un dispositivo basado en Arduino en pacientes pediátricos con enfermedades crónicas respiratorias.
Los beneficios esperados de esta memoria son mejorar la exactitud del despliegue de alarmas (cantidad y tipo) del sistema desarrollado y aumentar el tiempo previo a la predicción de una crisis.
Gestión del ingreso y flujo de pacientes en el servicio de emergencias del Hospital Clínico de la Universidad de Chile – Carlos Maldonado
Los servicios de emergencias al interior de un hospital cuentan con procesos complejos y exigencias cada vez más altas de la atención médica ejercida. El objetivo de este tipo de servicio es estabilizar al paciente y determinar un diagnóstico preciso en el menor tiempo posible, utilizando una serie de recursos y servicios de alto costo (médicos, enfermeras, equipos médicos, etc.) en el proceso, los cuales deben coordinarse de la manera más eficiente posible. El proyecto de tesis aborda la gestión clínica y el flujo de pacientes al interior del Servicio de Emergencias del Hospital Clínico de la Universidad de Chile, utilizando metodologías de macroprocesos hospitalarios validadas en hospitales chilenos. Se propone desarrollar una herramienta de apoyo a la monitorización y control de los protocolos clínicos llevados a cabo en el servicio. Lo que se espera de esta investigación es encontrar un modelo que permite cuantificar probabilísticamente el cumplimiento de protocolos durante la atención de pacientes, con el cual generar acciones correctivas que permitan dar un mejor flujo a los procesos y por consecuencia reducir los tiempos de estadía y espera al interior del servicio, atendiendo una mayor cantidad de pacientes sin necesariamente aumentar los costos de atención.
Profit-Based Detection of Prepaid Credits in Banking – Juan Pablo Hormazábal
En general, la materia más investigada en aplicaciones de minería de datos relacionadas a créditos de consumo corresponde a la estimación del riesgo crediticio. En dónde, en la mayoría de las investigaciones se busca identificar a los “defaulters” de forma previa a la entrega de un crédito, buscando de esta forma minimizar las pérdidas por no pago. Una vez formalizada la contratación del crédito, suele ser fácil identificar a los probables “defaulters”, pues comienzan a retrasarse en los pagos del crédito y ya con un atraso mayor a tres meses pasan a cobranza judicial y se asume que no pagarán. En este sentido, un reto menos estudiado al ya haber entregado el crédito corresponde a la detección de prepagos.
Se han realizado más trabajos en modelos de análisis de supervivencia (Survival Analysis) y modelos econométricos relacionados con el problema. Desde el área de la minería de datos existen pocos trabajos al respecto. En este sentido, el objetivo de este estudio es modelar esta situación a través de los modelos clásicos de clasificación realizando el principal aporte en la forma de evaluar la conveniencia de uno u otro método considerando la maximización de beneficios a la hora de ejecutar una campaña de retención. La aplicación será desarrollada para un banco privado que opera actualmente en Chile.
Proyectos Finalizados

Esta investigación buscaba resolver el problema de encontrar grupos de productos que se venden conjuntamente en tiendas de retail con el fin de generar mejores ofertas a los clientes. Sin embargo, las técnicas tradicionales de análisis de datos fracasan debido a las enormes cantidades de datos transaccionales dispersos y la dificultad para analizar las numerosas reglas generadas con técnicas tradicionales.
Este problema entonces es abordado utilizando técnicas de graph mining, que representa a los productos como nodos y a las relaciones como arcos dentro del grafo que se forma. Como resultado se obtienen comunidades de productos fuertemente relacionados. Se demuestra la eficacia del enfoque en una cadena de supermercados al por mayor y una cadena de supermercados minorista, con registros transaccionales cercanos a los 238 y 128 millones respectivamente. Los resultados encontrados en ambos casos permitieron un mejor manejo del mix de productos en comparación con el enfoque tradicional y descubrieron relaciones de productos no obvias.
Metodología para estimar el impacto que generan las llamadas realizadas en un Call Center en la predicción de fuga de clientes – Catalina Sepúlveda
Este trabajo tiene por objetivo medir el impacto que generan las llamadas realizadas en un call center en la predicción de fuga de los clientes en una empresa de telecomunicaciones.
Dentro de los beneficios esperados se encuentra el determinar las variables que logren describir las llamadas registradas en el call center por medio de técnicas de text mining, para así identificar tópicos que estén relacionados con la posible fuga de un cliente.
Con lo anterior se espera construir diferentes modelos de fuga utilizando tanto las variables de las llamadas como variables que describan al cliente, de modo de evaluar la capacidad predictiva de estos modelos y así definir la importancia y relevancia que puedan tener las interacciones con el call center en la predicción de fuga.
Optimización del assortment de paquetes conformados por equipos móviles y planes – Francisco Donoso
El objetivo del proyecto es desarrollar una metodología que determine los packs a ofrecer, uniendo los planes más rentables para la empresa con los equipos más atractivos para los clientes, considerando las restricciones de stock de equipos.
Se espera determinar el surtido de los packs ofrecidos en la página web, aumentar las ventas al integrar esta planificación y pronosticar las probabilidades de elección de cada conjunto en los futuros periodos.
A esto se agrega como parte del trabajo, establecer la importancia cuantitativa de cada atributo de los planes y equipos. Y con ello establecer que combinaciones son más valoradas por los clientes.
Evaluación experimental de efectividad de campañas multicanal en una compañia de telecomunicaciones – Felipe Ayala
Este proyecto estimó la efectividad de campañas multicanal considerando las preferencias específicas de cada cliente y la dinámica de múltiples contactos. Con esto obtuvo una evaluación preliminar de la efectividad de cada canal por tipo de campaña a nivel cliente para luego implementar un modelo experimental de evaluación de contactos multicanal en secuencias temporales.
Además, se mejoró la eficiencia propia de las campañas de la empresa, para lograr tasas de respuesta mayores a las actuales, y obtener una evaluación de la efectividad de distintas combinaciones de contactos secuenciales multicanal.
Diseño de un plan de negocios para movilidad en tiempo real – Daniela Palma
Este trabajo consistió en el diseño de un plan de negocios que evalúe la factibilidad y resultados del negocio desde el análisis estratégico del nuevo mercado al que se enfrenta: el marketing geo-localizado.
Lo que se ofrece finalmente es un canal a través del cual las empresas envíen contenido a potenciales clientes, quienes serán seleccionados según sus preferencias y actividades habituales que son registradas de acuerdo a la información geo-referenciada que emiten sus celulares. Esto permitirá que el contenido que reciben sea oportuno y relevante, aumentando su propensión a la compra.
Mejoramiento de un modelo de targeting de clientes de telefonía móvil usando análisis de redes sociales y minería de datos – Gonzalo Hermosilla
Las compañías, para lograr una relación rentable y de largo plazo con sus clientes, han utilizado un enfoque de selección basándose en los atributos sociodemográficos y comerciales de sus clientes, sin considerar el efecto que podrían tener sobre las decisiones de éstos sus amigos, familiares o cercanos. Es por esto que este trabajo plantea utilizar un modelo de targeting que incorpore atributos sociales extraídos de la red social de teléfonos móviles de cada uno de los clientes, entendiendo que una llamada telefónica entre dos usuarios significa una relación entre ellos. Adicionalmente, se estudió la influencia que podrían tener adopciones previas de sus amigos sobre la adopción propia del cliente en estudio.
Entre las principales conclusiones se destaca que si bien el incorporar los atributos sociales de los clientes no mejora por sí mismo el poder de predicción del modelo propuesto de targeting, el combinar los resultados de este modelo con los del modelo utilizado anteriormente por la empresa permite obtener notables mejoras debido a que ambos logran complementarse al identificar clientes adoptadores distintos.
Construcción y caracterización de perfiles de clientes en base a su movilidad – Constanza Richardson
Motivados por el alto potencial del conocimiento obtenido en base a la movilidad de los usuarios, este trabajo tiene por objetivo construir y caracterizar perfiles de clientes basándose en su movilidad. Para esto se analizó la información de ubicación temporal de los usuarios y se identificaron métricas que resumieron sus patrones de movilidad.
Una vez generada la información, se evaluó su utilidad para poder diferenciar entre clientes con distinto valor para la compañía, específicamente determinando su poder explicativo de la variable de ingresos promedio por cliente. Se obtuvieron 10 grupos diferentes de clientes, los que fueron perfilados basados en su movilidad y enriqueciéndolos con información demográfica y transaccional.
A partir de los resultados obtenidos se concluyó que la información de movilidad puede aportar conocimiento relevante para caracterizar a los clientes y dirigir ciertas comunicaciones a ellos.
Mejoramiento del proceso de atención y asistencia a contribuyentes en Servicio de Impuestos Internos mediante Business Intelligence – Matías Contador
El trabajo se enmarca en un estudio de mejoramiento de la Plataforma de Atención y Asistencia a Contribuyentes (P.A.A.C.). El objetivo del estudio es encontrar el número óptimo de recursos y un modelo de atención de corto plazo y mediano plazo que mejore los indicadores de espera y atención de los contribuyentes.
En el mejoramiento de este sistema de atención se aplicaron herramientas basadas en Business Intelligence, que permiten la obtención de información captada por el dispensador electrónico de números de atención (Total Pack).
Finalmente los modelos utilizados reducen la espera promedio ponderada entre un 35%-98% en la mayoría de los casos con menos recursos que en la actualidad, permitiendo liberar funcionarios para fiscalización en terreno con una mejor y más rápida atención a los contribuyentes en las direcciones regionales, además de recomendaciones de funcionamiento que reducen las visitas promedio de los contribuyentes durante el año.
Extracción de conocimiento nuevo desde los reclamos recibidos en el Servicio Nacional del Consumidor mediante técnicas de Text Mining – Constanza Contreras
Desde el 2010 a la fecha, SERNAC posee más de 1 millón de reclamos, los cuales son utilizados para realizar estudios que establecen las políticas institucionales de los próximos años. Dado esto, el objetivo de este trabajo fue extraer conocimiento nuevo y específico de los reclamos de SERNAC utilizando técnicas de minería de textos.
Se logró extraer problemas comunes entre los consumidores, temas de contingencia nacional, problemas específicos de productos o servicios y caracterizar el comportamiento de empresas y consumidores frente a ciertas problemáticas. Así, se creó una metodología semi-automática de análisis de reclamos que sirve de base para la creación de una plataforma que cumpla esta función.
Con esta metodología se reducen los tiempos de estudios de semanas a un día y se logra un nivel de profundidad en los estudios de reclamos mayor al actual.
Mejora del proceso de análisis y detección de entidades relacionadas a bancos, en apoyo al control y regulación de límites de créditos – Felipe Vera
Este trabajo obtuvo conocimiento no trivial del sistema bancario chileno con el fin de detectar e inferir el comportamiento de las personas naturales dueñas de un Banco o con participaciones importantes que incursionen en otros negocios a través de sociedades que no estén siendo informados a la Superintendencia de Bancos e Instituciones Financieras (SBIF). El objetivo de esto fue mejorar el proceso de análisis y detección de entidades relacionadas a Bancos en apoyo al control y regulación de los límites de créditos.
Para lograr el objetivo se utilizaron técnicas de procesamiento del lenguaje natural (NLP), lingüística computacional y técnicas de reconocimiento de entidades-relaciones (NER).
Gracias a este proyecto se demostró que los nuevos mecanismos de análisis de información desarrollados poseen un alto potencial de uso en los ambientes productivos de la organización. No obstante, se establecieron ámbitos de mejora en el diseño y automatización del procesamiento, análisis y detección de entidades que apoyan una parte importante de la cadena de valor del proceso de regulación.
A semantic framework for continuous u-health services provisioning – Matías Echeverría, Ángel Jimenez, Sebastián Ríos
La necesidad de contar con una atención médica más preventiva, personalizada y anticipada para los pacientes con enfermedades crónicas conlleva una provisión continua de los servicios de salud en todas partes, en cualquier momento y a cualquier persona. El paradigma de la computación ubicua es un enfoque para hacer realidad esta visión. Sin embargo, el uso de todos los servicios de salud potenciales ubicua e información contextual es bastante limitada en la literatura. Para hacer frente a este problema, en este trabajo se propone un marco semántico de continuo aprovisionamiento servicios ubicuos. Pacientes necesidades están representadas en los procesos de negocio. Además, este trabajo propone un modelo de descripción semántica de los procesos, servicios, así como la información médica y ambiental contextual, con el fin de hacer más fácil para seleccionar los servicios apropiados de los procesos de negocio semánticamente seleccionados. La idoneidad del marco se evalúa a través de un estudio de caso para la enfermedad crónica respiratoria, haciendo uso de los datos de pacientes reales y profesionales de la salud de un hospital público pediátrico.
Design and implementation of an algorithm for the screening of obstructive sleep apnea in children under 15 years old – Lilí Erazo
El gold-standard (mejor prueba clínica) para el diagnóstico de Trastornos Respiratorios del Sueño (TRS) es la polisomnografía, que consiste en la recolección de señales biomédicas durante el sueño.
El problema es que este examen es invasivo, costoso y difícil de practicar en niños pequeños. Por lo tanto existe la necesidad de una forma de pre-diagnosticar TRS, específicamente apnea para aumentar el número de niños diagnosticados, y, como resultado, el número de niños tratados.
Para esto, el objetivo general planteado es pre-diagnosticar apnea obstructiva del sueño a partir de señales recogidas por polisomnografía en niños menores de 15 años usando técnicas de minería de datos.
Los resultados logran identificar, mediante técnicas de reducción de información, las señales que tienen mayor poder predictivo para realizar el pre-diagnóstico.
Mejora de los procesos de monitorización hospitalaria en el Hospital Exequiel González Cortés – Miguel Agüero
En el área hospitalaria pediátrica de cualquier hospital público, pueden desencadenarse innumerable situaciones de riesgo, dentro de las cuales existen algunas que revisten mayor relevancia que otras, dada su gravedad o frecuencia de ocurrencia. Dos de los casos que tienen precisamente la característica mencionada en el párrafo anterior son el Paro Cardio-Respiratorio (PCR) y la Infección Intrahospitalaria (IIH). En el ámbito extrahospitalario, sólo entre el 5% al 12% de los niños que presentan un PCR sobreviven. En el ámbito hospitalario, la cifra aumenta a un 27%, lo cual no es precisamente alentador. Por otra parte, con respecto a la IIH los brotes de Infecciones Asociadas a Atenciones de Salud (IAAS) forman parte del 10% de las infecciones del país. Conociendo la alta demanda por servicios hospitalarios en la región metropolitana y la escases de recursos en el sector público, se hace necesario tener procesos eficientes que logren minimizar el número de errores u omisiones que se pudiesen cometer en el servicio de hospitalización. Dado este escenario, es que se sugiere un rediseño de procesos para mejorar la monitorización hospitalaria, apoyados por tecnologías de la información. El objetivo de este proyecto es disminuir la probabilidad de ocurrencia de un evento crítico en los pacientes hospitalizados en el área de pediatría, lo cual permitirá evitar fallecimiento a causa de estas situaciones de crisis.
o.
Gestión de clientes de alto patrimonio en base a su comportamiento de inversión – Karen Orbenes
El mercado financiero en Chile se ha centrado en los últimos años principalmente en la captación de clientes en sus distintas líneas de negocio. Para esto, el centro está en la captación de nuevos segmentos de inversión, tales como el segmento de altos patrimonios y por lo tanto ha tenido que crear nuevas líneas de atención al cliente que permitan soportar las nuevas necesidades.
El objetivo de este trabajo entonces es revisar los procesos de negocio de la compañía desde una mirada estratégica, orientado al conocimiento de los clientes y sus necesidades de inversión para la protección de su patrimonio y su fidelización.
Considerando lo anterior, más herramientas de Data Mining (Clustering) y Business Process Managment, se realizó una consolidación de los datos de los clientes y la segmentación de los clientes de altos patrimonios más la generación de reglas de negocios convertidas en alertas que permitieron reaccionar oportunamente a errores sistémicos y operacionales, además de conocer en profundidad a los clientes y sus necesidades de inversión, todo esto alineado a su perfil de inversiones lo que permitirá proteger proactivamente el patrimonio de los clientes.
Optimización de una flota de radio taxis mediante el uso de un sistema de asignación de carreras en tiempo real – Rafael Benavides
El objetivo principal de la memoria es diseñar y desarrollar un sistema computacional capaz de realizar la asignación de carreras de una empresa de radio taxis en base a información asociada a la ubicación del pasajero, además del estado y localización de los vehículos de la flota en tiempo real; en base a un algoritmo de ruteo efectivo. Gracias a esto la empresa será capaz de reducir el tiempo de recogida de pasajeros y los costos asociados a una mala asignación de carreras; en relación a las flotas de vehículos de sus clientes.
Dentro de los alcances del proyecto se encuentra el diseño e implementación de un sistema de asignación de carreras capaz de integrarse al servicio de geo-ubicación actualmente ofrecido por la empresa. Una vez construido dicho sistema se podrán evaluar los resultados obtenidos utilizando indicadores de rendimiento previamente definidos en base a los datos históricos de Radio Taxi Astral.
Estudio estructural de comunidades virtuales de práctica – Jacqueline Araya
Las diferentes redes sociales han surgido a partir del sentido común y natural de los humanos por reunirse en torno a un tema, sintiendo que pertenecen a una comunidad. Con la tecnología actual, es posible expresarse en plataformas por Internet como blogs, foros, redes sociales, chats y miles de otros.
Por lo tanto, la principal contribución de este trabajo es tomar en cuenta la semántica de los contenidos creados por los miembros de dos comunidades de práctica virtuales (VCoP), así como las propiedades estructurales de las redes, para estudiar si agregar este tipo de información permite encontrar nuevos miembros clave, buscar los principales temas de investigación, y las nuevas propiedades para una mejor caracterización.
El estudio propuesto considera una VCoP científica del área de computación ubicua y otra del área Web Semántica, considerando como data a los autores de los papers aceptados en las conferencias de las comunidades y su contenido.
Los resultados muestran que las redes científicas en estudio pueden ser modeladas como Comunidades virtuales de práctica usando la metodología SNA-KDD usando teoría de grafos. Esto queda evidenciado en los resultados de la métrica “Modularidad”, obteniendo valores sobre 0.9 en la mayoría de las redes, lo que indica una estructura de comunidad.