Big Data para la investigación en telefonía móvil

Las tecnologías móviles han transformado el mundo en que vivimos gracias a que los bajos precios de estas tecnologías han permitido su rápida difusión en todo el globo.

 

La manufactura de teléfonos inteligentes cada vez más económicos permite preveer que en pocos años la penetración de éstos será muy superior a los celulares tradicionales. Esto tiene grandes consecuencias sociales y económicas pues los teléfonos se han transformado en instrumentos no sólo para comunicarse rápidamente y generar participación colectiva, sino que son verdaderas computadoras ubicuas. Más aún, distintos grupos de usuarios, han comenzado a usarlos en formas creativas e innovadoras para proveer nuevos servicios que hace unos años eran solo posibles en escenarios de ciencia ficción. La ubicuidad de los teléfonos móviles y la riqueza creciente en información transaccional y de contexto generada por los sensores y las aplicaciones han dado fruto a un nuevo dominio de investigación que abarca la computación y las ciencias sociales para comprender de mejor forma el comportamiento humano y así proveer mejores servicios. Los investigadores están comenzando a examinar las problemáticas de las ciencias humanas y del comportamiento desde la perspectiva del Big Data usando información colectada a gran escala como input para caracterizar y entender fenómenos de la vida real, incluyendo características individuales, desplazamientos, comunicación y patrones de interacción.

Nokia en conjunto con la École Politecnique Fédérale de Lausanne lanzó un concurso en 2012 donde investigadores de todo el mundo pudieron acceder a los datos colectados de más de 200 personas de la región del lago Leman, Suiza, durante el curso de 3 años. Los temas principales de investigación propuestos se centraban en predecir el significado semántico del lugar más visitado, sin dar la ubicación geográfica sino que analizando los patrones de uso del teléfono y aplicaciones en ese lugar, predecir el próximo lugar que se visitará a partir del contexto e información del uso del teléfono, y por último la predicción de atributos socio-demográficos de los usuarios. Además los investigadores podían proponer distintos tópicos, los cuales de ser aceptados por el comité se les entregaba acceso a los datos. En el artículo disponible en este enlace se describe completamente el proyecto, se detallan los protocolos de anonimización de los datos para la investigación y se referencia a las publicaciones que obtuvieron los mejores resultados.

Entre ellas destacamos Contextual conditional models for Smartphone-based human mobility prediction, Do et al., 2012, cuyo abstract reproducimos a continuación:

Human behavior is often complex and context-dependent. This paper presents a general technique to exploit this «multidimensional» contextual variable for human mobility prediction. We use an ensemble method, in which we extract different mobility patterns with multiple models and then combine these models under a probabilistic framework. The key idea lies in the assumption that human mobility can be explained by several mobility patterns that depend on a sub-set of the contextual variables and these can be learned by a simple model. We showed how this idea can be applied to two specific online prediction tasks: what is the next place a user will visit? and how long will he stay in the current place?. Using smartphone data collected from 153 users during 17 months, we show the potential of our method in predicting human mobility in real life.

Asimismo Identifying important places in people’s life from cellular network data, Isaacman et al., 2011 cuyo abstract presentamos a continuación:

People spend most of their time at a few key locations, such as home and work. Being able to identify how the movements of people cluster around these “important places” is crucial for a range of technology and policy decisions in areas such as telecommunications and transportation infrastructure deployment. In this paper, we propose new techniques based on clustering and regression for analyzing anonymized cellular network data to identify generally important locations, and to discern semantically meaningful locations such as home and work. Starting with temporally sparse and spatially coarse location information, we propose a new algorithm to identify important locations. We test this algorithm on arbitrary cellphone users, including those with low call rates, and find that we are within 3 miles of ground truth for 88% of volunteer users. Further, after locating home and work, we achieve commute distance estimates that are within 1 mile of equivalent estimates derived from government census data. Finally, we perform carbon footprint analyses on hundreds of thousands of anonymous users as an example of how our data and algorithms can form an accurate and efficient underpinning for policy and infrastructure studies.

 

Más información en http://research.nokia.com/page/12000 y http://research.nokia.com/publications

 

Si no puede acceder a uno de los artículos contáctanos o escríbenos a contacto@ceine.cl