Chile es un pais conocido por la alta frecuencia y magnitud de sus eventos sísmicos; a la vez, para un país como el nuestro es importante
pensar en soluciones para la efectiva y rapida detección de eventos sísmicos.
Hoy podemos ver como redes sociales como Twitter pueden aportar con información en tiempo real de diversos temas, en particular al ocurrir
un evento sismologico es un hecho que la tasa de Tweets con palabras claves como 'sismo', 'temblor', 'terremoto', etc aumenta
cirscunstancialmente. Lo que nos motiva a pensar una forma de aprovechar estos datos para la deteccion de eventos sismologicos.
Un problema es que directamente inspeccionando el flujo de Tweets con éstas palabras claves no es suficiente para determinar la ocurrencia
de un evento real. Dado que es usual encontrar Tweets que si bien presentan estas palabras, no hablan de un Evento Sismologico en Tiempo Real.
(Es usual encontrar Tweets hablando de eventos sismologicos pasados, musica, etc).
En el contexto de Twitter y los eventos sismcios, nuestro proyecto consiste en desarrollar un Clasificador que,
dado un Tweet con palabras claves de sismos, sea capaz de identificarlo como una "Alerta en Tiempo Real" o no.
Es decir, diferenciar un Tweet como una real alerta de un evento que acaba de ocurrir, de un tweet que puede estar hablando de
un evento pasado, una canción o cualquier otra frase que incluya estas keywords.
Para entrenar el Clasificador ideamos una técnica para etiquetar tweets como Alerta en Tiempo Real usando Tweets relacionados a eventos pasados.
Basandonos en las siguientes hipotesis:
- Dado la fecha de comienzo de un evento sismologico, los Tweets con keywords publicados desde el comienzo del evento hasta un par de minutos después son Alertas en Tiempo Real.
- Los Tweets con keywords publicados en fechas lejanas a cualquier evento sismologico ocurrido en el mundo no es Alerta en Tiempo Real.
Con ésta tecnica logramos etiquetar 4000 datos rapidamente.