martes, 15 de noviembre de 2016

Citizen security using Machine Learning algorithms through Open Data - Parte 2

En la entrada anterior se estudió los primeros pasos para poder realizar técnicas de Machine learning a una base de datos abierta, dejando los datos correctamente limpios y preparados para su uso. En esta entrada veremos los dos modelos de clasificación utilizados: Random Forest y Regresión Logística Múltiple.

3. Modelos de Machine Learning

En Machine Learning, los algoritmos de clasificación múltiple asigna una etiqueta clase por cada ejemplo de salida. Dado un conjunto de datos de entrenamiento de una forma (xi, yi), dónde xi pertenece a Rn y es el i-th ejemplo de yi, que pertenece {1...K} es la clase i-th. La meta es buscar el modelo de aprendizaje "H" tal que H(xi)= yi para los nuevos ejemplos desconocidos. Esta idea puede verse en la figura 9.
Figura 9: ejemplo de Clasificación múltiple basado en Iris Data Set
Figura 9: ejemplo de Clasificación múltiple basado en Iris Data Set

Citizen security using Machine Learning algorithms through Open Data - Parte 1

1. Introducción

El siguiente artículo, con nombre, Citizen security using Machine Learning algorithms through Open Data, ha sido presentado para el 8th IEEE Latin-American Conference on Communications (LATINCOM) que se ha celebrado entre los días 15 y 17 de noviembre del 2016 en la Universidad Pontificia Bolivariana de Medellín en Colombia.
Para poder realizar todo este tratamiento de datos se ha tomado como referencia la Base de datos abierta de la Municipalidad de San Isidro; en esta base de datos se ha escogido la tabla de seguridad ciudadana como muestra la figura 1.
Figura 1: Seguridad ciudadana de Open Data San Isidro. Fuente: http://datosabiertos.msi.gob.pe/