Machine Learning con R: Regresion con Red Neuronal

viernes, 25 de diciembre de 2015

Regresion con Red Neuronal

El siguiente script utiliza el package neuralnet para hacer una regresión y predecir el valor de viviendas (expresado en \$1000), usando el data set Boston incluido en el package MASS.

Para un mejor ajuste del modelo (es decir, para que la red aprenda mejor), se hace un preprocesamiento de los datos, donde se normaliza el data set, quedando así:

Luego se crea el modelo con el data set normalizado, que conceptualmente queda así:

Luego que se tiene el modelo se realiza la predicción, la cual resulta en un valor normalizado. Para tener el resultado que se desea, es decir la predicción del precio de las viviendas, se procede a "desnormalizar" la predicción, que conceptualmente seria así:

Cuando se tiene la predicción del precio de la vivienda, se puede validar que tan bueno es el ajuste del modelo. Una forma puede ser el siguiente gráfico:

El Script

# LIBRERIAS Y DATOS
# -----------------------------------------------------
library(MASS); library(neuralnet); library(ggplot2)
set.seed(65)
datos    <- Boston
n        <- nrow(datos)
muestra  <- sample(n, n * .70)
train    <- datos[muestra, ]
test     <- datos[-muestra, ]
 
 
# NORMALIZACION DE VARIABLES
# -----------------------------------------------------
maxs      <- apply(train, 2, max)
mins      <- apply(train, 2, min)
datos_nrm <- as.data.frame(scale(datos, center = mins, scale = maxs - mins))
train_nrm <- datos_nrm[muestra, ]
test_nrm  <- datos_nrm[-muestra, ]
 
 
# FORMULA
# -----------------------------------------------------
nms  <- names(train_nrm)
frml <- as.formula(paste("medv ~", paste(nms[!nms %in% "medv"], collapse = " + ")))
 
 
# MODELO
# -----------------------------------------------------
modelo.nn <- neuralnet(frml,
                       data          = train_nrm,
                       hidden        = c(7,5), # ver Notas para detalle 
                       threshold     = 0.05,   # ver Notas para detalle
                       algorithm     = "rprop+" 
                       )
 
 
# PREDICCION
# -----------------------------------------------------
pr.nn   <- compute(modelo.nn,within(test_nrm,rm(medv)))
 
# se transoforma el valor escalar al valor nominal original
medv.predict <- pr.nn$net.result*(max(datos$medv)-min(datos$medv))+min(datos$medv)
medv.real    <- (test_nrm$medv)*(max(datos$medv)-min(datos$medv))+min(datos$medv)
 
 
 
# SUMA DE ERROR CUADRATICO
# -----------------------------------------------------
(se.nn <- sum((medv.real - medv.predict)^2)/nrow(test_nrm))
 
 
#GRAFICOS
# -----------------------------------------------------
# Errores
qplot(x=medv.real, y=medv.predict, geom=c("point","smooth"), method="lm", 
      main=paste("Real Vs Prediccion. Summa de Error Cuadratico=", round(se.nn,2)))
# Red
plot(modelo.nn)

NOTAS:
El parametro threshol = 0.05 indica que las iteraciones se detendrán cuando el "Cambio" del error sea menor a 5% entre una iteracion de optimizacion y otra. Este "Cambio" es calculado como la derivada parcial de la función de error respecto a los pesos.

El parámetro algorithm = "rprop+" refiere al algoritmo "Resilient Backpropagation", que actualiza los pesos considerando únicamente el signo del cambio, es decir, si el cambio del error es en aumento (+) o disminución (-) entre una iteración y otra. Para detalles ver: https://en.wikipedia.org/wiki/Rprop

El parámetro hidden = c(7,5) especifica una primera capa oculta con 7 neuronas y una segunda capa oculta con 5 neuronas.

Referencia:
http://www.r-bloggers.com/fitting-a-neural-network-in-r-neuralnet-package/

14 comentarios:

Unknown25 de enero de 2016 a las 23:05
Excelente blog, felicidades y gracias.

ResponderEliminar
Respuestas
DANIELWOLF8 de mayo de 2016 a las 9:35
Que tal Enmanuel, muy bueno el post, no tendrás un ejemplo de redes neuronales con series de tiempo.Saludos desde Perú.
ResponderEliminar
Respuestas
Anónimo10 de noviembre de 2016 a las 10:11
Gracias por tus aportes, saludos.
ResponderEliminar
Respuestas
lll24 de marzo de 2017 a las 1:09
¿Por que as.formula(paste("medv ~", paste(nms[!nms %in% "medv"], collapse = " + ")))
? que consigues con esta formula?
ResponderEliminar
Respuestas
Nathaly20 de junio de 2017 a las 9:49
Buenas tardes,

no me queda claro por qué se extrae el máximo y mínimo solo de train pero luego se normaliza toda la base de datos (train+test) con estos valores. En teoría mis datos de test se deben utilizar solo para validar el modelo
ResponderEliminar
Respuestas
Anónimo20 de julio de 2017 a las 10:24
Una consulta, que formula utilizo para normalizar los datos y cual para revertir el resultado?
ResponderEliminar
Respuestas
Anónimo27 de julio de 2018 a las 12:49
Hola, que libreria recomiendas para redes neuronales de tipo cascada.gracias
ResponderEliminar
Respuestas
Monica Tahan23 de septiembre de 2018 a las 20:26
Hola,

Muy bueno su artículo. Tengo aun una duda, cuando se emplean muestras muy grandes y el error medio cuadrático da muy alto, ¿cuál es la interpretación de ese resultado?

Mil gracias por su respuesta!!!
ResponderEliminar
Respuestas
Unknown12 de marzo de 2019 a las 6:34
Buenos días, hago una consulta ya que me hace ruido cuando luego de la predicción se transforma el valor escalar al valor nominal original... no deberían usarse los máximos y mínimos originales (sólo de test) en lugar de los máximos y mínimos del dataset completo? En caso de que no sea un error, por qué se hace de esa forma?

Muchas gracias por la aclaración. Slds!
ResponderEliminar
Respuestas
aikidoiwamamendoza12 de abril de 2019 a las 17:56
muy bueno y claro!!!
ResponderEliminar
Respuestas
Daniel_Amadei_Requena5 de abril de 2020 a las 13:29
Por favor alguien podría aclararme un par de dudas sobre pronóstico en series de tiempo con machine learning? Favor escribir a damadei@fen.uchile.cl
Un abrazo
ResponderEliminar
Respuestas
Anónimo13 de junio de 2022 a las 23:50
saludos, mi inquietud es sobre la primera capa oculta, esos numeros son aleatorios o es un valor predeterminado que usas
ResponderEliminar
Respuestas

Añadir comentario

INICIO

viernes, 25 de diciembre de 2015

Regresion con Red Neuronal

14 comentarios: