TransWikia.com

Cross validation en R

Stack Overflow en español Asked by la_roca on October 2, 2020

Queria preguntarles como hacer un método de validacion cruzada simplificado, con solo datos de entrenamiento y testeo, especificamente seleccionando 100.000 variables seleccionadas aleatoriamente como entrenamiento, y el resto para testeo e implementar la validacion cruzada 200 veces. Esto no es separando posteriormente los datos de entrenamiento, nuevamente en entrenamiento y validación?

Agradezco su ayuda!

One Answer

Para realizar la validación cruzada, sólo se hace con el grupo de entrenamiento y no con el testeo.

library(caret)
set.seed(2020)
index      <- createDataPartition(datos$target, p=0.7, list=FALSE)
train<- datos[index,]         
test<- datos[-index,]  

Con esto se logra dividir la base general en entrenamiento y testeo.

Ahora para poder realizar la validación cruzada sería de la siguiente manera:

fit_control <- trainControl(method = "cv", number = 200, savePredictions = 'final', classProbs = T)

Con esto realizas una validación cruzada 200 veces.

Answered by césar huamani ninahuanca on October 2, 2020

Add your own answers!

Ask a Question

Get help from others!

© 2024 TransWikia.com. All rights reserved. Sites we Love: PCI Database, UKBizDB, Menu Kuliner, Sharing RPP