Sinopsis
Los algoritmos de Ciencia de Datos utilizan métodos computacionales para extraer información directamente de los datos. En la fase de Análisis de la Ciencia de Datos, el Aprendizaje Automático utiliza dos tipos de técnicas:
• el Aprendizaje Supervisado, que entrena a un modelo con datos conocidos de entrada y salida para que pueda predecir resultados futuros, y
• el Aprendizaje no Supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada.
El Aprendizaje Supervisado utiliza técnicas de clasificación y regresión para desarrollar modelos de predicción. Las técnicas de clasificación predicen respuestas categóricas y clasificación los datos de entrada en las categorías de la variable dependiente. Las técnicas de regresión predicen respuestas continuas.
La mayoría de las técnicas de Aprendizaje Supervisado para la clasificación se desarrollan a lo largo de este libro desde un punto de vista metodológico y desde un punto de vista práctico con aplicaciones a través del software R.
El libro comienza tratando las técnicas de Análisis Discriminante Lineal y Cuadrático, tanto simple, como múltiple. A continuación, se profundiza en los Modelos Lineales Generalizados presentando el trabajo con Modelos Logit, Modelos Probit, Modelos de Recuento y Modelos de Elección Discreta.
Posteriormente se aborda la temática de los Árboles de Decisión, considerando las tipologías más importan-tes como los árboles CHAID, CART, QUEST y árboles aleatorios (RANDOM FOREST).
Finalmente se expone el trabajo con Redes Neuronales para el ajuste de modelos predictivos utilizando las arquitecturas más importantes. También se trata el trabajo con Redes Neuronales para la predicción de Series Temporales.
Los capítulos comienzan con explicaciones metodológicas sencillas que posteriormente se ilustran con ejemplos y ejercicios resueltos paso a paso con el software R. Se incide especialmente en la fase de la evaluación de las técnicas a través de Matrices de confusión, Curvas características de operación y Densidades de probabilidad.
En la página web del libro se encuentran disponibles los archivos de datos necesarios para desarrollar los ejemplos que se utilizan a lo largo del texto.