CIENCIA DE DATOS A TRAVES DE PYTHON

CIENCIA DE DATOS A TRAVES DE PYTHON

Técnicas de aprendizaje supervisado: clasificación
25-10-2024
9788419034755
Rustica
370
450
170x240 mm
CASTELLANO
ESTUDIOS GENERALES
PVP
40.00

Sinopsis

La ciencia de datos es un campo interdisciplinar que utiliza métodos, algoritmos, procesos y sistemas para extraer conocimiento y conclusiones a partir de todo tipo de datos. A través del aprendizaje automático se combinan elementos de estadística, informática, matemáticas y técnicas de análisis para resolver problemas, hacer predicciones y generar valor a partir de los datos. Se apoya en grandes volúmenes de datos (Big Data) para descubrir patrones, tendencias y relaciones que pueden ser utilizadas para la toma de decisiones. El aprendizaje automático utiliza dos tipos de técnicas:

• el aprendizaje supervisado, que entrena a un modelo con datos conocidos de entrada y salida para que pueda predecir resultados futuros, y

• el aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada.

El aprendizaje supervisado utiliza técnicas de clasificación y regresión basadas en modelos predictivos, según la naturaleza de la variable dependiente. Si esta es categórica estamos ante las técnicas predictivas de clasificación y si es cuantitativa estamos antes las técnicas predictivas de regresión.

Este libro desarrolla las técnicas de aprendizaje supervisado para la clasificación. Comienza en el análisis discriminante, tanto simple como múltiple y tanto lineal como cuadrático. También, se abordan los modelos lineales generalizados haciendo hincapié en los modelos de elección discreta y en los modelos de recuento como casos particulares. Se profundiza en la regresión logística, los modelos Probit, los modelos de Poisson y los modelos Binomial Negativa. Se hace hincapié en la diagnosis a través de instrumentos como la matriz de confusión, la curva ROC y la acuracidad.

Los capítulos siguientes se centran en la clasificación mediante árboles de decisión, teniendo en cuenta los árboles de clasificación, los árboles de regresión y los árboles aleatorios (Random Forest). También se profundiza en otros clasificadores como el algoritmo KNN del vecino más cercano, el algoritmo SVM (Support Vector Machine) y el algoritmo Naive Bayes. A continuación, se abordan las técnicas de ensamblado de modelos como Boosting, Bagging, Stacking, Voting y Blending.

Finalmente se desarrollan temas avanzados como los modelos de redes neuronales para la clasificación. Se tienen en cuenta arquitecturas como el Perceptrón Multicapa, la Red de Base Radial, las redes Adaline, las redes de Hopfield y las redes neuronales para predicción se series temporales como las redes LSTM, las redes recurrentes RNN, las redes GRU y las redes NARX.

Para todos los temas se presentan los conceptos metodológicos ilustrados con ejemplos y ejercicios resuel‐ tos en Python.

Más libros del autor