Análisis Exploratorio de Datos
Última actualización
¿Te fue útil?
Última actualización
¿Te fue útil?
Se toman todos los datos (o una muestra).
Se generan resúmenes de los datos.
Los resúmenes nos ayudarán a entender cómo se comporta lo que estamos estudiando.
Algunos datos útiles del dataset para el EDA:
Promedio
Moda (valor más repetido)
Valor máximo
Valor mínimo
Histograma
Valor máximo: para saber lo más que podemos esperar.
Valor mínimo: para saber lo menos que podríamos esperar.
ArgMax: cuál fue la muestra con mayor valor.
ArgMin: cuál fue la muestra con menor valor.
Mean: El promedio te ayuda a predecir datos nuevos: Es probable que un dato nuevo esté cerca del promedio.
Mode: La moda te dice cuál es el dato más repetido: Datos nuevos pueden caer muy cerca de la moda.
Hist: Te permite generar un histograma con tus datos.