Análisis Exploratorio de Datos

Análisis Exploratorio de datos (EDA)

  • Se toman todos los datos (o una muestra).

  • Se generan resúmenes de los datos.

  • Los resúmenes nos ayudarán a entender cómo se comporta lo que estamos estudiando.

Algunos datos útiles del dataset para el EDA:

  • Promedio

  • Moda (valor más repetido)

  • Valor máximo

  • Valor mínimo

  • Histograma

Funciones de PANDAS para generar tu EDA

  • Valor máximo: para saber lo más que podemos esperar.

  • Valor mínimo: para saber lo menos que podríamos esperar.

  • ArgMax: cuál fue la muestra con mayor valor.

  • ArgMin: cuál fue la muestra con menor valor.

  • Mean: El promedio te ayuda a predecir datos nuevos: Es probable que un dato nuevo esté cerca del promedio.

  • Mode: La moda te dice cuál es el dato más repetido: Datos nuevos pueden caer muy cerca de la moda.

  • Hist: Te permite generar un histograma con tus datos.

---> Sigue con el Reto 06 <---

Última actualización

¿Te fue útil?