LogoLogo
  • Data Analysis
  • Introducción a Bases de Datos
    • Sesión 01 Consola
      • Agenda
      • Temas
        • 1. Shell y kernel
        • 2. ¿Qué es una terminal?
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
    • Sesión 02 Preparación y Consulta de Datos
      • Agenda
      • Temas
        • 1. Procesamiento de Datos
        • 2. Big Data
        • 3. Ciencia de Datos
        • 4. Expresiones Regulares
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
      • Encuesta de satisfacción
    • Sesión 03 Fundamentos de SQL
      • Agenda
      • Temas
        • 1. ¿Qué es una base de datos?
        • 2. ¿Qué es SQL?
        • 3. ¿Sistema de Gestor de Bases de Datos?
        • 4. Consultas a una BD
        • 5. Miniconda
        • 6. MyCLI
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
    • Sesión 4 Consulta de Datos y Relaciones SQL
      • Agenda
      • Temas
        • 1. ORDER BY(Ordenamiento)
        • 2. Operaciones matemáticas
        • 3. Teoría de conjuntos
        • 4. Joins
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
    • Sesión 5 Fundamentos de Mongo DB
      • Agenda
      • Temas
        • 1. NoSQL
        • 2. JSON
        • 3. MongoDB Compass
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
      • Proyecto
    • Sesión 6 Consultas con MongoDB a datos estructurados
      • Agenda
      • Temas
        • Consultas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
      • Proyecto
    • Sesión 7 Fundamentos de bases de datos en la nube
      • Agenda
      • Temas
        • API
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
    • Sesión 8 Consulta de datos en la nube
      • Agenda
      • Temas
        • Tipos de Datos
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
      • Proyecto
  • Fundamentos de Pyhon para Data Analysis
    • Sesión 01 Fundamentos de Python
      • Agenda
        • Temas
          • ¿Por qué Python?
          • Python: Lenguaje secuencial, tipos de datos y estructuras
          • Python: Procedimientos y funciones
          • Python: Condicionales
          • Python: Ciclos e iteraciones
      • Ejemplos y Retos
        • Ejemplo 01 y Reto 01
        • Ejemplo 02 y Reto 02
        • Reto 03
        • Ejemplo 03 y Reto 05
        • Reto 04
  • Sesión 02 Librerías para el análisis de datos con Python
    • Agenda
      • PANDAS: Dataframes
      • Jupyter Notebook
      • Ambientes de Python
      • MatPlotLib
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Ejemplo 02 / Reto 02 y Reto 03
      • Reto Final
  • Sesión 03 Análisis estadístico de datos (Numpy)
    • Agenda
      • Numpy
      • El objeto “Array” en NumPy
      • Creación y limpieza de datos con NumPy
      • Funciones útiles de NumPy
      • Matemática de Matrices con NumPy
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Ejemplo 02 y 03 / Reto 02
      • Ejemplo 04 / Reto 03
      • Ejemplo 05 y Reto 04 / Reto Final
  • Sesión 04 Análisis exploratorio de datos (Diccionarios y Pandas)
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 02
      • Ejemplo 02 y Reto 04
      • Reto 03
      • Reto 06
    • Agenda
      • Diccionarios
      • Keys & Values
      • Archivos JSON
      • Diccionarios, JSONs y PANDAS
      • Análisis Exploratorio de Datos
  • Sesión 05 Procesamiento y Transformación de datos
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Reto 02
      • Ejemplo 03 y Reto 03
    • Agenda
      • Limpieza de datos
      • Normalización de datos
      • Mappeo de datos
      • Unión de DataFrames
  • Sesión 06 Visualización de datos con Python (Matplotlib y otras)
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Reto 02
      • Reto 03
      • Reto 04
    • Agenda
      • Scatter plots: gráficas de dispersión
      • Figuras y sub-figuras
      • Plotteos 3D
      • Generación de subplots 3D
  • Sesión 07 Regresión con Python (Machine Learning)
    • Ejemplos y Retos
      • Reto 01
      • Reto 02
      • Reto 03
      • Reto 04
    • Agenda
      • Teoría de regresión lineal: Bases de la Inteligencia Artificial
      • La neurona artificial: La base de la I.A. moderna
      • Entrenamiento y prueba: Mi primer algoritmo de I.A
  • Sesión 08 Clasificación con Python: (Machine Learning)
    • Agenda
      • La clasificación automática
      • Agrupamiento en clústers: Clasificación no supervisada
      • Clasificación supervisada
      • Clasificación multiclase supervisada
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Reto 02
      • Ejemplo 03 y Reto 03 / Ejemplo 04 y Reto 04
  • Programación con Python para Data Analysis
  • PROGRAMACIÓN CON PYTHON PARA DATA ANALYSIS
  • Sesión 01 Python Fundamentals
    • Sesión 01: Python Fundamentals
    • Agenda
      • Agenda
    • Ejemplos y Retos
      • Temas
      • Ejemplo 01 y Reto 01
      • Ejemplos y Retos
      • Untitled
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
        • Reto Final
    • Sesión 02: Estructuras de datos y funciones
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
        • Ejemplo 06
        • Reto final
    • Sesión 03: Módulos y paquetes
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
        • Reto final
    • Sesión 04: Manipulación de archivos, JSON, CSV y excepciones
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Reto final
    • Sesión 05: Programación Orientada a Objetos
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Reto final
    • Sesión 06: Servidores web y APIs
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Reto final
    • Sesión 07: Web Scraping
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
    • Sesión 08: Computación numérica o científica
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
Con tecnología de GitBook
En esta página

¿Te fue útil?

  1. Sesión 06 Visualización de datos con Python (Matplotlib y otras)
  2. Agenda

Scatter plots: gráficas de dispersión

AnteriorAgendaSiguienteFiguras y sub-figuras

Última actualización hace 5 años

¿Te fue útil?

¿Qué es un scatter plot?

Un scatter plot te permite ver todo un dataset por medio de puntos. Un punto = una muestra. Cada color debe representar un conjunto. Ejemplo: Café (rojo), té (verde) y agua (azul).

¿Para que nos sirve?

Las gráficas de dispersión ayudan a hallar separaciones útiles en los datos. Por ejemplo, este dataset:

  • Los puntos rojos están muy separados de los demás.

  • Los verdes y azules están muy mezclados.

Ejemplo: Scatter plot de cardiología

Para los siguientes ejemplos usaremos una base de datos de cardiología.

  • Son datos reales de pacientes, previamente limpios.

  • Obtenidos del instituto de cardiología de Cleveland.

Objetivo: tratar de separar pacientes sanos de enfermos.

1.- Cargar el CSV --> pd.load_csv (‘archivo’)

Los datos ya están limpios los y contienen los headers. ☺

2.- Transformar a NumPy Recuerda que MatPlotLib utiliza NumPy para casi todas sus operaciones. Vamos a transformar el dataframe a una matriz de NumPy. Como los valores 1, 2 y 3 son “pacientes enfermos”, voy a usar un ciclo para hacer que los pacientes sean 0 o 1 (sano / enfermo).

3.- Plottear con Scatter

Con una llamada a plt.Scatter(...) puedes generar el plot. No es muy interactivo que digamos así.

plt.scatter

Scatters descriptivos

Para un científico de datos, un plano de dispersión es crucial. Un plano poco descriptivo no es útil. Es importante saber con qué datos lidias: ¿Qué significa este plano? ¿Por qué los datos están tan mezclados?

  1. Primero, separemos los datos en dos clases: Sanos y enfermos. Para ello, usaremos “np.where()”

  • np.where marca: “dame los índices donde se cumpla cierta condición.” En este caso, donde datos_cardio[:,13] sea 0 y luego donde sea 1.

Plotteando scatters útiles

Luego, utiliza esos datos para hacer scatters separados (MatPlotLib los pondrá en el mismo plano).

Resultado:

  • Ahora cada gráfica de dispersión tiene su propio color.

  • Si hubiera varias categorías, podrías ponerlas una sobre otra.

  • ¡Puedes incluso mejorar este código para ser más descriptivo!

Dataframe.columns

  • Ahora mismo hemos usado variables para elegir las columnas.

  • Puedes obtener las columnas, y usar las variables para indicar que significa ese scatter plot.

La instrucción plt.xlabel(...) y plt.ylabel(...) te permiten poner texto en los ejes.

Resultado del código anterior:

Ahora dependiendo de las columnas que elijas todos los datos se ajustarán para que inspecciones los datos.

---> Sigue con el ejemplo 01 // Reto 01 <---

Scatterplot (1)
Scatterplot (2)
Transformar el dataframe a Numpy
Scatter descriptivo