LogoLogo
  • Data Analysis
  • Introducción a Bases de Datos
    • Sesión 01 Consola
      • Agenda
      • Temas
        • 1. Shell y kernel
        • 2. ¿Qué es una terminal?
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
    • Sesión 02 Preparación y Consulta de Datos
      • Agenda
      • Temas
        • 1. Procesamiento de Datos
        • 2. Big Data
        • 3. Ciencia de Datos
        • 4. Expresiones Regulares
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
      • Encuesta de satisfacción
    • Sesión 03 Fundamentos de SQL
      • Agenda
      • Temas
        • 1. ¿Qué es una base de datos?
        • 2. ¿Qué es SQL?
        • 3. ¿Sistema de Gestor de Bases de Datos?
        • 4. Consultas a una BD
        • 5. Miniconda
        • 6. MyCLI
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
    • Sesión 4 Consulta de Datos y Relaciones SQL
      • Agenda
      • Temas
        • 1. ORDER BY(Ordenamiento)
        • 2. Operaciones matemáticas
        • 3. Teoría de conjuntos
        • 4. Joins
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
      • Proyecto
    • Sesión 5 Fundamentos de Mongo DB
      • Agenda
      • Temas
        • 1. NoSQL
        • 2. JSON
        • 3. MongoDB Compass
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
      • Proyecto
    • Sesión 6 Consultas con MongoDB a datos estructurados
      • Agenda
      • Temas
        • Consultas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
      • Proyecto
    • Sesión 7 Fundamentos de bases de datos en la nube
      • Agenda
      • Temas
        • API
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
    • Sesión 8 Consulta de datos en la nube
      • Agenda
      • Temas
        • Tipos de Datos
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
      • Proyecto
  • Fundamentos de Pyhon para Data Analysis
    • Sesión 01 Fundamentos de Python
      • Agenda
        • Temas
          • ¿Por qué Python?
          • Python: Lenguaje secuencial, tipos de datos y estructuras
          • Python: Procedimientos y funciones
          • Python: Condicionales
          • Python: Ciclos e iteraciones
      • Ejemplos y Retos
        • Ejemplo 01 y Reto 01
        • Ejemplo 02 y Reto 02
        • Reto 03
        • Ejemplo 03 y Reto 05
        • Reto 04
  • Sesión 02 Librerías para el análisis de datos con Python
    • Agenda
      • PANDAS: Dataframes
      • Jupyter Notebook
      • Ambientes de Python
      • MatPlotLib
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Ejemplo 02 / Reto 02 y Reto 03
      • Reto Final
  • Sesión 03 Análisis estadístico de datos (Numpy)
    • Agenda
      • Numpy
      • El objeto “Array” en NumPy
      • Creación y limpieza de datos con NumPy
      • Funciones útiles de NumPy
      • Matemática de Matrices con NumPy
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Ejemplo 02 y 03 / Reto 02
      • Ejemplo 04 / Reto 03
      • Ejemplo 05 y Reto 04 / Reto Final
  • Sesión 04 Análisis exploratorio de datos (Diccionarios y Pandas)
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 02
      • Ejemplo 02 y Reto 04
      • Reto 03
      • Reto 06
    • Agenda
      • Diccionarios
      • Keys & Values
      • Archivos JSON
      • Diccionarios, JSONs y PANDAS
      • Análisis Exploratorio de Datos
  • Sesión 05 Procesamiento y Transformación de datos
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Reto 02
      • Ejemplo 03 y Reto 03
    • Agenda
      • Limpieza de datos
      • Normalización de datos
      • Mappeo de datos
      • Unión de DataFrames
  • Sesión 06 Visualización de datos con Python (Matplotlib y otras)
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Reto 02
      • Reto 03
      • Reto 04
    • Agenda
      • Scatter plots: gráficas de dispersión
      • Figuras y sub-figuras
      • Plotteos 3D
      • Generación de subplots 3D
  • Sesión 07 Regresión con Python (Machine Learning)
    • Ejemplos y Retos
      • Reto 01
      • Reto 02
      • Reto 03
      • Reto 04
    • Agenda
      • Teoría de regresión lineal: Bases de la Inteligencia Artificial
      • La neurona artificial: La base de la I.A. moderna
      • Entrenamiento y prueba: Mi primer algoritmo de I.A
  • Sesión 08 Clasificación con Python: (Machine Learning)
    • Agenda
      • La clasificación automática
      • Agrupamiento en clústers: Clasificación no supervisada
      • Clasificación supervisada
      • Clasificación multiclase supervisada
    • Ejemplos y Retos
      • Ejemplo 01 y Reto 01
      • Reto 02
      • Ejemplo 03 y Reto 03 / Ejemplo 04 y Reto 04
  • Programación con Python para Data Analysis
  • PROGRAMACIÓN CON PYTHON PARA DATA ANALYSIS
  • Sesión 01 Python Fundamentals
    • Sesión 01: Python Fundamentals
    • Agenda
      • Agenda
    • Ejemplos y Retos
      • Temas
      • Ejemplo 01 y Reto 01
      • Ejemplos y Retos
      • Untitled
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
        • Reto Final
    • Sesión 02: Estructuras de datos y funciones
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
        • Ejemplo 06
        • Reto final
    • Sesión 03: Módulos y paquetes
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
        • Reto final
    • Sesión 04: Manipulación de archivos, JSON, CSV y excepciones
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Reto final
    • Sesión 05: Programación Orientada a Objetos
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Reto final
    • Sesión 06: Servidores web y APIs
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Reto final
    • Sesión 07: Web Scraping
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
        • Ejemplo 05
    • Sesión 08: Computación numérica o científica
      • Agenda
        • Temas
      • Ejemplos y Retos
        • Ejemplo 01
        • Ejemplo 02
        • Ejemplo 03
        • Ejemplo 04
Con tecnología de GitBook
En esta página

¿Te fue útil?

  1. Sesión 08 Clasificación con Python: (Machine Learning)
  2. Agenda

Clasificación supervisada

AnteriorAgrupamiento en clústers: Clasificación no supervisadaSiguienteClasificación multiclase supervisada

Última actualización hace 5 años

¿Te fue útil?

No sabemos a qué clase pertenece cada dato. Dejamos que K-Means decida por nosotros los grupos. Nosotros solo decimos cuántos grupos queremos. Ahora vamos a darle indicios de las clases en cada muestra.

Entrenamiento supervisado

Para un entrenamiento supervisado necesitamos pasar por:

  • Entrenamiento: Cuando ajustas el modelo para tratar de ser óptimo.

  • Prueba: Cuando muestras datos y comparas la clasificación obtenida vs la esperada.

Datasets de entrenamiento y prueba

  • Pruebas: muestra si tu modelo de machine learning hace su trabajo.

  • Entrenamiento: ajusta el modelo.

De todos los datos, debes hacer una división en 2 conjuntos.

División 70 / 30: 70% para entrenamiento, 30% para pruebas.

¿Cómo debes dividir los datos?

Supongamos que tienes un dataset de la siguiente forma… Los datos en “Y” son las salidas que esperas (ya sea binaria o multiclase).

Primer paso: “shuffle” Revolverás las muestras (filas) de forma aleatoria, para asegurarte de que no elijas por error muestras sencillas. No revolver las muestras = problema de “Cherry picking”

Segundo paso: “split”

Cortarás tanto X, como Y, en dos partes proporcionales. La parte de pruebas no debe ser usada jamás para entrenar. Usar las pruebas para entrenar = mentirte a ti mismo sobre la eficacia del sistema.

Separando en Train / Test

Para este ejemplo usaremos make_blobs nuevamente. Generamos 1000 datos de 2 dimensiones, con make_blobs - Puntos amarillos y morados, clase 0 y 1

Neuronas como clasificadores supervisados

Una neurona puede tener un comportamiento de clasificador. Para ello, las neuronas utilizan una función llamada “Función de activación”.

Función sigmoidal

Es una de las funciones de activación más comunes. Toma cualquier valor de una neurona y la transforma en un valor de 0 a 1

0 = respuesta rechazada. 0.5 = incertidumbre 1 = Respuesta aceptada

Las ecuaciones de una neurona

El perceptrón multicapa

¿Qué pasa si ponemos varias neuronas juntas? --> Todas las conectamos a las mismas entradas.

Cada neurona nos puede dar resultados diferentes. Estas neuronas juntas en una línea se le conoce como “Capa neuronal”.

Si hacemos que todas las salidas se conecten a una (o más neuronas) logramos un “perceptrón multicapa”.

Entre más capas: - Comportamientos más inteligentes - Mayor dificultad de entrenamiento

¡Implementando redes neuronales!

SciKit Learn te permite crear Redes neuronales rápidamente. Solo necesitas decirle:

  1. Qué función de activación quieres

  2. Qué método de entrenamiento usar

  3. La tasa de aprendizaje

  4. El ajuste de pesos sinápticos

  5. Cuántas neuronas en cada capa

Obteniendo resultados de clasificación

  • Con x_prueba vemos que tal predice las clases (predict). Los errores son calculados con:

  • La precisión se calcula con:

Actividad: Modifica el MLP y reporta qué pasa

* No modifiques la generación de blobs, ni la generación de train test Split (Tendrás resultados incongruentes siempre).