Mappeo de datos

¿Qué es el mappeo de datos?

Por lo general, los programadores escriben el estado de algún evento con Strings. Sin embargo, necesitamos códigos numéricos a veces. Ejemplo:

“OK!” 🡪 200 “Success” 🡪 201 “Error” 🡪 500 “Not found” 🡪 404

  • Mappeo de datos es transformar un dato en otro.

  • A cada dato original le corresponde un dato modificado.

  • Los datos pueden repetirse, por ejemplo: “Success, Ok, Éxito, etc…” pueden compartir el mismo punto de mappeo.

ACTIVIDAD: Piensa en un ejemplo de buen y mal mappeo

Buenos mappeos:

  • El celular para acceder a tu banca móvil.

  • Tu Código postal y tu colonia.

Malos mappeos:

  • “Tu sabrás…”

  • “Haz lo que quieras…”

  • “Mjm…”

¿Para qué sirve el mappeo de datos?

Razón 1: Espacio

  • Ocupa menos memoria interna guardar un número que un string

Por ejemplo:

  • Memoria = bytes x #filas

Un numero usa 8 bytes: 8 x 10,000,000 = 80 Mb Un String largo usa 160 bytes: 80 x 10,000,000 = 1.6 Gb

Razón 2: Usabilidad

  • Es más sencillo contar fallas si valen “1” que si valen “algo falló”

  • Si falla = 1, y éxito = 0, entonces solo sumas todas las filas y el resultado es el número de fallas.

Razón 3: Facilidad de cómputo

  • Los algoritmos de clasificación y de reconocimiento no entienden Strings.

  • Hay que transformar Strings a números para poder procesar con facilidad.

  • Internamente, el programador mappea Strings a números.

Mappeando con PANDAS

Si conoces los datos de la serie que vas a Mappear, no hay problema ;) si no, haz un histograma primero, para conocer los datos. Revisa en el eje X cuáles son los datos a mappear (Fell & Found en este caso).

Mappeo con PANDAS

Última actualización

¿Te fue útil?