Mappeo de datos
¿Qué es el mappeo de datos?
Por lo general, los programadores escriben el estado de algún evento con Strings. Sin embargo, necesitamos códigos numéricos a veces. Ejemplo:
“OK!” 🡪 200 “Success” 🡪 201 “Error” 🡪 500 “Not found” 🡪 404

Mappeo de datos es transformar un dato en otro.
A cada dato original le corresponde un dato modificado.
Los datos pueden repetirse, por ejemplo: “Success, Ok, Éxito, etc…” pueden compartir el mismo punto de mappeo.

ACTIVIDAD: Piensa en un ejemplo de buen y mal mappeo
Buenos mappeos:
El celular para acceder a tu banca móvil.
Tu Código postal y tu colonia.
Malos mappeos:
“Tu sabrás…”
“Haz lo que quieras…”
“Mjm…”
¿Para qué sirve el mappeo de datos?
Razón 1: Espacio
Ocupa menos memoria interna guardar un número que un string
Por ejemplo:
Memoria = bytes x #filas
Un numero usa 8 bytes: 8 x 10,000,000 = 80 Mb Un String largo usa 160 bytes: 80 x 10,000,000 = 1.6 Gb
Razón 2: Usabilidad
Es más sencillo contar fallas si valen “1” que si valen “algo falló”
Si falla = 1, y éxito = 0, entonces solo sumas todas las filas y el resultado es el número de fallas.
Razón 3: Facilidad de cómputo
Los algoritmos de clasificación y de reconocimiento no entienden Strings.
Hay que transformar Strings a números para poder procesar con facilidad.
Internamente, el programador mappea Strings a números.
Mappeando con PANDAS
Si conoces los datos de la serie que vas a Mappear, no hay problema ;) si no, haz un histograma primero, para conocer los datos. Revisa en el eje X cuáles son los datos a mappear (Fell & Found en este caso).


Última actualización
¿Te fue útil?