Mappeo de datos
Última actualización
¿Te fue útil?
Última actualización
¿Te fue útil?
¿Qué es el mappeo de datos?
Por lo general, los programadores escriben el estado de algún evento con Strings. Sin embargo, necesitamos códigos numéricos a veces. Ejemplo:
“OK!” 🡪 200 “Success” 🡪 201 “Error” 🡪 500 “Not found” 🡪 404
Mappeo de datos es transformar un dato en otro.
A cada dato original le corresponde un dato modificado.
Los datos pueden repetirse, por ejemplo: “Success, Ok, Éxito, etc…” pueden compartir el mismo punto de mappeo.
Buenos mappeos:
El celular para acceder a tu banca móvil.
Tu Código postal y tu colonia.
Malos mappeos:
“Tu sabrás…”
“Haz lo que quieras…”
“Mjm…”
¿Para qué sirve el mappeo de datos?
Razón 1: Espacio
Ocupa menos memoria interna guardar un número que un string
Por ejemplo:
Memoria = bytes x #filas
Un numero usa 8 bytes: 8 x 10,000,000 = 80 Mb Un String largo usa 160 bytes: 80 x 10,000,000 = 1.6 Gb
Razón 2: Usabilidad
Es más sencillo contar fallas si valen “1” que si valen “algo falló”
Si falla = 1, y éxito = 0, entonces solo sumas todas las filas y el resultado es el número de fallas.
Razón 3: Facilidad de cómputo
Los algoritmos de clasificación y de reconocimiento no entienden Strings.
Hay que transformar Strings a números para poder procesar con facilidad.
Internamente, el programador mappea Strings a números.
Mappeando con PANDAS
Si conoces los datos de la serie que vas a Mappear, no hay problema ;) si no, haz un histograma primero, para conocer los datos. Revisa en el eje X cuáles son los datos a mappear (Fell & Found en este caso).