Normalización de datos
Última actualización
¿Te fue útil?
Última actualización
¿Te fue útil?
¿Qué es la normalización de datos? Supongamos que tienes una I.A. que clasifica datos de pacientes para diagnosticar.
1er dato: Temperatura. De 32 °C a 42 °C 2do dato: Niveles de glucosa. De 50 a 400 mg/dl Resultado: 1 = enfermo, 0 = sano.
Rango de datos para clasificar:
--> De 35.8 a 37.5 °C es sano en temperatura. --> De 50 a 125 mg/dl es sano en niveles de glucosa.
Sin embargo, un clasificador / separador lineal no sabe esto, y tratará de inferirlo. Hay un rango más amplio en glucosa que en temperatura.
Normalización
Todos los datos deben ser igual de relevantes.
La IA o el clasificador determinará cual es más importante.
Una variación será proporcionalmente igual de importante en todos los datos.
¿Qué quiere decir esto?
La temperatura es un valor mucho más delicado que la glucosa.
Normalizar los datos lo hace más visible.
Los algoritmos de clasificación se harán más sensibles a los cambios más importantes.