Actividad: limpieza de datos
Actividad: limpieza de datos#
Este es un paso fundamental para utilizar nuestras fuentes de datos. Comparte con tus colegas el enlace a tu Google Colab donde realices el proceso de limpieza de la información seleccionada. Es decir:
Segmenta tu información para que solamente contenga las columnas con datos que necesitas procesar.
Asegurar que las columnas a procesar no tengan valores nulos o vacíos (utiliza el método fillna() o dropna() según lo consideres adecuado)
Elimina duplicados con el método drop_duplicates()
Transforma los datos que serán sujetos de análisis a su tipo adecuado según corresponda. Por ejemplo, fechas que estén en tipo ‘object’ deben ser transformadas con to_datetime(), números que no estén en enteros o decimales deben convertirse con to_numeric(), entre otros casos.
Comparte tu cuaderno de Google Colab para que los demás colegas puedan comentar. También comenta y valora los aportes de los demás colegas.