Actividad: limpieza de datos#

Este es un paso fundamental para utilizar nuestras fuentes de datos. Comparte con tus colegas el enlace a tu Google Colab donde realices el proceso de limpieza de la información seleccionada. Es decir:

  • Segmenta tu información para que solamente contenga las columnas con datos que necesitas procesar.

  • Asegurar que las columnas a procesar no tengan valores nulos o vacíos (utiliza el método fillna() o dropna() según lo consideres adecuado)

  • Elimina duplicados con el método drop_duplicates()

  • Transforma los datos que serán sujetos de análisis a su tipo adecuado según corresponda. Por ejemplo, fechas que estén en tipo ‘object’ deben ser transformadas con to_datetime(), números que no estén en enteros o decimales deben convertirse con to_numeric(), entre otros casos.

Comparte tu cuaderno de Google Colab para que los demás colegas puedan comentar. También comenta y valora los aportes de los demás colegas.