to_csv
to_csv
#
Después de realizar todas las operaciones, podemos guardar el resultado en un archivo csv para reutilizarlo o compartirlo. Pandas
incluye una función que facilita esta tarea, el único requisito consiste en indicar el nombre del archivo y la ruta donde se guardará.
Vamos a asegurar que tenemos el conjunto de datos que requerimos, con la información limpia, procesada y transformada.
Utilizaremos los conjuntos de datos que segmentamos previamente y los uniremos siguiendo lo que observamos en la sección combinar fuentes de datos.
covid_clean = pd.merge(muestra_covid, geolocalizacion, how='inner', on='municipio_residencia')
Llenamos los valores nulos con ‘NO APLICA’ para que no sean considerados en el análisis. Dejaremos como valores nulos los correspondientes a fecha_def
para poder hacer la transformación de fechas.
covid_clean.fillna({'municipio_residencia': 'NO APLICA', 'pais_nacionalidad': 'NO APLICA'}, inplace=True)
Transformamos los valores de las columnas ['fecha_ingreso', 'fecha_sintomas', 'fecha_def']
a datetime64[ns]
.
columnas = ['fecha_ingreso', 'fecha_sintomas', 'fecha_def']
for columna in columnas:
muestra_covid[columna] = pd.to_datetime(muestra_covid.loc[:, columna])
muestra_covid.dtypes
Unnamed: 0 int64
sexo object
edad int64
entidad_nacimiento object
municipio_residencia object
indigena object
nacionalidad object
migrante object
pais_nacionalidad object
fecha_ingreso datetime64[ns]
fecha_sintomas datetime64[ns]
fecha_def datetime64[ns]
dtype: object
Y con esto tenemos listo nuestro conjunto de datos para guardarlo en un archivo csv.
ruta = '../data/covid_clean.csv'
covid_clean.to_csv(ruta, index=False) # Recuerda modificar la ruta a tu Drive. Debe ser algo como '/content/drive/MyDrive/Tu Directorio/elnombredetucsv.csv'
Y para comprobar que lo hicimos correctamente:
pd.read_csv(ruta)
Unnamed: 0_x | sexo | edad | entidad_nacimiento | municipio_residencia | indigena | nacionalidad | migrante | pais_nacionalidad | fecha_ingreso | fecha_sintomas | fecha_def | Unnamed: 0_y | Lat_Decimal | Lon_Decimal | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 7 | MUJER | 75 | QUERÉTARO | naucalpan de juárez | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-02-21 | 2022-02-16 | NaN | 141786 | 19.478803 | -99.233218 |
1 | 142 | MUJER | 32 | CIUDAD DE MÉXICO | naucalpan de juárez | NO ESPECIFICADO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-01-07 | 2022-01-02 | NaN | 141786 | 19.478803 | -99.233218 |
2 | 153 | HOMBRE | 30 | CIUDAD DE MÉXICO | naucalpan de juárez | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-02-04 | 2022-02-03 | NaN | 141786 | 19.478803 | -99.233218 |
3 | 911 | MUJER | 51 | CIUDAD DE MÉXICO | naucalpan de juárez | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-01-01 | 2021-12-28 | NaN | 141786 | 19.478803 | -99.233218 |
4 | 1031 | HOMBRE | 83 | GUANAJUATO | naucalpan de juárez | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-01-01 | 2021-12-30 | NaN | 141786 | 19.478803 | -99.233218 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
158080 | 1300735 | HOMBRE | 12 | VERACRUZ DE IGNACIO DE LA LLAVE | amatlán de los reyes | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-06-23 | 2022-06-23 | NaN | 257896 | 18.847578 | -96.915484 |
158081 | 1304944 | MUJER | 46 | CIUDAD DE MÉXICO | amatlán de los reyes | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-06-22 | 2022-06-19 | NaN | 257896 | 18.847578 | -96.915484 |
158082 | 1306736 | MUJER | 59 | CIUDAD DE MÉXICO | general simón bolívar | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-06-23 | 2022-06-22 | NaN | 86081 | 24.689074 | -103.225975 |
158083 | 1308787 | MUJER | 27 | MÉXICO | temozón | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-06-24 | 2022-06-22 | NaN | 289799 | 20.803680 | -88.201158 |
158084 | 1311869 | MUJER | 32 | MÉXICO | izamal | NO | MEXICANA | NO ESPECIFICADO | MÉXICO | 2022-06-24 | 2022-06-20 | NaN | 286011 | 20.932998 | -89.019715 |
158085 rows × 15 columns
¡Excelente! Ya estás listo para entregar la actividad de cierre de esta semana y proceder a la visualización de datos.