Importar datos a Google Colab
Importar datos a Google Colab#
Con “importar datos” nos referimos a la manera en la que preparamos la fuente de datos para ser leída por nuestro programa.
Existen múltiples maneras de importar la información. Por ejemplo, podemos sencillamente utilizar el mismo método que usamos con nuestro archivo ejemplo-1.txt
.
Descarga el archivo que quieras utilizar en el directorio de Drive en el que vayas a almacenar tus datos.
Como ejemplo, voy a utilizar los casos nacionales de COVID-19 registrados diariamente durante el primer semestre de 2022 compartidos por la Secretaría de Salud de Ciudad de México.
Descargo el archivo CSV en un directorio de mi computadora. Posteriormente lo subo a mi directorio de datos de Google Drive:

Volvemos a nuestro cuaderno de Google Colab. Me aseguro de haber activado Google Drive en mi Google Colab y busco el directorio en el cual está mi archivo. En mi caso: '/content/drive/MyDrive/Colab Notebooks/curso_datos/casos_nacionales_covid-19_2022_semestre1.csv'

Con esos pasos, podemos hacer la importación:
datos = '/content/drive/MyDrive/Colab Notebooks/curso_datos/casos_nacionales_covid-19_2022_semestre1.csv'
with open(datos, 'r') as f:
data = f.readlines(10) # agrego este argumento porque el archivo es muy extenso.
data
De esta manera hemos logrado incluir el archivo en nuestro cuaderno, pero será muy complejo manipularlo. Por esta razón, es preferible utilizar una librería que nos ayude a procesar estos datos. En nuestro caso, usaremos ‘pandas’ [McKinney, 2018].
Para hacer que nuestro programa funcione, solamente debemos importar la librería:
import pandas as pd
Y posteriormente podremos abrir nuestro archivo desde Python:
import pandas as pd
df = pd.read_csv(datos)
df.head()
Puedes ver el resultado de este ejercicio en el siguiente enlace
Problemas comunes
Este método funciona con archivos csv, no con archivos de texto o de Excel. Para replicar el ejercicio en este momento te recomendamos seleccionar una fuente de datos en ese formato.
También es posible que surja un error al momento de ejecutar la importación. Intenta por esta semana con otra fuente de datos. La siguiente semana detallaremos algunas habilidades que te ayudarán a resolver ese problema.
Intenta replicar el ejercicio con un archivo que sea de tu interés y compártelo con los demás colegas en la siguiente actividad.