¿Qué aprendimos esta semana?
Contents
¿Qué aprendimos esta semana?#
Vamos a repasar los objetivos de la primera semana de este curso.
Creaste un cuaderno en Google Colab, editar celdas de texto y código, y realizar importaciones de archivos de texto.
Compartiste públicamente un cuaderno de Google Colab.
Buscaste una fuente de datos en los repositorios públicos de datos abiertos.
Seleccionaste una fuente de datos teniendo en cuenta su descripción, creadores, rango de tiempo y tipo de archivo.
Importaste la fuente de datos a tu Google Drive y de allí a tu Google Colab utilizando Python.
¿Qué aprendiste de programación en Python esta semana?#
Si seguiste detenidamente los pasos de esta primera semana, habrás aprendido algunas habilidades básicas de programación.
Sintaxis básica#
Python es un lenguaje con una sintaxis muy sencilla. Básicamente comprende los siguientes aspectos:
Indentación#
Cada bloque de código se escribe con espacios o tabuladores. Por ejemplo:
if 5 > 2:
print("5 es mayor que 2")
5 es mayor que 2
Nota que hay cinco espacios entre la primera instrucción if 5 > 2:
y la segunda instrucción print("5 es mayor que 2")
. Si utilizamos otro “formato” vamos a encontrar un error:
if 5 > 2:
print("5 es mayor que 2")
File "/var/folders/6z/cjmzygfj49d6yzn_qgny7hgr0000gp/T/ipykernel_99075/1165996053.py", line 2
print("5 es mayor que 2")
^
IndentationError: expected an indented block
Comentarios#
Los comentarios son una forma de documentar el código.
# Este es un comentario
print("Hola mundo")
Hola mundo
Como ves, los comentarios se escriben con un #
y seguido del texto. El programa no los ejecuta y sirven solamente para anotar el código.
Variables#
Las variables son una forma de almacenar información.
nombre = "Juan"
edad = 30
distancia = 3.7
kilometros = True
print(nombre)
print(edad)
print(distancia)
print(kilometros)
Juan
30
3.7
True
Las variables se declaran con un nombre y se asignan un valor.
Tipos de datos#
nombre
es una variable de tipostr
(string) que almacena una cadena de texto.edad
es una variable de tipoint
(entero) que almacena un número entero.distancia
es una variable de tipofloat
(flotante) que almacena un número con decimales.kilometros
es una variable de tipobool
(booleano) que almacena un valor booleano.
Manejo de archivos#
El manejo de archivos básico en Python se realiza a través de estas dos funciones:
open()
permite abrir un archivo para lectura o escritura.read()
permite leer el contenido de un archivo.
La función open()
recibe dos parámetros:
file
es el nombre del archivo que se quiere abrir.mode
es el modo de apertura del archivo.
Si queremos abrir un archivo para lectura, el modo de apertura es r
.
archivo = open("../file_samples/ejemplo-1.txt", "r")
contenido = archivo.read()
print(contenido)
archivo.close()
¡Hola!
Este es un archivo de ejemplo. Solamente contiene unas cuantas líneas de texto, pero es un ejemplo de como se puede leer un archivo de texto :)
Si queremos abrir un archivo para escritura, el modo de apertura es w
.
archivo = open("../file_samples/ejemplo-2.txt", "w")
archivo.write("Hola mundo")
archivo.close()
Existen otros modos de apertura, como a
para agregar contenido al archivo y x
para crear un archivo nuevo si no existe. En este momento, es suficiente con conocer el modo general de lectura y escritura de archivos.
Importar librerías o módulos#
Los módulos son una forma de organizar un conjunto de funciones y clases que pueden ser utilizadas en un programa.
import math
print(math.pi)
3.141592653589793
math
es el nombre del módulo que contiene las funciones matemáticas.pi
es el nombre de la función que contiene el valor demath.pi
.
¿Qué aprendiste de datos abiertos esta semana?#
Reconociste que los datos abiertos son una forma de acceder a una fuente de datos proveniente de instituciones gubernamentales, relacionadas primordialmente con el diagnóstico y aplicación de políticas públicas.
Formatos de archivo#
El formato de archivo primordial en los datos abiertos es el CSV (comma-separated values). Sin embargo, es posible que la información se suba en otros formatos como XLSX, JSON, XML, etc.
csv
es un formato de archivo para archivos de texto que contienen datos separados por comas.
Metadatos#
El metadato es una forma de almacenar información que describe una fuente de datos. Por ejemplo:
descripción
es una descripción de la fuente de datos.creadores
son los autores de la fuente de datos.rango de tiempo
es un rango de tiempo que describe el periodo de tiempo que abarca la fuente de datos.tipo de archivo
es el tipo de archivo que contiene la fuente de datos.