{ "cells": [ { "cell_type": "markdown", "id": "6dd4a4e6", "metadata": {}, "source": [ "# Renombrar columnas\n", "\n", "Un problema común de las fuentes de datos abiertas está relacinado con la forma en la cuales están nombradas las columnas. Es usual recurrir a abreviaturas, pero también es común que las categorías estén marcadas en forma de códigos. En nuestro caso, la mayoría de columnas son lo suficientemente descriptivas para que no sea necesario renombrarlas. Sin embargo, podríamos darles un nombre aún más descriptivo, en particular a las columnas `[\"entidad_nac\",\"entidad_res\",\"municipio_res]`.\n", "\n", "La sintaxis para renombrar una columna es:\n", "\n", "```python\n", "df.rename(columns={'columna_original':'nuevo_nombre'}, inplace=True)\n", "```\n", "\n", "El parámetro `inplace` es opcional, pero si no se especifica debe asignarse el resultado a una nueva variable, de otra manera parecerá que el renombre no tuvo éxito.\n", "\n", "Como muchas operaciones en `pandas` podemos valernos de un diccionario para modificar aplicar una serie de cambios a las columnas. Sirvámonos de nuestro ejemplo de datos:" ] }, { "cell_type": "code", "execution_count": 1, "id": "44a85f2a", "metadata": { "tags": [ "remove-cell" ] }, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/Users/jairoantonio/opt/anaconda3/lib/python3.9/site-packages/IPython/core/interactiveshell.py:3444: DtypeWarning: Columns (13) have mixed types.Specify dtype option on import or set low_memory=False.\n", " exec(code_obj, self.user_global_ns, self.user_ns)\n" ] } ], "source": [ "import pandas as pd\n", "try:\n", " covid_nacional = pd.read_csv('../data/casos_nacionales_covid-19_2022_semestre1.csv')\n", "except FileNotFoundError:\n", " covid_nacional = pd.read_csv('../datos/casos_nacionales_covid-19_2022_semestre1.csv')" ] }, { "cell_type": "code", "execution_count": 2, "id": "31f905ff", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | Unnamed: 0 | \n", "fecha_actualizacion | \n", "id_registro | \n", "origen | \n", "sector | \n", "entidad_um | \n", "sexo | \n", "entidad_nacimiento | \n", "entidad_residencia | \n", "municipio_residencia | \n", "... | \n", "otro_caso | \n", "toma_muestra_lab | \n", "resultado_lab | \n", "toma_muestra_antigeno | \n", "resultado_antigeno | \n", "clasificacion_final | \n", "migrante | \n", "pais_nacionalidad | \n", "pais_origen | \n", "uci | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
7 | \n", "8 | \n", "2022-06-26 | \n", "0ba73d | \n", "FUERA DE USMER | \n", "ISSSTE | \n", "CIUDAD DE MÉXICO | \n", "MUJER | \n", "QUERÉTARO | \n", "MÉXICO | \n", "NAUCALPAN DE JUÁREZ | \n", "... | \n", "NO | \n", "NO | \n", "NO APLICA (CASO SIN MUESTRA) | \n", "NO | \n", "NO APLICA (CASO SIN MUESTRA) | \n", "CASO SOSPECHOSO | \n", "NO ESPECIFICADO | \n", "MÉXICO | \n", "NO APLICA | \n", "NO APLICA | \n", "
8 | \n", "9 | \n", "2022-06-26 | \n", "0681f2 | \n", "FUERA DE USMER | \n", "SSA | \n", "CIUDAD DE MÉXICO | \n", "HOMBRE | \n", "CIUDAD DE MÉXICO | \n", "NaN | \n", "NaN | \n", "... | \n", "NO | \n", "NO | \n", "NO APLICA (CASO SIN MUESTRA) | \n", "SI | \n", "NEGATIVO A SARS-COV-2 | \n", "NEGATIVO A SARS-COV-2 | \n", "NO ESPECIFICADO | \n", "MÉXICO | \n", "NO APLICA | \n", "NO APLICA | \n", "
9 | \n", "10 | \n", "2022-06-26 | \n", "0a98b4 | \n", "FUERA DE USMER | \n", "SSA | \n", "CIUDAD DE MÉXICO | \n", "MUJER | \n", "MICHOACÁN DE OCAMPO | \n", "NaN | \n", "NaN | \n", "... | \n", "NO | \n", "NO | \n", "NO APLICA (CASO SIN MUESTRA) | \n", "SI | \n", "POSITIVO A SARS-COV-2 | \n", "CASO DE SARS-COV-2 CONFIRMADO | \n", "NO ESPECIFICADO | \n", "MÉXICO | \n", "NO APLICA | \n", "NO APLICA | \n", "
3 rows × 41 columns
\n", "