Sesión 4 Lectura de datos

Para leer datos lo más sencillo es utilizar la interfaz de RStudio. En el caso de un archivo de texto plano (.csv, .txt,…) utilizaremos Environment > Import Dataset > From text (readr). Y seleccionamos los datos que queremos importar en la ventana.

Importante: Siempre incluye el código de lectura de datos en tu script!

library(readr)
df_muni <- read_csv("datos/df_municipios.csv")
#> Rows: 2457 Columns: 8
#> ── Column specification ────────────────────────────────────────────────────────
#> Delimiter: ","
#> chr (3): state_abbr, municipio_name, metro_area
#> dbl (5): pop, pop_male, pop_female, afromexican, indigenous
#> 
#> ℹ Use `spec()` to retrieve the full column specification for this data.
#> ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
df_muni
#> # A tibble: 2,457 × 8
#>    state_abbr municipio_name      pop pop_male pop_female afromexican indigenous
#>    <chr>      <chr>             <dbl>    <dbl>      <dbl>       <dbl>      <dbl>
#>  1 AGS        Aguascalientes   877190   425731     451459         532     104125
#>  2 AGS        Asientos          46464    22745      23719           3       1691
#>  3 AGS        Calvillo          56048    27298      28750          10       7358
#>  4 AGS        Cosío             15577     7552       8025           0       2213
#>  5 AGS        Jesús María      120405    60135      60270          32       8679
#>  6 AGS        Pabellón de Art…  46473    22490      23983           3       6232
#>  7 AGS        Rincón de Romos   53866    26693      27173          13       6714
#>  8 AGS        San José de Gra…   8896     4276       4620          13       1733
#>  9 AGS        Tepezalá          20926    10197      10729           4       3468
#> 10 AGS        El Llano          20245     9982      10263           0        936
#> # ℹ 2,447 more rows
#> # ℹ 1 more variable: metro_area <chr>

Abre el script ejercicios.R y añade código para leer los datos de educación a nivel municipal, ubicados en la carpeta df_edu.csv.

Usando la interfaz de RStudio también podemos importar datos de Excel, SPSS, SAS, o Stata. En Excel podemos especificar la hoja y rango de datos a importar.

library(readxl)
women_school <- read_excel("datos/Years_in_school_women_25_plus.xlsx", 
                           sheet = "Data")
women_school
#> # A tibble: 175 × 41
#>    `Row Labels`   `1970.0` `1971.0` `1972.0` `1973.0` `1974.0` `1975.0` `1976.0`
#>    <chr>             <dbl>    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
#>  1 Afghanistan         0        0.1      0.1      0.1      0.1      0.1      0.1
#>  2 Albania             3.9      4        4.1      4.2      4.3      4.5      4.6
#>  3 Algeria             0.6      0.6      0.6      0.7      0.7      0.8      0.8
#>  4 Angola              0.5      0.5      0.5      0.5      0.6      0.6      0.6
#>  5 Antigua and B…      7        7.1      7.2      7.4      7.5      7.7      7.8
#>  6 Argentina           5.5      5.6      5.7      5.9      6        6.1      6.2
#>  7 Armenia             5.9      6        6.2      6.3      6.5      6.6      6.8
#>  8 Australia           8.4      8.5      8.6      8.7      8.8      8.9      9  
#>  9 Austria             7.2      7.3      7.4      7.5      7.6      7.7      7.9
#> 10 Azerbaijan          4.5      4.6      4.8      5        5.1      5.3      5.5
#> # ℹ 165 more rows
#> # ℹ 33 more variables: `1977.0` <dbl>, `1978.0` <dbl>, `1979.0` <dbl>,
#> #   `1980.0` <dbl>, `1981.0` <dbl>, `1982.0` <dbl>, `1983.0` <dbl>,
#> #   `1984.0` <dbl>, `1985.0` <dbl>, `1986.0` <dbl>, `1987.0` <dbl>,
#> #   `1988.0` <dbl>, `1989.0` <dbl>, `1990.0` <dbl>, `1991.0` <dbl>,
#> #   `1992.0` <dbl>, `1993.0` <dbl>, `1994.0` <dbl>, `1995.0` <dbl>,
#> #   `1996.0` <dbl>, `1997.0` <dbl>, `1998.0` <dbl>, `1999.0` <dbl>, …