Analiza podatkov s programom R

« nazaj

Analiza podatkov s programom R - vaje 10.12.2020

Primerjava podatkov z zemljevidom

library(readr)
library(tidyr)
druzine <- read_csv("druzine.csv", col_names=c("obcina", 1:4), skip=1,
                          locale=locale(encoding="Windows-1250")) %>%
        pivot_longer(-obcina, names_to="velikost", values_to="stevilo") %>%
        mutate(velikost=parse_number(velikost))

lvls <- levels(obcine$OB_UIME) %>% sort()
druz <- unique(druzine$obcina) %>% sort()
razlicni <- lvls != druz

primerjava <- data.frame(obcina.zemljevid=lvls,
                         obcina.druzine=druz,
                         stringsAsFactors=FALSE)[razlicni, ]

library(stringr)
levels(obcine$OB_UIME) <- levels(obcine$OB_UIME) %>%
  str_replace("Slov[.]", "Slovenskih")
druzine <- druzine %>% mutate(obcina=obcina %>%
                                str_replace("/.*", "") %>%
                                str_replace(" - ", "-") %>%
                                str_replace("Slov[.]", "Slovenskih") %>%
                                parse_factor(levels(obcine$OB_UIME)))

Povprečna velikost družine

povprecna.druzina <- druzine %>% group_by(obcina) %>%
  summarise(povprecje=sum(velikost * stevilo) / sum(stevilo))

Izris zemljevida

tm_shape(merge(obcine, povprecna.druzina, by.x="OB_UIME", by.y="obcina")) +
  tm_polygons("povprecje")