odcepitev <- parse_character(tabela$odcepitev, na=c("", "-", "—"))
odcepitev <- gsub(" \\([^'].*\\)", "", odcepitev)
odcepitev <- gsub("[*]", "", odcepitev)
odcepitev <- gsub("LJ", "Ljubljana", odcepitev) %>% strsplit(split=", ") %>%
lapply(. %>% .[! is.na(.)])
obcina <- lapply(1:nrow(tabela), . %>% {
rep(tabela$obcina[.] %>% as.character(), length(odcepitev[[.]]))
}) %>% unlist() %>% parse_factor(levels(tabela$obcina))
odcepitev <- unlist(odcepitev)
leto <- odcepitev %>% strapplyc("\\('([0-9]{2})\\)") %>%
sapply(. %>% ifelse(length(.) == 0, NA, .)) %>% parse_integer() %>%
{ ifelse(. < 50, . + 2000, . + 1900) }
odcepitev <- odcepitev %>% strapplyc("^[^\\(]+") %>% unlist() %>% trimws()
odcepitve <- data.frame(obcina, odcepitev, leto) %>%
inner_join(tabela %>% select(obcina, ustanovitev)) %>%
transmute(obcina, odcepitev, leto=ifelse(is.na(leto), ustanovitev, leto))