Zabawa danymi: 2018

piątek, 22 czerwca 2018

Czy mamy jeszcze szanse?

Mundial zaczął się dla jak zwykle w tym milenium, od porażki w żenującym stylu. Rozsądek podpowiada, że przed nami kolejna porażka i koniec emocji. Serce przekonuje, że szanse jeszcze przecież są. Rozsądek na to: sprawdźmy jak duże.

Można to zrobić m.im. odwołując się do danych historycznych. Znajdziemy je np. tutaj https://github.com/openfootball/world-cup. Są w formacie txt. Niestety nie do końca spójnym z imprezy na imprezę, ale wystarczająco, żeby zautomatyzować ich obróbkę. Choć dostępne dane sięgają 1930 r. ograniczam się do 1998-2014, gdyż tylko w tych latach imprezy miały ten sam format - osiem czterodrużynowych grup, z których awansują dwie najlepsze.

Pobieranie danych i ich obróbkę załatwił poniższy kod w R:

library(tidyverse)
library(RCurl)
library(tidyr)
library(glue)


# do testowania impreza = "2002--south-korea-n-japan"
#do testowania lewe_ciecie = ".*[0-9]+\\s[A-z]+"

ZrobTabele <- function(impreza,lewe_ciecie){
page_url <- glue("https://raw.githubusercontent.com/openfootball/world-cup/master/{impreza}/cup.txt")
my_data <- read.delim(page_url)

my_data <- as.vector(my_data$X............................)
mecze <- my_data[grepl("@", my_data)]
nr.meczu <- as.numeric(gsub(".*\\(([0-9]+)\\).*","\\1",mecze)) #ma zastapic dzien bo ten jest w roznych formatach
mecze <- gsub("@.*","",mecze)
mecze <- gsub(lewe_ciecie,"",mecze)
mecze <- gsub("\\(.-.\\)","",mecze)
mecze <- gsub(" ","",mecze)
mecze <- gsub("Republicof","",mecze) #bo w 2002 irlandia jest zapisana raz tak raz tak
wynik <- gsub(".*([0-9]-[0-9]).*","\\1",mecze)
p.druzyna <- gsub("(.*)[0-9]-[0-9].*","\\1",mecze)
d.druzyna <- gsub(".*[0-9]-[0-9](.*)","\\1",mecze)
grupa <- sort(rep(LETTERS[1:8],6))
tabela <- data.frame(grupa, nr.meczu, p.druzyna,d.druzyna,wynik)
tabela$p.gole <- as.numeric(substr(tabela$wynik,1,1))
tabela$d.gole <- as.numeric(substr(tabela$wynik,3,3))
tabela$roz.gole <- (tabela$p.gole - tabela$d.gole)
tabela$p.wynik <- ifelse(tabela$p.gole>tabela$d.gole,3,ifelse(tabela$p.gole<tabela$d.gole,0,1)) 
tabela$d.wynik <- ifelse(tabela$p.gole<tabela$d.gole,3,ifelse(tabela$p.gole>tabela$d.gole,0,1)) 

pierwsze <- tibble(grupa=tabela$grupa, nr.meczu=tabela$nr.meczu, druzyna=tabela$p.druzyna, 
                   goleF=tabela$p.gole, goleA=tabela$d.gole, goleR=tabela$roz.gole, 
                   punkty=tabela$p.wynik, przeciwnik=tabela$d.druzyna)
drugie <- tibble(grupa=tabela$grupa, nr.meczu=tabela$nr.meczu, druzyna=tabela$d.druzyna, 
                 goleF=tabela$d.gole, goleA=tabela$p.gole, goleR=-tabela$roz.gole, 
                 punkty=tabela$d.wynik, przeciwnik=tabela$p.druzyna)
tabela <- rbind(pierwsze, drugie)
tabela <- tabela[order(tabela$druzyna,tabela$nr.meczu),] #ulozenie wg druzyny i daty
mecz <- rep(c("fst","snd", "trd"),32) #tworzy ciąg 1,2,3,1,2,3 itd.
tabela$k.mecz <- as.factor(mecz) #przypisanie trzem meczom kazdej druzyny kolejnosci 1,2,3

#tworze tabele 'long' czyli tylko kolumny powtarzajace + jedna do rozciągnięcia w 'wide'
tabela_long <- tibble(grupa=tabela$grupa, druzyna=tabela$druzyna, 
                      punkty=tabela$punkty, k.mecz=tabela$k.mecz)
#przerobienie long na wide
tabela_wide <- spread(tabela_long,k.mecz,punkty)
tabela_wide <- tabela_wide %>% mutate(pkt=fst+snd+trd)


#tworzy z pierwszej tabeli sumaryczna roznice goli dla kazzdej druzyny
tabela_gr <- tabela %>% group_by(druzyna) %>% summarise(goleF = sum(goleF), goleA = sum(goleA)) %>%
  mutate(roznica=goleF-goleA) %>% select(druzyna, roznica)
# i dodaje taka kolumnę do table_wide
tabela_wide <- merge(tabela_wide, tabela_gr ,by.x = "druzyna", by.y = "druzyna")
# sortowanie wg grupy i punktów
tabela_wide <- tabela_wide[order(tabela_wide$grupa,-tabela_wide$pkt,-tabela_wide$roznica),]

pozycja <- rep(seq(1:4),8) #tworzy ciąg 1-4 pozycji w grupie
awans <- rep(c("T","T","N","N"),8) #tworzy ciąg 1-4 pozycji w grupie
tabela_wide$pozycja <- as.numeric(pozycja)
tabela_wide$awans <- awans

return(tabela_wide)
} #koniec funkcji ZrobTabele

RPA <- ZrobTabele("2010--south-africa",".*:[0-9]{2}")
Brazylia <- ZrobTabele("2014--brazil",".*:[0-9]{2}")
Niemcy <- ZrobTabele("2006--germany",".*/[0-9]+")
KorJap <- ZrobTabele("2002--south-korea-n-japan",".*[0-9]+\\s[A-z]+")
Francja <- ZrobTabele("1998--france",".*[0-9]+\\s[A-z]+")

zbiorcza <- rbind(Brazylia,RPA,Niemcy,KorJap,Francja)

To daje nam zbiorczą tabelę z wynikami wszystkich meczów grupowych ostatnich lat w następującym formacie:

      druzyna grupa fst snd trd pkt roznica pozycja awans
6       Brazil     A   3   1   3   7       5       1     T
23      Mexico     A   3   1   3   7       3       2     T
12     Croatia     A   0   3   0   3       0       3     N
8     Cameroon     A   0   0   0   0      -8       4     N
24 Netherlands     B   3   3   3   9       7       1     T
9        Chile     B   3   3   0   6       2       2     T

Więc teraz wystarczy policzyć ile razy drużyna przegrywająca pierwszy mecz (fst=0) dawała radę awansować (awans=T). Dodatkowo sprawdźmy jak szanse te zmieniają się w zależności od wyniku drugiego meczu.

#jaki % pregranych w pierwszym meczu awansowal
zbiorcza %>% count(fst,awans) %>% filter(fst==0) %>% mutate(procenty = n/ sum(n)) 
#jaki procent przegranych w pierwszym wygranych w drugim awansowal
zbiorcza %>% count(fst,snd,awans) %>% filter(fst==0 & snd==3) %>% mutate(procenty = n/ sum(n))
#jaki procent przegranych w pierwszym remis w drugim awansowal
zbiorcza %>% count(fst,snd,awans) %>% filter(fst==0 & snd==1) %>% mutate(procenty = n/ sum(n))
#jaki procent przegranych w pierwszym przegranych w drugim awansowal
zbiorcza %>% count(fst,snd,awans) %>% filter(fst==0 & snd==0) %>% mutate(procenty = n/ sum(n))

No więc tak - szanse są :) ale prawdopodobieństwo nie napawa optymizmem. Podsumować je można poniższym schematem.

Jeśli powtórzy się scenariusz z poprzednich dwóch imprez, w których Polacy brali udział, to po drugim meczu wszystko będzie jasne :)

czwartek, 14 czerwca 2018

Alternatywne historie mistrzostw świata w piłce nożnej

Na stronie Economist.com można znaleźć wykres prezentujący wszystkie gole strzelone na wszystkich dotychczasowych mistrzostwach świata. Fajna wizualizacja pokazuje kto, komu, w której minucie, fazie i jaki był ostateczny wynik. Wygląda to mniej więcej tak:

Gole nie są rozłożone równomiernie - są takie minuty w których padło więcej niż 40 goli i takie, w których mniej niż 10. Zatem czy jest to rozkład losowy, czy też jednak piłką rządzi jakaś prawidłowość?

Żeby to sprawić wygenerowałem alternatywne, zupełnie losowe historie mistrzostw świata. Zadane kryteria - ta sama liczba goli, karnych i samobójczych, ale dla uproszczenia usunąłem minuty dodatkowe - wszystko co ponad 45 w pierwszej połowie i 90 w drugiej (również dogrywki). Oczywiście odpowiednio zmniejszyłem liczbę goli.

Generowanie losowych historii i umieszczenie ich na wykresie zrobiłem w R. Poniżej kod:

library(ggplot2)
library(gridExtra)

kolory <- c("lightblue", "red", "yellow", "green") #wektor kolorow, zeby wykresy mialy rozne kolory
kolory1 <- c("#FF0000", "pink", "#000000")
kolory2 <- c("#FF0000", "yellow", "#000000")
kolory3 <- c("#FF0000", "lightgreen", "#000000")
kolory4 <- c("#FF0000", "lightblue", "#000000")
kolory <- list(kolory1, kolory2, kolory3, kolory4)

for(wykres in 1:4){ #petla robi 4 wykresy
x <- sample(1:90, 2259, replace=TRUE)  # losowy szereg z zakesu 1-90 o dlugosci 2259

x1 <- as.data.frame(table(x)) #przerobienie wektora szeregu na tabele z liczebnosciami i df
x1$x <- strtoi(x1$x)     #zamiana char na integer, bo w table pierwsza zmienna to char. z tego beda pobrane dane do petli 

x2 <- as.data.frame(x)    ##przerobienie wektora szeregu na df
x2 <- as.data.frame(x2[order(x),])   #sortowanie - do tego beda dodane sekwencje z petli. znowu as.data.frame, bo traci sie 
colnames(x2) <- "minuty" #nadanie nazwy kolumny, bo jakas dziwna powstaje


calosciowy <- vector()   #inicjacja wektora do petli


#petla tworz9ca wektory z sekwencjami od 1 do dlugosci rownej liczebnosci kazdej z minut

#nastjpnie sumowanie tych wektorow do jednego, ktory bedzie dodany jako kolumna do x2
for (wiersz in 1:90){      
minuta <- x1[wiersz, "x"]
ilosc <- x1[wiersz, "Freq"]
kolejny <- seq(1,ilosc)
calosciowy <- c(calosciowy,kolejny)}

x2$liczbagoli <- calosciowy

karny <- rep("karny", 174)
samob <- rep("samob", 38)
normalny <- rep("normalny", 2047)
rodzajgola <- c(karny,samob,normalny)
numerki <- seq(1,2259)
numerki <- sample(numerki)  #losowe ulozenie
typgola <- as.data.frame(rodzajgola)
typgola$numerki <- numerki
typgola <- as.data.frame(typgola[order(numerki),])
x2$typgola <- typgola$rodzajgola

assign(paste("p",wykres,sep=""), ggplot(x2, aes(minuty, liczbagoli, color=typgola)) +
   geom_point(size = 1.5) +
   theme(panel.border = element_blank(),
          panel.grid.major = element_line(size = 0.3, linetype = 'solid',
                                          colour = "#444444"),
          panel.grid.minor = element_blank(),
          panel.background = element_rect(fill="white")) +
   scale_color_manual(values=kolory4,guide=FALSE))
}

grid.arrange(p1, p2, p3, p4)

A tak wyglądają wyniki, bardzo podobnie do tych rzeczywistych. również są minuty z 30-40 golami i więcej, jak i takie poniżej 20.

Wniosek - nie ma żadnych prawidłowości gole padają i będą padać od 1 do ostatniej minuty i nie mamy jak tego przewidzieć. Przynajmniej jeśli chodzi o całą historię i wszystkie reprezentacje. Na pojedynczych przypadkach może to wyglądać inaczej, o czym niedługo we wpisie na FB @ZabawaDanymi.

środa, 14 marca 2018

Jakie miasta budzą najwięcej zainteresowania w poszczególnych województwach?

Jakie miasta budzą najwięcej zainteresowania w poszczególnych województwach (mierzone zapytaniami w GoogleTrends)? Oczywiście stolice własnych województw - we wszystkich 16 przypadkach. Jakie zatem miasto interesuje nas najbardziej poza stolicą własnego województwa?

W1. Najcześciej wyszukiwane miasto w poszczególnych województwach (Google Trends)

Jak można było się spodziewać Warszawa "rządzi". Jedynie Kraków, Wrocław i Poznań budzą większe zainteresowanie u swoich najbliższych sąsiadów. Co z miastem wybieranym jako drugie?

W2. Drugie najczęściej wyszukiwane miasto w poszczególnych województwach (Google Trends)

Tam gdzie pierwszym wyborem była Warszawa, teraz pojawiają się sąsiedzi - np. Katowice w opolskim i małopolskim, Gdańsk w kujawsko-pomorskim i warmińsko-mazurskim, Olsztyn w pomorskim i podlaskim. Kraków zastępuje Warszawę w kilku przypadkach, a Warszawa pojawia się tam, gdzie nie była pierwszym wyborem. I kończąc - co z trzecim wyborem?

W3. Trzecie najczęściej wyszukiwane miasto w poszczególnych województwach (Google Trends)

Mechanizm jest nadal ten sam - tam gdzie nie pojawili się wcześniej, pojawiają się teraz sąsiedzi (np. Opole w śląskim, Rzeszów w lubelskim, czy Szczecin w wielkopolskim). Zaś jako trzecie wybijające się miasto ujawnia się Wrocław.
Na poniższej mapce widać ile razy dane miasto pojawia się wśród trzech pierwszych wyborów we wszystkich województwach.

W4. Ile razy miasto pojawia się w top 3 wyszukiwanych (Google Trends)

Oczywiście dominuje Warszawa - pojawia się we wszystkich województwach, a poza opolskim jest to pierwsza bądź druga pozycja. Wyróżniają się też Kraków i Wrocław. To co ciekawe na tej mapie, to miasta, którymi nie interesuje się nikt: Gorzów Wkp., Zielona Góra, Toruń, Łódź, Kielce. Być może trzy pierwsze cierpią na tym, że współdzielą status stolicy (Gorzów z Zieloną G., Toruń z Bydgoszczą). Dla dwóch pozostałych nie mam wyjaśnienia.

W5. Zbiorczo - najczęściej wyszukiwane miasta (Google Trends)

Uzupełniająco wrzucam dwa wykresy pokazujące najpopularniejsze zapytania w przekroju wszystkich województw

W6. Najliczniejsze zapytania o wybrane miasto w wybranym woj. (Google Trends)

W6. Najliczniejsze zapytania o wybrane miasto w wybranym woj. na 1mln mieszkańców (Google Trends)

Najliczniej reprezentowana jest oczywiście Warszawa, ale wygrywa Wrocław w opolskim - zarówno absolutnie jak i relatywnie do liczby mieszkańców.
Dane jak już pisałem pochodzą z google trends, a mapki były kreślone w pakiecie tmap w R.

środa, 7 marca 2018

Jednoczenie i dzielenie państw, a wyniki na igrzyskach

Zawierucha historii dzieli i łączy państwa, a te startują w różnych konfiguracjach na igrzyskach. Stanowić to może pewną zagwozdkę jeśli np. chcieć pokazać liczby zdobywanych medali w czasie. No bo czy państwo podzielone na dwa poradzi sobie lepiej czy gorzej? Powinno lepiej - może wystawić więcej reprezentantów. Z drugiej strony jeśli i tak nie dysponuje trzema silnymi kandydatami do medali, to nie powinno mieć to znaczenia. Jak jest w rzeczywistości?

Do testów zostali wybrani trzej kandydaci - Niemcy, Czechosłowacy i ludzie radzieccy :). Na igrzyskach zimowych nie widać w zasadzie żadnego efektu. Liczba niemieckich medali rośnie systematycznie i okres RFN+NRD nie jest tu wyjątkiem. Widać pewien spadek po zjednoczeniu ale następnie następuje solidny wzrost, co wpasowuje się w ogólny obraz dużej zmienności.

Lustrzana sytuacja dotyczy ZSRR. Po rozpadzie wynik nagle skoczył, ale potem spadł i znowu wygląda to na zwykłą zmienność.

Czesi i Słowacy stopniowo zyskują na znaczeniu od końca XX w., ale nie widać by był to efekt podziału, bo po nim nie nastąpił gwałtowny skok.

Zatem nie ma efektu? Ano jest, ale na igrzyskach letnich, gdzie generalnie więcej medali jest do rozdania. Może to efekt tego?

Niemcy przez swój aktywny udział w obu wojnach nieco psują szeregi czasowe (nie było igrzysk w czasie wojny, następnie nie zapraszano ich na kolejne, a jak już jechali to osłabieni i niby jako jedna reprezentacja, choć państwo było podzielone na strefy okupacyjne). Niemniej widać wyraźny wzrost potęgi niemieckiego sportu w czasach NRD i RFN - efekt kobiet z wąsami...? Po ponownym zjednoczeniu liczba zdobywanych medali dramatycznie spada. Co jednak może być nie tyle efektem zjednoczenia, co stopniowego upadku kokso-sportu w stylu NRD.

Czechy i Słowacy dla odmiany pokazują jak podział im dobrze zrobił. Widać wyraźny skok poziomu po 1990 roku i od tego czasu liczba medali utrzymuje się na tym wyższym poziomie.

Dlaczego taki efekt widać na igrzyskach letnich, a zimowych nie? Jedną hipotezę zaserwowałem wyżej. Drugie co różni letnie od zimowych, to większa 'demokratyzacja', ale nie wiem czy to może mieć wpływ. Być może zadecydował przypadek.

wtorek, 6 marca 2018

Jak utrata statusu stolicy województwa odbiła się na populacji miast?

Niedługo minie 20 lat od słynnych reform rządu J. Buzka. Każda z nich miała i ma do dzisiaj istotny wpływ na naszą rzeczywistość. Jedną z reform była ta administracyjna. W jej efekcie nagle 31 miast spadło z pierwszej ligi miast wojewódzkich do ligi drugiej - miast powiatowych. Z zażartej walki o swoje województwo wyszło tylko Opole. Z ręką w nocniku zostały tak duże miasta ja Radom, Bielsko-Biała, Częstochowa.

Jak odbiło się to na ich kondycji, potencjale rozwojowym? Co widać po tych ok. 20 latach? To co stosunkowo prosto można sprawdzić to zmiany w zakresie populacji.

W1. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1980 - 2020 (1980=100)

Na pierwszy rzut oka wydaje się, że jakiś niewielki negatywny wpływ jest - miasta "byłe" do ok. 1998 roku rosły szybciej niż obecne wojewódzkie. Następnie zaczęły tracić impet. Różnice są jednak niewielkie (mieszczą się w granicach dwóch błędów standardowych). Dodatkowo twierdzenie o wykryciu wpływu w ten sposób podważa charakter porównywanych grup. Są one mocno różne od siebie i do tego wewnętrznie zróżnicowane.

W2. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1960 - 2050

Szczególnie miasta "obecne" i szczególnie ze względu na Warszawę bardzo się różnią. Poza tym są dużo większe od "byłych" i rosły szybciej w ujęciu nominalnym przed reformą, więc nawet bez niej powinny powiększać przewagę. Natomiast w ujęciu relatywnym dużo szybciej rosły "byłe", co też utrudnia porównanie.

W3. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1960 - 2050 (1960=100)

Co z czym zatem można porównać? Wskazane jest wybranie miast w jakimś stopniu do siebie podobnych. Pierwszy pomysł, to dobranie miast o podobnym rozmiarze - populacji. Problemem jest to, że (jak widać na W2) miasta wojewódzkie są średnio wyraźnie większe, więc nie wszystkim można dobrać pary. Jednak możliwe jest dobranie 8 par - 8 największych "byłych" i najmniejszych "obecnych" miało podobną populację w 2000 r. (odpowiednio 162 tys. i 177 tys.).

Na tak dobranej próbie również widać niewielki wpływ reformy.

W4. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1980 - 2020 (1980=100), na próbie 2x8

W latach 1980-2000 miasta wojewódzkie rosły średnio o 0,3 punktu procentowego szybciej, niż byłe wojewódzkie. Po reformie to tempo wzrosło do 0,5 pkt. proc. W efekcie różnica 6% z 2000 wzrośnie do 17% w 2020. Mimo wszystko to niewielka różnica - mniejsza niż dwa błędy standardowe. Co gorsza porównanie tych grup również nie do końca jest wiarygodne.

W5. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1960 - 2050 (1960=100), na próbie 2x8

Jak widać na W5 podobna populacja w 2000 r. nie oznacza podobieństwa porównywanych grup. Obecne miasta wojewódzkie były mniejsze w 1960, ale rozwijały się szybciej, przegoniły "byłe" mniej więcej w 1980 i były na fali wznoszącej. Zatem ich lepsze wyniki po 2000 r. nie muszą być jedynie efektem reformy.

Drugie podejście do doboru grup oparłem zatem nie na populacji w danym momencie ale tempie wzrostu w latach 1960-2000. Do próby włączono miasta wojewódzkie, dla których udało się dobrać miasto "byłe" ze współczynnikiem korelacji > 0,985. Dobra wiadomość - udało się dla 13 miast, więc próba jest większa niż poprzednio (poza Katowicami, Opolem, Warszawą, Krakowem i Wrocławiem - brak dobrych dobrych odpowiedników). Dopasowanie widać poniżej.

W6. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1960 - 2050 (1960=100), na próbie 2x13

W tak dobranej próbie "byłe" rosły tylko nieznacznie szybciej do czasu reformy, ale na pewno jest to tempo "porównywalne". Wojewódzkie zaczynają nadganiać po reformie i przeganiają w kilak lat po niej.

Jak wygląda to na skróconym okresie 1980-2020 (20 lat przed i po reformie)?

W7. Zmiana populacji miast wojewódzkich (obecnych i byłych) 1980 - 2020 (1980=100), na próbie 2x13

Do momentu reformy tempo wzrostu miast jest bardzo podobne z lekką przewagą "byłych". Po reformie widać wyraźnie większy spadek populacji miast, które utraciły status stolicy województwa. Do 2020 strata, którą można przypisać reformie administracyjnej, to 5% populacji. To przykładowo 9100 mieszkańców w Bielsku-Białej, 12900 w Częstochowie, 6500 w Płocku, 11700 w Radomiu, 6900 w Wałbrzychu.
Nadal w mocy pozostaje zastrzeżenie o dużym zróżnicowaniu miast wojewódzkich, co czyni wspomniany wynik 'statystycznie nieistotnym'.

niedziela, 4 marca 2018

Wzrost i kurczenie się polskich miast

Polskie miasta - stolice województw prawie wszystkie istniały już w 1500 r., choć do 1800 tylko kilka z nich (Warszawa, Kraków, Wrocław, Gdańsk) miały rozmiar co najmniej przeciętniej mieścinki, jak na dzisiejsze standardy (kilkadziesiąt tys. mieszkańców).

Co działo się potem? szybki wzrost do 1939. Szczecin i Łódź znacznie przerastają Gdańsk i Kraków. Następnie dramatyczny spadek na skutek 2 wojny światowej - najbardziej kurczą się Warszawa, Szczecin, Wrocław, choć jak wiadomo z różnych powodów. Warszawa odzyskuje przedwojenny rozmiar dopiero w 1970 r. Ubytku mieszańców nie widać w Katowicach i Krakowie.

Po wojnie wszystkie miasta przeżywają długi okres wzrostu. Ale coś zaczęło się psuć już na przełomie 1980/90, najpierw w Katowicach i Łodzi. od 2000 r. na minusie jest już połowa miast, a obecnie kurczą się prawie wszystkie, choć w różnym tempie. Do 2050 najbardziej skurczą się Łódź, Katowice, Opole. Jedynym miastem rosnącym ma być Warszawa.

Animacja zrobiona jest w Excel - wykres bąbelkowy z podłożonym obrazem jako tłem obszaru kreślenia. Pionowa oś, to odrębny wykres kolumnowy z jedną kolumną bez wypełnienia i etykietą.

dane pobrane z BDL (od 1995) i wikipedii (starsze, ze stron ludność[nazwa miasta]). Prognoza do 2050 wg GUS, a 2051-2100, to trend liniowy dopasowany do lat 2000-2050.

poniedziałek, 26 lutego 2018

Pyeongchang - Europejczyki trzymają się mocno

Takie mam poczucie od lat, że nasza Europa coraz bardziej traci na znaczeniu względem innych regionów, szczególnie Azji i staje się nieuchronnie małymi, mało znaczącymi peryferiami i że dotyczy to wszystkiego: gospodarki, nauki, innowacji, populacji, sportu.

Przy okazji kończących się igrzysk w Pyeongchang chciałem zobaczyć jak tracimy na znaczeniu na tym polu, a tu zaskoczenie. Europa nadal trzyma się w sportach zimowych mocno, bardzo mocno! 70% medali robi wrażenie i choć bywało i 90%, to spadek ten nie wydaje się dramatyczny. Przy okazji widać kilka innych ciekawostek.

Igrzyska zimowe - udział medali zdobywanych przez reprezentantów poszczególnych kontynentów

Bycie organizatorem oczywiście ułatwia zdobywanie medali. Choć efekt ten miał największe znaczenie w zamierzchłej historii, gdy podróżowanie było większą barierą.

Zauważalny spadek w dominacji Europy w latach 1990 niekoniecznie oznacza, że inni podciągnęli się w tradycyjnych dyscyplinach, ale to że pojawiły się nowe, jak np. shorttrack, w którym Azjaci dominują.

Zastanawia tez zupełny brak medalistów z innych kontynentów. Może nie Afryki, ale Ameryka Pd.? Przecież mają wysokie i śnieżne góry.

Igrzyska zimowe vs letnie - udział medali zdobywanych przez reprezentantów Europy

Na letnich igrzyskach tracimy na znaczeniu nieco szybciej, ale wcale nie tak dużo szybciej, po prostu zawsze to znaczenie było mniejsze.

Udział Europy w medalach igrzysk zimowych, globalnym PKB i populacji (1960=100%)

I kolejne zaskoczenie. Udział w populacji faktycznie spada dramatycznie, ale już PKB wcale nie, w zasadzie udział w PKB i medalach igrzysk był taki sam w 1960 i obecnie.

Zabawa danymi