Kirkkohäiden osuuden ja kuolleisuuden kesken vahva korrelaatio!

Mikäli joku miettii, mitä tekemistä otsikolla on talouden kanssa, voimme vastata suoraan: ei yhtään mitään. Eräs lukijoistamme oli yhteydessä meihin ”Romahtaako pörssi?” otsikoidun kirjoituksen jälkeen. Häntä mietitytti muun muassa jutun ensimmäinen kuvio Yhdysvaltain keskuspankin Federal Reserven (FED) taseesta ja S&P 500-osakeindeksistä.

Lukijan mielestä käyrien välillä vallitsi vahva korrelaatio kvantitatiivisen elvytyksen alettua. Tästä syystä hän olikin valmis hyväksymään väitteen, että FEDin elvytys on paisuttanut osakekursseja. Näyttäisi siltä, että on olemassa väärinkäsityksiä korrelaation ja aikasarjojen suhteen. Näitä väärinkäsityksiä on hyvä tiedostaa, kun joku esittää kuviota ja väittää käyrien välillä vallitsevan yhteys.

Aloitamme Udny Yulen klassisella esimerkillä hänen avauspuheenvuorostaan Royal Statistical Societyssa vuodelta 1925. Ei ole mitenkään epätavallista, että ajasta riippuvilla aineistoilla on korkea korrelaatio keskenään, vaikka niiden välillä ei olisi minkäänlaista yhteyttä. Osoittaakseen tämän hän piirsi kuolleisuuden 1000 henkeä kohden sekä Englannin kirkon osuuden kaikista avioliitoista.

 korrelaatio kuolleisuuden ja kirkkohäiden kesken

Yllä oleva kuvio vastaa Yulen kuviota vuodelta 1925. Aikasarjojen korrelaatio on erittäin korkea, 0,9515, mutta tämä ei tarkoita, että kuolleisuus kasvaa kun yhä suurempi osuus vihkimisistä tapahtuu Englannin kirkossa! Hän osoitti, että korrelaatio on merkityksetön, kun aikasarjojen keskiarvo ja/tai varianssi muuttuvat ajan myötä.

Korrelaatio FEDin taseen ja S&P 500-indeksin välillä kertoo tasan yhtä paljon kuin Yulen esimerkki yllä. Jos todellakin on kiinnostunut laskemaan sarjojen korrelaation, pitää niistä ensin poistaa trendi. Trendin poiston jälkeen laskettu korrelaatio varmaan yllättää monet, jotka ovat nähneet kuvion FEDin taseesta ja S&P 500-indeksistä. Korrelaatio aikasarjojen välillä on olematon.

”Yllättävä” tulos johtuu varmaan väärinkäsityksestä siitä mitä korrelaatio oikeastaan mittaa. Korrelaatio kertoo ainoastaan, että jos yksi osake nousee tänään, nouseeko myös toinen osake. Ajatelkaamme, että meillä on kaksi osaketta, joiden korrelaatio on 0,9 ja molempien osakkeiden volatiliteetti on 20 prosenttia. Jos toinen osake nousee 10 prosenttia, tulee toisen osakkeen kurssimuutos olemaan 95 prosentin varmuustasolla -7 prosentin ja +31 prosentin välillä. Yllättävääkö?

Kyseinen lukija ei oikeastaan ollut kiinnostunut korrelaatiosta vaan yhteisintegraatiosta, toisin sanoen yhteydestä FEDin taseen ja S&P 500-indeksin kehityksessä. Yhteisintegraatiota voisi kuvata esimerkillä juopuneesta miehestä, joka kävelee pubista kotiinsa koiransa kanssa. Kävellessään hän horjuu sattumanvaraisesti. Koirakin kulkee omaa satunnaista kulkuaan miehen vierellä. Heidän kävelynsä ei ole korreloitua tai korreloimatonta, mutta etäisyys heidän välillä ei voi koskaan tulla pidemmäksi kuin hihna.

Testasimme, onko FEDin taseen ja S&P 500-indeksin välillä jokin lineaarinen yhteys kvantitatiivisen elvytyksen alettua, mutta tulokset eivät olleet tilastollisesti merkittäviä. Testien tarkoituksena ei ollut löytää absoluuttista totuutta vaan ainoastaan osoittaa, että FEDin taseen ja S&P 500-indeksin välillä ei ole mitään yksinkertaista yhteyttä, vaikka graafisesti siltä näyttäisikin.

Kuvio voi näyttää erittäin vakuuttavalta, mutta yritä aina ymmärtää, mistä korrelaatio johtuu. Ole erityisen varovainen, jos muuttujien välillä ei näyttäisi olevan mitään yhteyttä. Toisaalta tämä ei tarkoita, etteikö niiden välillä voisi olla yhteyttä. Tästä huolimatta korkea korrelaatio kahden muuttujan välillä ei kuitenkaan ole riittävä todiste syy-yhteydestä.

Alla olevassa kuviossa olemme piirtäneet kolme indeksiä, jotka on muodostettu siten, että kolme eri henkilöä heittää kolikkoa. Jokaisen henkilön heitoista muodostetaan indeksi. Jos hän heittää kruunan, indeksiin lisätään yksi ja indeksistä vähennetään yksi, jos hän heittää klaavan. Esimerkiksi ensimmäinen henkilö (punainen käyrä) heittää klaava, kruuna, kruuna, kruuna, klaava, jolloin viisi ensimmäistä indeksilukua ovat -1, 0, 1, 2 sekä 1.

korrelaatio kolikoiden heitossa

Kolikkojen tai henkilöiden välillä ei ole ehdottomasti minkäänlaista yhteyttä, mutta korrelaatio kolikko 1:n ja kolikko 2:n välillä olisi vakuuttava (0,905), ellei tietäisi mistä indeksit koostuvat. Korrelaatio kolikko 2:n ja kolikko 1:n sekä kolikko 3:n välillä ovat -0,205 sekä -0,319, mutta korrelaatio kolikkojen välillä on merkityksetön. Millään kolikoista ei ole korkeampaa korrelaatiota kuin toisilla. Kysessä on ainoastaan sarja kumulatiivisia satunnaislukuja.

Tilastollisessa mielessä punainen ja sininen käyrä ovat lineaarisesti riippuvia toisistaan 95 prosentin varmuusvälillä, mutta tämä johtuu ainoastaan sattumasta. Aina silloin tällöin muuttujien välillä voi saada tilastollisesti merkittäviä yhteyksiä, vaikka niiden välillä ei olisikaan minkäänlaisia syy-yhteyksiä. Tämä ei taaskaan välttämättä tarkoita, ettei niiden välillä ole mitään yhteyttä. Tietysti kyseessä voi olla sattuma kuten yllä tai sitten yhteys saattaa johtua kolmannesta muuttujasta, joka puuttuu yhtälöstä. Esimerkiksi jäätelönmyynnillä ja hukkumisilla voisi kuvitella olevan yhteys, mutta yhteys on harha, koska niin jäätelönmyynti kuin hukkumisten lukumäärä johtuvat luultavasti lämpötilasta.

Sijoittajatilaisuuksissa näkee aina silloin tällöin saman kaltaisia kuvioita kuin ”Romahtaako pörssi?” -kolumnin ensimmäinen kuvio FEDin taseesta ja S&P 500-indeksistä. Kuvio on vakuuttava, mutta informaatioarvoltaan arvoton. Trendin omaavien aikasarjojen korrelaatio ei kerro mitään järkevää ja käyrien piirtäminen eri skaaloille ei kerro sitä, onko niiden välillä yhteyttä. Muistakaa käyttää maalaisjärkeä kuunnellessanne esityksiä!

Tom Lindström

Etkö ole vielä Nordnetin asiakas? Tule asiakkaaksi tästä.

Alla olevassa kommenttikentässä voit kommentoida tämän blogikirjoituksen sisältöä ja lukea muiden jättämiä kommentteja. Kommenttien sisältö ei edusta Nordnetin mielipidettä. Nordnet ei tarkista kommentteja ennen niiden julkaisemista, mutta poistamme epäasialliset kommentit, jos sellaisia esiintyy.
Jos haluat tietää lisää siitä, miten Nordnet käsittelee henkilötietojasi, klikkaa tästä.

guest
3 Kommentti
vanhin
uusin tykätyin
Inline-palaute
Näytä kaikki kommentit
Nimetön
Nimetön
29.04.2015 20:27

Juttua lukiessani niin toivoin, että kerrankin olisi saatu aiheesta aikaiseksi teksti ilman jäätelönsyöntiä ja hukkumiskuolemia, mutta ei…

Nimetön
Nimetön
05.05.2015 11:26

Nämä asiat on tietenkin tilastotieteessä tuttuja juttuja, mutta osakesäästäjille ym. sijoittajille niitä on mahdoton toistaa liian monta kertaa. Kiitos, kun näette vaivaa. Ettei vaan monella Fed:n taseen ja S&P 500:n tason välistä syy-yhteyttä tälläkin tavalla todistelevalla ole ensin lopputulos varma, ja sitten kaivetaan ja kaivetaan lapiolla vakuuttavia todisteita heittäen vastaväitteet takaisin monttuun. Kyllä minunkin mututuntumani sanoo, että yhteys voi olla, mutta en silti lähde tällä tavalla sitä todistelemaan. Joku toinen tapa on parempi. Itse asiassa todella moni asia näyttää minusta viittaavan tähän suuntaan, mutta älyllinen rehellisyys on minulle tärkeämpää kuin oikeassa oleminen. Sitä ei voi tosin syödä, mutta olen muutenkin… Lue lisää >>

Nimetön
Nimetön
05.05.2015 14:02

Olipa ilo lukea! Selkeää ja havainnollista tekstiä.