Korelasyon: Revizyonlar arasındaki fark

[kontrol edilmiş revizyon][kontrol edilmiş revizyon]
İçerik silindi İçerik eklendi
düzeltme AWB ile
Aybeg (mesaj | katkılar)
Değişiklik özeti yok
106. satır:
yahut
: C neden A sonuçtur VE C neden B sonuçtur.
İşte ''sahte korelasyon'' üçüncü halde ortaya çıkar. A ve B arasında görülen yakın ilişki birbirinin sebep-sonuç olmasından doğmaz. Yakın korelasyon her hâlde sebep-sonuç ilişkisi ifade etmez: "korelasyon nedensellik degildirdeğildir".
 
''Sahte korelasyon'' hakkında birçok örnek verilmiştir ve bunlar bazen alaycı, bazen şaşırtıcı ve bazen gülünçtür. Bunlardan bazılarını verip niçin ''sahte korelasyon'' bulunduğunu açıklayalım:
* İskandinavya'da 19. yüzyilyüzyıl sonu ve 20. yüzyıl için yıllık leylek sayısı ve yıllık çocuk doğumları inceleyince çok yakın bir pozitif korelasyon bulunmaktadır. Bu, doğan çocukların leylekler tarafından getirildikleri önermesini doğrulamaz. Hem çocuk doğum sayısı hem de leylek sayısı ekonomik gelişme ve şehirleşme dolayısıyla azalmış ve bu iki azalma birinin diğerine sebep-sonuç olmasından ortaya çıkmamıştır.
* Bir sahil şehrinde aylık dondurma satışları ile aylık denizde boğulma sayıları yıl içinde birlikte artıp eksilime gösterip yakın pozitif korelasyon gösterirler. Bu demek değildir ki fazla dondurma fazla boğulmalara sebep-sonuç olmakta veya boğulmaların azalması dondurma satışlarına aksi tesirde bulunmaktadır. Her ikisi de mevsim değiştiği için aynı yönde değişik etki görmektedir.
* Ayakkabı ile uyumak, baş ağrısı ile uyanmakla yakın pozitif korelasyon gösterir. Bu demek değildir ki ayakkabiayakkabı ile yatmak baş ağrısı doğurur. Çok daha uygun bir açıklama, her ikisinin de fazla alkollü içki kullanımı sonucu ortaya çıkmasıdır.
* Bir yangına müdahale eden itfaiye mensuplarının sayısı ile yangından ortaya çıkan maddi hasar birbirleri ile yakın korelasyon gösterirler. Bu demek değildir ki itfaiye mensubu sayısı artışı (yağmacı artışı gibi) daha çok maddi hasar çıkmasına neden olur. Asıl açıklama yangının büyüklüğü ve şiddetine dayanır; büyük yangınlar daha çok itfaiyeci gerektirir ve daha çok hasar doğurur.
* 1950lerden beri hava kirliği göstergeleri ile polise bildirilen hırsızlık olayları sayısı pozitif korelasyon göstermektedir. Bu demek değildir ki hava kirliliği artışı hırsızlık olaylarının artışına; yahut hava kirliliğinin artışı hırsızlık sayısı artışına neden olmuştur. Her iki değişkende de hızlı şehirleşme dolayısı ile artış görülmektedir.
121. satır:
Pearson'un korelasyon katsayısı iki değişken arasındaki doğrusal ilişkinin gücünü göstermekle beraber, kestirim olarak bulunan katsayı değeri bu ilişkiyi tam olarak açıklamak için yeterli değildir. Bu sonuç eğer veriler [[normal dağılım]] göstermiyorlarsa daha da önem kazanmaktadır.
 
Dört değişik veri çiftini ve dört ''serpme diyagram''ını kapsayan ve istatistikçiler arasında çok iyi bilinen yandaki gösterimler İngiliz asıllı Amerikan istatistikçi [[Francis Anscombe]] tarafından hazırlanan bir yazıda gösterilmiştir.<ref>Anscombe, Francis J. (1973) Graphs in statistical analysis. ''American Statistician'', C.27 say. 17-21.</ref> Gösterilen 4 değişik ''y'' değişkeninin hepsi için de aynı olan [[ortalama]] (7,5), [[standart sapma]] (4,12), korelasyon katsayısı (0,81) ve regresyon doğrusu (<math>y = 3 + 0.5x</math>) bulunmaktadır. Fakat gösterimden açıkcaaçıkça görülmektedir ki dört Y değişkenin dağılımları çok farklıdır. Sol yukarıdaki göstergede iki değişken birbirine korelasyon ile ilişkili olup her iki değişkenin de normal dağılıma uyduğu varsayımlarının gerçeğe uygun olduğu kabul edilebilir. Üst sağdaki gösterim de değişkenlerin normal dağılım gösterdikleri kabul edilemez; iki değişken arasında iliskiilişki olmakla beraber bunun doğrusal olduğu da kabul edilemez ve bu nedenle yüksek korelasyon katsayısı bu ilişkiyi açıklayamaz. Alt soldaki göstergeden görülmektedir ki iki değişken arasında tam bir doğrusal ilişki vardır, ancak tek bir [[aykırı değer]] bulunmakta ve bu da korelasyon katsayı değerini 1'den 0.81'e düşürmektedir. Alt sağdaki son gösterimden iki değişken arasındaki ilişkinin doğrusal olmadığı ve bulunan tek bir aykırı noktanın hesaplanan yüksek korelasyon katsayısına neden olduğu görülmektedir.
 
Bu örnek açıkcaaçıkça göstermektedir ki bir özetleme istatistiğine (burada korelasyon katsayı değerine) dayanarak, verilerin daha ayrıntılı incelenmesi yapılmadan, ortaya sonuç çıkartma iyi inceleme için gayet yetersizdir.
 
== Korelasyon katsayısının kesin olarak tek-geçişli olarak bilgisayarla hesaplanması ==
"https://tr.wikipedia.org/wiki/Korelasyon" sayfasından alınmıştır