Korelasyon ile nedensellik ilişkisi veri analizinde ve karar verme süreçlerinde çok sık karıştırılan bir konudur. Basit bir karışıklık gibi görünen bu durum, dikkat edilmediği zamanlarda yanlış kararlara yol açabilmekte, şirketleri zarara uğratabilmektedir. Peki korelasyon nedir, nedensellik ile korelasyon farkı nedir, nedensellik nasıl tespit edilir? Gelin beraber inceleyelim.
Korelasyon değişkenler arasındaki ilişkinin gücünü ve yönünü yorumlamamıza imkan tanıyan istatistiksel bir terimdir. Korelasyon değişkenler arasındaki ilişkiye bağlı olarak -1 ile 1 aralığında değer alabilmektedir. Değişkenler beraber hareket ediyorsa korelasyon pozitif bir değere sahip olur. Değişkenlerden birisi artarken diğeri azalıyorsa korelasyon değeri negatif olacaktır. Korelasyon ile ilgili detaylı bilgi için Korelasyon Nedir? isimli yazımı inceleyebilirsiniz.
Nedensellik, bir olayın oluşmasına başka bir olayın etki etmesidir. Bu sebeple iki olaydan birisinin gerçekleşme durumuna bakarak diğer olay hakkında çıkarımda bulunabiliriz. Korelasyonda da iki değişkenin beraber hareket edip etmediğini inceleyerek çıkarımlar yapıyorduk. Ne kadar benziyorlar değil mi? Peki korelasyon ile nedensellik aynı şey midir? Korelasyonu fazla olan değişkenler birbirini etkiliyor diyebilir miyiz? Hadi beraber inceleyelim.
Korelasyon iki durumun ya da değişkenin beraber hareket edip etmediğini göstermektedir. Yüksek korelasyon, değişkenlerin birbirini etkilediği anlamına gelmemektedir. Korelasyonu yüksek iki değişken birbirinden tamamen bağımsız olabilir. Bu değişkenler başka bir değişken sebebiyle beraber hareket ediyor olabilir. Örneğin dondurma satışı ile klima kullanım süresi verileri arasındaki korelasyon değeri yüksektir. Bu iki veri arasında doğrudan bir ilişki bulunmaz. Bu iki değişkeni de etkileyen üçüncü veri sıcaklıktır. İki değişken de sıcaklık değişkeni sebebiyle aynı şekilde hareket ederler. Bu sebeple korelasyon analizi ile nedensellik yorumu yapılmamalıdır..
Nedensellik tespitinin yapılmasında kullanılan en etkili yöntemlerden birisi A/B testi yöntemidir. Bu testi yapabilmek için iki grup oluşturulur. Bu gruplardan birisi deney grubu diğeri ise kontrol (Plasebo) grubu olarak isimlendirilir. Deney grubunda etkisi incelenen değişkenin değerinde değişiklik yapılırken kontrol grubunda değişiklik yapılmaz. Deney grubu ile kontrol grubundaki sonuçların farkı istatistiksel olarak anlamlı ise iki değişkenin nedensellik ilişkisi var demektir. Aradaki fark yeteri kadar anlamlı değilse yapılan değişiklik sonuca etki etmemiş, iki değişken birbirini etkilemiyor sonucuna ulaşılır. A/B testi ile ilgili detaylı bilgi için A/B Testi Nedir? isimli yazımı inceleyebilirsiniz.
İstatistik ile ilgili gelişmelerden ve örnek çalışmalardan haberdar olmak isterseniz beni aşağıdaki hesaplardan takip edebilirsiniz.
Linkedin: www.linkedin.com/in/mustafabayhan/
Medium: medium.com/@bayhanmustafa