13 Aralık 2012 Perşembe

KORELASYON ANALİZİ


KORELASYON ANALİZİ

Korelasyon Analizinde, bir ana kütleden seçilmiş en az iki veya daha fazla örnek grup alınarak, bu gruplar arasındaki etkileşime bir katsayı yardımıyla bakılır. Bu katsayı korelasyon katsayısıdır ve r ile gösterilir.

Korelasyon analizinin yapılacağı gruplar (bunlara değişken de diyebiliriz) arasında etkileşime bakılırken, regresyon analizinde olduğu gibi bağımlı değişken veya bağımsız değişken olma şartı aranmaz. Korelasyonuna bakılacak olan değişken gruplar ikiden fazla olsalar dahi ikili olarak ele alınırlar ve bu ikili değişkenlerin etkileşimi, katsayı yardımıyla yön ve kuvvet olarak tayin edilirler.

Saçılım(scatterplot) grafikleri iki degisken arasındaki iliski hakkında genel bir bilgi edinmemizi saglar. Ancak, iliskinin miktarı konusunda yorum yapabilmek için korelasyon katsayısının hesaplanması gerekmektedir.
Korelasyon katsayısı (r), iki degisken arasındaki iliskinin ölçüsüdür ve -1 ve +1 arasında değisim gösterir.

 
       ( a )                                         ( b )                                         ( c )

        r= -1                                       r= 0                                         r= 1

                Mükemmel negatif                            İliski Yok                         Mükemmel pozitif
                              İliski                                                                                        İliski

Yukarıdaki saçılım grafikleri ;

( a ) değişkenlerden birisinin artısına bağlı olarak diğerinde azalma olan doğrusal ilişki

olduğu,

( b ) iki değişken arasında ilişki olmadığı

( c ) değişkenlerden birisindeki artışa bağlı olarak diğerinde de artış olan doğrusal ilişki

olduğu seklinde açıklanır.

Korelasyonun katsayısının gücü ile ilgili olarak aşağıdaki tanımlamalar yapılmıştır:

0.00 - 0.25 Çok zayıf ilişki

0.26 - 0.49 Zayıf ilişki

0.50 - 0.69 Orta ilişki

0.70 - 0.89 Yüksek ilişki

0.90 - 1.0 Çok yüksek ilişki

Korelasyon katsayısı, örneklem büyüklüğünden etkilenmektedir. Küçük hacimli örneklerde, elde edilen korelasyon katsayısı büyük bile olsa istatistiksel olarak önemli bir değer olmayabilir. Dolayısıyla, elde edilen değerin hipotez testinin yapılması gereklidir.

Aralarında İlişki Araştırılan Değişkenlerin Türlerine Göre Korelasyon Katsayıları

Sınıflanabilir nitel değişkenler arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayıları

• Phi Katsayısı (Degiskenlerin her ikisi de 2 kategorili ise)
• Cramer V Katsayısı
• Olaganlık Katsayısı
• Lambda Katsayısı

Sıralanabilir nitel değişkenler arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayıları

• Spearman Korelasyon Katsayısı
• Gamma Katsayısı
• Kendall’ın tau-b Katsayısı
• Kendall’ın tau-c Katsayısı
• Somer’in d Katsayısı
Kesikli/Sürekli Nicel değişkenler arasındaki ilişkinin belirlenmesinde kullanılan korelasyon
katsayıları
• Pearson Korelasyon Katsayısı (Değişkenlerin her ikisi de normal dağılım gösteriyorsa)
• Spearman Korelasyon Katsayısı (Değişkenlerden en az birisi normal dağılım
göstermiyorsa)
Sınıflanabilir Nitel bir değişken ve Kesikli/Sürekli bir Nicel değişken arasındaki ilişkinin
belirlenmesinde kullanılan korelasyon katsayıları
• Çift Serili Korelasyon Katsayısı
• Nokta Çift Serili Korelasyon Katsayısı
Sıralanabilir Nitel bir değişken ve Kesikli/Sürekli bir Nicel değişken arasındaki ilişkinin
belirlenmesinde kullanılan korelasyon katsayısı
• Çoklu Serili Korelasyon Katsayısı

Kısmi Korelasyon Katsayıları

Korelasyon katsayısı iki değişken arasındaki ilişkiyi gösterirken diğer değişkenlerin etkilerini dikkate almaz. Ancak, bazen geriye kalan değişkenlerin etkisi ortadan kaldırıldıktan sonra, iki değişken arasındaki ilişkinin miktarı incelenmek istenebilir. Diğer bir deyişle, ikincil ilişkilerin etkisi ortadan kaldırıldıktan sonra iki değişken arasındaki gerçek ilişki incelenmek istenebilir. Bu inceleme kısmi korelasyon katsayıları yardımı ile yapılır. Bu konuya ilişkin örnek olarak verilebilecek en önemli değişken bireylerin yasıdır.

Korelasyon katsayısı, değişkenlerin yönü, etkileşimlerin nasıl olduğu hakkında bilgi verir. Değişkenlerin birbiri arasındaki etkileşim var mı, varsa etkileşimin çok fazla mı yani kuvvetli mi olduğu ve gözlem gruplarından birinin gözlem değerleri artarken diğerinin azalıyor mu yoksa aynı yönde mi değerleri değişiyor olduğu gözlenebilir.

Korelasyon katsayısı -1 ile +1 arasında değişen değerler alır. Katsayı, etkileşimin olmadığı durumda 0, tam ve kuvvetli bie etkileşim varsa 1, ters yönlü ve tam bir etkileşim varsa -1 değerini alır.

Korelasyon katsayısının yorumunu, tam değerler dışında ara değerler için yapmak oldukça güçtür. Ara değerler için katsayı değerlendirirken, örnek gözlem sayısı (n) oldukça önemlidir. Çok fazla gözleme dayanan değerlendirmelerde 0.25'e kadar düşmüş bir korelasyon katsayısı bile anlamlı sayılabilmektedir. Fakat az sayıda, 10-15 gözleme dayanan değerlendirmelerde korelasyon katsayısının 0.71 üstünde olması beklenir. Anakütleye göre normal sayılacak kadar bir gözlem sayısı alınarak bakılmış gözlem grupları için genellikle, 0-0.49 arasında ise korelasyon zayıf, 0.5-0.74 arasında ise orta derecede, 0.75-1 arasında ise kuvvetli ilişki vardır denilmektedir. 

Regresyon modelinde değişken katsayılarını kullanarak model ve değişkenler hakkında oldukça yararlı bilgiler edinmiştik. Korelasyon katsayısı basit olarak -1 ile 1 değerleri arasında değişen ve bağımsız değişkenler hakkında kısaca bilgi veren bir değerden oluşmaktadır. Regresyon analizinde olduğu gibi basit ve çoklu modellerde hesaplanışı aşağıda anlatılmıştır.

Borsada işlem gören bir hisse senedinin belli bir dönemdeki günlük getirisini (X) ile içinde yer aldığı bir endeksin günlük getirisi (Y) alınırsa, aralarındaki ilişki Korelasyon katsayısı ile incelenir.

Korelasyon katsayısının hesaplanışı

Belirli sayıda gözlem değerinden oluşan iki grup için hesaplanışı:
X ve Y diye adlandırabileceğimiz n adet gözlem değerine ait, iki değişken grup varsa, (iki grup aralarında neden sonuç ilişkisi olan gruplar da olabilir) bu gruplar arasındaki korelasyona, aşağıda verilen formül dahilinde, açıklamalarda belirtilmiş işlemler yapılarak bakılmaktadır.
1.      X ve Y, n adet gözlemden oluşan iki değişken gözlem dizidir.

2.      olarak  ifade edilirler. Tüm gözlem değerleri ortalamadan çıkarılarak x ve y dizileri oluşturulur.

3.      x ile y dizisinin değerleri teker teker çarpılır. Toplamları bulunur.

4.      x dizisinin ve y dizisinin ayrı ayrı kareleri alınır. Toplamları bulunur.

5.      x ile y dizisin çarpılarak toplamları alınmış değer, x dizisinin karesi alınarak toplamı bulunmuş değer ile y dizisinin çarpılarak toplamları alınmış değere bölünür.
Belirli sayıda gözlem değerinden oluşan ikiden fazla grup için hesaplanışı:

Y, X1, X2, X3, ... diye adlandırabileceğimiz n adet gözlem değerine ait, ikiden fazla değişken grup varsa (aralarında neden sonuç ilişkisi olan gruplar da olabilir), bu gruplar arasındaki korelasyona, aşağıda verilen formüller dahilinde, açıklamalarda belirtilmiş işlemler yapılarak ikili ilişkiler şeklinde bakılmaktadır.

Aşağıda formülleri verilmiş ve aralarında korelasyon ilişkisi aranan değişken diziler, Y, X1, X2, X3'dür.
Y ile X2 arasındaki korelasyon katsayısı;

ile hesaplanır.

Y ile X3 arasındaki korelasyon katsayısı;

ile hesaplanır.

X2 ile X3 arasındaki korelasyon katsayısı;

ile hesaplanır.

X3 ile X2 arasındaki korelasyon katsayısı;

ile hesaplanır.

1.      Y, X2, X3; n adet gözlemden oluşan üç değişken gözlem dizidir.

2.      olarak ifade edilirler. Tüm gözlem değerleri ortalamadan çıkarılarak x'ler ve y dizileri oluşturulur.

3.      İki değişkenli diziler için gerçekleştirilen işlemler,üç değişkenli diziler için de yukarıdaki formüllerde yazan değerler için gerçekleştirilir.
Hesaplanacak korelasyon katsayısın yorumu, yine n sayısı dikkate alınarak yapılmaktadır.

Hiç yorum yok:

Yorum Gönder