1. Bu site çerezler kullanır. Bu siteyi kullanmaya devam ederek çerez kullanımımızı kabul etmiş olursunuz. Daha Fazla Bilgi.

Spss'te regresyon analizi nasıl yapılır?

'İstatistiksel Yazılımlar' forumunda statist tarafından 5 Haziran 2018 tarihinde açılan konu

  1. statist

    statist Moderator

    Spss'de regresyon analizi ne zaman yapılır? Spss'te regresyon analizi nasıl yapılır? Bunlardan bahsetmeden önce korelasyon analizi nasıl yapılır yazımızı okumayı ihmal etmeyin.

    Pearson Korelasyon analizi iki sayısal değişken arasındaki ilişkinin büyüklüğünü sayısal olarak değerlendiren bir ölçüdür. Pearson korelasyon katsayısı (r) -1 ile +1 arasında değişir ve 0'dan uzaklaştıkça ilişkinin büyüklüğünün arttığı söylenebilir. İşaretin - olması değişkenlerden biri artarken diğerinin azaldığını ifade etmektedir.

    Bir bağımlı bir veya birden çok bağımsız değişken arasındaki ilişkiyi görebilmek için regresyon analizinden yararlanılır. Regresyon analizi ile,

    Bağımsız değişkenlerle bağımlı değişken arasındaki ilişki
    Bağımsız değişkenlerden hangisinin bağımlı değişkeni daha çok etkilediği
    Bağımsız değişkenlerdeki 1 birimlik değişimin bağımlı değişkende ne kadarlık değişime neden olduğunun açıklanması

    gibi sorulara yanıt aranır.

    Bu yazıda çoklu doğrusal regresyon analizinden bahsedilecektir. Doğrusal olmayan ilişkiler burada incelenmeyecektir.

    Spss'e veri girişi yapılırken her değişken bir sütunda olacak şekilde girilir. Burada "YK" değişkenleri bağımsız; "YorumKalemi" değişkeni bağımlı değişkendir.

    YorumKalemi_regresyon_veri.png

    Regresyon analizi uygulamadan önce değişkenler arasındaki korelasyon katsayılarına bakmak gerekir.

    YorumKalemi_regresyon_korelasyon.png
    Korelasyon katsayılarına dikkat ederseniz iki bağımsız değişken (YK1 ve YK2) birbiri ile ilişkili; YK5 değişkeni de bağımsız değişkenle ilişkisizdir. Bu nedenle YK1 ve YK2 değişkeninden yalnızca biri modelde olmalıdır; YK5 değişkeni modelde olmamalıdır.

    Yukarıdaki bilgiyi gözardı edip tüm değişkenler ile regresyon analizi gerçekleştirelim.

    Analyse -> Regression -> Linear...

    YorumKalemi_regresyon_menu.png

    Bağımlı değişken Dependent bölümüne bağımsız değişkenler Independent(s) bölümüne koyulur. Statistics menüsü tıklanır açılan pencereden Collinearity Diagnostics kutucuğu tıklanır. Böylece varyans şişme değerleri (VIF değerleri) elde edilir.

    YorumKalemi_regresyon_VIF.png

    Sonuçlar aşağıdaki gibidir.

    YorumKalemi_regresyon_1.png

    YK1 ve YK2 değişkenlerine ilişkin VIF değerleri 10'un hatta 100'ün bile üzerinde çıkmıştır. Bu nedenle bu değişkenlerden biri modelden çıkarılmalıdır. Üstelik YK5 değişkeni modelde yer almaktadır. Bu değişkeninde modelde olmaması gerekirdi. Bu nedenle YK2 değişkeni (VIF değeri en yüksek olduğu için) modelden çıkarılıp model yeniden kurulacaktır.

    YorumKalemi_regresyon_2.png
    YK2 değişkeni modelden çıktıktan sonra çoklu bağıntı sorunu ortadan kalkmıştır ancak modelde anlamsız değişkenler vardır. YK4 ve YK6 modelden çıkarılmalıdır. Üstelik korelasyon katsayısı düşük olan YK5'de modelde olmaması gereken bir değişkendir. YK4 ve YK6 modelden çıkarılıp model yeniden kurulacaktır.

    YorumKalemi_regresyon_3.png
    Şu an her şey yolunda gibi görünse de aslında yolunda değil. Kurduğumuz model hatalı. Çünkü YK5 değişkeni ile bağımlı değişken arasında oldukça düşük ilişki var ve modelde olmaması gerektiği halde modelde öyleyse bizim artıkları ve etkili gözlem değerlerini inceleyip sorunlu gözlem varsa tespit edip modelden çıkarmamız gerekir.

    YK1, YK3 ve YK5 değişkenleri ile modeli kurarken Save... kutucuğunu tıklayıp uygun ölçüleri seçiyoruz.

    YorumKalemi_regresyon_save.png

    İlgili değerler verilerimizin hemen yanına kaydedilecek buradan bir veya birkaç gözlemi silip yeniden model kuracağız. Ayrı ayrı mahalanobis uzaklığı, cook uzaklığı ve artık değerlerine göre silme işlemini yapabiliriz.

    YorumKalemi_regresyon_diagnostic.png

    Kırmızı ile işaretli satıra denk gelen gözleme ait tüm veriler silinerek regresyon analizi tekrar yapıldığında sonuçlar şu şekildedir.

    YorumKalemi_regresyon_4.png

    En baştan beri söylediğimiz gibi şu anda YK5 değişkeninin modelde olmaması gerektiğini gördük. Bu değişkeni çıkarıp tekrar model kuruyoruz ve varsa aykırı gözlem ve etkili gözlem değerlerini modelden çıkarıyoruz. En son ki sonuçlar aşağıdaki gibi çıkacaktır.

    YorumKalemi_regresyon_5.png

    Şu an hem model (F=171.473; p<0.05) hem de tüm katsayılar anlamlı bulunmuştur.

    Buna göre,

    Regresyon modeli Y = 530,39 -18,63*YK1 - 3,88*YK2 şeklindedir.

    YK1'deki 1 puanlık artış bağımlı değişkende 18.6 puanlık azalmaya, YK2'deki 1 puanlık artış bağımlı değişkende 3,88 puanlık azalmaya neden olur.

    Standartlaştırılmış beta katsayılarına göre (-1,088; -0,301) YK1 değişkeni bağımlı değişken üzerinde daha çok etkilidir.

    Modelin tümel açıklayıcılık katsayısı 0,821 olarak bulunmuştur. Yani bağımlı değişkendeki değişimin %82.1'i bağımsız değişkenler tarafından açıklanır ve %17,9'u bizim hesaba katmadığımız değişkenlerce açıklanmaktadır.
     
    Tags:

Bu Sayfayı Paylaş

Yükleniyor...