Basit Doğrusal Regresyon Analizi: İstatistiksel Modellemenin Temel Taşı
İçindekiler
Toggleİstatistiksel analizin en temel ve yaygın kullanılan yöntemlerinden biri olan basit doğrusal regresyon analizi, veri bilimcilerin ve araştırmacıların sıkça başvurduğu güçlü bir araçtır. Bu yazımızda, basit doğrusal regresyon analizinin derinliklerine inerek, bu yöntemin nasıl kullanıldığını ve neden bu kadar önemli olduğunu keşfedeceğiz. İster bir veri bilimci, ister bir araştırmacı olun, basit doğrusal regresyon analizini anlamak, veri dünyasında daha etkili kararlar almanıza yardımcı olacaktır.

Basit Doğrusal Regresyon Analizi Nedir?
Basit doğrusal regresyon analizi, iki değişken arasındaki ilişkiyi modellemek ve tahmin etmek için kullanılan istatistiksel bir yöntemdir. Bu analiz, bir bağımsız değişken (X) ile bir bağımlı değişken (Y) arasındaki doğrusal ilişkiyi inceler. Yöntem, bu ilişkiyi en iyi temsil eden doğrusal bir denklem oluşturmayı amaçlar.
Amaçları Nelerdir?
Basit doğrusal regresyon analizinin temel amaçları şunlardır:
- İki değişken arasındaki ilişkinin yönünü ve gücünü belirlemek
- Bağımsız değişkenin bağımlı değişken üzerindeki etkisini ölçmek
- Gelecekteki değerleri tahmin etmek için bir model oluşturmak
- Değişkenler arasındaki nedensel ilişkileri anlamak
- Veri setindeki aykırı değerleri ve etkileyici gözlemleri tespit etmek
Kullanım Alanları
Basit doğrusal regresyon analizi, birçok farklı alanda yaygın olarak kullanılmaktadır. İşte bu analizin kullanıldığı bazı önemli alanlar:
- Ekonomi: Ekonomistler, örneğin gelir ve harcama arasındaki ilişkiyi incelemek için bu analizi kullanır.
- Pazarlama: Reklam harcamaları ile satış rakamları arasındaki ilişkiyi analiz etmek için tercih edilir.
- Tıp: Hastalık risk faktörleri ile belirli sağlık göstergeleri arasındaki ilişkiyi incelemek için kullanılır.
- Eğitim: Öğrencilerin çalışma saatleri ile sınav sonuçları arasındaki ilişkiyi değerlendirmek için faydalanılır.
- Çevre Bilimleri: Hava kirliliği seviyeleri ile sıcaklık arasındaki ilişkiyi analiz etmek için tercih edilir.
- Finans: Hisse senedi fiyatları ile şirket performansı arasındaki ilişkiyi incelemek için kullanılır.
- Spor: Antrenman süresi ile performans arasındaki ilişkiyi değerlendirmek için faydalanılır.
Örnek Problemler
1. Ekonomi Örneği: Bir ekonomist, aylık gelir (X, bin TL) ile aylık tasarruf miktarı (Y, yüz TL) arasındaki ilişkiyi inceliyor. 12 kişilik bir örneklem üzerinde yapılan analizde aşağıdaki veriler elde edilmiştir:
X: 3, 4, 5, 5, 6, 7, 8, 8, 9, 10, 11, 12
Y: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14
Regresyon analizi sonucunda elde edilen denklem: Y = 0.5 + 1.1X
Katsayıların yorumu:
-
- Sabit terim (0.5): Gelir sıfır olduğunda bile 50 TL’lik bir temel tasarruf yapılacağını gösterir.
- Eğim katsayısı (1.1): Aylık gelirdeki her 1000 TL’lik artışın, aylık tasarruf miktarını ortalama 110 TL artırdığını ifade eder.
2. Pazarlama Örneği: Bir e-ticaret şirketi, haftalık reklam harcamaları (X, bin TL) ile haftalık satış miktarı (Y, on bin TL) arasındaki ilişkiyi araştırıyor. 12 haftalık veri analizi sonucunda aşağıdaki veriler elde edilmiştir:
X: 5, 7, 8, 10, 12, 13, 15, 16, 18, 20, 22, 25
Y: 10, 12, 13, 15, 17, 18, 20, 21, 23, 25, 27, 30
Regresyon analizi sonucunda elde edilen denklem: Y = 4.2 + 1.03X
Katsayıların yorumu:
-
- Sabit terim (4.2): Hiç reklam harcaması yapılmasa bile haftalık 42,000 TL’lik bir temel satış olacağını gösterir.
- Eğim katsayısı (1.03): Her 1000 TL’lik reklam harcamasının, haftalık satışları ortalama 10,300 TL artırdığını ifade eder.
3. Sağlık Örneği: Bir sağlık araştırmacısı, günlük egzersiz süresi (X, dakika) ile vücut kitle indeksi (BMI) (Y) arasındaki ilişkiyi inceliyor. 12 katılımcı üzerinde yapılan çalışmada aşağıdaki veriler elde edilmiştir:
X: 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110
Y: 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21
Regresyon analizi sonucunda elde edilen denklem: Y = 32 – 0.1X
Katsayıların yorumu:
-
- Sabit terim (32): Hiç egzersiz yapılmadığında beklenen ortalama BMI değerini gösterir.
- Eğim katsayısı (-0.1): Günlük egzersiz süresindeki her 10 dakikalık artışın, BMI’da ortalama 1 birimlik bir düşüşe neden olduğunu ifade eder.
Bu örnekler, basit doğrusal regresyon analizinin farklı alanlardaki uygulamalarını ve sonuçların nasıl yorumlanabileceğini göstermektedir. Her örnekte, bağımsız değişkenin (X) bağımlı değişken (Y) üzerindeki etkisi açıkça görülmektedir.
Varsayımları
Basit doğrusal regresyon analizinin güvenilir sonuçlar vermesi için bazı temel varsayımların karşılanması gerekmektedir:
- Doğrusallık
- Bağımsızlık
- Homojenlik (Eşit varyans)
- Normallik
- Hata terimlerinin ortalamasının sıfır olması
Varsayımların Detayı ve Test Edilmesi
- Doğrusallık: Bağımlı ve bağımsız değişken arasında doğrusal bir ilişki olmalıdır. Bu varsayım, dağılım grafiği veya kısmi regresyon grafikleri ile test edilebilir.
- Bağımsızlık: Gözlemler birbirinden bağımsız olmalıdır. Durbin-Watson testi ile kontrol edilebilir.
- Homojenlik: Hata terimlerinin varyansı sabit olmalıdır. Breusch-Pagan testi veya White testi ile incelenebilir.
- Normallik: Hata terimleri normal dağılıma sahip olmalıdır. Shapiro-Wilk testi veya Q-Q grafikleri ile değerlendirilebilir.
- Hata Terimlerinin Ortalaması: Hata terimlerinin beklenen değeri sıfır olmalıdır. Bu, artık (hata veya residü olarak da geçer) grafikleri ile incelenebilir.
Avantajları ve Dezavantajları Nelerdir?
Avantajları:
- Kolay anlaşılır ve uygulanabilir.
- Hızlı sonuç verir.
- İki değişken arasındaki ilişkiyi net bir şekilde gösterir.
- Tahmin yapmak için kullanışlıdır.
Dezavantajları:
- Sadece iki değişken arasındaki ilişkiyi inceler
- Doğrusal olmayan ilişkileri modelleyemez
- Aykırı değerlerden kolayca etkilenebilir
- Nedensellik göstermez, sadece ilişkiyi ortaya koyar
Alternatifi Olan Testler
- Çoklu doğrusal regresyon
- Lojistik regresyon
- Poisson regresyon
- Doğrusal olmayan regresyon modelleri
- Zaman serisi analizi
Hangi İstatistiksel Programlarda Yer Alır?
Basit doğrusal regresyon analizi, birçok istatistiksel yazılımda mevcuttur:
- SPSS
- SAS
- Stata
- R (lm paketi)
- Python (statsmodels paketi)
- Excel
- Minitab
- MedCalc
- Jamovi
- JASP
Özet
Basit doğrusal regresyon analizi, iki değişken arasındaki ilişkiyi anlamak ve tahmin etmek için kullanılan güçlü bir istatistiksel araçtır. Ekonomiden sağlığa, pazarlamadan eğitime kadar birçok alanda yaygın olarak kullanılmaktadır. Ancak, bu yöntemin etkili bir şekilde kullanılabilmesi için varsayımlarının dikkatle incelenmesi ve uygun şekilde test edilmesi gerekmektedir. Basit doğrusal regresyon analizi, veri bilimi ve istatistik dünyasında temel bir yöntem olarak önemini korumaya devam etmektedir.
Aklınıza takılan soruları, varsa yorumlarınızı bizimle yorum olarak veya iletişim sayfamızdan paylaşmayı ihmal etmeyin. Tahliz İstatistik olarak, bu süreçte size yardımcı olmaktan memnuniyet duyarız. Hepinize bol istatistikli ve analizli günler dileriz 🙂 Sonraki yazılarda görüşmek üzere.




















