Bu yazıda bir verideki değişkenliği ölçmede kullanılan standart sapma, varyans, ortalama sapma, değişim katsayısı, açıklık ve çeyrekler arası genişlik gibi merkezi dağılım ölçüleri konusunu ele alacağız. Hazırsanız çayınızı-kahvenizi alın, başlayalım.
İçindekiler
ToggleMerkezi Dağılım Ölçüsü Nedir?
Bir veride gözlenen değerlerin merkezi eğilim ölçüsüne (genellikle ortalama) olan konumlarını belirlemek için kullanılan ölçülere denir.
Temel Özellikleri Nelerdir?
- Frekans dağılımları ve grafikler veri hakkında bilgilendirici olmakla beraber yeterli değildir.
- Verinin genel eğilimi ve yayılım (değişkenliği) hakkında ek bilgiye ihtiyaç duyulur.
- Merkezi eğilim ölçüleri veriyi özetlemede faydalı olsa da birimlerin birbirlerine göre konumları hakkında bilgi vermez.
- Ortalama ve medyan gibi değerler verinin merkezine ilişkin bilgi sağlar ancak ne kadar değişken olduğunu söylemez.
- Ölçüm (gözlem) değerlerinin birbirlerine göre konumlarını, birbirlerine yakınlık ve uzaklıklarını yansıtan değerlere merkezi dağılım (yayılım, saçılım) ölçüleri denir.
- Ölçüm değerlerinin hangi değer etrafında toplandıklarını belirlemek için merkezi eğilim,
- Eğilim ölçüsüne göre konumlarını belirlemek içinse merkezi dağılım ölçüleri kullanılır.
Ortalama Sapma Nedir?
Verideki ölçüm değerleri ile aritmetik ortalama arasındaki farkların mutlak değerce toplamının ortalamasıdır.
Örnek Hesaplama
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden ortalama sapma değeri:
Varyans ve Standart Sapma Nedir?
Varyans, ölçüm değerlerinin ortalamadan farklarının karelerinin ortalaması olarak tanımlanır. Standart sapma ise varyansın kareköküne eşittir.
Temel Özellikleri
- En önemli merkezi dağılım ölçüleridir.
- Gözlem değerlerinin ortalamadan ne kadar uzaklaştığının, saptığının genel bir ifadesidir.
- Negatif değer alamazlar. Sıfır değerini almaları tüm gözlem değerlerinin eşit olduğu anlamına gelir.
- Profesyonel raporlamalarda ve program çıktılarında standart sapma için SD, varyans için VAR kısaltmaları kullanılır.
- Varyans ve doğal olarak standart sapma değeri aykırı değerlerden aşırı derecede etkilenir.
- Örneklem standart sapması yanlı bir tahmin edicidir. Yani değerleri gerçek kitle standart sapma değerine yakınsamaz.
- Standart sapma ölçüm değerleri ile aynı birime sahiptir.
- Varyans ile ölçüm değerlerinin birimleri farklıdır. Biri örneğin m ise diğeri m2 cinsindendir.
- Genel geçer bir kural olarak bir gözlem değeri xi < (µ – 2σ) ise ortalamadan anlamlı derecede düşük değerli, xi > (µ + 2σ) ise ortalamadan anlamlı derecede yüksek değerli olduğu sonucuna götürür.
Örnek Hesaplama
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden ortalama sapma değeri:
Değişim Katsayısı Nedir?
Bir veride standart sapmanın aritmetik ortalamaya oranı olarak tanımlanır.
Temel Özellikleri
- İki standart sapma değerinin karşılaştırılması ancak ortalama değerleri eşit ise kullanışlıdır. Örneğin ortalamaları aynı ise standart sapması daha küçük olan daha homojen, aksi durumda daha heterojen (değişken) ölçümlere sahiptir youmu yapılabilir.
- Fakat ortalamalar farklı iken bu yorumlar geçerli olmayabilir. Değişim katsayısı bu noktada faydalıdır.
Örnek Hesaplama
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden ortalama sapma değeri:
Açıklık (Range) Nedir?
Açıklık, verideki en büyük ve en küçük değer arasındaki farktır.
Temel Özellikleri
- Sadece en büyük ve en küçük değerleri kullanmasından ötürü aykırı değerlere karşı aşırı hassastır.
- Değişkenliği yansıtan değerlerin çoğunu kullanmaz.
Örnek Hesaplama
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden ortalama sapma değeri:
Çeyrekler Arası Genişlik Nedir?
Veri 4 dilime ayrıldıktan sonra birinci dilim ile üçüncü dilim değerleri arasındaki fark çeyrekler arası genişlik olarak tanımlanır.
Temel Özellikleri
- Büyük verilerde gözlemlerin ortadaki yarısını içerir.
- Aykırı gözlemlerden çok az etkilenirler.
- Örneklemden kitleye ilişkin çıkarım gücü yoktur. Bu nedenle ortalama ve standart sapma daha yaygın kullanılır.
Örnek Hesaplama
Bir sınavda öğrencilerin sınavda durma sürelerini ölçmüş olalım. Bu süreler aşağıdaki gibi verilmiş iken verinin çeyrekler arası genişlik değerini bulalım:
Verinin sıralanmış hali:
Yukarıdaki veriye +1 gözlem ekleyerek çift sayıda veride hesaplamanın nasıl yapıldığını görelim:
Verinin sıralanmış hali:
Sonuç ve Genel Değerlendirme
Bu yazıda merkezi dağılım ölçüleri konusunu ele aldık. Merkezi eğilim ölçülerinde olduğu gibi ortalama sapma, varyans, standart sapma, değişim katsayısı, açıklık, çeyrekler arası genişlik gibi merkezi dağılım ölçüleri de veri yapısına bağlı olarak kullanılmalıdır. Örneğin veride çok düşük veya çok yüksek değerler söz konusu ise çeyrekler arası genişlik kullanışlı olabilir. Benzer bir şekilde dengeli bir veride en doğru ölçü varyans ve standart sapma olacaktır. Bir diğer önerimiz ise az sayıda aşırı değer söz konusu ise veriden ayıklayıp kalanına bağlı hesaplamalar yapmaktır. Literatürde bu amaçla budanmış (truncated) ve sansürlenmiş (winsorized) ölçüler tanımlanmıştır. Bu ölçüleri ilerleyen süreçlerde paylaşacağı. Ayrıca özellikle sınıflandırılmış (gruplandırılmış) veride merkezi dağılım ölçüleri hesabı biraz daha fazla matematiksel işlem gerektirdiğinden ayrı yazılarda değinmeyi planlıyoruz.
Onüçüncü yazısını tamamladığımız “adım adım istatistik temelleri” adlı yazı dizisinde alan içinden ve dışından bireylerin sorunsuzca kavrayabileceği formatta birçok içerik hazırlamaktayız. Serinin önceki yazılarına blog adresimizden ulaşabilirsiniz.
Aklınıza takılan soruları, varsa yorumlarınızı bizimle yorum olarak veya iletişim sayfamızdan paylaşmayı ihmal etmeyin. Hepinize bol istatistikli ve analizli günleriz dileriz 🙂 Sonraki yazılarda görüşmek üzere.






















