Veri istatistiğin ham maddesidir. Kullanılan verinin kalitesi ile yapılan analizin kalitesi doğru orantılıdır. Peki veri nedir, veri kaynakları nelerdir? Bu yazıda istatistiğin bu kavramı ve yaygın kaynaklarını inceleyeceğiz. Veri kaynakları elde edilen istatistiklerin güvenirliğini anlamada kritik bir öneme sahip olmasından ötürü iyi anlaşılması ve ayırt edilmesi gerekir.
Hazırsanız ve çayınızı-kahvenizi aldıysanız veri, veri kaynakları, bu kaynakların artılarını-eksilerini tartışalım:
İçindekiler
ToggleVeri (Data) Nedir?
Herhangi bir birime (insan, hayvan, bitki veya cansız her türlü nesne) ait ilgilendiğimiz herhangi bir niteliğin almış olduğu değer veya değerlerin bir bütünüdür.
- Örneğin alışveriş yaparken incelediğiniz telefon markaları, her bir telefonun fiyatı, girmiş olduğunuz site, içinde bulunduğunuz zaman dilimi, yaşadığınız şehir, cinsiyetiniz, mesleğiniz gibi her türlü nitelik ve size ait karakteristik herhangi bir bilgi olarak tanımlanabilir.
Bu verilerin toplanması sürecinde farklı yöntemler denenebilir. Bu yöntemler birincil ve ikincil kaynaklar olarak iki gruba ayrılır:
Birincil Veri Kaynakları
Bir araştırmacının anket, ölçek, deney ve gözlem yoluyla doğrudan elde ettiği durumu tanımlar.
Hangi Yollarla Elde Edilebilir?
- Telefon
- Online araçlar (google forms, surveymonkey vb.)
- Doğrudan birebir görüşme
Birincil Kaynakların Artıları
Bu şekilde veri toplamanın olumlu yanları kullanılan yollar düşünüldüğünde kolaylıkla anlaşılabilir. Derli toplu özetlersek:
- Daha hızlı toplama
- Araştırmaya uygun birimleri filtreleme imkanı
Birincil Kaynakların Eksileri
- Bilerek yanlış yanıt veren bireyler, yanlı anketörler, kasıtlı yönlendirme ve yanıt alamama sorunları
- Düşük yanıt oranı nedeniyle düşük temsil kabiliyeti sorunu
Birincil veri toplama günümüz bilimsel araştırmalar düşünüldüğünde çoğu zaman bir zorunluluktur. Çünkü deney planlama, uygun birimleri seçme, uygulama, gözlemleme ve takip etme gibi ihtiyaçlar nedeniyle tercih edilir. Burada temsil kabiliyeti konusu önemlidir. Hedeflenen sorulara yanıt bulabilmek için toplanan verilerin araştırmayı yeterince iyi temsil edildiğinden emin olunmalıdır.
Yaygın bir öneri olarak küçük ama yanıt oranı yüksek örneklem, büyük ama yanıt oranı düşük örnekleme tercih edilmelidir. Diğer bir deyişle az ama tam ve güvenilir ölçüm, çok ama eksik ve zayıf ölçümlü veriden daha güçlü çıkarımlar sağlar.
İkincil Veri Kaynakları
Başka bir kaynakta paylaşılmış, yayımlanmış veya derlenmiş olan verilerdir.
Hangi Yollarla Elde Edilebilir?
- TÜİK verileri (işsizlik, enflasyon ve nüfus verileri gibi)
- Bakanlıklar
- OECD
- Dünya Sağlık Örgütü (WHO)
- Eurostat
- Diğer tüm kamu ve uluslararası kuruluşlar
İkincil Kaynakların Artıları
- Hazır olması
- Gözlemlenemeyen veya ölçülemeyen durumlara kaynak olması
- Geçmiş verilere erişim imkanı
İkincil Kaynakların Eksileri
- Kullanışlı ve güncel tarihli olmayabilir.
- Farklı birimlerle ölçümlenmiş olabilir.
- Doğru olmayabilir veya yanlı olabilir.
Sonuç
Bu yazıda veri kaynaklarını genel hatlarıyla öğrendik. Paylaşılan bir istatistiğin hangi kaynaktan elde edildiği onun geçerliliği ve güvenirliliği doğrudan etkiler. Örneğin bir bilimsel araştırmanın kaynağı genellikle birincil olması ve çoğunlukla veri gizliliği olduğundan elde edilen sonuçların doğrulanma imkanı söz konusu değildir. Diğer yandan ikincil bir kaynağında da yanlılık nedeniyle istatistiklerden emin olmak mümkün olmayabilir. Çeşitli platformlarda paylaşılan ve birer manipülasyon aracı olarak kullanılan istatistiklerin kaynakları da tespit edilememektedir.
Siz değerli istatistik sever okuyucularımıza istatistiksel her türlü bilgiyi veya sonucu eleştirel bir gözle ve bilimsel bir şüphecilikle ele almanızı tavsiye ederiz. İkinci yazısını tamamladığımız “adım adım istatistik temelleri” adlı yazı dizisinde alan içinden ve dışından bireylerin sorunsuzca kavrayabileceği formatta birçok içerik hazırlamaktayız. Bu seriye ait yazıları blog adresimizden ulaşabilirsiniz.
Aklınıza takılan soruları, varsa yorumlarınızı bizimle yorum olarak veya iletişim sayfamızdan paylaşmayı ihmal etmeyin. Hepinize bol istatistikli ve analizli günleriz dileriz 🙂 Sonraki yazılarda görüşmek üzere.






















