Tamamlanmamış ve Eksik Verileri Görselleştirme
Yapılandırılmış, iyi formatta olan verilerle çalışmak işin en kolay ve zevkli tarafı. Hatta seçim verileri veri gazetecileri için kullanımı hem çok kolay hem de çok rahat veri setleridir. Ancak tüm veriler seçim verileri gibi değildir. Çoğunlukta güncel değildirler, veriler eksiktir ve hamdır.
Flowingdata’da yer alan ve böylesi durumlarda ne yapılması gerektiğine dair bazı tavsiyeler şöyle:
Boşlukları gösterin
Bu bazen en hızlı çözümdür ve kolaydır.
Bir kategori gibi davranın
Anket verileri çoğunlukla “uygulanabilir değil” gibi bir kategori içeriyor veya soruyu cevaplamama seçeneği vardır. Bunu ayrı bir cevap olarak görmek yararlı olacaktır.
Uzaklaştır
Ormandaki ağaçların durumu gibi düşünün. Veri setine çok yaklaşıldığında çok küçük bir alt grup gibi görülür, belki bu sebeple uzaklaştırma ile görebileceğinizi belki böylece kaybetmiş olursunuz.
Ara değerini hesaplamak
Düzensiz veya seyrek verilerle uğraşırken, boşlukları akıllıca doldurmak için istatistiksel bir yaklaşım getirilir. Bu genellikle belirli bir noktanın etrafında olanın ağırlıklı ortalamasının alınması biçiminde olur. Örneğin, coğrafik verilerle, belirli bir konumun komşu değerlerini düşünülebilir. Zaman serileri ile, bir regresyon modeli uygulanablir.
Sahip olduğunuza odaklanın
“Sahip olmadığınıza odaklanmayı bırakın ve sahip olduğunuza odaklanın. Eksik olan çok veri varsa, mevcut verilere odaklanın.”
Eksik verileri toplayın
Verilerin eksik olması, onların mevcut olmadığı anlamını taşımıyor. Demek ki henüz birileri tarafından bir araya getirilmemiş. Toplanmamış. Belki eksik veriler farklı noktalarda ve toplanması gerekir.
Detaylı örnekler ve daha fazla tavsiye için tıklayınız