Veri Gazeteciliği için Veri Görselleştirme
Veriyi bir grafiğe ya da haritaya dönüştürmeden önce bir dakika istatistik ve interaktiv grafik öğelerinin gazetecilikte oynayacağı rolü düşünün.
Haber aşamasında veri görselleştirmeyi nasıl yapacağınıza yönelik bir iki nokta:
*Haberinizin geri kalanı için temalarınızı ve sorularınızı belirleyiniz
*Aykırılıkları tanımayın: iyi hikayeler ya da belki hatalar olacak verinizde
*Tipik örnekler bulmanıza yardımcı olun
*Haberinizdeki boşlukları gösterin
Veri görselleştirme çoklu bir rol oynuyor habercilikte. Nasıl?
*Hikayede en zorlayıcı bölümü görselleştirerek açıklamayı sağlıyor
*Teknik bilgilerin içerisindeki yavan bölümleri çıkarmaya kolaylık sağlıyor
* Özellikle interaktif olduklarında ve keşfe müsaade edip, okuyucularınıza haber sürecinizle ilgili şeffaflık sağladığınızda güvenirlik sağlar
Bu roller, elektronik veri ya da kayıtlarla ilgilenseniz de haberde erken ve sıklıkla veri görselleştirmeyle başlamanız gerektiğinizi savunur. Onu ayrı bir adım olarak değil de, hikaye geniş çaplı yazıldıktan sonra değerlendirilmesi gerekli bir şey olarak düşünün. Bırakın bu tür bir çalışma haberlerinize yol göstersin.
Geçmiş 45 yıldaki devlet yardımları ve önemli olaylarla ilişkili ve son birkaç ayda inşa edilmiş çiftlik gelir payını gösterir. Benzer açıklama ve anlamlı, zamanla kullanılabilecek veri bulmak bir meydan okumaydı. Tüm uç noktaları ve çukurları incelemek, kalan raporlamamızı yaparken içeriği aklımızda tutmamızda bize yardımcı oldu. Bu, aynı zamanda hikaye yazılmadan bir angaryanın neredeyse sona erdirildiği anlamına da geliyordu.
Görselleştirme ve veri setinizi keşfetmek için bazı öneriler.
1.öneri: Hızlı bir şekilde büyük veri seti içinde kendinizi yönlendirmek için küçük katları kullanın
George W. Bush yönetiminin bağımsız değil politik temellere hibe verdiği ipuçlarına bakarken, Washington Post’ta bu tekniği kullandım. Bu yardım programlarının çoğu formüllerle yapılıyor ve yıllardır başkaları hibe almış durumda, bu nedenle yaklaşık 1500 keyfi harcamaya bakarak tüm hibe sürecini çözebilir miyiz merak ediyorduk.
Her program için kırmızı noktaların bir başkanlık seçimi yılını ve yeşil noktaların kongre dönemi bir yılı gösterdiği bir grafik oluşturdum. Problem: Evet, bu programların birkaçında başkanlık seçiminden altı ay önce ani bir sivrilme olmuştu, yanlarında uç numaralı kırmızı noktalar fakat bu, yanlış seçim yılıdır. Model tutarlı şekilde 2000 yılı Al Gore ve George W. Bush arasındaki başkanlık seçimini gösteriyordu, 2004 seçimini değil.
HHS Hibeler: Hikayeyi tanımak için kıvılcım hatları(Washington Post)
Bir sayılar tablosundan ziyade bir grafik serisinde görmek oldukça kolaydı, ve interaktif bir form, çeşitli hibe, bölge ve acente tiplerini kontrol etmemizi sağladı. Küçük safhalardaki haritalar, karşılaştırması kolay statik bir göstergedeki zamanı ve yeri göstermek için bir yol olabilir — hatta bazen interaktif bir yoldan daha kolay.
Bu örnek, PHP ‘de yapılmış kısa bir programla oluşturuldu, fakat şuan Excel 2007 ya da 2010’un mini grafikleriyle yapılması daha basit. Görselleştirme uzmanı Edward Tufte, bu “yoğun, basit, kelimevari grafikleri” bilginin geniş bir veriseti içerisinde bir bakışta iletilebilmesi amacıyla oluşturuldu. Şuan onlara, borsa alıntılarındaki küçük grafiklerden spor dallarındaki kazan-kaybet kayıtlarına kadar her yerde rastlarsınız.
2.öneri: Verinize yukarıdan aşağıya ve yanlamasına bakınız
Bir hikaye ya da veri setini anlamaya çalıştığınızda, ona bakmanın yanlış şekli yoktur; aklınıza gelebilecek her yolu deneyin, böylece farklı bakış açısı kazanacaksınız. Suçlar üzerine raporlama yapıyorsanız eğer, bir yıl içindeki şiddet suçlarındaki değişimlerin olduğu bir grafik setine bakabilirsiniz; bir diğeri yüzde değişimi olabilir, ya da diğer şehirlerle karşılaştırma, zaman içinde değişime bakılabilir. İşlenmemiş sayılar, yüzdeler ve dizinler kullanın.
Hepsine farklı ölçeklerden bakın. X-ekseninin sıfır olması gerektiği kuralını izleyin. Veri için garip dağılımlı logaritmalar, karekökler deneyin.
Görsel algı üzerine yapılan araştırmayı aklınızda tutun. William Cleveland’in deneylerinin gösterdiğine göre ortalama eğim yaklaşık 45 derece olduğunda, göz bir imgedeki değişimi görür. Bu, daima sıfırda başlamak için uyarıları gözardı ettiğinizi, bunun yerine en kavrayışı kuvvetli grafikle çalıştığınızı öne sürüyor. Epidemoloji üzerine diğer bir araştırma grafiğiniz için sınır olarak bir hedef seviyesini bulduğunuzu ileri sürüyor. Bu yolların hepsi veriyi farklı şekillerde görmenize yardımcı olur. Size yeni bir şeyler anlatmayı bıraktıklarında, işinizin bittiğini bilirsiniz.
3.öneri: Düşünmeyin
Şuan verinize çeşitli şekillerde baktınız, muhtemelen doğru gözükmeyen kayıtlara rastladınız – ilk anda ne anlama geldiklerini anlamayabilirsiniz, ya da yazı hatası gibi görünen dışa düşenler, geriye doğru giden akışlar olabilir.
Eski araştırmanıza dayalı ya da yayınlanmış bir görselleştirmedeki bir şeyi sunmak isterseniz, bu bilinmezleri çözümlemek zorunda kalır ve varsayımlar yapamazsınız. İlginç hikayeler ya da yanlışlara; yaygın akla ilginç bir meydan okuyuşa ya da yanlış anlaşılmalara dönüşürler.
Lokal hükümetlerin yanlışlarla dolu özet tablolar sağlamaları az rastlanır değildir ve ayrıca bir veri setindeki hükümet jargonunu yanlış anlamak da kolaydır.
İlk olarak, kendi işinize geri dönün. Dokümantasyonu, uyarısını okudunuz mu, problem verinin orijinal versiyonunda mı bulunuyor? Eğer sizin açınızdan her şey hatasız görünüyorsa, telefonunuzu kaldırmanızın zamanı. Onu kullanmayı planlıyorsanız eğer, analiz ettirmeniz gerekecek, bu nedenle şimdi başlamamanız için bir neden yok.
Yine de, her hata önemli değildir. Kampanya maliye kayıtlarında, 100,000 kayıtlı bir veri setinde bulunmayan yüzlerce posta kodu olması sıradandır. Hepsi aynı şehirde ya da bir adayda olmadığı sürece, nadir kötü veri kaydının bir önemi yoktur.
Kendinize soracağınız soru: Bunu kullanırsam, okuyucular verinin ileri sürdüğünden temelde doğru bakış açısı elde edecek mi? ‘dir.
4.öneri: Hassasiyet saplantılı olmaktan kaçının
Yeterince soru sormamanın diğer yanı mesele olmadan kesinlik üzerinde takılıp kalmaktır. Keşif niteliğindeki grafikleriniz genelde doğru olmalı fakat çeşitli seviyelerde yuvarlamalar bulundurmak, tam yüzde 100’ü bulmak ya da 20’de bir ya da iki yıl eksiğiniz olmasından endişe duymayın. Bu, araştırma sürecinin bir parçasıdır. Büyük akışları görecek ve yayınlama zamanından önce ne toplamanız gerektiğini bileceksiniz. Aslında, yukarıdaki grafikler gibi veriden daha da iyi anlam çıkarabilmek için etiketleme ve ölçek belirteçlerini kaldırmayı düşünebilirsiniz.
5.öneri: Olguların ve olayların kronolojisini oluşturun
Karışık herhangi bir hikayende öncelikle önemli olayların kronolojisini çıkarmakla başlayın. Çalışmak için Excel, bir Word dokümanı ya da TimeFlow gibi özel bir araç kullanabilirsiniz.
6.öneri: Grafik grubunuzla erken ve sık buluşun
Haber merkezinizde ki tasarımcılarla olası grafikler üzerine beyin fırtınası yapın. Veriniz üzerine güzel bakış açıları, nasıl etkileşimli çalışabileceğine ilişkin önerileri olacak ve veri ve hikayenin nasıl birleştirileceğini bileceklerdir. Öncelikle ne toplamanız gerektiğini ya da onu toplayamadığınızda bir grafiğin mümkün olmadığı konusunda takımınızı alarma geçirebileceğinizi bilmeniz raporlamanızı daha kolay hale getirecektir.
Haberciler için öneriler
Araştırmanız üzerinde sadece birkaç gün ya da birkaç saat harcamış olabilirsiniz ya da hikayenizin haberleştirilmesi aylarınızı almış olabilir. Fakat yayınlama zamanı geldiğinde, iki yön daha önemli hale gelir.
Eski araştırmanızdaki eksik yılı hatırlıyor musunuz? Aniden onsuz ilerleyemez olursunuz. Peki görmezden geldiğiniz tüm o kötü bilgiyi? Sizi ziyaret için geri gelecektir. Sebebi kötü veri etrafında yazamamanız. Bir grafik için, ya ihtiyaç duyduğunuz her şeye sahip olursunuz ya da olmazsınız, bu ikisinin ortası bulunmaz.
Etkileşimli grafik ile veri toplamayı eşleştirin
İnteraktif bir grafikte gizleme yoktur. Okuyucularınızın verinizi istedikleri gibi incelemelerini sağlayacaksanız gerçekten, o zaman her veri unsuru ileri sürdüğü şey olmak zorunda. Kullanıcılar her an herhangi bir hata bulabilirler ve bu aylar ya da yıllarca peşinizden gelebilir. Kendi veritabanınızı oluşturuyorsanız, bu, sizden tüm veritabanınızı tanımanız, doğruluğunu kontrol etmenizi ve tashihini yapmanız gerektiği anlamına gelir. Devlet kayıtlarını kullanıyorsanız, ne kadar üstveri kontrolü yapacağınıza ve kaçınılmaz hatayı bulduğunuzda ne yapmayı planladığınıza karar vermelisiniz.
Okuyucular için iki tür tasarım
Grafik bağımsız interaftik bir özellik ya da hikayenize eşlik eden statik bir görselleştirme de olsa iki farklı okuyucu türünü memnun etmeli. Bir bakışta anlaması kolay fakat daha ileri gitmek isteyen kişiler için ilginç bir şey sunacak kadar karışık olmalıdır. Interaktif olarak hazırlarsanız, okuyucularınızın tek bir numara ya da isimden daha fazlasını elde edeceğinden emin olun.
Tek fikir iletmek, sonra basitleştirmek
İnsanların görmesini istediğiniz tek bir şeyin olduğundan emin misiniz? Bir okuyucuda oluşmasını istediğiniz baskın izlenime karar verin ve diğer her şeyi ortadan kaldırın.
Sarah Cohen, Duke Üniversitesi