Konuşulmayan veri görselleştirme kuralları (ve onları çiğnemek)
Yazar: Kaiser Fung
https://datajournalism.com/read/longreads/the-unspoken-rules-of-visualisation-and-when-to-break-them
Veri görselleştirmek; bir yapbozun parçalarını birleştirmek gibidir. Başarılı olmak için önceden bilmeniz gereken bazı şeyler vardır — parçalar birleştiğinde ortaya çıkacak olan manzara, veri grafiğinin anlatmasını istediğiniz hikaye gibidir. Ayrıca elinizde neler olduğunu anlamanız gerekir — yapbozun parçaları önünüzde duran veri setleridir. Sonrasında ise verilerinizi anlatmak için yapbozu bitirmek, bulmacayı çözmek veya grafiğinizin öğelerini birleştirmek sizin işinizdir.
Verileri görselleştirmek bir seçenektir. Kelimeler yerine resimleri seçmiş olursunuz. Atasözünde de denildiği gibi: Bir resim, bin kelimeye bedeldir. Görsel araçlarda hissedilen güç, verimlilik ve çok boyutluluk kaynaklıdır. Gapminder projesi tarafından toplanan verilerden elde edilen, dünyanın sağlık ve zenginlik durumunun aşağıdaki özetini göz önünde bulundurun:
Son 50 yılda (1965-2015), hem sağlıkta hem de ülkelerin zenginliğinde muazzam bir ilerleme kaydedilmiştir. Yaşam beklentisindeki yükselme oldukça dikkat çekiciydi. İzlanda 1965 yılında, vatandaşlarının yaşam ortalamasının 74 olmasıyla tüm ülkeleri geride bıraktı. 2015’e gelindiğinde, neredeyse tüm Avrupa, Amerika ve Asya’nın çoğu ve hatta bir dizi Afrika ülkesi de bu seviyeye ulaştı, hatta bu seviyeyi aştılar bile.
Son 50 yılda, kişi başına düşen GSMH’nin kullanılmasında önlemler alınarak, satın alma gücü paritesi enflasyonu düzeltilerek dünyanın çoğu zenginleşmiştir. 1965’te çoğu ülke, kişi başı 5000 doların altında kazanırken; 2015 yılına kadar kişi başına düşen gelirlerini 10.000 doların üzerine çıkardılar. 1965’te ortalama geliri 32.000 dolar olan İsviçre, 2015 yılına kadar İrlanda, Norveç ve Lüksemburg tarafından geçilmesine rağmen, Avrupa’nın en zengin ülkelerinden biri olmaya devam etti. Libya’nın öne çıkan istisnası dışında birçok Afrika ülkesi de daha zengin oldu.
Şimdi, bu verilerin bir çift dağılım grafiği olarak görselleştirmesine bakalım: Burada görsel aracın gücü açıkça görülüyor.
Zihin, yukarıda verilen çeşitli konuşan noktaları rahatlıkla kavrar. Bilgiler tek seferde metinde belirtilen sırayla okunduğunda yararlı hale gelir. Fotoğraflarda gözlerimiz dolaşıyor, aynı anda birden fazla boyutta bilgi arıyor. Biliş; referans çizgileri, lejantlar, veri etiketleri ve ek açıklamalar gibi tasarım öğeleri tarafından yönlendirilir. Burada dikkat edilmesi gereken şey görsel ortamın zenginliği sözel olarak ifade edildiğinde; uzun soluklu, uyarı yüklü cümlelere yol açan karmaşık ilişkileri gün yüzüne çıkarmasıdır.
Görselin verimliliği ve çok boyutlu olması, veri görselleştirmenin üreticileri ile tüketicileri arasındaki iletişimi düzenli hale getiren bir dizi kuraldan kaynaklanmaktadır. Bu kurallar genellikle söylenmez: Bunlar “söylemeye gerek yok” demenin görsel karşılığıdır.
Bu küresel sağlık ve zenginlik grafiğine, aşağıda görüldüğü gibi ek bir “Bu Grafik Nasıl Okunur” kutusu eklendiğini düşünün:
Bu grafik nasıl okunur
Bu grafikte, dikey eksende tasvir edilen, bir ülkenin sağlığının göstergelerinden biri olan, ortalama yaşam beklentisini bulacaksınız. Ülkenin zenginliğinin bir göstergesi olan, kişi başına düşen GSMH ile ölçülen, satın alma gücü paritesi enflasyonu düzeltilmiş kişi başına düşen gelir ise yatay eksende gösterilmiştir. Yaşam beklentisi yıl olarak ölçülmektedir ve 35 ile 80 yıl arasında, 10 yıllık artışlarla gösterilmektedir. Kişi başına düşen gelir 0 ile 120.000 dolar arasında her 10.000 dolar için işaret çentikleri ve her 20.000 dolar için etiketlerle gösterilmiştir.Her ülke iki boyutlu yüzeyde bir nokta ile temsil edilmektedir: Her ülkenin sağlık göstergesi, yatay çizgiye göz atılarak dikey eksende okunabilirken, her ülkenin gelir göstergesi de dikey bir çizgi çekilerek yatay eksende benzer şekilde okunabilir. Örneğin, 1965’te Amerika Birleşik Devletleri’nin ortalama yaşam beklentisi yaklaşık 70 yıl ve kişi başına düşen geliri yaklaşık 20.000 dolardı. Grafikte her ülkenin noktası hangi kıtaya ait olduğuna göre renklendirilmiştir. Mor noktalar Avrupa ülkeleri; mavi noktalar Amerika; turuncu noktalar Asya ve sarı noktalar Afrika. İki dağılım grafiği yan yana yerleştirilmiştir. Sol grafik 1965 verilerini, sağ grafik 2015 verilerini göstermektedir. İki taslaktaki noktaların konumlarının karşılaştırılması, 50 yıl içinde sağlık ve zenginlikteki değişimi ortaya koymaktadır.Bu tür karşılaştırmalar, etiketli her ülke ve kıta için tek tek yapılabilir. İki referans çizgisi, kişi başına düşen gelir olarak 10.000 doları ve 1965’te Avrupa’nın en zengin ülkesi olan İsviçre’nin rakamı 32.000 doları dikey olarak çizmektedir. 32.000 dolar referans çizgisinin solundaki ve sağındaki mor nokta kümesinin karşılaştırılması, 50 yıl boyunca Avrupa’da gelirdeki artışı göstermektedir. 10.000 dolar referans çizgisinin solundaki ve sağındaki nokta sayısının karşılaştırılması, dünya çapında gelirdeki muazzam büyümeyi ortaya koymaktadır.
Durun! Bana bağırmak istiyorsunuz çünkü bu kelimelerin çoğu gereksiz. Ayrıca itirazınız bununla sınırlı değil: “Nasıl okunur” kutusunu eklemek görselin avantajlarını azaltıyor. Söylemeye gerek yok ancak tasarımcılar okuyucular tarafından sezgisel olarak kavranan belirli kurallara uyduğunda uzun talimatlar gereksizdir.
Bu uzun okumanın geri kalanında, veri grafiği üretimimize rehberlik etmesi gereken bir dizi temel kuralı vurgulayacağız. Yazının sonunda listelenen referanslar, bu ve diğer kuralların daha fazla açıklamasını sunmaktadır. Bilgi tasarımcısı Alberto Cairo’nun How Charts Lie adlı kitabının 1. Bölümü; tüketicilerin, grafikleri üreticinin bakış açısından nasıl okuması gerektiğini özetlediğinden konu ile oldukça ilgili. Alberto, görsel iletişimin ‘zihinsel modellerinin’ varlığının; okuyucu, tasarımcının modelini kendi modeli ile karşılaştırıp onu yakınsadığında başarılı olacağının altını çizmektedir.
Veri görselleştirmedeki çoğu kural benzersiz değildir — bazı durumlarda, birbiriyle çelişen kurallar bir arada bulunmaktadır. Zaman içinde renkleri nasıl ele alacağımız gibi bazı kurallar görselleştirme araçlarıyla birlikte gelişir. Her kuralın bir istisnası vardır: Tasarımımız kasıtlı olarak bir kuraldan saptığında, eğer grafik uygunsa, “Bu Grafik Nasıl Okunur” kutusu da dahil olmak üzere okuyucularımızın dikkatini bu sapmaya çekeriz.
Leland Wilson’ın The Grammar of Graphics’inde; estetiği, -verilerin geometrik nesnelere kodlanmasını- anlamaya yardımcı olan kılavuzlardan ayırır. Bu ayrımın ardından veri görselleştirme kurallarını iki gruba bölüyorum. Her bölümde, bu en iyi veri görselleştirme uygulamalarının ardındaki mantığı ortaya koymak için, biri kurala uygun olan ve diğeri kurala uygun olmayan aynı verilerin iki görüntüsü yan yana yerleştirilmiştir.
Estetik Kuralları
Pasta grafikler
Pasta grafik, veri görselleştirme uzmanları tarafından hakkında en çok kötü konuşulan grafik formu olmasına rağmen kullanılmaya devam etmektedir. Bazı pasta grafikler uygun kurallara göre yapılması şartıyla iş görmektedir.
Veri görselleştirme uzmanı Xan Gregg tarafından bir nottan çıkarılan örneğe bakalım. Bu iki pasta grafik, internette kullanılan dilleri göstermektedir:
Örnek okuyucular, internetin yarısından fazlasında İngilizce’nin kullanıldığını söylerken, Rusça’dan Japonca’ya diğer altı dilden her biri yaklaşık yüzde beşe tekabül etmektedir.
Bu pasta grafiğini oluştururken bir dizi kuralı takip ettim: a.) Makul sayıda dilim kullanma, gerekirse küçük kategorileri bir araya getirme, b.) Dilimleri en büyükten en küçüğe doğru sıralama, c.) Sıralaması ne olursa olsun “Diğer” dilimini en sona koyma, d.) Birinci yani en büyük dilimi üst dikey yarıçapa göre konumlandırma ve diğer dilimleri saat yönünde sıralama, e.) Renkleri yalnızca farklı verileri kodluyorsa değiştirme. Bu durumda “Diğer” dilimi için daha hafif bir gölgelendirme kullandım, tek başına birden çok dili temsil ettiğini ve grafikteki en az öneme sahip olan dilim olduğunu belirttim.
“Veri görselleştirmedeki çoğu kural benzersiz değildir — bazı durumlarda, birbiriyle çelişen, çelişkili kurallar bir arada bulunur.”
Bu kurallar, konuşulmayan kurallardır. Tasarımcı onlara sessizce başvurur ve okuyucu onları sezgisel olarak uygular. Bu kurallar göz ardı edildiğinde, pasta grafiğini kavramak daha fazla zaman alır. En büyük pasta diliminin rastgele bir açıyla ve diğer dilimlerin de rastgele bir sırayla yerleştirildiği, her dilime rastgele bir renk atanmış olduğu kuraldan sapmış olan örneğine bir göz atın. Grafik oluşturucu kurallardan saptığında, okuyucunun tasarımın mantığını anlaması için gereğinden fazla zaman ayırması gerekir.
Çubuk grafikler
Bir çubuk grafikteki (biraz daha genişletirsek sütun grafiği de buna dahil edebiliriz) temel kural, değer ekseninin alt sınırının sıfır olarak ayarlanması gerektiğini belirten kural yani sıfırdan başlama kuralıdır. The Economist‘ten uyarlanan bir sonraki örneğimiz, bu kurala uymayan bir örnektir.
Bu grafik, okuyucunun İsviçre’deki emeklilik yaşını Fransa’dakinin iki katı olarak anlamasına yol açmaktadır. Çünkü İsviçre çubuğu Fransız çubuğunun uzunluğunun iki katı görünmektedir. Bu son satır doğru olamaz: İsviçre emeklilik yaşı Fransa’dakilerden sadece %10 daha fazladır. Değer eksenimiz, kurala uygun örneğimizde olduğu gibi sıfıra uzatıldığında, çubuk genişliklerinin oranı verilerin oranının olduğu konuma, yani yeniden doğru konuma gelir.
Uyarı okuyucusu, örneğin bir tasarımcının her bir çubuğun sol kenarına bir kesme sembolü yerleştirdiğini fark eder ve genişliğinin yarıdan fazla kesildiğini bildirir. Bu nedenle tasarımcı çubuk grafiklerde bilerek estetik kurallara karşı koymaktadır. Onaylama, kesme işleminin getirdiği bozulmayı düzeltmez ve olası yanlış yorumlamaya yol açar.
Kuşkusuz, yenilenen çubuk grafik hala yeterli değildir. Daha etkili bir gösterim, üçüncü örnekte olduğu gibi bir nokta grafiğine geçilerek elde edilir. Bir başka etkili gösterim seçeneği, dördüncü örnekte görüldüğü gibi, resmi emeklilik yaşlarına karşı etkili boşluklara odaklanmaktır. Bu tasarımların her ikisi de sıfırdan başlama kuralına tabidir.
Dağılım grafikleri
Dağılım grafiği, her veri birimini iki eksenin kapsadığı bir yüzey üzerinde nokta olarak gösterir. Noktanın yatay (x) ve dikey (y) konumları iki değişkeni kodlar. Nokta bulutu şekli, iki değişken arasındaki korelasyonun doğasını görselleştirir. Sağlık harcamalarının yaşam beklentisindeki öngörülen artışı büyük ölçüde gerçekleştiremediği, sıradışı bir ülke olarak ABD’yi tek başına ele alan bir sonraki örneğimizdeki muhteşem dağılım planına bir bakın!
Kurallar, hangi değişkenin hangi eksene yerleştirileceğine karar vermemizi sağlar. Bu örnekte, kişi başına yapılan sağlık harcamasının sağlık sonuçlarının itici gücü olduğu iddia edilmektedir. Kural olarak, sağlık harcamaları (açıklayıcı değişken) x, yaşam beklentisi (sonuç) y olarak kodlanır.
Buna karşılık, kurala uymayan diğer örneğimizde x ve y eksenleri yer değiştirmiştir.
Görsel
formu, aynı verilerin 45 derecelik köşegen boyunca yansımasıdır. Tasarım kuralından sapıldığı için, özellikle STEM alanlarında (fen, teknoloji, mühendislik, matematik alanlarında) eğitim almış birçok okuyucunun kafası karışacak ve hatta rahatsızlık ile tepki vereceklerdir.
Regresyon çizgisi dağılım grafiğinde rutin bir eklentidir. (Aynı zamanda piyasanın lideri elektronik tablo programı Excel tarafından yanıltıcı bir şekilde ‘eğilim çizgisi’ olarak da adlandırılır). Regresyon analizi, bir dağılım grafiğinde görüntülenen iki değişken arasındaki korelasyonu ölçmektedir. Regresyon çizgisi, nokta ve çizgi bulutu arasındaki ortalama mesafeyi en aza indirecek şekilde çizilir. Bir sonraki dağılım grafiğimizde bir regresyon çizgisi bulunmaktadır.
En önemlisi, belirli bir nokta ile regresyon çizgisi arasındaki mesafenin yatay olarak değil dikey olarak ölçülmesidir. Bu dikey ayrım, okuyucunun grafiğin önemli mesajını öğrendiği ipucudur: Amerikalılar aynı orana sahip diğer ülkelerle karşılaştırıldığında 82 yılı aşkın bir yaşam beklentisine sahip olmalıdır.
X ve y eksenlerinin değiştirilmesi, regresyon çizgisini yansıtmaz (noktaları yansıtmadığı gibi). Noktalar ve çizgi arasındaki dikey mesafeleri en aza indirgeyen şey yatay mesafeleri en aza indirgemez. Aşağıdaki iki örnekte gösterildiği gibi, yukarıdaki örnekte bir ekseni ters çevirdiğimizde, y ekseni üzerindeki x’in regresyon çizgisi, y ekseni üzerindeki x’in yansıtılan regresyon çizgisi ile çakışmaz.
Özellikle, bu kural hangi değişkenin açıklayıcı değişken olduğu ve hangi değişkenin sonuç
değişkeni olduğunu belirlemez. Tasarımcı bunlara karar verdikten sonra, kurala göre değişkenleri uygun eksenlere yerleştirir. Buna göre, yaşam beklentisi sağlık harcamalarındaki değişkenliğin bir açıklaması olarak sunuluyorsa ikinci örnek uygundur. Bu konu hakkında daha fazla bilgi için blogumu ziyaret edebilirsiniz.
Zaman serisi grafikleri
Yıllar, aylar ve tarihler gibi zaman değişkenleri için uygun yer yatay eksendedir. Kural olarak, zaman soldan sağa doğru ilerler (sağdan sola doğru okunan ülkelerde değişiklik gösterir). Aşağıdaki tablolar Avustralya’yı ziyaret eden Çinli turistlerin hızlı büyümesini göstermektedir. Zamanın soldan sağa sıralandığı bir örnek ile aşağıdan yukarıya sıralandığı iki örneği karşılaştırın. Soldan sağa kuralı yazıların soldan sağa okunduğu kültürlerdeki veri grafiklerinin üreticileri ve tüketicileri arasında paylaşılan konuşulmayan bir kuraldır. Bu kuralı bozmak okuyucunun bilişini her daim yavaşlatacaktır.
Zaman serisi grafikleri için diğer bir kural orantılı aralıklar kullanmaktır. Veriler eşit olmayan aralıklarla yerleştirildiğinde, zaman eksenindeki çentikler de aynı düzensizlikte olmalıdır. Aksi halde, grafiğin büyüme hızı bozulur. Aşağıdaki farklı bir örnekte, eşit olmayan aralıklı verilere eşit aralık bırakmanın yapay bir olgusu sayesinde büyüme eğilimi, “hokey sopası” gibi görünmek yerine doğrusal gibi görünmektedir.
Renk Kodlaması
Sosyal medya çağında renk, herhangi bir veri grafiğinin favori tamamlayıcısı haline gelmiştir. Renk uygulamasına rehberlik eden birkaç ana kural şu şekilde özetlenebilir:
- Renk sayısını sınırlayın ve Dona Wong’un The Wall Street Journal’ın Bilgi Grafikleri Rehberi’nde önerdiği gibi, “kuralları zarif bir şekilde kabul edin”.
- Aynı renk, aynı veri: Renk farklı veri farkını yansıtmalıdır. Bu kural renklerin rastgele atanmasını devre dışı bırakmaktadır.
- Belirli renk çiftleri anlam yüklü olduklarından onları dikkatli kullanın. İş dünyasında siyah pozitif, kırmızı negatif bir anlam taşır ama bazı kültürlerde siyah şanssızlığı simgelerken kırmızı şansı sembolize eder. Isı haritalarında kırmızı sıcak ve mavi soğukken, ABD siyasetinde kırmızı-mavi renk çifti iki büyük siyasi partiyi ifade eder. Başlangıçta da belirttiğim gibi kurallar bazen çatışabilir.
- Birçok yazar, örneğin gri tonlamalı bir sürümü inceleyerek grafikleri renk körü okuyuculara uygun hale getirmenizi önermektedir.
13 ülkedeki emeklilik yaşlarını gösteren çubuk grafiğimizin iki varyasyonuna bakalım. Soldakinde, çubuklara kural b’den farklı olarak anlamsız renkler atanmış. Okuyucunun kafası bu yanlış işaret ile karışır ve okuyucu renk düzeninin arkasındaki verileri verimsiz bir şekilde arar. Sağdaki tasarımda ise her çubuk için farklı bir renk kullanılması kural a’ya uymamaktadır. Burada, renk paleti dikkat dağıtıcı hale gelir ve kişinin anlama hızını azaltır.
İkinci örneğin iki grafiği, emeklilik yaşlarındaki aralıkları çizen çubuk grafikten türetilmiştir. Tasarımcının tercihine göre, pozitif bir aralık, etkili emeklilik yaşının resmi emeklilik yaşını aştığı anlamına gelir. Tasarımcı soldaki grafikte, pozitif aralıklara yeşil, negatif aralıklara kırmızı uygulamıştır. Kural d, kırmızı-yeşil renk körü bir okuyucu renkler arasında ayrım yapamayacağından kırmızı ve yeşil tonlarının aynı anda kullanılmaması gerektiğinin altını çizmektedir. Sağdaki grafik, kırmızıda pozitif ve siyahta negatif aralıkları kodlamaktadır. Bu renk seçimi, özellikle iş dünyasında popüler olan ve negatif sayılar için kırmızı kullanma kuralı nedeniyle kafa karıştırıcıdır.
Kılavuzlara ilişkin kurallar
Grafik tasarımcıları, kavramayı hızını artırmak amacıyla lejantlar, eksenler, ızgara çizgileri ve etiketler gibi kılavuzlar eklemektedirler. Edward Tufte ve diğer uzmanların belirttiği gibi, bu tür kılavuzlar iyi bir şekilde hazırlanmadığında bazen geri tepebilir. Bunun için çok sayıda kural geliştirilmiştir.
Eksen
Eksenler kanonik yönlere sahiptir. Dikey eksende daha büyük değerler, daha küçük değerlerin üzerine yerleştirilirken, yatay eksende büyük değerler, kendilerinden küçük değerlerin sağına yerleştirilir (Sağdan sola okuyan ülkeler hariç). Bu kuralların çiğnenmesi oldukça saçma grafiklerle sonuçlanmaktadır.
Reuters, 2014 yılında aşağıdaki grafiği yayınlayınca, veri görselleştirme toplulukları arasında hemen bir tweet fırtınası başladı.
Bu meşru müdafa yasasının silahlı şiddeti daha da kötüleştirmesi bekleniyordu fakat grafiğe göre 2005 yılında yürürlüğe giren yasa sayesinde silahlı şiddet aşağı yönlü bir eğitim gösterdi. Grafikteki dikey eksenin yanlış konumlandığını fark ettikten sonra okuyucular silahlı şiddetin azalmadığının farkına vardılar. Bir profesör bundan şöyle bahsetti: “O kadar fazla yanıltıcı ki, gözlerimi buna maruz bıraktığım için kendimden nefret ediyorum”. Bu yoğun eleştirel tweet dalgası, zorlayıcı bir neden olmadığı sürece tasarımcıların niçin kurallara uyması gerektiğini gösterdi.
Bir zaman söz konusuysa, kural zamanı yatay eksene yerleştirmektir. Dağılım grafiğinde, sonuç değişkeni dikey eksene, açıklayıcı değişken yatay eksene kodlanmalıdır.
Diğer konuşulmayan iki kural ise eksenlerin tasarımı hakkındadır. Çizim yüzeyindeki aşırı beyaz boşluğu kaldırmak için makul limitler seçilir. İşaretler kolayca yorumlanabilir artışlara ve değerlere düşmelidir; örneğin [2, 22, 42, 62, …, 122] gibi ya da daha kötüsü [2.3, 42.3, 62.3, …, 122.3] gibi bir dizi yerine [0, 20, 40, 60, …, 120] dizisi tercih edilmelidir.
Aşağıdaki iki grafik eksen etiketleri hariç birbirinin aynısıdır. İkisi de 2017’den beri Avustralya’ya giden Çinli turistlerin Yeni Zelanda’dan daha fazla olduğunu göstermektedir. İkinci örnekteki oldukça ayrıntılı etiketlerin kavranması daha zordur.
Lejantlar
Neredeyse tüm grafikler lejant içermektedir. Kullanılan renklerin açıklamaları çizgi, çubuk, pasta grafiklerde ve daha fazlasında mutlaka bulunur. Lejantlar için ilk kural, doğrudan etiket kullanmak mümkün olduğunda bir gösterge kullanmamaktır.
Çizgi grafiklerde, etiketleri bir gösterge kutusunun içine koymak değil de çizgilerin yanına yerleştirmek tercih edilir. Lejanttaki renklerin, grafiğin kendisindeki renklerle bire bir aynı olması gerektiğini ve görünüş sırasının grafiktekini takip etmesi gerektiğini söylemeye gerek yok. Excel gibi popüler yazılımlar, öğeler genellikle ana grafikte göründüğü için açıklama kutusunun içindeki ters sırayı göstererek bu kuralı ihlal etmektedir.
Avustralya’yı ziyaret eden Çinli turistlerin göz kamaştırıcı yükselişini içeren bu grafiklerde; çizgi etiketleri, en son yıl olan 2018’de turist sayımlarının sıralamasını takip ediyor. Birinci örnek, doğrudan etiketleme ile kafa karıştıran miktarı, çizgiyle lejant başlığını birleştirmek için azaltır.
Bir gösterge kutusu koymak kaçınılmazsa, çubuk veya sütun grafikler için kural, okuyucular grafiği yorumlayabilmek için bilgilere güvendiklerinden, başlıkları ana başlığın altına grafiğin üzerine yerleştirmektir. Kategorilerin sırası verilerin yönünü yansıtmalıdır.
National Post, biri üçüncü örnekte yeniden üretilen bir dizi eşleştirilmiş sütun grafikte göçmenlere yönelik tutum anketinin sonuçlarını ortaya koymuştur. Bu tablolar, “kabul ediyorum” cevabını veren katılımcıların oranını renklendirerek ülkeleri sıralamıştır ve ülke isimlerini grafik başlığının altına yerleştirmiştir. Buna karışık dördüncü örnekte ülkeler alfabetik sıraya göre verilmiştir ve kavrayışı son derece güçleştiren sağa yaslı bir lejant kullanılmıştır.
Bu durumdan çıkarılacak bir kural da lejantları grafik başlığına veya alt başlığa yerleştirmektir. Avustralya’nın turizm verilerinin grafiğe uygulandığı beşinci örnekteki renkli metin, okuyucunun dikkatini Çin ve Yeni Zelanda’nın kilit ülkeler olduğuna çekiyor. Altıncı örnekteyse okuyucuyu grafik başlığına ve etiketlere bağlamak biraz daha fazla çaba gerektirecektir.
Düzen
Bir grafik üzerinde öğelerin nasıl sıralandığı okuyucunun kavrayışı üzerinde büyük bir etkiye sahiptir. Yazılımlarda genellikle alfabetik sıra tercih edilmesine rağmen, bu nadiren doğru bir seçimdir. Visual Revelations’ın ve veri görselleştirme ile ilgili diğer birçok kitabın yazarı Howard Wainer, bununla “Önce Alabama!” diyerek alay etmektedir. (Alabama alfabetik sıraya göre ABD’nin ilk eyaletidir) Ancak kural, doğal düzenin kullanılmasını gerektirmektedir. Zaman değişkenleri, yaş grupları, gelir grupları, eğitim düzeyleri vb. doğal düzene tabidir.
Araştırmacı Stephen Follows tarafından derlenen birinci örnek Birleşik Krallık’taki yaş gruplarındaki suç filmlerinin göreli popülerliğini göstermektedir. Yaş grupları, en küçüğünden en büyüğüne kadar doğal düzende sunulur. İkinci örnekte görüldüğü gibi, gözlerimiz diziyi yeniden oluşturmak için oradan oraya atladığından, değere göre sıralama doğal sıralamaya tabi verilerle iyi şekilde sonuç vermemektedir.
Bir grafik paneli oluştururken, geçerli olan kural diğer tüm grafiklerde aynı değer sırasını korumaktır. Daha önce atıfta bulunulan National Post’un göçe yönelik tutum çalışmasından alınan üçüncü örnekteki görseller, ülkelerin sırasını grafikten grafiğe değiştirmenin, okuyucunun iki anket sorusunun yanıtlarını karşılaştırma yeteneğini nasıl engellediğini göstermektedir.
Örnek dörtte gösterildiği gibi, panel boyunca ülkelerin sırasını sabitlemeliyiz. Ülkeler, ilk ifadeyi kabul eden katılımcıların oranının azalmasıyla soldan sağa doğru düzenlenmiştir.
Bilgi Notu
Kullanılan metin, görsel deneyimi az miktarda da olsa tamamlar. Birçok yazar bilgilendirici grafik başlıkları kullanmanızı önermektedir. Tasarımcı, genellikle grafik yazılımı tarafından atanan ve eksen başlıklarının birleştirilmesinden oluşan grafik başlıklarını değiştirmelidir. Bir başka kural ise tüm kısaltmaları ve jargonu açıklamaktır. Ayrıca, bir altbilgiye veri kaynaklarının dahil edilmesi de alışılagelmiş bir şeydir.
Verileri etiketlerken uyulması gereken bir kural, hikayenin önemli parçaları olan öğeleri etiketlemektir. Her şeyin etiketlenmesi gerekmez. Aslında etiketelerin temel görevi, okuyuculara en önemli öğeler hakkında birtakım ipuçları vermektir. Birinci örnek, ülke etiketlerinin tamamı ile sağlık harcamalarının etkinliğini inceleyen daha önceki bir çizelgeyi yeniden sunmaktadır. Okuyucunun dikkati çok fazla etiket yüzünden bölünmektedir.
Kurallar ne zaman yok sayılmalıdır?
Bir kural, çok sayıda uygulayıcı bir tasarım öğesinin akıllılığı konusunda hemfikir olduğunda ortaya çıkmaktadır. Bazı kurallar, popülerleşmeleri için yeterli ya da gerekli görülmeyen bilimsel deneylerle desteklenen bilişsel gerekçelere sahiptir. Araştırmacılar Bill Cleveland ve Robert Kosara bu çalışmalardan bazılarını gerçekleştirdiler. Ama neredeyse her kuralın bir istisnası bulunmaktadır. Benim tavsiyem: Bir kuralı çiğnemeden önce iki kere düşünün, ancak çok gerekliyse hiç düşünmeyin!
Bir kuralın kavraşıyı geliştirmek için haklı bir gerekçeyle çiğnendiği birçok grafik örneği ile karşılaştım. Bu uzun okumayı kural çiğnemenin ya da kuraldan sapmanın payını verdiğimiz bir örnekle bitireyim.
Amerikalılara 2018’den beri ABD dolarının Euro karşısında güçlendiğine dair bir şeyler söylemek için bir örnek kullandığınızı düşünün. Bir eğilim çizgisinin azaldığı görsel bu izlenimi güçlendirme mesajıyla çelişir. Döviz kuru, bir Euro başına ABD doları sayısı olarak ifade edildiğinden, bu sayı ne kadar düşük olursa, ABD doları o kadar güçlü demektir. Bu zoraki görsel için bir yara bandı ikinci örnekteki gibi ek açıklamalar koymaktır.
Böyle bir açıklama sadece okuyucunun çözmesi gereken bir bulmacanın çerçevesini belirler. Daha düşük bir çizgi neden daha güçlü bir ABD dolarına tekabül etmektedir?
Bu durumda tasarımcı, dikey ekseni ters çevirerek eksen kuralını da kırabilir. Üçüncü örnek, ekseni tersine döndürme (ve sonuç olarak etiketlerin çevrilmesi) haricinde ikinci örnekle aynıdır.
Bu etkiyi elde etmenin bir başka yolu, döviz kuru oranını ters çevirmek, yani bir ABD doları başına Euro sayısı olarak ifade etmektir. Bu çözüm, ABD Doları / Euro oranına bakmaya alışkın olan finansal topluluğu memnun etmeyecektir.
Sonuç
Görsel ortam çok sayıda ve çok boyutta bilgiyi büyük miktarda verimli bir şekilde aktarmak için biçilmiş kaftandır. Bu verimlilik, veri grafiklerinin üreticileri ve tüketicileri arasında dolaylı olarak paylaşılan bir dizi sözlü kurala dayanmaktadır. Bu uzun okumada, hem estetiği hem de grafik kılavuzlarını kapsayan bir dizi ana kuralı inceledik. Veri görselleştirme tasarımcıları, grafiklerini basitleştirmek ve gereksiz açıklamaları kaldırmak için bu kurallardan yararlanabilirler. Bu konuşulmayan kuralları tanımak, istenmeyen yanlış anlamaları önlemeye yardımcı olur. Tüm görsel tasarımlarda olduğu gibi, özel uygulamanıza ve kitlenize bağlı olarak, kurala karşı gelmek bazen kurtarıcı olabilir. Son olarak, Bir kuralı çiğnemeden önce iki kere düşünün, ancak çok gerekliyse hiç düşünmeyin!
Kuralların Özeti
Estetik Kuralları
Pasta Grafikler
- Makul sayıda dilim kullanın.
- Küçük kategorileri “Diğer” kategorisi altında toplayın.
- Dilimleri en büyükten en küçüğe doğru sıralayın
- Sıradan bağımsız olarak “Diğer” dilimini sıranın sonuna yerleştirin.
- İlk ve en büyük dilimi üst dikey yarıçapa göre konumlandırın.
- Dilimleri saat yönünde düzenleyin.
- Renkleri yalnızca veri kodlama amacıyla değiştirin.
Çubuk grafikler
- Eksenin başlangıç değeri sıfırdır.
Dağılım grafikleri
- Açıklayıcı değişkeni yatay eksene yerleştirin.
- Sonuç değişkenini dikey eksene yerleştirin.
- Bir regresyon çizgisi ekliyorsanız, mutlaka sonuç değişkenini atayın.
Zaman serisi grafikleri
- Zamanın alanını yatay eksende çizin.
- Zamanı soldan sağa doğru ilerletin.
- Zaman aralıkları eşit değilse, aynı şekilde aralıklar da eşit olmamalıdır.
Renk Kodlaması
- Toplam renk sayısını sınırlayın.
- Renk farkı veri farkını yansıtmalıdır.
- Bazı renk çiflerini dikkatli kullanın.
- Grafikleri renk körü okuyuculara uygun hale getirin.
Kılavuzlara ilişkin kurallar
Eksen
- Standart yönler kullanın (yani, bir değerin sağındaki değerler ondan daha büyük olmalı).
- Zaman yatay eksende gösterilir.
- Sonuç değişkeni dikey eksene yerleştirilir.
- Beyaz alanı doldurmak için sınır çizgilerini kullanın.
- İşaretler kolayca yorumlanabilir artışlara ve değerlere düşülmelidir.
Lejantlar
- Mümkünse doğrudan etiketler kullanın.
- Göstergedeki renkler, tablodaki renklere bire bir tekabül etmelidir.
- Göstergedeki renkler, grafikte göründükleri sırayla sunulmalıdır.
- Göstergeyi başlığın altına yerleştirin
- Göstergeyi grafik başlıklarına veya alt başlıklarına yerleştirin.
Düzen
- Değerleri mümkün olduğunca doğal sırayla yerleştirin.
- Bağlam tarafından gerekçelendirilmedikçe varsayılan alfabetik sıradan kaçının.
- Bir grafik panelindeki tüm alanlarda aynı sırayı koruyun.
Bilgi Notu
- Bilgilendirici grafik başlığı kullanın.
- Tüm kısaltmaları ve jargonu açıklayın
- Veri kaynağını alt bilgiye ekleyin
- Tüm öğeleri değil, yalnızca önemli olanları etiketleyin.
Ek Kaynaklar
Aşağıdaki kitaplar ve bloglar, yazıda açıklandığı gibi veri görselleştirme kuralları hakkında mükemmel kaynaklardır:
- Good Charts: The HBR Guide to Making Smarter, More Persuasive Data Visualizations
- How Charts Lie: Getting smarter about visual information
- The Elements of Graphing Data. Revised Edition
- Information Dashboard Design: Displaying data for at-a-glance monitoring
- Junk Charts
- Statistical Modeling, causal inference, and social science
- EagerEyes
- Elements of Graph Design
- Visualization Analysis & Design
- Creating More Effective Graphs
- Visual Revelations: Graphical Tales of Fate and Deception from Napoleon Bonaparte to Ross Perot
- The Wall Street Journal Guide to Information Graphics: The Dos and Don’ts of Presenting Data, Facts and Figures
Orjinal çeviri kaynağı: https://datajournalism.com/read/longreads/the-unspoken-rules-of-visualisation-and-when-to-break-them
Çeviri: Aydan Aloğlu
Voyd gönüllüsü-Yüksek Lisans Öğrencisi
Konuşulmayan veri görselleştirme kuralları (ve onları çiğnemek)