Gazeteciler İçin Veri Toplama Kılavuzu
Veri toplama teknolojileri programlama bilgisi ile daha pratik olur iken bu alanı hiç bilmeyen gazeteciler ya da programlamaya yeni başlayan gazeteciler için zor olabiliyor. Henüz kod öğrenmek gibi bir planınız yok ise aşağıda işinizi kolaylaştırabilecek ücretsiz ve açık kaynak araçları paylaşıyoruz.
Araçlar:
Firebug – Kazıp atmayı planladığınız web sitelerinden alınan parametrelerin ve dosyaların izlenmesi de dahil olmak üzere bir dizi faydalı geliştirme araçları ekleyen bir Firefox eklentisi.
Ruby – ProPublica’nın en çok kullandığı bir programlama dili.
Nokogiri – Web sayfalarından kazıma yapmak için gerekli olan bir Ruby kütüphanesi.
Tesseract – Taranmış metni “gerçek” ve yorumlanabilir metin haline getirmek için kullanışlı olan Google’ın optik karakter tanıma (OCR) aracı.
Adobe Acrobat – PDF’leri iyi yapılandırılmış HTML’ye dönüştürebilirsiniz (bazen).