Dağınık Veri Temizleme Aracı Open Refine’ın V3.0 Beta Sürümü Çıktı
Veri gazetecilerinin dağınık veri temizlemede sıklıkla kullandığı araç Open Refine yeni sitesi ile yayında. Site geçtiğimiz günlerde Beta sürümünü de duyurmuştu.
Veri Temizleme Aracı Open Refine’ın V3.0 Beta Sürümü Çıktı. Veriler kazındığında ya da bilgi edinmeden temin edildiğinde istenen yapıda ve kalitede olmayabiliyor. Boşluklar, satır ve sütunlar birbirine geçmiş olabiliyor, bazı hücreleri ayırmak gerekebiliyor.
Excel ile de veri temizlenip analiz edilebilir ancak Open Refine, Excel’den daha fazla fonksiyonu olan bir araç. Bu sebeple bu açık kaynak araç ile Open Refine’ı kullanarak dağınık veriyi temizleyebilirsiniz. Araç web tarayıcısında çalışır, açık kaynak bir araçtır.
V3.0 beta sürümünde açıklanan yeni özellikler şöyle:
Wikidata uzantısı
Veri paketi meta verileri
Etiket sistemi
Google Drive API’sı
OpenRefine Veritabanı Alma Uzantısı
Birleştirme işlevini ekle
“Facet by null” ve “Facet by empty string” uygulayın ve özelleştirilmiş facets menüsüne ekleyin
Özellik İsteği: SqlDump
JRDF’den JENA kütüphanesine geçiş
Veri tablosundaki hücrelerde göster / gizle boş değerleri arasında geçiş yapma seçeneği eklendi
Dahili tarih türünü birleştirin
OpenRefine logosunu güncelle
Http req başlıklarını ayarla
Bulma işlevi ekle
Bazı hata düzeltmeleri
Değişikliklerin tam listesine buradan ulaşabilirsiniz :
https://github.com/OpenRefine/OpenRefine/issues?q=is%3Aissue+milestone%3A3.0+is%3Aclosed