DataVeri

Dosya Formatlarına Genel Bir Bakış


1)JSON (Javascript Object Notation)
Basit bir dosya formatıdır, diğer programlama dillerine göre daha kolay okunur. JSON’un en büyük avantajı diğer formatlara (xml, html) göre daha kolay işlenebilir olmasıdır.

2) XML (Extensible Markup Language) (Genişletilebilir İşaretleme Dili)
Veri alışverişi için yaygın olarak kullanılan formattır. Hem insanlar hem de bilgi işlem sistemleri tarafından kolayca okunabilir. XML formatta verinin yapısı korunur. Geliştiricilere dosyayı okumadan yazma imkanı tanır.

3) RDF

RDF formatı birden fazla kaynaktan gelen veriyi tek bir formda birleştirme olanağı sağlar. RDF formatındaki veriler XML ve JSON içinde depolanabilir. RDF genelde url’leri tanımlayıcı olarak kullanır, bu da web üzerindeki açık devlet girişimlerine doğrudan ulaşım sağlar. RDF hala yaygın bir format olmasa da açık veri girişimleri (Britanya ve İspanya açık veri projeleri) tarafından kullanılmaktadır.

4) Spreadsheet (E-tablolar)

Spreadsheet interaktif bir bilgisayar uygulamasıdır. Bir çok organizasyon tablo formunda veri analizi yapmak ve depolama için Microsoft Excel gibi spreadsheet yazılımları kullanır. Bu formatta sütun(column) ve satırlar(row) yer alır. Belli bir noktada kesişen satır ve sütunlar hücreleri (cell) oluşturur. Her hücre numerik veya metin verisi taşır. Sütunlar satırlar arası ilişkiler, formüller ve grafikler aracılığıyla analiz edilir.

5) CSV (virgülle ayrılmış değerler /coma separeted files)

CSV formatı adı üstünde virgülle ayrılmış değerleri ifade eder, ayraç olarak virgül kullanılır. CSV diğer formatlara göre daha kompakt bir yapıdadır. Büyük verilerin transferi için uygundur, CSV formatındaki veri transfer edilirken verinin yapısı bozulmaz.

6) Metin Dosyası (Text Document)

Word, ODF ve PDF formatındaki dosyalardır, belirli verileri göstermek, depolamak için kullanılır. Metin dosyası formatında dosya yapısı tutarlı değildir. Eldeki veriyi sergilemek ve sunmak için ucuz maliyetli bir formattır. Bu formattaki dosyalardan verileri çekme diğer formatlara göre zordur. Özellikle pdf formatındaki veriler, veri analizi için interaktif bir yapıda değildir. Pdf’ten veriye erişmek ve analiz edilebilir duruma getirmek için ayrıca bir kazıma işlemi uygulanır.

7) Plain Text (Düz Metin)

Türkçe düz metin olarak kazandırılan formatın diğer metinlerden farkı sadece ve sadece metin içeriyor olmasıdır. Diğer metin formatları, kalın, italik harfler, hatta farklı harf fontları gibi düzenlemeler barındırabilir ama plain text formatındaki dosyada böyle bir şey söz konusu değildir. Bilgisayarlar tarafından hızlı okunabilen bir formattır. Düz metin dosyalarında genelde (.txt) uzantısı kullanılır.

8) Scanned İmage ( Taranmış Görsel)

Elektronik ortamda veri analizi yapmak ve transfer etmek için en az uygun olan veri formatıdır. Dosya TIFF veya JPEG gibi resim formatlarındadır. Bir anlamda dosyanın fotoğraf çekilmiş halidir. Bu tip dosyaları elektronik ortama aktarmak için OCR destekli yazılımlar kullanılmalıdır.

9) Proprietary formats (Tescilli Formatlar)

Bazı sistemler verilerini tescil haklarına sahip oldukları veri formatlarında saklayabilirler. Kendi verilerini bu formatlar aracılığıyla aktarır ve depolarlar. Veri ile uğraşan özel şirketler buna örnek verilebilir. Örneğin veri analizi ve görselleştirme aracı olan tableau kendi veri formatını kullanır.

10) HTML ( Hiper Metin İşaretleme Dili, Hypertext Markup Language)

HTML web sayfalarını oluşturmak için kullanılan standart metin işaretleme dilidir. Günümüzde veriler web formatında genelde html formatında kullanıyor. HTML formatı veriyi sergilemek için başlangıç noktası olabilir. Çünkü bu formatta veriler kolayca indirilebilir ve analiz edilebilir hale getirilebilir ve üstelik maliyeti ucuzdur. HTML dosya formatı genelde web tarayıcılar tarafından okunur. HTML web sayfa oluşturmak ve bu web sayfada yer alan multimedya içeriği birbirine bağlamak için kullanılır.

Kaynak:

Bu kaynaktan çevrilmiştir.

http://opendatahandbook.org/guide/en/appendices/file-formats/

4 thoughts on “Dosya Formatlarına Genel Bir Bakış

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*