Webhose.io: Yapılandırılmamış web içeriği, makine okunabilir veriye dönüştürür
Büyük veri üzerine çalışmalar yürüten Eran Levy tarafından geliştirilen Webhose.io, WWW ve dark web’i yapılandırılmış web veri beslemeleriyle analiz etmeyi sağlıyor. Yapılandırılmamış web içeriği, makine okunabilir veriye dönüştürüyor.
Araştırmacılar, veri bilimcileri ve veri gazetecileri, ağı yalnızca sunduğu toplam hizmetlerden daha fazlası olarak görebiliyorlar ve web’i veri madenciliği ve analizi için kullanılabilen önemli bir kaynak olarak da kullanıyorlar.
Bu düşünce yeterince mantıklı görünse de, aslında web’i analiz etmenin, herhangi bir analist için zor tarafları da var. Bunlardan en önemlileri, binlerce veya milyonlarca web sitesi arasında, genellikle yapılandırılmamış metin içeriği olarak dağıtılan verileri elde etmek.
Webhose.io ve diğer web veri sağlayıcılarının ciddi bir analiz gerçekleştirilmeden önce bu verilerin ayıklanması ve makinenin okunabilir formatına dönüştürülmesini sağlıyor.
Veriler, siteyi taramak, ilgili içeriği ele geçirmek ve daha sonra analitik analizler için çıkarılabilecek bir biçim ve veritabanına ayrıştırmak yoluyla web sitelerinden çıkarılır.
Web’i muazzam bir veri havuzu olarak analiz etmeye başlamak için ücretsiz Webhose.io hesabı oluşturabilirsiniz.