İnternetteki veri akışı kullanılarak dünyanın iklim değişiklikleri, toplumsal hareketleri ve ekonomisi, finansal pazar verileri, sağlık kayıtları ve sosyal ağlardan elde edilen bilgileri semantik bir mantıkla derleyip, tahminler veya simülasyon yapmak teorik olarak mümkün. Bunun için ilk yapılması gereken online veritabanlarına ulaşmaktır.
İnternetteki açık kaynak veritabanları ile edilen verileri semantik teknolojiler yoluyla derleyerek muazzam bir canlı dünya simülasyonu elde edilebilir. 2010 Nisan ayında Avrupa Komisyonunda dünyadaki her türlü krizi, toplumsal sorun ve değişimleri ve sosyal patlamaları önceden tahmin edebilmeyi mümkün kılacak bir proje başlatılması konusu gündeme gelmişti. Tabii böyle bir canlı dünya simülasyonu elde edebilmek için çok iyi bilgisayarlar, sağlam bir algoritma modeli, iyi bir mühendislik desteği ve de tüm veri akışlarının yapıldığı veritabanlarına tam erişim sağlamak gerekir. Bu projenin gerçekleşmesinin önünde boğuşması gereken elbette bir yığın problem vardı. Muhtemelen böyle bir projeyi hayata geçirenler elde ettikleri hazineyi hiçbir şekilde başkalarıyla da paylaşmayacaklardır. Çünkü bunun inanılmaz bir avantaj sağlaması ve maddi getiri potansiyeli onu her türlü rakipten sakındırılması gereken bir proje haline getirecektir. Projenin kendisi bir yana, veri kaynakları olarak kullanılması düşünüle veritabanları gerçekten çok ilginç ve faydalı sitelerden oluşuyor. Sizler için bu veritabanlarını bir araya getirdik:
İnternet ve Tarihsel Enstantaneler
- Internet Archive / Wayback machine
İnternet arşivi ve geri dönüş makinesi araştırmacılar, tarihçiler ve öğrenciler için dijital ortamda yazı, ses, resim ve program arşivi sunmakta olan ve 1996’dan bu yana bu işi yapan kaynak bir sitedir. - Wikipedia
Wikipedia, hepimizin çok aşina olduğu gibi internetin elle müdahaleye de izin veren en geniş kütüphanesidir. Dışarıdan müdahaleye çok açık olduğundan dolayı içindeki bazı bilgileri ve verileri sıkı bir kontrolden geçirmekte her zaman fayda var. - World Digital Library
Dijital dünya kütüphanesidir. Dünya üzerinde kültürler ve toplumlar hakkında bilgiler sağlayan çok yararlı bir kaynaktır. - Freebase
12 milyondan fazla kategorik olarak düzenlenmiş verinin sunulduğu muazzam bir depodur. Aklınıza gelebilecek her türlü konuda birleştirilmiş, aralarında bağlamsal ilişkiler bulunanlar sunan milyonlarca bilginin olduğu açık kaynak bir veritabanıdır.
Web’de Veri Madenciliği
- Google Trends
Google’da zamanla aranan anahtar kelimelerin görsel istatistiklerini ve karşılaştırmalarını sunan bir trend analizi aracıdır. - Google Correlate
Gerçek dünya trendlerine uyumlu arama modellerini bulan ilginç araçtır. - Google Flu Trends
Google’un dünya üzerindeki grip trendlerini gözlemlemeyi sağlayan ilginç bir araç. - We Feel Fine
Milyonlarca insanın duygularını bloglardan ve sosyal ağlardan toplayan bir veritabanıdır. - CyberEmotions
The CyberEmotions, BBC’nin forum sayfalarından toplanan 2,594,745 yorum, Digg sosyal imleme sitesindeki 1,646,153 yorumdan ve MySpace sayfalarıdaki yorumlardan derlenen bir duygu durum değerlendirme projesidir. - Linked Data
Linked Data, internetteki daha önceden ilişkilendirilmemiş verileri çeşitli araçlat yoluyla bağlamak ve bu yolla anlamlandırmak için geliştirilmiş bir sitedir. içinde çeşitli yollar, araçlar, programlar ve yardımcı kaynaklar var.
Çatışma ve Savaş Verileri
- CSCW Data on Armed Conflict
1946’dan günümüze dünya üzerinde yaşanmış tüm silahlı çatışmalar ve savaşların verilerinin tutulduğu bir veritabanı. - WarViews
Çatışmaları ve savaşları coğrafi bilgi sistemi kullanarak gösteren bir projedir. - Uppsala Conflict Data Program (UCDP).
- ACLED
Silahlı çatışmaların konum ve olay veri setlerini sunan, ülke ülke kodlama yapılan ve 1997’den 2016’ya kadarki olayları sunan bir veritabanıdır. - CERAC
Çatışma, çarpışma ve savaş analizi kaynağıdır. Politik ve siyasi veriler de sunuyor. - The Cross-National Time-Series Data Archive
1815’ten günümüze çok geniş bir alanda yaşanmış olayların sunulduğu oldukça muazzam bir veritabanıdır.
Ekonomik ve Finansal Veriler
- Bloomberg
Uluslararası gerçek-zamanlı finans verileri sağlayan bir sitedir. - Maddison Data
Ekonomik büyüme, gelişme, kalkınma ve nüfus verilerini tarihsel istatistiklere bağlı olarak gösteren yararlı bir kaynak. - The UNCTAD Handbook of Statistics on-line
Birleşmiş Milletler’in ticaret ve kalkınma üzerine 1950’den bu yana tuttuğu verilerin bulunduğu bir kaynaktır. - OECD Statistics Portal
OECD ülkeleri hakkında ekonomik ve demografik istatistiklerin sunulduğu faydalı bir portal. - EUROSTAT
Avrupa Birliği ülkeleri ve aday ülkeler hakkında çok çeşitli istatistiklerin sunulduğu güzel bir kaynak. - Eurobilltracker
Euro takip sitesi.
Bilimsel İşbirliği Verileri
- Web of Science
7500 bilimsel yayın ve makalenin yanı sıra binlerce kaynaktan yazı, içerik, yayın vb verilerin toplandığı muazzam bir kaynaktır. Her yerden ulaşılamamaktadır. Kurum veya enstitü üyeliği gerektirmektedir. - Google Scholar
Google’ın akademik arama motorudur. - Scopus
5000’den fazla yayın ve 18000’den fazla makaleyi kapsayan, edebiyat araştırmalarına yönelik atıf ve özetlerin yer aldığı çok kaliteli bir kaynaktır. - Living Science
Sosyal Bilimler
- ICPSR of the University of Michigan
Bütü disiplinlerde 500,000’den fazla dijital dosyayı bünyesinde barından oldukça harika bir araştırma sitesidir. - UK Data Center of the University of Essex
ıngiltere’nin en büyük sosyal ve beşeri bilimler veritabanıdır. - Berkeley’s UC DATA Archive
Politik, sosyal ve sağlık alanındaki bilimlere ait verilerin tutulduğu Berkeley Üniversitesinin veri deposudur. - The Economic and Social Data Service (ESDS)
Economik ve sosyal veri servisidir. Çok geniş bir alanda anahtar verilerin yanı sıra istatistiki veriler sunuyor. - CESSDA
Ekonomik ve sosyal anketlerin yanı sıra seçim çalışmaları ve kamuoyu anketleri sunan ilginç bir kaynaktır. - Gapminder Data
Birçok konudaki istatistikleri ve verileri incelenebilir hale getirip genel kullanıma sunan popüler bir uygulamadır. Tonlarca veri kümesi ve sosyo-ekonomik bilgiyi ücretsiz sunuyor. - World Value Survey
Dünya değerleri anketi de diyebileceğimi site dünya üzerindeki kültürler, değerler ve değişimlerin verilerini ve bu konudaki anket çalışmalarını sunan çok yararlı bir kaynaktır.
Sağlık ve Hastalık Verileri
- HealthMap
Salgın ve bulaşıcı hastalıkları küresel düzeyde takip edebileceğiniz bir online harita ve bilgi servisidir. - CDC (Centers for Disease Control and Prevention)
Bulaşıcı hastalıklar hakkında bilgiler - European Centre for Disease Prevention and Control
Bulaşıcı hastalıklar hakkında bilgiler
Açık Haritalar
- Google Maps
Dünyaca meşhur Google Maps servisi. - OpenStreetMap
OpenStreetMap, tüm dünyanın online wiki haritası. Siteye üye olarak haritalar üzerinde oynama yapabilir ve kendinize özel harita üretebiliyorsunuz. - Wikimapia
İnsanlar tarafından düzenlebilen bir online açık harita. - HERE WeGo
Diğer Açık Veri Teşebbüsleri
- Data.gov
Araştırmacılar için oldukça geniş bir alanda Amerika’a ait açık veriler sunan bir portaldir. - Data.gov.uk
Araştırmacılar için oldukça geniş bir alanda İngiltere’ye ait açık veriler sunan bir portaldir. - Guardian Data Blog
Veri gazeteciliği teşebbüsüne ait Guardian tarafından yayınlanan bir açık veri görselleştirme ve paylaşma sitesidir. Çok ilginç istatistikleri oldukça iyi bir şekilde görsel hale getiriyorlar. - Google Public Data
Google’ın dünyadaki sosyo-ekonomik göstergelere ve sağlayacılara bağlı olarak elde ettiği açık verileri görsel hale getirdiği çok yararlı bir sitedir. - Common Crawl
2010 yılından bu yana 40’tan fazla dilde yazılmış milyarlarca web sayfası ile trilyonlarca linkin ham, metadata ve metin verisi olarak ücretsiz bir şekilde sunulduğu muazzam bir veritabanıdır.
Kaynak: http://www.esiber.com/teknoloji/internetin-acik-kaynak-veritabanlari/