Big Data Nedir? Örnekleri Nelerdir?
Big Data terimi, çevrimiçi ve çevrimdışı olarak neredeyse gezegendeki her yerde giderek daha fazla kullanılan bir terimdir. Ve yalnızca bilgisayarlarla ilgili değildir. Big Data, bilgi teknolojisi adı verilen ve şu anda hemen hemen tüm diğer teknolojilerin, çalışma alanlarının ve iş alanlarının bir parçası sayılmaktadır.
Şirketinizin sunucularında yatan veriler, düne kadar sadece veri – sıralanmış ve dosyalanmıştı. Birdenbire, Big Data argo popüler oldu ve şimdi şirketinizdeki veriler Big Data olarak adlandırılmaya başlandı. Terim, kuruluşunuzun şimdiye kadar sakladığı her bir veri parçasını kapsar. Bulutlarda saklanan verileri ve hatta yer işareti koyduğunuz URL’leri içerir.
Kısacası, sunucularınızda bulunan tüm veriler (sınıflandırılmış olsun olmasın) toplu olarak Big Data olarak adlandırılır. Tüm bu veriler, farklı analiz türlerini kullanarak farklı sonuçlar elde etmek için kullanılabilir. Tüm analizlerin tüm verileri kullanması gerekli değildir. Farklı analiz, gerekli sonuçları ve öngörüleri üretmek için Big Data’nın farklı bölümlerini kullanır.
Big Data (Büyük Veriler)
Büyük veriler için sıradan veritabanlarında kullanılanlardan daha büyük ve karmaşık olan özel makinelere ihtiyaç duyulmaktadır. Bu tür veriler genellikle devlet ve bilim kuruluşlarında bulunur, ancak bazı çok büyük web sitelerinde de bu çok miktarda bilgi bulunur.
Veriler üç standartta, ancak katı boyutlarda değil. Küçük veriler tek bir bilgisayara veya bir dizüstü bilgisayar gibi makineye sığabilir. Orta veri bir disk dizisine sığabilir ve en iyi şekilde bir veritabanı tarafından yönetilir.
Büyük verilere ilişkin katı bir kılavuz bulunmamakla birlikte, genellikle terabayt (TB) seviyesinden başlar ve petabayt (PB) seviyesine kadar yükselir. Bu veri miktarı için uzmanlaşmamış bir veritabanında büyük verilerle çalışmaya çalışmak, önemli bazı sorunlara neden olacaktır. Veritabanı bilgi miktarını idare edemez, bu nedenle bazı veriler silinmelidir. Bu sadece 50 GB sabit disk alanlı bir bilgisayara 100 gigabayt (GB) sığdırmaya çalışmak gibidir ; yapılmaz. Geriye kalan veriler, hem kontrolü hem de yönetmek açısından beceriksiz olacak, çünkü herhangi bir işlevi tamamlamak uzun sürebilir ve veritabanı yeni gönderimler için kapatılmalıdır.
Makineleri satın almaya ve veritabanlarına yeni veri eklemeye devam etmek mümkün olsa da, bu da hantal bir sorunu ortaya çıkarmaktadır. Bunun nedeni, veritabanı yazılımının yalnızca orta verilerle çalışılmasıdır. Büyük veri kümeleri hatalara ve yönetim sorunlarına neden olur, çünkü yazılım büyük veri ile sorun yaşamadan hareket edemez veya çalışamaz.
Büyük veriler çoğu kuruluş veya web sitesi tarafından görülememektedir, düzenli olarak incelenmemektedir. Savunma ve askeri kuruluşlar, bu bilgiyi modeller oluşturmak ve test sonuçlarını depolamak için kullanır ve yabancı ülkede olan birçok büyük bilimsel kurum benzer nedenlerle bu özel makinelere ihtiyaç duyarlar. Bazı çok büyük web siteleri büyük veri makinelerine ihtiyaç duyar, ancak web siteleri bu pazarın ajansları kadar yaygın değildir. Bu kuruluşlar, gelecekteki verileri daha iyi analiz etmeye ve tahmin yapmaya yardımcı olduğu için, tüm verileri saklamalıdır.
Çeşitli Sektörlerden Canlı Big Data Örnekleri:
- Hava koşulları (sıcaklık, rüzgar hızı, nem, basınç), her saniyede alınan hava durumu izleme istasyonundan alınır.
- İnsan ve diğer genomların DNA dizilimi.
- Tüketici verileri (hangi ürünler, hangi fiyata ve hangi lokasyonda satılır) dünyanın her mağazasından.
- Her dakika, her sayaçtan, dünyadaki her bina ve evden enerji tüketimi.
Bunları da okumalısınız
GRAV Nedir?
7 Nisan 2023
Apdex nedir? APDEX Skoru Nasıl Hesaplanır?
23 Şubat 2023