Big Data

Bir önceki yazıda artan datanın işlenmesindeki performansı yüzünde popülerleşen Teradatadan bahsetmiştim. Bu yazıda da verinin eskiye oranla daha büyük bir ivmeyle artışını ve bu artış sebebiyle ortaya çıkmış olan bir kavramdan, big datadan bahsedeceğin. Türkçeye “Büyük Veri” olarak çevrilen bu ifade, özellikle sosyal medya ve benzeri ortamların ortaya çıkmasıyla günden güne artan ve büyük miktarda yer kaplayan, haliyle işlenmesi zorlaşan veriye karşılık gelmektedir. Bir önceki yazıda değindiğim üzre Teradata, bu verinin işlenmesinde çok iyi bir performans sergiliyor.

Günden güne artan bilgi sebebiyle veri tabanları “bilgi çöplüğü” halini almaya başlamıştır. Sürekli artan data sebebiyle sürekli data silinmesi veya kapasitenin arttırılması gibi çözümler akla geliyor. Bu ihtiyaçlara binaen yapılan Ar-Ge çalışmaları neticesinde Big Data kavramı ortaya çıkmıştır. Big Data; sosyal medyadan, fotoğraf,video, oyun, log dosyaları, ağ dataları vb. değişik ortamlardan toplanan verinin anlaşılır bir şekilde işlenmesiyle elde edilen veridir. Bu dataların çoğunluğu ilişkisel olmayan veri yığınıdır. Bu sebeple ilişkisel veri tabanlarında tutulması zordur.  Eskiden olsa bu veriler değersiz olduğu için gözardı edilebilirdi. Ancak günümüzde her bilginin değerli olduğu ve ufacık bir bilgiyle –kişisel bazda baktığımızda-bir kişinin eğilimlerine –sektörel- şirketten beklentilerine dair önemli sonuçlar çıkarabileceğimizi görüyoruz. Büyük Veri; internet gezdiğimiz yerlerin logları, internet istatistiklerimizi, blogları, GSM operatörleri yağtığımız alışverişleri, sosyal medya paylaşımları vb. ortamlardan elde edilen büyük kapasitedeki bilgiden oluşur. Bu bilgileri doğru analiz metotları ile yorumlandığında şirketin vizyonuna yön verebilir, pazarlama stratejilerinin gözden geçirilmesine sebep olabilir.  Ar-Ge’de kullanılarak Büyük Veri’den nasıl yararlanılacağı üzerine çalışmalar yapılabilir.

Word Cloud "Big Data"Platformlardan toplanan veriler geleneksel veritabanlarının işleyemeceği büyüklükte olduğu gibi geleneksel yapıda artan verinin büyüme hızını barındırabilecek bir veri depolama ünitesi de yoktur. Bu çapta büyük veriyi işleme, transfer etme gibi işlerin tümüne Büyük veri (Big Data) denilmektedir. İlişkisel VT’larında GB seviyesinde veri tutalabiliyorken, Big Data ile PB(PetaByte) seviyesinde veri saklanabiliyor.  Ancak Big Data  Batch işlemleri için uygundur. Transaction işlemleri için ilişkisel veritabanları uygun olacaktır. Big Data’da batch ile işlem bir defa işlenip özet hale getirildikten sonra okunması çok kısa süre alacaktır. Teradata’da bahsettiğimiz konularla ne kadar da benzer :)

Büyük veri platformunun oluşumunda beş bileşen vardır.

Bunlar 5V olarak kısaltabileceğimiz Variety(Çeşitlilik), Velocity(Hız), Volume(Veri Büyüklüğü), Verification(Doğrulama) ve Value(Değer) ‘dir.

  • Variety (Çeşitlilik): Üretilen veri farklı ortamlardan farklı dillerle farklı şekillerde bir araya getirilmiş olabilir.
  •  Velocity (Hız): Big Data’da verinin işlenip üretimi çok hızlıdır.
  •  Volume (Veri Büyüklüğü): Günden güne artan ve geometrik bir artışla katlanan verinin büyüklüğü Big Data için önemli bir bileşendir. 2010’lu yıllarda dünyadaki toplam bilişim harcamaları yılda %5 artmakta, ancak üretine veri miktarı %40 artmaktadır.
  • Verification (Doğrulama): Elde edilen verinin doğruluğu, doğrulanabilir olması Big Data’nın kendi içerisinde algoritması açısından önemli bir bileşendir.
  • Value (Değer): Veri işlendikten sonra en önemli hususlardan birisi bu verinin değeri. İşe yarar bir verinin şirket veya kişinin kullanımı için oluşturulan verinin değeri önemlidir.

 Büyük Verinin Uygulandığı Örnekler

Son dönemlerde işletmeler; kişiye özel hizmet için müşterilerini daha iyi tanıyıp, onlara “bireyselleştirilmiş – kişiye özel” hizmetleri sunabilmek için onlarla ilgili çok sayıda bireysel bilgiyi saklıyor.

  • Hastaneler; hastalarına yönelik etkili, bireysel, kişiselleştirilmiş, tıbbi hizmetler sunabilmek için, bireysel bazdaki verileri kendi sayısal ortamlarında depolamaktalar.
  • Hükümetler; yurttaşlarına yönelik bilgi ve hizmetleri işleyip, saklama konusunda oluşan çok büyük ölçekli veri ile çalışmak zorundadırlar. Örneğin, RTÜK kararları gereği, ülkemizdeki televizyon kanallarının son bir yıllık yayınlarını saklama zorunluluğu var. Saklanacak bilgiler, “Büyük Veri” olarak tanımladığımız türden.
  • İnternet üzerindeki üretici ve tüketicilerin veri üretimini hızlandırması, başta servis sağlayıcı firmalara olmak üzere, büyüyen bilgiyi harmanlayıp, anlamlı biçime dönüştürerek kullanıma yeniden sunma görevi yüklüyor.
  • Bankalar, müşterileriyle ilgili olarak toplayıp sakladıkları bilgiler yoluyla, kullanıcısını tanıyan, internet şubesine o gün ne için girdiğini bilen ve buna göre ana sayfayı, menüyü en etkin hale getiren, müşterisine hatırlatmalar yapan, özelleştirilebilir arayüzler sunan, zengin içerikli, hızlı ve kullanışlı bir 7/24 şube haline geldi.
  • Enerji firmaları, akıllı şebeke ve sayaçlar kullanarak, abonelerinin bireysel kullanımlarıyla ilgili oluşan verileri, saklayıp, işlemek durumundalar.
  • İlaç sanayisinde; örneğin “kanser araştırmaları” için oluşturulan büyük genomik veritabanları, araştırmacıların sürekli erişimine açık olmak durumundadır.

Eskiden şirketlerin amacı belirli bir ürünü üretmek ve müşteriye ulaşımını sağlamaktı. Bu yıllarda ERP(Enterprise Resource Planning) sistemlerinin geliştirilmesiyle müşteri, dağıtım merkezi, tedarikçiler ve üretimi bir platformda toplanıp üretilen ürünün satılması amaçlanıyordu.Ancak bu anlayış “müşterim ne ister ?” sorusuyla yer değiştirdi. CRM sistemleri bu sebeple önemli bir hale gelmiştir., CRM (Customer Relationship Management-Müşteri ilişkileri Yönetimi)’in  amacı “Doğru ürün ya da hizmeti, doğru müşteriye, doğru fiyatla, doğru kanalda, doğru yerde ve zamanda sunmaktır.“ Yani artık ürüne göre müşteri değil, müşteriye göre ürün devri başlamıştır.

Kaynaklar : http://tr.wikipedia.org/wiki/Ana_Sayfa

Leave a Reply