6 Aralık 2016 Salı

TANAGRA İLE VERİ MADENCİLİĞİ


Big Data kavramı birçok algımızı değiştirdi ve değiştirmeye devam ediyor. Olumlu anlamda değiştirdiği ve geliştirdiği kavramlardan birisi de Veri Madenciliği. Özellikle Big Data analitiği ile Veri Madenciliği analitiği arasındaki benzerlikler her iki alanı birden güçlendirmiş ve önemli hale getirmiştir. O nedenle eğer Big Data konusunu anlamak istiyorsak Veri Madenciliğini daha iyi anlamaya ihtiyacımız vardır.

Veri Madenciliği kavram olarak büyük hacimli veri içerisinde gizli kalmış fakat değerli olabilecek bilgi ve kuralların otomatik veya yarı otomatik yöntemlerle çıkarılması anlamında kullanılmaktadır. Belki Big Data ile bu anlamda en önemli fark Büyük Veri ile değil de Büyük Hacimli Veri ile çalışma farkı. Büyük veri ile Büyük hacimli veri arasında; donanımsal, yazılımsal ve içerik olarak farklar olmakla birlikte veriyi analiz anlamında derin ortaklıklar bulunuyor. 

Peki veri madenciliğini soyut bir kavram olmaktan çıkarıp onu somut hale getirmek için ne yapacağız? Bu sorunun cevabı veri madenciliği araçlarını kullanmak.

Veri madenciliği araçları STATISTICA DATA MINER'dan, SPSS Clementine ve SAS Miner uygulamasına hatta Weka, Orange, Rapid Miner ve diğer uygulamalara kadar geniş bir spektruma sahiptir. Bu araçlardan kimi çok yüksek ücretlere satıldığı gibi kimisi de hiçbir ücret istemez. Kimisi karmaşık bir yapıya sahip iken kimisi çok basit bir arabirime sahiptir. Kimisi öğrenmek için uzmanlık isterken kimisini öğrenmek oldukça kolaydır. İşte bu kriterler göz önüne alındığında; ücretsiz, kolay bir arabirime sahip ve oldukça düşük boyutlu bir dosya olarak yüklenebilen bir seçenek olarak karşımıza TANAGRA isimli yazılım çıkıyor. 

Kısa sürede veri madenciliği projeleri yapabilmek için yapılacak ilk işlem;

http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html adresinden uygulamayı indirmek olacak. 

Ardından; Veri Seçimi, Ön işlem, Veri Madenciliği Algoritması Kullanımı ve Sonuçlar şeklinde işlemler yapılacaktır. Sonraki yazılarda detaylı analizler paylaşılacaktır. 

Hidayet TAKCI

VERİ BİLİMCİSİ - DATA SCIENTIST