6 Aralık 2016 Salı

TANAGRA İLE VERİ MADENCİLİĞİ


Big Data kavramı birçok algımızı değiştirdi ve değiştirmeye devam ediyor. Olumlu anlamda değiştirdiği ve geliştirdiği kavramlardan birisi de Veri Madenciliği. Özellikle Big Data analitiği ile Veri Madenciliği analitiği arasındaki benzerlikler her iki alanı birden güçlendirmiş ve önemli hale getirmiştir. O nedenle eğer Big Data konusunu anlamak istiyorsak Veri Madenciliğini daha iyi anlamaya ihtiyacımız vardır.

Veri Madenciliği kavram olarak büyük hacimli veri içerisinde gizli kalmış fakat değerli olabilecek bilgi ve kuralların otomatik veya yarı otomatik yöntemlerle çıkarılması anlamında kullanılmaktadır. Belki Big Data ile bu anlamda en önemli fark Büyük Veri ile değil de Büyük Hacimli Veri ile çalışma farkı. Büyük veri ile Büyük hacimli veri arasında; donanımsal, yazılımsal ve içerik olarak farklar olmakla birlikte veriyi analiz anlamında derin ortaklıklar bulunuyor. 

Peki veri madenciliğini soyut bir kavram olmaktan çıkarıp onu somut hale getirmek için ne yapacağız? Bu sorunun cevabı veri madenciliği araçlarını kullanmak.

Veri madenciliği araçları STATISTICA DATA MINER'dan, SPSS Clementine ve SAS Miner uygulamasına hatta Weka, Orange, Rapid Miner ve diğer uygulamalara kadar geniş bir spektruma sahiptir. Bu araçlardan kimi çok yüksek ücretlere satıldığı gibi kimisi de hiçbir ücret istemez. Kimisi karmaşık bir yapıya sahip iken kimisi çok basit bir arabirime sahiptir. Kimisi öğrenmek için uzmanlık isterken kimisini öğrenmek oldukça kolaydır. İşte bu kriterler göz önüne alındığında; ücretsiz, kolay bir arabirime sahip ve oldukça düşük boyutlu bir dosya olarak yüklenebilen bir seçenek olarak karşımıza TANAGRA isimli yazılım çıkıyor. 

Kısa sürede veri madenciliği projeleri yapabilmek için yapılacak ilk işlem;

http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html adresinden uygulamayı indirmek olacak. 

Ardından; Veri Seçimi, Ön işlem, Veri Madenciliği Algoritması Kullanımı ve Sonuçlar şeklinde işlemler yapılacaktır. Sonraki yazılarda detaylı analizler paylaşılacaktır. 

Hidayet TAKCI

10 Mart 2016 Perşembe

YAPAY ZEKÂ



İnsanın en değerli özelliklerinden birisi sahip olduğu zekâsıdır. Bu sayede doğru ile yanlışı ayırt edebilir, olaylar arasında ilişkiler kurabilir, muhakeme yapabilir hatta mevcut bilgileri yardımıyla gelecek hakkında ve yaşanan gün hakkında yorumlar yapabilir, tahminlerde bulunabilir, olayları açıklamaya çalışır. Zekâ, bilgi depolama yeteneği ile değil depolanan bilgiler üzerine yorum çıkarma yeteneği ile ilgilidir. Güncel teknolojilerin de desteği ile insana has olan bu önemli yeteneğin bilgisayarlara kazandırılması fikri ortaya çıkmış ve bu fikir yapay zekâ şeklinde isimlendirilmiştir. 

Yapay zekâ, görme, örüntü tanıma, çıkarımlarda bulunma gibi bilgisayarlar için zor fakat insanlar için sıradan olan yetenekleri bilgisayarlara kazandırmaya çalışır. Popüler ve somut olması nedeniyle bizler yapay zekâyı en çok robotlarda görürüz. Arkasından iteklenen bir robotun düştükten sonra kendi çabasıyla yeniden ayağa kalkması yapay zekâda gelinen noktayı çok iyi göstermektedir. İlk olarak Alan Turing tarafından geliştirilen Turing makinesi ile testleri yapılan yapay zekâ bugün iyi bir noktada sayılabilir. Sayılabilir dememin nedeni mevcut robotlarda veya yapay zekâ sistemlerinde elde edilen zekânın ancak bir çocuğun zekâsı kadar işleri yapabilmesi nedeniyledir.


Konu neden önemlidir diye soracak olursak cevabı net ve belirgindir. Bazı sektörlerde insanların görev alması tehlikelidir ve maliyetlidir. Örneğin mayın temizleme görevinde askerin görev alması askerin şehit olması ile sonuçlanabilir. Hemen her yıl yaşadığımız maden çıkarma faaliyetlerinde insanların göçük altında can vermesi hepimizi derinden üzmektedir. Araçların test edilmesinde insan kullanımı tehlikelidir. Demir çelik sektöründe insanların çalıştırılması iş güvenliği anlamında problemlere gebedir. Dolayısıyla yapay zekâ sayesinde insan gibi davranan robotlar geliştirebilirsek en azından bazı alanlarda insanı başına gelebilecek felaketlerden koruyabiliriz. Sadece bu kadar mı değil tabi…

Her geçen gün daha da yaşlanan insanlığın bakım hizmetine olan ihtiyacı artmaktadır. Kişiler gençliklerinde çok iyi bilgisayar kullanabilseler dahi yaşlılıkta bu mümkün olamamaktadır. Bununla birlikte kişilerin ses yardımıyla yönetebildiği, kullanabildiği elektronik cihazlar yaşam kalitesini artırabilecektir. Bunun yolu da insanı anlayan bilgisayarlar geliştirebilmektedir. Dolayısıyla yapay zekânın bir kullanım alanı insan gibi davranan sistemler geliştirmek iken diğer kullanım alanı insanı anlayan sistemler geliştirebilmektir. Tam bu noktada karşımıza doğal dil işleme konusu çıkmaktadır. Doğal dil işleme çalışmalarındaki nihai hedef sesli komutlarla bilgisayarları/robotları emrimize amade edebilmektir. Her ne kadar duygudan yoksun bilgisayar sistemleri hayırlı evladın yerini tutmasa bile azalan hayırlı evlat oranı bu çözümleri gerekli kılmaktadır.

Yapay zeka teknolojisinin gelişmesi ben dahil olmak üzere birçok kişiyi haklı olarak ürküten bir durum. Bunun en önemli nedeni insan gibi düşünebilen sistemler meydana getirdiğinizde kontrolü eksik bırakılmış sistemler kontrolü ele geçirebilirler. Kimi zaman bilim kurgu filmlere konu olan durum bence çok da gerçeklikten uzak değildir. Bununla birlikte eğer bu konuda insanların geri dönülmez şekilde çabaları varsa biz de millet olarak bundan geri kalamayız. Eğer birileri kendi robot askerlerini üretecekse biz onlardan daha önce bu konuya yatırım yapmalıyız. Birileri savaşmak için robot yapıyorsa biz barışı tesis için bu işe girmeliyiz. Bu da ancak diğer teknolojilerde olduğu gibi millileşmek ile olabilir.

Hadi biraz da hayal kuralım. İnsan davranışına benzer robot dediğimize göre insan davranışlarını ele alarak gidelim. İnsan davranışına etki eden önemli konulardan birisi din ve ahlaktır. İnsan özellikleri gösterecek robotlara eğer biz onları kötülük yapmaktan sakındıracak özellikler veremezsek bir gün de döner ve bize zarar vermeye başlar. Eğer geliştireceğimiz robotlara kendini savunma yetenekleri vermezsek hayali bir robotlar savaşında robotlarımız savaşa başlamadan yenilecektir. Dolayısıyla şu an hayal olmakla birlikte eğer gelecekte robot teknolojisi daha ileri noktalara varacaksa bu olasılıklar baştan planlanmalıdır.

Konuyu sadece robotlara bağlamak diğer alanlara haksızlık olacaktır. Bu nedenle biraz da diğer yapay zekâ alanlarına bakalım. Örneğin veri madenciliği. Adı bile güzel ve manidardır. Daha az değerli olan sıradan veri içerisinden bir madenci sabrı ile çok daha değerli fakat az olanı bulmaya odaklanır. Herkes onu meşhur Pazar sepeti analizi ile hatırlar. Pazar sepeti analizi bilmeyenlere kısaca özetlemek gerekirse; önce geçmişte yapılan alışveriş sepetleri kayıt altına alınarak daha sonra ürünlerden birini alan müşteriye diğeri de tavsiye edilir. Geri plandaki motivasyon şudur: eğer insanlar her zaman A ile B ürünlerini birlikte alıyorsa A ürününü alana B ürünü reklamı yapılmalıdır. Sanal ortamda yapılan reklamların ve önerilerin birçoğu bu mantıkla yapılır. Çok fazla bilinmemekle birlikte aslında DNA testi olarak da bildiğimiz babalık testi yine bir veri madenciliği görevidir. Kanser erken teşhisi, kredi verme kararı, gelecekle ilgili tahminler kestirimler yapma hep bu alanla ilgilidir. Son dönemde oldukça başarılı olan hava tahminleri yine bu alanın iyi bir örneğidir. Çağın projesi olan GENOM projesi de bir yönüyle veri madenciliği projesidir.

Her bir yanımızı çepçevre sarmalamış olan yapay zekâya bir bakış yapmak istediğimiz bu yazıyı bitirirken herkese önemle tavsiye edeceğim bir şey var. Yapay zekâ alanında çalışmalar yapmak zorunda değilsiniz ama konu hakkında mutlaka araştırmalar yapınız derim.

Saygılarımla
Yrd. Doç. Dr. Hidayet Takcı
C.Ü. Bilgisayar Müh. Böl. Öğretim Üyesi
Sivas, 2016    

     

  

VERİ BİLİMCİSİ - DATA SCIENTIST