19 Haziran 2011 Pazar

BİLGİNİN YOLCULUĞU

Veri madenciliği bir disiplin olarak nispeten yenidir fakat veri madenciliği görevlerinin tarihi oldukça eskilere dayanır. VERİ (data) à BİLGİ (information) à ANLAM (knowledge), ilk insandan bu yana bilinen ve kullanılan bir süreçtir. Önce olgulardan ve gerçeklerden veriler elde edilir, onlar tasnif edilerek gerekli ve gereksiz olanları ayırt edilir, her birine bir etiket verilerek bilgi haline getirilir ve ardından bu bilgilerden karar vermeye yardımcı sonuçlar çıkarılarak süreç tamamlanır. Yaşanan olaylar, olaylardan çıkarılan dersler ve bunu yorumlayan ozanlar, bilge dedeler aslında birer veri madenciliği aktörüdür. Ozanların, bilge dedelerin dillerindeki öğütler, aslında veri madenciliğine ait en önemli tarihi belgeler niteliğindedir. Bir sayısal alan olan veri madenciliği aynı zamanda sosyal problemler için de kullanılabilmiş ve toplumun bilgi birikiminin gelişmesine katkıda bulunmuştur.

Bir toplum için toplanan veriler veya doneler toplumun kültürünü nasıl oluşturmaktaysa toplumun nasıl hafızasını oluşturmakta ise bir kurum için toplanan ve işlenen veriler de o kurumun zekası olmaktadır. Kurumsal zeka denilen olay veri à bilgi à anlam üçlüsünün kuruma yansımasından başka bir şey değildir.

“Kelebek etkisi” olayını bilmeyen yoktur, bir bölgede sürü halinde aynı anda hareket eden kelebekler bir başka yerde fırtına meydana getirmektedir. Fiziksel bir olay başka bir yerde başka bir halde hissedilmekte ve dolayısıyla fiziksel olaylar arasında bir ilişki olduğu ortaya çıkmaktadır. Örnekleri çoğaltmak mümkündür, fiziksel olaylarda olduğu gibi sosyal olaylarda da etkileşim vardır. İlginç olan konu ise bu etkileşimlerin birçoğunun hala gizli olmasıdır.

Örneğin, evinde karınca besleyen bir bilim meraklısı depremleri önceden tespit ettiğini söylemektedir. Veri kaynağı karıncaların hareketleridir, veriyi ölçen ve işleyen karınca sahibi adamdır. Ardından karıncalardan edindiği bu bilgileri bir araya getirerek deprem ile ilgili bir tahminde bulunmaktadır. Bilinçli veya bilinçsiz olarak veriden anlama ulaşmış ve daha önemlisi belki tam tekniğine uygun olmasa bile veri madenciliği yapmıştır.

Dünyamızda hala gizli bulunan ve açığa çıkmayı bekleyen binlerce hatta milyonlarca bilgi ve kural bulunmaktadır. Bunların açığa çıkarılması ise veri madenciliği süreçleri ile mümkün olacaktır. Bu kitabı yazmaktaki amacımız ortaya çıkmayı bekleyen gizli bilgilerin bir an önce ortaya çıkmasına yardımcı olmak ve ayrıca veri okuryazarlığını artırmaktadır. Ham veriyi görerek kişilerin bu verilerle ne tip sonuçlar bulabileceğini anlaması bizim için yeterlidir. Çünkü veri madenciliği için en önemli başlangıç orasıdır. 

2 yorum:

  1. Güncel örneklerle besleyerek farklı yorumlar katmışsınız hocam veri madenciliği sürecine, daha bir okunası olmuş yazı.

    Data-information döngüsü konusuna izninizle aşağıdaki linkide eklemek isterim.

    http://www.cognitivecybernetics.com/PrimerFoU.html

    Kurumsal zeka yani business intelligence için ise şöyle bir tanım benim çok hoşuma gitmiştir "Data mining süreçlerinin kurumların daha hızlı ve doğru karar almaları için yöneylem araştırması disiplini altında yeniden yorumlanmasıdır"

    Paylaşımlarınız için teşekkürler, kitap geliyor anlaşılan yazınızdan okuduğum kadarı ile.

    YanıtlaSil
  2. Katkı için teşekkürler Ali, aslında bu yazıları yayınlamaktaki kasıtlardan biri de zaten sizin gibi değerli arkadaşlarımızın katkılarını da alabilmek.

    Kitap düşüncem var, inşallah er veya geç olacak...

    Sevgiler,

    YanıtlaSil

VERİ BİLİMCİSİ - DATA SCIENTIST