21 Temmuz 2012 Cumartesi

Kimlik Doğrulama Sistemleri ve Bir Öneri


Yazım Stili Biyometriği

Yrd. Doç. Dr. Hidayet Takcı

Sanal dünyanın en zor problemlerden birisi karşınızdaki kişinin iddia edilen kişi olup olmadığının anlaşılmasıdır. Karşınızdaki kişinin iddia edilen kişi olup olmadığının tespiti kimlik doğrulamanın konusudur. Bu konuda karşımıza çıkan en önemli üç yöntem; şifreler, akıllı kartlar ve biyometriklerdir. Bunlara ek olarak; açık anahtar kimlik doğrulama, sayısal imzalar, SSL (secure socket layers), IP-SEC, secure shell, kerberos gibi yöntemler de kullanılmaktadır fakat bu yöntemler daha çok güvenliğin yüksek seviyede önemli olduğu durumlarda kullanılır.

Yukarıda bahsedilen üç temel yöntemden şifreler bazı zafiyetlere sahiptir; saklanmaları zordur, ele geçirilme ihtimalleri vardır ve şifrelerin kırılması kolaydır [1]. Şifreleri güçlendirmek için tek kullanımlık şifreler üretilmiştir. Ayrıca şifreler şifrelenerek güvenlik artımına gidilmiştir. Akıllı kartlar yaygın kullanımı olan bir başka kimlik doğrulama yöntemidir. Ek bir donanıma ihtiyaç duyarlar, bu donanımların çalınma ve kaybolma ihtimalleri bu yöntemin en büyük dezavantajıdır. Üçüncü önemli kimlik doğrulama yöntemi biyometriklerdir. Biyometrik yöntemler başlangıçta; ses, yüz, iris ve imza gibi insanlar tarafından tanımlanabilir niteliklerden seçilmiştir fakat ilerleyen yıllarda damar örüntüleri, vücut ısısı ölçümü, hatta DNA şifresi gibi - insanlar tarafından tanımlanamayan - özelliklerden seçilmeye başlanmıştır [2]. Kaynağına göre biyometrikleri iki kategoride incelemek mümkündür. Bunlardan birincisi fizyolojik diğeri ise davranışsal biyometriklerdir. Yüz tarama, parmak izi, iris tarama ve hatta DNA testi, bunların tamamı fiziksel biyometriklerdir. Ses, imza, tuş vuruş analizi, yürüyüş stili ve buna benzer biyometrikler ise davranışsal biyometriklerdir.

Bu yöntemler bazı makalelerde üstünlük açısından karşılaştırılmıştır. Furnell ve arkadaşları [3] tarafından yapılan böylesi bir çalışmada; şifreler ve biyometrikler karşılaştırılmış ve bu araştırma sonucunda zayıflıklarına rağmen şifrelerin daha çok tercih edildiği görülmüştür. Bununla birlikte şifrelerin açıklıklarına karşı biyometriklerin bir araya getirilmesi ile daha iyi bir çözüm ortaya çıkacağı ifade edilmiştir. Australian TRUST [4] projesinde de kullanıcıların kimlik doğrulama yöntemi tercihi ile ilgili bir araştırma yapılmış ve tercih yine şifre kullanımından yana olmuştur. Kullanıcılar şifrelerden sonraki tercihleri; fizyolojik daha sonra da davranışsal biyometrikler olmuştur. Diğer araştırmalarda ise kimi yerde tuş vuruş analizi gibi davranışsal biyometriklerin diğerlerinden daha fazla tercih edildiği görülmektedir. Mobil cihazlar için kimlik doğrulamada biyometriklerin kullanımı üzerine Clarke ve Furnell [5] tarafından yapılan bir çalışmada özellikle tuş vuruş analizi üzerinde durulmuş ve ortalama %5 hatanın altında bir hata ile kimlik doğrulama yerine getirilmiştir. Makalede bütünleşik bir doğrulama mekanizmasında biyometrikler ile daha güvenli bir ortamın sağlanabileceği ifade edilmektedir. Yukarıda anılan çalışmalar ve bunlara benzer diğer çalışmalardan çıkan sonuç şudur; şifreler biyometriklerle desteklendiği takdirde başarılı çözümler ortaya çıkacaktır.

Kimlik doğrulama içerisinde biyometriklerin önemli bir yeri vardır. Bugüne kadar geliştirilen biyometrikler göz önüne alındığında yazınsal alana ait bir çalışmaya rastlanmamıştır. Yazım davranışı ile ilgili yapılmış çalışmalar daha çok tuş vuruş analizine benzer çalışmalardır. Kişilerin yazım karakteristiklerine dayalı bir biyometriğe rastlanmamıştır. Yazım karakteristiğinden kasıt kişilerin fiziksel olarak ne hızda yazdıkları değil daha çok ne içerikte yazdıkları ve yazım sonucunda nasıl bir metin ortaya çıktığı ile ilgilidir. Dolayısıyla, yazılı iletişimlerde kimlik doğrulama için şifrelere yardımcı olacak bir biyometriğe ihtiyaç vardır.  

Literatürde, şifreler ve biyometriklerin bütünleştirilmesinin başarı sağladığı görülmüştür. Yöntemimiz de güçlendirici olacaktır. Bu yeni biyometriği anlamak için öncelikle yazım stilinin ne olduğu ve nerelerde kullanıldığı konusuna bakılmalıdır.

Yazım Sitili veya Yazar Tanıma Çalışmaları
Yazım stili bir metnin yazarına bağlı olarak ortaya çıkan karakteristik özelliklerdir. Her yazarın kendine has bir yazım stili vardır. Yazım stillerinin en sık kullanıldığı alan yazar tanımadır. Konuyla ilgili dikkat çekici gelişmelerin geçmişi Mendenhall tarafından 19. yüzyılda yapılan çalışmalara kadar uzanır [6]. Bu çalışmaları 20. yüzyılın birinci yarısındaki Zipf ve Yule tarafından yapılan diğer çalışmalar [7.8.9] takip etmiştir. Ardından Federalist Papers olarak bilinen makaleler üzerinde Mosteller ve Wallace [10] tarafından önemli çalışmalar yapılmıştır. Stile dayalı yazar tanıma veya stil ölçümü çalışmaları 1990 sonlarına kadar devam etmiştir. Holmes [11,12] yazım stili olarak; cümle uzunluğu, kelime uzunluğu, kelime zenginliği, karakter frekansları ve sözlük zenginliğini sunmuştur. Rudman [13] yazım stilleri için yaklaşık 1000 civarında ölçüm önermiştir. 1990 sonrası yazar tanıma için ikinci perde olarak düşünülebilir. Özellikle elektronik veri miktarındaki artış araştırmacıları bilgi alma (IR), makine öğrenimi (ML) ve doğal dil işleme (NLP) tekniklerinden faydalanmaya yönlendirmiştir. Bu devrede yazar tanıma sadece yazınsal alanda değil aynı zamanda diğer alanlarda da kullanılmaya başlanmıştır. Yazar tanıma; mesajlaşmalara dayalı olarak teröristlerin tanınmasında [14], medeni hukuk ve özellikle de yayın hakkı konularında [15,16] elektronik postaların adli analizlerinde [17] v.s. kullanılmıştır.

Yazım stilleri için iki temel yöntem kelimelerin (özellikle fonksiyonel kelimeler) ve karakterlerin (karakter n-gramlar gibi) kullanımıdır. Kelime tabanlı çalışmalarda genellikle sözcüksel ölçümler kullanılır [18] ve bu işaretçilerin çıkarılması özellikle de Asya kökenli diller için hiçte kolay değildir. Kullanılan teknikler dile bağımlıdır [19]. Kelime tabanlı yöntemde fazladan özellikleri elemek için özellik seçimi yapmak gerekir fakat bu işlem kolay olmayan bir işlemdir, hangi özelliğin diğerinden daha önemli olduğunu tespit etmek zordur.

Yukarıda tarihsel gelişimi ve kullanım alanları verilen yazım stilleri bir biyometriğin sahip olması gereken özellikleri taşımaktadır. Yazım stili evrenseldir; ona herkes her yerde sahiptir. Yazım stili ayırt edilebilirdir; herkesin yazım stili diğerinden farklıdır. Yazım stili sabittir; kişilerin yazım karakteristikleri kolaylıkla değişmez değişimler de saklı şablonlara kolayca işlenebilir. Yazım stili toplanabilirdir; kişiler yazım stili vermek için özel bir iş yapmalarına dahi gerek yoktur, sunucu üzerindeki bir yazılım kişilerin yazım stilini doğrudan alabilmektedir.

Biyometriklerde sabitlik önemli özelliklerden birisidir. Örneğin, parmak izi biyometriği fiziksel bir biyometrik olup bu biyometriğin değeri kesinlikle değişmez. Fakat bütün biyometrikler parmak izi gibi tamamen sabit değildir. Davranışsal biyometrikler sınıfına giren biyometrikler ufak nüanslarla kimi zaman farklılıklar gösterirler. Önerdiğimiz yazım stili de zaten davranışsal bir biyometriktir ve ölçümlerde onlar kadar nüans farklarına sahip olabilecektir. Bu durum yazım stilinin bir biyometrik olarak kullanılmasına mani değildir. Bir biyometriğin sabit olması tabi ki istenen bir durum olmakla birlikte biyometrik bilginin ele geçirilmesi durumunda aslında tamamen sabitlik istenmeyen durum olabilmektedir. Önerdiğimiz biyometrik ele geçirilse bile kullanılabilir olacaktır. Çünkü bu biyometriğin güncellenme imkânı vardır ve bu da önerdiğimiz biyometrik için çok önemli bir özgün değerdir.

Önerimiz önceki biyometriklerden birinin yeniden uygulaması olmayıp yeni bir biyometrik önerisi getirmektedir.

Kaynaklar
1.        Richard Duncan, (2001), “An Overview of Different Authentication Methods and Protocols”, © SANS Institute 2002
2.        The right biometric?, (2006) , “Biometric Technology Today” • March 2006
3.        Furnell, S.M., Dowland, P.S., Illingworth, H.M. and Reynolds, P.L. 2000, “Authentication and Supervision: A Survey of User Attitudes”, Computer & Security, Vol. 19, No. 6
4.        Deane, F., Barrelle, K., Henderson, R., and Mahar, D. 1995. “Perceived acceptability of biometric security systems”, Computers & Security, vol. 14, no. 3: 225-231.
5.        Clarke, N.L. Furnell, S.M. “Advanced user authentication for mobile devices”, 2007, Computers & Security, 26, 110-119.
6.        Mendenhall, T. C. (1887). The characteristic curves of composition. Science, IX, 237–49
7.        Zipf, G.K. (1932). Selected studies of the principle of relative frequency in language. Harvard University Press, Cambridge, MA
8.        Yule, G.U. (1938). On sentence-length as a statistical characteristic of style in prose, with application to two cases of disputed authorship. Biometrika, 30, 363-390
9.        Yule, G.U. (1944). The statistical study of literary vocabulary. Cambridge University Press.
10.     Mosteller, F. & Wallace, D.L. (1964). Inference and disputed authorship: The Federalist. Addison-Wesley
11.     Holmes, D.I. (1994). Authorship attribution. Computers and the Humanities, 28, 87–106
12.     Holmes, D.I. (1998). The evolution of stylometry in humanities scholarship. Literary and Linguistic Computing, 13(3), 111-117.
13.     Rudman, J. (1998). The state of authorship attribution studies: Some problems and solutions. Computers and the Humanities, 31, 351-365
14.     Abbasi, A., & Chen, H. (2005). Applying authorship analysis to extremist-group web forum messages. IEEE Intelligent Systems, 20(5), 67-75
15.     Chaski, C.E. (2005). Who’s at the keyboard? Authorship attribution in digital evidence investigations. International Journal of Digital Evidence, 4(1)
16.     Grant, T. D. (2007). Quantifying evidence for forensic authorship analysis. International Journal of Speech Language and the Law, 14(1), 1 -25.
17.     A Novel Approach of Mining Write-Prints for Authorship Attribution in E-mail Forensics. Farkhund Iqbal, Rachid Hadjidj, Benjamin Fung, Mourad Debbabi, Digital Investigation 5, (2008) 542-551
18.     Stamatatos, E., Fakotakis, N., & Kokkinakis, G. (2001). Computer-based authorship attribution without lexical measures. Computers and the Humanities, 35(2), 193-214
Vlado Keselj, Fuchun Peng, Nick Cercone, Calvin Thomas, N-Gram-Based Author Profiles For Authorship Attribution, Pacific Association for Computational Linguistics, 2003

Hiç yorum yok:

Yorum Gönder