Hoşgeldiniz!

Değerli Misafirlerimiz, Bu platform "Kütüphanecilik ve Bilgi Bilimi" camiasına fayda sağlamak amacıyla kurulmuştur. Tüm üye ve moderatörlerimiz yaptığı ve yapacağı çalışmalarla alanımıza katkıda bulunmaktadırlar. Sizler de aramıza katılmak istiyorsanız kayıt olabilirsiniz.

Veri Madenciliği Nedir? Temel Kavramlar

turankanbul

Administrator
Yetkili üye
Katıldı
16 Kasım 2019
Mesajlar
64
Puanlar
33
Yaş
24
Turan KANBUL
Çankırı Karatekin Üniversitesi
Bilgi ve Belge Yönetimi (Yüksek Lisans)
Günümüzün popüler konuları arasında yer alan bilgi yönetimi, büyük veri, veri madenciliği vb. konuların tarihsel sürecine bakıldığında yazının bulunmasıyla birlikte bilginin kayıt edilmesine dayanmaktadır. Sümerliler tarafından yazının bulunması ve bilginin kayıt altında tutulması ortaya ilk bilgi kaynaklarını çıkarmıştır. Yazıdan sonra matbaa ve teknolojik gelişmelerle birlikte bilginin kayıt edilmesi ve depolanması oldukça kolaylaşmıştır. Bilginin kayıt altında tutulması ve erişiminin kolay olması bilgi patlamasını tetiklemiştir. Günümüzde "Big Data" kavramının gündemde olmasının başlangıç aşaması bilgi patlaması olarak adlandırdığımız döneme dayanmaktadır. Bilginin elektronik ortamda depolanmaya başlanması ile birlikte, bilgi miktarının periyodik olarak katlanarak arttığı gözlemlenmektedir. Bilginin artış hızına paralel olarak depolama araçları (VTYS, HDD, Cloud Storage) gelişme göstermektedir. Veri Depolarında veri olduğu gibi işlenmeden saklanması kullanıcı açısından önem teşkil etmemektedir. Var olan verinin bir amaç ve hedef doğrultusunda işlenmesi onu değerli kılacaktır(Atalay, 2017).

"Veri madenciliği veri tabanı teknolojisi, istatistik, yapay zeka (artificial intelligence), makine öğrenimi (machine learning), örüntü tanımlama (pattem recognition) ve veri görselleştirmesi (data visualization) gibi pek çok teknik alan arasında köprü görevi gören çok disiplinli bir alandır. Veri madenciliği astronomi, biyoloji, finans, pazarlama, sigorta, tıp gibi bir çok dalda uygulanmaktadır. Bu çalışmanın amacı, bilişim teknolojileri dünyasındaki önemini her geçen gün daha da arttıran veri madenciliği konusunu ve veri madenciliği modellerini incelemektir(Özekes, 2006)."


Veri madenciliğide temel olarak iki model kullanılmaktadır.
  • Tahmin Edici (Predictive) Modeli
Predictive modellerde, bir makine öğrenmesi mantığı bulunmaktadır. Sonucu bilinen verilerden yola çıkarak ortaya bir model çıkarıp sonucu bilinmeyen veriler üzerinde bağlantılı tahminler yürütmesi olarak algılanabilir.
"Örneğin, bir banka önceki dönemlerde vermiş olduğu kredilere ilişkin gerekli tüm verilere sahip olabilir. Bu verilerde bağımsız değişkenler kredi alan müşterinin özellikleri, bağımlı değişken değeri ise kredinin geri ödenip ödenmediğidir. Bu verilere uygun olarak kurulan model, daha sonraki kredi taleplerinde müşteri özelliklerine göre verilecek olan kredinin geri ödenip ödenmeyeceğinin tahmininde kullanılmaktadır(Özekes, 2006)."
  • Tanımlayıcı (Descriptive) Modeli
Tanımlayıcı modellerde ise karar vermeye rehberlik etmede kullanılabilecek mevcut verilerdeki örüntülerin tanımlanması sağlanmaktadır. Yapılacak istatistiğin, önceden belirlenmiş bir takım yöntem ve/veya algoritma örüntü olarak kabul edilebilir. Bu bağlamda tanımlayıcı modeller için ön hazırlıklı istatistik modeli kavramı da kullanılabilir.

Veri Madenciliğinde Temel Kavramlar

  • Karar Destek Sistemleri (KDS)
KDS, farklı veri kaynaklarından aldığı verileri işledikten sonra karar yapısını modelleyerek, olası sonuçlar üzerine analiz ve değerlendirme sonuçlarını sunan sistemlerdir. Karar Destek Sistemleri kullanılarak elde edilen sonucun doğruluğu verinin yeterliliğine bağlıdır. Farklı bir yaklaşımla değinilecek olunursa Karar Destek Sistemlerinden ulaşılan kararın başarısı, verinin standartlara uygun sınıflanmasına, istatistiğe uygun işlenmesine ve doğru hesaplanmasına bağlıdır.
  • Veri tabanları
Veri Tabanı, verinin işlenmiş veya işlenmemiş olarak saklı tutulduğu alanlardır. Tanımdan yola çıkılacak olunursa veri tabanları kullanım amaçlarına göre "İlişkisel veri tabanları, işlemsel veri tabanları vb." şekilde kategorize edilebilir.
Hastanelerin veri tabanları ilişkisel veri tabanı olarak tanımlayabiliriz. Hastane veri tabanlarında her hasta, her doktor ve her poliklinik için tekil (primary key) anahtar bulunmaktadır. Çeşitli sorgular yapılarak hangi hastanın hangi doktora, hangi doktorun hangi hastaya baktığına dair bilgiler elde edilebilen ilişkisel veri tabanları temel olarak bu amaçlar doğrultusunda kullanılır(Akpınar, 2000).

İşlemsel veri tabanında ise satır(line)'da bulunan her veri bir işlem olarak kabul edilir. Örneğin Alışveriş merkezinde her müşterinin aldığı alışveriş fişi kayıt olarak tutuluyor ve bu işlemsel veri tabanlarında veri olarak saklanmaktadır. "Bu veritabanından, bugün, ilgilenilen üründen kaç tane satıldığı sorusunun cevabına ulaşılabilir. Zaman serisi veritabanı düzenli zaman aralıkları ile elde edilmiş (yıllık, haftalık, günlük) verilerin tutulduğu alanlardır. Örnek olarak borsa verilerinin, stok kontrolleri sonucu alınan verilerin, sıcaklık ölçümlerinden elde edilen verilerin depolanması gösterilebilir(Akgöbek ve Çakır, 2009)."
  • Veri Ambarları
“Veri ambarları, tüm operasyonel işlemlerin en alt düzeydeki verilerine kadar inebilen, etkili analiz yapılabilmesi için özel olarak modellenen ve tarihsel derinliği olan veri depolama sistematiği olarak tanımlanabilir(Çelik, 2009).”
  • OLTP (Çevrimiçi İşlem Süreçleri)
Organizasyonda satın alma, kaydetme, muhasebe, bankacılık gibi günlük işlemlerin yapıldığı işlemsel veritabanı sistemleridir.
  • OLAP (Çevrimiçi Analitik Süreçler)
Veri analizi ve karar verme için alt yapıyı oluşturan veri ambarı sistemleridir.
  • Analizler sonrasında ortaya çıkan bilgi ve bilgi süreçleriyle ilgilidir.
  • Genel olarak özet bilgiler içerir ve çok boyutludur.
  • Veri saklama kapasiteleri oldukça yüksektir.
Yukarıdaki kavramlar, Karar Destek Sistemleri'ne girdi sağlayan veri madenciliğinin daha kolay yapılabilmesi ve bunun için gerekli veri depolama, aktarma ve analize hazır hale getirme ile ilgilenir.


KAYNAKÇA
Özekes, S. (2002). Veri madenciliği modelleri ve uygulama alanları. İstanbul Ticaret Üniversitesi Dergisi. 36(3): 65-82
Akgöbek Ö, Çakır F. (2009). Akademik Bilişim: Veri Madenciliğinde Bir Uzman Sistem Tasarımı. Şanlıurfa: Harran Üniversitesi.
Akpınar H. (2000). Anonim Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği, İstanbul Üniversitesi İşletme Fakültesi Dergisi, 29, 1-22.
Atalay M, Çelik E. (2017). Büyük Veri Analizinde Yapay Zekâ ve Makine Öğrenmesi Uygulamaları. Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 9(22), 155-172.
 

Asya Tongut

Don't you quit !
Yetkili üye
Katıldı
16 Kasım 2019
Mesajlar
31
Puanlar
18
Yaş
22
Yaşadığın yer
Ankara
Günümüzde pek çok alanda kullanılan Veri Madenciliği hakkında yaptığınız bu bilgi dolu paylaşım için teşekkür ederiz. Emeğine sağlık :)
 
Top