Yazarların 9 bölümden oluşan kitabında, veri madenciliği yöntemleri ile ilgili çeşitli konular anlatılmıştır. Kitap hem eğitim hem de araştırma niteliğine sahiptir. Hem Türkçe hem de İngilizce çalışmalar bulunmaktadır. İstatistikte ileri düzey konuları içeren veri madenciliği ile makine öğrenimi konularına ilgi duyan öğrenci, araştırmacı ve bilim insanlarının zevkle ve ilgi ile takip edecekleri bir eser olacağını umuyoruz.
ÖNSÖZ
Değerli araştırmacılar ve okuyucular,
İstatistik bilimi her geçen gün önemini arttıran, hemen hemen her alanda uygulanabilen ve tüm araştırmacıların çalışmalarında kullandığı ve ihtiyaç hissettiği bir bilim dalı haline gelmiştir.
Son yıllarda gittikçe popüler bir çalışma haline gelen veri madenciliği, makine öğrenmesi ve çok değişkenli istatistik analizi ile birçok alanda değişik konularda uygulanmaktadır. Veri madenciliği yöntemleri ham veriyi bilgiye dönüştürmede istatistiksel yöntemleri ve makine öğrenme algoritmalarını kullanan bir tekniktir.
Veri madenciliği konusuyla ilk çalışmalarım genç yaşta kaybettiğimiz Sayın Prof. Dr. Ecevit EYDURAN ile başladı. Rahmetli Ecevit hocamın kendisiyle veri madenciliği ve diğer istatistik yöntemleri uygulayarak çok sayıda makaleler yazdık ve bilimsel kongre ve sempozyumlarda bildiriler sunduk. Ortaklaşa yaptığımız çalışmaları birçok akademisyenle paylaştık.
Kitapta veri madenciliği ve makine öğrenmesi ile ilgili bazı temel bilgiler anlatılmıştır ve farklı alanlarda uygulamalar yapılmıştır. Veri madenciliği ve makine öğrenmesi yöntemleri 7 bölümden oluşmaktadır. Burada karar ağacı, sınıflandırma ve regresyon ağaçları (CART), CHAID, QUEST, AID, ID3, C4.5 ve C5.0 algoritmaları, Destek Vektör Makinesi, MARS algoritması ve Rastgele Orman (RF) algoritması gibi yöntemler ele alınmıştır ve uygulamalar yapılmıştır. Ayrıca makine öğrenmesi ile ilgili olarak duygu analizi ve eğitim ve test verisi ile Ridge regresyon analizi uygulaması yapılmıştır. Türkiye’de farklı üniversitelerde görev yapan 15 farklı akademisyen tarafından büyük bir fedakarlıkla hazırlanan bu kitap, 7 bölüm ve 224 sayfadan oluşmaktadır. Kitaba katkıda bulunan yazarların tamamına yakınının istatistikçi olması bu kitabın en önemli özelliklerinden biridir. Yazarlar farklı üniversitelerde istatistik, biyometri, ekonometri, sayısal yöntemler ve elektronik mühendisliği gibi bölümlerde görev yapmaktadır ve istatistik ile ilgili dersler vermektedir. Kitaba katkıda bulunan tüm öğretim üyelerine teşekkür ederim. Kitapta bulunan tüm bölüm hakem sürecinden geçmiştir ve titizlikle kontrol edilmiştir.
Kitabın basım ve yayın işlemini gerçekleştiren Sayın Prof. Dr. Mehmet SAHIN hocam başta olmak üzere Holistence Publications Yayınevi’ne çok teşekkür ederiz.
Saygılarımızla,
Editörler
Doç. Dr. Şenol ÇELİK
Bingöl Üniversitesi Ziraat Fakültesi Zootekni Bölümü Biyometri ve Genetik ABD. Bingöl
Doç. Dr. Nilay KÖLEOĞLU
Çanakkale Onsekiz Mart Üniversitesi Biga İktisadi ve İdari Bilimler Fakültesi İşletme Bölümü Sayısal Yöntemler ABD, Çanakkale
Doç. Dr. Fatih ÇEMREK
Eskişehir Osmangazi Üniversitesi Fen Fakültesi İstatistik Bölümü Uygulamalı İstatistik ABD-Eskişehir
1.BÖLÜM
VERİ MADENCİLİĞİNDE KARAR AĞACI ÖĞRENME ALGORITMALARI
Çiğdem TAKMA’, Hatice HIZLI
1.GİRİŞ
Günümüzde analitik modellerin yetersiz kaldığı karmaşık ve büyük veri kümelerindeki sorunları çözmek için makine öğrenmesinden yararlanılmaktadır. Makine öğrenmesi ile herhangi bir insan müdahalesi olmadan verilerden öğrenebilen ve deneyimler ile geliştirebilen algoritmalar oluşturulmuştur. Bu algoritmalar denetimli veya denetimsiz olarak öğrenebilmektedir. Denetimli makine öğrenimi ile bilinen bir girdi verisine bilinen yanıtlar alınarak yeni verilere uygun yanıt için model eğitilmektedir. Denetimli öğrenmede, tahmin modellerinin geliştirilmesi için sınıflandırma ve regresyon tekniklerinden yararlanılmaktadır.
Denetimsiz öğrenmede ise modelin denetlenmesine ihtiyaç bulunmamakta, sistem öğretilmeyip verilerden öğrenilmesi sağlanmaktadır. Denetimsiz makine öğrenimi, verilerdeki bilinmeyen her türlü patemi bularak denetimli öğrenmeye kıyasla daha karmaşık görevlerin gerçekleştirilmesini sağlamaktadır.
Denetimli makine öğrenmesi genellikle regresyon ve sınıflandırma problemlerinde uygulanırken, denetimsiz öğrenme daha çok kümeleme ve ilişkilendirme problemlerinde kullanılmaktadır.
Bu derleme yazısında, veri madenciliğindeki makine öğrenmesi tekniklerinden karar ağacı algoritmalarının özellikleri tanıtılmıştır. Aynica, söz konusu algoritmaların karşılaştırma yöntemleri de belirtilerek veri setine en uygun algoritmanın seçiminin önemi vurgulanmıştır.
2.KARAR AĞACI YAPISI
Karar ağaçları regresyon ve sınıflandırma problemleri için çalışan denetimli makine öğreniminde yaygın kullanılan algoritmalardan biridir (Breiman ve ark., 1984).
Bu denetimli model, ağaç biçiminde gösterildiğinden “Karar Ağaçları” (Decision Tree) adını almıştır. Karar ağaçlarının akış şemasına benzer yapısı vardır. Bu şemada değişkenler düğüm tarafından temsil edilir. Karar ağacının en tepesi kök düğümü, en son yapı yaprak ve aradaki yapılar dallardır. Ağaç yapısı inceleme konusu veri ve tahminlemede kullanılan algoritmalara göre değişiklik göstermektedir. Nitekim Karar Ağacındaki kök düğüm verideki bütün gözlemleri kapsamaktadır. Kök düğüm iki alt dala ayrılarak ağaç yapısı oluşurken her düğümde test ve dallara ayırma işlemi ardışık olarak devam etmektedir. Ağaçta, çocuk düğümlere (child node) bölünmüş düğüme ebeveyn düğümü (parent node) adı verilir. Aynıca, eğer ağaç yapısındaki bir dalın ucunda işlem gerçekleşmiyorsa bu noktada bir yaprak düğümü (leaf node, terminal node) meydana gelir. Sınıflama işleminin yapılabildiği dalın sonunda karar düğümü (decision node, split node) oluşur (Carvalho ve Freitas, 2004; Han ve Kamber 2006). Buna göre bir karar ağacına ait düğümlerin tanımları Şekil 1 ile özetlenebilir.
Bir karar ağacının veriden eğitilmesi, ağacın kökten yapraklara doğru birleştirilmesi gereken karar sırasının bulunması anlamına gelmektedir. Bu işlem yukarıdan aşağıya doğru bölünmenin olmadığı tahmini yaprak düğüme ulaşılana kadar devam eder.
….
Bu kitabı en uygun fiyata Amazon'dan satın alın
Diğerlerini GösterBurada yer almak ister misiniz?
Satın alma bağlantılarını web sitenize yönlendirin.
- Kategori(ler) Akademik Bilim & Mühendislik
- Kitap AdıVeri Madenciliği ve Makine Öğrenmesi İle Farklı Alanlarda Uygulamalar
- Sayfa Sayısı224
- YazarNilay Köleoğlu, Fatih Çemrek,Şenol Çelik
- ISBN9786258048971
- Boyutlar, Kapak13*19,5, Karton Kapak
- YayıneviHolistence Publications / 2023