Veri Madenciliği Ders Notları #
📖 Kaynaklar #
📄 Ders Notları (Web) – Tarayıcı üzerinden okuyabileceğiniz notlar
💻 Kodlar ve Scriptler – Python ve R uygulama kodları
📊 Uygulama Veri Setleri – Laboratuvar verileri (ARFF, CSV)
Dr. Öğr. Üyesi Erkan Özhan tarafından hazırlanan bu ders, ham veriden anlamlı bilgi çıkarma süreçlerini, büyük veri analizini ve veri madenciliği algoritmalarını kapsamlı bir şekilde ele almaktadır.
📚 Ders İçeriği #
Bu derste aşağıdaki konuları öğreneceksiniz:
- Veri Ön İşleme: Veri temizleme, eksik veri analizi, aykırı değer tespiti ve normalizasyon
- Birliktelik Kuralları (Association Rules): Apriori algoritması, FP-Growth, Market Sepeti Analizi
- Sınıflandırma (Classification): K-En Yakın Komşu (KNN), Naive Bayes, Karar Ağaçları (C4.5, CART)
- Kümeleme (Clustering): K-Means, Hiyerarşik Kümeleme, DBSCAN (Yoğunluk tabanlı)
- Metin Madenciliği (Text Mining): Metin ön işleme, TF-IDF, Duygu analizi
- Model Performansı: Cross-validation, Recall, Precision, F-Score metrikleri
🛠️ Kullanılan Araçlar #
- Python: pandas, numpy, mlxtend, scikit-learn
- R: arules, tm (text mining), ggplot2
- WEKA: Association ve Clustering modülleri
🎯 Kimler İçin Uygun? #
Bu ders, veri analitiği, büyük veri ve iş zekası alanlarında uzmanlaşmak isteyen mühendislik öğrencileri ve araştırmacılar için temel bir kaynak niteliğindedir.
🏷️ Etiketler #
veri madenciliği, data mining, apriori, birliktelik kuralları, kümeleme, sınıflandırma, python, R, weka, veri analizi, büyük veri, metin madenciliği