MACHINE LEARNING | Mobile App Developer

All Posts All Posts

Category: MACHINE LEARNING
Destek Vektör Makineleri ve Çok Katmanlı Algılayıcılar ile Göğüs Kanseri Teşhisi

Projenin Kodları

Raporu indir

1. Çalışmanın Özeti

Bu çalışmada, göğüs kanseri öznitelik vektörlerinin, destek vektör makineleri ve yapay sinir ağları(çok katmanlı algılayıcı) ile sınıflandırılmasına dayalı bir gögüs kanseri teşhisi yapılmaktadır. Teşhis için kullanılan yapay sinir ağları çok katmanlı algılayıcılar(Multi Layer Perceptron)’dır. Destek vektör makinaları(Support Vector Machine ) SVM-Lineer, SVM-Polinomsal ve SVM-Radyal Tabanlı modellerdir. Sınıflandırma işleminde kullanılacak olan gögüs kanseri verileri Wisconsin Diagnostic Breast Cancer (WDBC)  datasetidir. Oluşturulan veri formatı WEKA paket programında uygulanmıştır. Çalışmada doğru teşhis başarısı, MLP’de %97.90, SVM-Lineer‘de %95.44  SVM-Polinomsal’da %72.24 ve  SVM-Radyal Tabanlı’da %62.75 olarak ölçülerek en yüksek başarı %97.90 ile MLP(Çok Katmanlı Algılayıcılar) öğrenme yöntemi ile ölçülmüştür. Bu yöntemin ROC eğrisi altında kalan alan değeri 0.9931 olarak hesaplanmıştır.

2. Uygulama

2.1.Veri ve Kütüphanelerin Hazırlanışı

2.1.1. Veri Seti

Çalışmanın gögüs kanseri verileri Wisconsin Diagnostic Breast Cancer (WDBC)  dataseti ile değerlendirilmiştir. Dataset(http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic)) adresinden indirilip Notepad++ programı yardımı ile datasette bulunan sütunlar ile öznitelik sayısı tespit edilmiştir. Her satırdaki verilerin ilk değeri incelediğinde toplam 2 sınıfın bulunduğu M ile ifade edilen sınıfın malignant yani kötü huylu, B ile ifade edilen sınıfında benign yani iyi huylu anlamına geldiği anlaşılıp, programla düzenlerek WEKA paket programında kullanılabilmesi için arff dosya tipine dönüştürülmüştür. Öznitelik sayısı 30 dir. Bu özniteliklerden bazıları; her bir hücre çekirdeği için, yarıçapı, doku, çevre, alan, düzgünlük, kompaktlık, konkavite, içbükey noktaları, simetri, fraktal boyutu gibi özniteliklerdir. Gögüs kanseri verisi 569 tanedir. Bu verilerden 212 tanesi sonuç olarak kötü huylu, 357 tanesi de iyi huylu olan kanser türüdür.

2.1.2.Kütüphanelerin Hazırlanışı

MLP(Çok Katmanlı Algılayıcılar) ögrenme yöntemi kütüphanesi WEKA paket programında hazır bulunmaktadır. SVM(Destek vektor makineleri) kütüphanesi (http://www.csie.ntu.edu.tw/~cjlin/libsvm/) adresinden indirilip WEKA’nın kurulu olduğu yere yerleştirilmiştir. Bu aşamadan sonra ortam değişkenlerine yeni bir sistem değişkeni olan CLASSPATH ve değişken değeri olarakta libsvm kütüphanesinin konumu yazılarak eklenmiştir. Böylece WEKA’da SVM-Lineer, SVM-Polinomsal ve SVM-Radyal Tabanlı modeller kullanılır hale getirilmiştir.

Naive Bayes ile Spor Metinleri Sınıflandırma

Projenin Kodları

Tüm projeyi İNDİR: Program Raporu ve Kodu

1. Çalışmanın Özeti

Bu çalışmada, spor metinlerine ait olan öznitelik vektörlerinin Naive Bayes ile sınıflandırılmasına dayalı bir spor metni tahmini yapılmaktadır. Çalışmada veri seti farklı kullanılarak sınıflandırmanın başarısı incelenmiştir. Farklı kullanımdan kasıt, veri setinin eğitim ve test amaçlı olarak kullanılan verilerin sayısının değiştirilmesidir. Çalışmada bulunan spor metinleri futbol, basketbol, tenis olmak üzere üç sınıf seçilmiştir. Elde edilen özellik vektörünün başarısı, Naive Bayes sınıflandırma yöntemi ile en yüksek %80 olarak alınmıştır.

Günümüzdeki gelişmeler veri birikiminin artmasına neden olmaktadır. Bu artışla istenilen verilere ulaşabilmek için metinlerin sınıflandırılması ihtiyacı doğurmuştur. Metin sınıflandırma, o metnin özelliklerine bakarak önceden belirlenmiş belli sayıda kategorilerden hangisine dahil olacağını belirlemektir. Metin sınıflandırma bilgi alma, bilgi çıkarma, döküman filtreleme, otomatik olarak metadata elde etme ve web sayfalarını hiyerarşik olarak düzenleme gibi pek çok alanda önemli rol oynamaktadır. Bu çalışmada içerisinde üç farklı kategoride 60 adet dökümandan oluşan bir veri seti kullanılmıştır.Makine öğrenmesi yöntemlerinden Naive Bayes kullanılarak bir metnin türünün belirlenmesi gerçekleştirilmiştir.