Tıbbi araştırmalarda destek vektör makinelerinin kullanımı

dc.contributor.advisorAnkaralı, Handan
dc.contributor.authorAkşehirli, Özge
dc.date.accessioned2021-02-25T15:10:03Z
dc.date.available2021-02-25T15:10:03Z
dc.date.issued2012
dc.departmentDÜ, Sağlık Bilimleri Enstitüsü, Biyoistatistik ve Tıbbı Bilişim Ana Bilim Dalıen_US
dc.descriptionYÖK Tez No: 340813en_US
dc.description.abstractGünümüz teknolojisinde bilgisayar kapasite ve hızlarının artmasına paralel olarak, çeşitli sektörlerde, depolanan verinin kapasitesi ve karmaşıklığı da artmaktadır. Bu verilerin uygun ileri tekniklerle işlenmesi sonucunda ise yaşam koşullarında baş döndürücü teknolojik değişimler gözlenmektedir. Büyük boyutlardaki verilerden anlamlı bilgiler çıkarmak amacıyla özellikle son yıllarda yoğun kullanım alanı bulan ve gelecekte ise klasik istatistik yöntemlerin yerini alacak olan veri madenciliği yöntemleri tercih edilmektedir. Destek vektör makinaları (DVM), bu yöntemlerden birisi olup günümüzde sınıflandırma, tahmin veya yapı tanıma amaçlarıyla en çok mühendislik uygulamalarında kullanılmaktadır. Bu tez çalışmasında, veri madenciliği kavramlarının tanımlanması, DVM'nin teorik temellerinin ayrıntılı olarak açıklanması ve bu yöntemin tanı koyma amacı güden tıbbi araştırmalarda kullanımı amaçlanmıştır. Bu amaca yönelik olarak çalışmada, ilk olarak veri madenciliğinden ve veri madenciliği yöntemlerinden kısaca bahsedilmiş, daha sonra destek vektör makinelerine kapsamlı olarak değinilmiştir. Veri madenciliği yöntemlerinden biri olan DVM, veriyi sınıflandırmak veya tahmin yapmak amacıyla kullanılan, eğiticili bir makine öğrenmesi yöntemidir. DVM'nin temelini, verilerin bir düzlem veya hiperdüzlem ile ayrılarak sınıflandırılması işlemi oluşturmaktadır. DVM bu işlemi, iki sınıf arasındaki marjini maksimum yaparak gerçekleştirir. Bu şekilde veri eğitildikten sonra, DVM yeni gelen veriyi doğru sınıflamayı amaçlamaktadır. Tıpta DVM özellikle, kanser morfolojisinde, tedavi başarısının ve ilgili genin belirlenmesinde, çeşitli hastalıkların teşhisinde kullanılmaktadır. Araştırmanın uygulama bölümünde, Zonguldak Karaelmas Üniversitesi Tıp Fakültesi psikiyatri polikliniğine gece yeme sendromu şikayetiyle 1-31 Ocak 2011 tarihleri arasında ayaktan başvuran ve çalışmaya katılmayı kabul eden 433 hastaya ilişkin bilgiler kullanılmıştır. Bu veriler kullanılarak, tek değişkenli analiz, lojistik regresyon analizi ve DVM yöntemleri ile tanı koymada etkili olan değişkenler incelenmiş ve sadece GYA_puan değişkeni üç yaklaşımla da etkili bulunmuştur. Ayrıca lojistik regresyon ve DVM ile doğru sınıflama başarıları incelendiğinde, her iki yöntemin de benzer sonuçlar verdiği görülmüş ancak DVM'nin üstünlükleri tartışılmıştır. Ayrıca, uygulamalarda en sık adı geçen doğrusal, polinomiyal, sigmoid ve radyal tabanlı fonksiyon (RTF) performansları da karşılaştırılmıştır. Bu karşılaştırmalarda 4 farklı çekirdek fonksiyonunun sınıflama performanslarının benzer sonuçlar verdiği görülmüş ancak çeşitli yönlerden RTF'nin üstünlüğünden bahsedilmiştir.en_US
dc.description.abstractIn today's technology, with increase of capacity and speed of computers, in various sectors, capacity and complexity of the stored data also increases. As a result of processing of these data with appropriate advanced techniques, the dizzying technological changes have been observed in living conditions. For the purpose of extracting meaningful information from huge amounts of data, data mining methods that found intensive usage especially in recent years and in the future will replace with the traditional statistical methods are preferred. Support vector machine (SVM) is one of these methods and today it is used for classification, estimation or pattern recognition mostly in engineering applications. In this study it was aimed to define concepts of data mining, explain theoretical foundations of SVM particularly and use of this method for diagnosing in medical research. For this purpose, firstly data mining and data mining methods were mentioned briefly, then support vector machines method was described comprehensively. SVM, which is one of data mining methods is a machine learning tool that uses supervised learning to classify or predict the data. Basic idea behind SVM is to classify the data by dividing them with a plane or hyperplane. DVM achives this procedure by doing maximum the margin between two classes. After training of the data, SVM aims to classify the new data correctly. In medicine, SVM is used for cancer morphology, identifying success of treatment and related gene, diagnosing various diseases. In application of the study, informations about 433 patient who were refer to the outpatient department of Zonguldak Karaelmas University Faculty of Medicine between date of 1-31 January 2011 for complaints of night eating syndrome were used. Using these data, variables that is effective in diagnosing were examined with univariate analysis, logistic regression and SVM methods and only GYA_puan variable found to be effective in the three approaches. Also when the classification performances of logistic regression and SVM were examined, it was seen that both of the methods gave similar results but superiority of SVM was discussed. In addition, performances of linear, polynomial, sigmoid and radial basis function (RBF) mentioned most common in applications were compared. In these comparisons, it was seen that the classification performances of 4 different kernel function gave similar results, however superiority of RBF in various ways was mentioneden_US
dc.identifier.endpage145en_US
dc.identifier.startpage1en_US
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=iTkOhwevEenJZ3onUvs52h1w3sP_GxVwmRjy1L23O-7XkN9CxfbK89bClx3CIcVm
dc.identifier.urihttps://hdl.handle.net/20.500.12684/7863
dc.institutionauthorAkşehirli, Özgeen_US
dc.language.isotren_US
dc.publisherDüzce Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectBiyoistatistiken_US
dc.subjectBiostatisticsen_US
dc.subjectBilimsel araştırmalaren_US
dc.subjectScientific researchsen_US
dc.subjectBiyoistatistiken_US
dc.subjectBioistatisticsen_US
dc.subjectTıbbi araştırmalaren_US
dc.subjectMedical researchesen_US
dc.subjectVektörleren_US
dc.subjectVectorsen_US
dc.subjectVeri madenciliğien_US
dc.subjectData miningen_US
dc.subjectÖğrenmeen_US
dc.subjectLearningen_US
dc.subjectÖğrenme yöntemlerien_US
dc.subjectLearning methodsen_US
dc.titleTıbbi araştırmalarda destek vektör makinelerinin kullanımıen_US
dc.title.alternativeUsing of support vector machines in medical researchen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
340813.pdf
Boyut:
2.78 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text

Koleksiyon