Doğal dil işleme ve makine öğrenmesi ile resmi yazışmaların konu bazlı sınıflandırılması
dc.contributor.advisor | Kara, Resul | |
dc.contributor.author | Bozdoğan, Zeynep | |
dc.date.accessioned | 2024-08-23T18:34:11Z | |
dc.date.available | 2024-08-23T18:34:11Z | |
dc.date.issued | 2024 | |
dc.department | DÜ, Fen Bilimleri Enstitüsü, Disiplinlerarası Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı | en_US |
dc.description.abstract | Dijital gelişimler ile birlikte kamu kurumlarındaki resmi yazışma belgeleri Elektronik Belge Yönetim Sistemi (EBYS)'leri aracılığı ile yürütülmektedir. Belgelerin Standart Dosya Planı (SDP) kodlarının uygun olarak belirlenmesi, doğru arşivleme ve arşiv imha işlemleri için önem arz etmektedir. Belgeyi oluşturan kişiler tarafından belgeye verilen SDP kodu bilgisi çeşitli sebeplerle hatalı olarak yazılabilmektedir. Bu hataları önlemek için belgelerin SDP kodunu otomatik olarak doğru tespit eden uygulamaların geliştirilmesi faydalı olacaktır. Bu amaçla çalışmada iki farklı veri seti oluşturulmuş ve bu veri setleri üzerinde öncelikle ön işlemler, ardından ön işlem uygulanmış veriler üzerinde çeşitli sınıflandırma algoritmaları uygulanarak belgelerin SDP kodunun sınıflandırma işlemleri ile tespit edilmesi gerçekleştirilmiştir. Sınıflandırma işlemlerinin sonuçları karşılaştırılarak analiz edilmiştir. Birinci veri seti üzerinde yapılan analizlerde en başarılı sınıflandırma sonuçları, Lojistik Regresyon (LR) algoritması ile 1000 adet resmi yazışma belgesinin 978 tanesinin SDP kodunun doğru tahmin edilmesi ile elde edilmiştir. İkinci veri seti üzerinde yapılan analizlerde en başarılı sınıflandırma sonuçları genel olarak 2100 adet belgenin 1851 tanesinin doğru konulara (SDP koduna) sınıflandırıldığı ve % 88,14 oranında başarı gösteren Non-Negatif Matrix Factorization (NNMF) algoritması ile elde edilmiştir. | en_US |
dc.description.abstract | In line with digital advancements, official correspondence documents in public institutions are managed through Electronic Document Management Systems (EDMS). Appropriate determination of the Standard File Plan (SFP) codes of documents is important for correct archiving and archival destruction process. The SFP code information given to the document by the people who created the document may be written incorrectly for various reasons. To prevent these errors, it would be useful to develop applications that automatically detect the correct SFP code of documents. For this purpose, two different data sets were created in the study; initially, preprocessing was performed on these sets, followed by the application of various classification algorithms on the preprocessed data to detect, the documents' SFP codes. The results of the classification processes were compared and analyzed. In the analysis of the first dataset, the most successful classification results were obtained by using the correctly predicting the SFP code of 978 out of 1000 official correspondence documents with the Logistic Regression (LR) algorithm. In the analyses performed on the second dataset, the most successful classification results were obtained with the Non-Negative Matrix Factorization (NNMF) algorithm, which classified 1851 of 2100 documents into the correct subjects (SFP code) and achieved 88.14% success rate. | en_US |
dc.identifier.endpage | 104 | en_US |
dc.identifier.startpage | 1 | en_US |
dc.identifier.uri | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=KMB79M3N7zK1UR2WYeRgQsoeOiyjoiYx4Ywy-U5YgcjanDjflsi_GviMfkoLlAo1 | |
dc.identifier.uri | https://hdl.handle.net/20.500.12684/15285 | |
dc.identifier.yoktezid | 863720 | en_US |
dc.institutionauthor | Bozdoğan, Zeynep | |
dc.language.iso | tr | en_US |
dc.publisher | Düzce Üniversitesi | en_US |
dc.relation.publicationcategory | Tez | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Bilgi ve Belge Yönetimi | en_US |
dc.subject | Information and Records Management | en_US |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | en_US |
dc.title | Doğal dil işleme ve makine öğrenmesi ile resmi yazışmaların konu bazlı sınıflandırılması | en_US |
dc.title.alternative | Topic classification of official correspondences with natural language processing and machine learning | en_US |
dc.type | Doctoral Thesis | en_US |
Dosyalar
Orijinal paket
1 - 1 / 1