Gri kurt optimizasyon algoritması ile çıkarımsal metin özetleme ve özetlerin derin öğrenme ile sınıflandırılması

Yükleniyor...
Küçük Resim

Tarih

2020

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Düzce Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Günümüzde özellikle internet ortamında metinsel veri hızla çoğalmaktadır. Büyük bir veri seti haline gelen bu metinlerde istenen parçaya ulaşmak gitgide zorlamıştır. Otomatik metin özetleme teknikleri, bu büyük verilerden ilgili bilgilerin çıkarılmasında büyük rol oynamaktadır. Bu tez kapsamında çıkarımsal metin özetleme tekniği olarak, sezgisel Gri Kurt Optimizasyon (GWO) algoritması önerilmiştir. GWO algoritmasının kümeleme yeteneği tekli metin özetleme uygulamasıyla test edilmiştir. Özetleme sisteminde cümle sıralaması, kelime uzunluğu gibi istatistiksel anahtar kelime çıkarma yöntemleri ile GWO'nun küme çıkarımı birleştirilmiştir. Özet sistemi K-means kümeleme algoritması ile de denenmiş ve sonuçlar ROUGE değerlendirme metriği ile ölçülmüştür. 2225 haber makalesinden oluşan BBC News veri setiyle test edilen çalışmada elde edilen sonuçlar doğrultusunda GWO algoritmasının oldukça iyi performans gösterdiğini görülmüştür. Elde edilen özet metinler derin öğrenme yöntemlerinden biri olan Uzun kısa süreli bellek (LSTM) ağları ile sınıflandırılmıştır. Deneysel sonuçlar LSTM ağının sınıflandırma başarısının GWO algoritması ile oluşturulan özetlerde arttığını göstermiştir. GWO algoritması çıkarımsal özetleme yöntemleri için yeni bir yaklaşım olarak sunulmuştur.
Today, especially in the internet environment, textual data is increasing rapidly. It is getting more and more difficult to reach the desired piece in these texts, which have become a large data set. Automated text summarization techniques play a major role in extracting relevant information from these big data. In this thesis, the intuitive Gray Wolf Optimization (GWO) algorithm is proposed as inferential text summarization technique. Clustering ability GWO algorithm has been tested with single text summarization application. In the summarization system, statistical keyword extraction methods such as sentence order, word length and cluster extraction of GWO are combined. The summary system was also tested with the K-means clustering algorithm and the results were measured with the ROUGE evaluation metric. In accordance with the results obtained in the study tested with BBC News data set consisting of 2225 news articles, GWO algorithm was observed to perform quite well. The summarized texts are classified with one of the deep learning methods, Long- Short term memory (LSTM) networks. Experimental results showed that the classification success of the LSTM network increased in the summaries created with the GWO algorithm. GWO algorithm is presented as a new approach for inferential summarization methods.

Açıklama

YÖK Tez No: 634927

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Koleksiyon