Kayaalp, FatihBaşarslan, Muhammet Sinan2024-08-232024-08-232023https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=a0OMTmEd_3mfOBxT8SiBTJzaOfOLaWYyKflHW9wOxHHBSPglYcGscjsRXUl_y838https://hdl.handle.net/20.500.12684/15274Teknolojinin gelişmesi, insanların sosyal hayatlarında birçok alışkanlığının değişimine sebep olmuştur. Pandeminin de etkisiyle eğitim başta olmak üzere birçok alanda yüz yüze iletişim oldukça azalmıştır. İnsanlar, sosyalleşmek için sosyal medya ve web sitelerine hızlıca erişim sağlayabilecekleri mobil cihazlar ile vakit geçirir hale gelmişlerdir. Pandemi sona ermesine rağmen, insanlar sosyalleşmek için web sitelerini ve sosyal medya uygulamalarını hala yaygın olarak kullanmaya devam edilmektedirler. İnsanlar birlikte izledikleri film, gittikleri restoran gibi birçok deneyimleri hakkında fikirlerini anlık şekilde paylaşmaktadırlar. Bu durum sosyal medya ve web siteleri aracılığıyla sürekli bir veri paylaşımına sebep olmaktadır. Bu veri paylaşımı çok büyük boyutta veri toplanmasına sebep olmaktadır. Bu veriler, pazarlamadan, reklama kadar birçok kurumu yakından ilgilendirmektedir. Bu kurumlar kendileri veya sektörlerine yönelik paylaşılan verileri kullanmak amacıyla çalışmalar yapmaktadırlar. Gelişen yapay zeka teknolojileriyle, bu çalışmalar firmalara katma değer kazandırmaktadır. Bu değeri kazandıran çalışma alanlarından biri de yapay zekanın alt dalı olan doğal dil işleme görevlerinden duygu analizidir. Bu çalışmada, IMDB web sayfasından toplanan veri kümesinde duygu analizi görevine yönelik deneysel çalışmalar gerçekleştirilmiştir. IMDB veri kümesi üzerinde Word2Vec kelime gömme yöntemi sonrası altı adet BiGRU ve sonrasına iki Evrişim Sinir ağı ile MBiGRUMCONV olarak isimlendirilen yeni bir yöntem önerilmiştir. Önerilen bu yöntemin en iyi doğruluk performansını verdiği %80-%20 eğitim-test ve %10 doğrulama kümesinde test sonuçları; %90,59, doğrulama kümesi sonuçları %94,67'dir. Ayrıca önerilen modelin 3, 5 ve 10 kat çapraz geçerleme sonuçları da alınmıştır. En iyi sonuç, 5-kat çapraz geçerleme ayrımında %90,67 doğruluk değeri ile alınmıştır. Tüm sonuçlar bir arada değerlendirildiğinde önerilen yöntemin literatür çalışmalarına kıyasla rekabetçi bir performans sergilediği görülmüştür. Çalışma kapsamında TripAdvisor, Rotten Tomatoes ve Twitterdan toplanan açık kaynak olarak sunulan veri kümeleri üzerinde farklı metin temsili yöntemleri sonrasında çeşitli derin öğrenme, makine öğrenmesi ve topluluk öğrenme yöntemleriyle modeller oluşturulmuştur. Yüksek model başarımı almak için gelecek çalışmalarda, hibrit model oluştururken; ön eğitimli BERT türevleri ile metin temsili çıkarıldıktan sonra çift yönlü sinir ağlarının kullanılması önerilmektedir.The development of technology has led to changes in many habits in people's social lives. As a result of the pandemic, face-to-face communication has decreased significantly in many areas, especially education. People have started to spend time with mobile devices where they can quickly access social media and websites to socialize. Even though the pandemic is over, people are still widely using websites and social media applications to socialize. People instantly share their opinions about their experiences such as the movie they watched together or the restaurant they went to. This leads to constant data sharing through social media and websites. This data sharing leads to massive data collection. This data is of great interest to many organizations from marketing to advertising. These organizations are working to use the data shared for themselves or their sectors. With the developing artificial intelligence technologies, these studies bring added value to companies. One of the areas of study that adds this value is sentiment analysis, one of the natural language processing tasks, which is a sub-branch of artificial intelligence. In this study, experimental studies were carried out for sentiment analysis task on the dataset collected from IMDB web page. A new method called MBiGRUMCONV was proposed on the IMDB dataset with six BiGRUs and two Convolutional Neural Networks after the Word2Vec word embedding method. The best accuracy performance of this proposed method is 90.59% for the 80%-20% training-testing and 10% validation set, and 94.67% for the validation set. The proposed model was also cross-validation 3, 5, and 10-fold. The 5-fold cross-validation resulted in an accuracy of 90.67%. When all the results are evaluated together, it is seen that the proposed method performs competitively compared to the literature studies. Within the scope of the study, models were created with various deep learning, machine learning and ensemble learning methods after different text representation methods on open-source datasets collected from TripAdvisor, Rotten Tomatoes and Twitter. In order to achieve high model performance, in future studies, it is recommended to use bidirectional neural networks after text representation extraction with pre-trained BERT derivatives when building hybrid models.trinfo:eu-repo/semantics/openAccessBilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolComputer Engineering and Computer Science and ControlSosyal Ağlarda Duygu Analizi için Hibrit Bir Yöntem GeliştirilmesiDevelopment of a Hybrid Method for Sentiment Analysis in Social NetworksDoctoral Thesis1128811405