El Yazısı Rakam Tanıma Problemi için
Havuzlama Yöntemlerinin Karşılaştırılması

Desen tanıma sistemlerinin tasarımında, el yazısı rakamlarının tanınması için güncel bir yaklaşım olarak evrişimli sinir ağları (convolutional neural network) kullanılmaktadır. Evrişimli sinir ağlarının çok katmanlı bir yapıya ve her bir katmanda çok sayıda öğeye sahip olması karmaşıklık düzeyini artırmaktadır. Karmaşıklık düzeyinin artması bu ağlar için optimum konfigürasyonun keşfedilmesini de epeyce zorlaştırmaktadır. Bu zorluğu aşmak ve görüntüleri başarılı bir şekilde sınıflandırmak için evrişimli sinir ağlarının katmanlarını bağımsız bir şekilde modellemek etkili bir çözüm olabilir. Bu makale çalışmasında evrişimli sinir ağlarının üç temel katmanından biri olan havuzlama (pooling) katmanının optimum tekniklerle tasarlanması üzerine araştırmalar yapılmıştır. Bu amaçla öncelikle temel bir evrişimli ağ yapısı oluşturulmuştur. Devamında ise MNIST veri seti kullanarak farklı havuzlama yöntemlerinin, bu ağların sınıflandırma performansı üzerinde etkisi araştırılmıştır. Yapılan çalışmada, literatürde en çok kullanılan ortalama ve maksimum havuzlama yöntemlerinin yanında Mixed havuzlama, Stochastic havuzlama, rastgele havuzlama, Gauss havuzlama, medyan havuzlama, minimum havuzlama yöntemleri de kullanılmıştır. Deneysel sonuçlar en yüksek doğruluk değerinin Mixed havuzlama, en düşük doğruluk değerlerinin minimum havuzlama yöntemine ait olduğunu göstermiştir.
Convolutional Neural Networks (CNNs) are used as a current approach to the recognition of handwritten digits for the design of pattern recognition systems. The fact that Convolutional neural networks have a multilayered structure and a large number of items in each layer increases the level of complexity. Increasing the level of complexity makes extremely difficult to discover the optimum configuration for these networks. Modelling the layers of convolutional neural networks independently may be an effective solution to overcome this difficulty and successfully classify images. In this paper, we have investigated the design of the pool layer, which is one of the three basic layers of convoluted neural networks, with optimum techniques. For this purpose primarily a basic convolutional network structure is formed. Then effect of different pooling methods on the classification performance of these networks was investigated using the MNIST dataset. In this study, in addition to the average and maximum pooling methods commonly used in the literature, Mixed pooling, Stochastic pooling, random pooling, Gaussian pooling, median pooling, minimum pooling methods are also used. Experimental results show that the Mixed pooling method has highest accuracy and minimum pooling method has the lowest accuracy .

Açıklama

2018 International Conference on Artificial Intelligence and Data Processing, IDAP 2018 -- 28 September 2018 through 30 September 2018 -- -- 144523

Anahtar Kelimeler

Convolutional neural network, Handwritten digit recognition problem, Pooling Methods

Kaynak

2018 International Conference on Artificial Intelligence and Data Processing, IDAP 2018

Bağlantı

https://doi.org/10.1109/IDAP.2018.8620848
https://hdl.handle.net/20.500.12684/9865

Koleksiyon

Scopus İndeksli Yayınlar Koleksiyonu

Detaylı Öğe Kaydı

El Yazısı Rakam Tanıma Problemi için Havuzlama Yöntemlerinin Karşılaştırılması

Dosyalar

Tarih

Yazarlar

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

Özet

Açıklama

Anahtar Kelimeler

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Bağlantı

Koleksiyon