El Yazısı Rakam Tanıma Problemi için Havuzlama Yöntemlerinin Karşılaştırılması
Loading...
Files
Date
2019
Journal Title
Journal ISSN
Volume Title
Publisher
Institute of Electrical and Electronics Engineers Inc.
Access Rights
info:eu-repo/semantics/closedAccess
Abstract
Desen tanıma sistemlerinin tasarımında, el
yazısı rakamlarının tanınması için güncel bir
yaklaşım olarak evrişimli sinir ağları (convolutional
neural network) kullanılmaktadır. Evrişimli sinir
ağlarının çok katmanlı bir yapıya ve her bir
katmanda çok sayıda öğeye sahip olması karmaşıklık
düzeyini artırmaktadır. Karmaşıklık düzeyinin
artması bu ağlar için optimum konfigürasyonun
keşfedilmesini de epeyce zorlaştırmaktadır. Bu
zorluğu aşmak ve görüntüleri başarılı bir şekilde
sınıflandırmak için evrişimli sinir ağlarının
katmanlarını bağımsız bir şekilde modellemek
etkili bir çözüm olabilir. Bu makale
çalışmasında evrişimli sinir ağlarının üç temel
katmanından biri olan havuzlama (pooling)
katmanının optimum tekniklerle tasarlanması
üzerine araştırmalar yapılmıştır. Bu amaçla
öncelikle temel bir evrişimli ağ yapısı
oluşturulmuştur. Devamında ise MNIST veri seti
kullanarak farklı havuzlama yöntemlerinin, bu
ağların sınıflandırma performansı üzerinde
etkisi araştırılmıştır. Yapılan çalışmada,
literatürde en çok kullanılan ortalama ve
maksimum havuzlama yöntemlerinin yanında
Mixed havuzlama, Stochastic havuzlama,
rastgele havuzlama, Gauss havuzlama, medyan
havuzlama, minimum havuzlama yöntemleri de
kullanılmıştır. Deneysel sonuçlar en yüksek
doğruluk değerinin Mixed havuzlama, en düşük
doğruluk değerlerinin minimum havuzlama
yöntemine ait olduğunu göstermiştir.
Convolutional Neural Networks (CNNs) are used as a current approach to the recognition of handwritten digits for the design of pattern recognition systems. The fact that Convolutional neural networks have a multilayered structure and a large number of items in each layer increases the level of complexity. Increasing the level of complexity makes extremely difficult to discover the optimum configuration for these networks. Modelling the layers of convolutional neural networks independently may be an effective solution to overcome this difficulty and successfully classify images. In this paper, we have investigated the design of the pool layer, which is one of the three basic layers of convoluted neural networks, with optimum techniques. For this purpose primarily a basic convolutional network structure is formed. Then effect of different pooling methods on the classification performance of these networks was investigated using the MNIST dataset. In this study, in addition to the average and maximum pooling methods commonly used in the literature, Mixed pooling, Stochastic pooling, random pooling, Gaussian pooling, median pooling, minimum pooling methods are also used. Experimental results show that the Mixed pooling method has highest accuracy and minimum pooling method has the lowest accuracy .
Convolutional Neural Networks (CNNs) are used as a current approach to the recognition of handwritten digits for the design of pattern recognition systems. The fact that Convolutional neural networks have a multilayered structure and a large number of items in each layer increases the level of complexity. Increasing the level of complexity makes extremely difficult to discover the optimum configuration for these networks. Modelling the layers of convolutional neural networks independently may be an effective solution to overcome this difficulty and successfully classify images. In this paper, we have investigated the design of the pool layer, which is one of the three basic layers of convoluted neural networks, with optimum techniques. For this purpose primarily a basic convolutional network structure is formed. Then effect of different pooling methods on the classification performance of these networks was investigated using the MNIST dataset. In this study, in addition to the average and maximum pooling methods commonly used in the literature, Mixed pooling, Stochastic pooling, random pooling, Gaussian pooling, median pooling, minimum pooling methods are also used. Experimental results show that the Mixed pooling method has highest accuracy and minimum pooling method has the lowest accuracy .
Description
2018 International Conference on Artificial Intelligence and Data Processing, IDAP 2018 -- 28 September 2018 through 30 September 2018 -- -- 144523
Keywords
Convolutional neural network, Handwritten digit recognition problem, Pooling Methods
Journal or Series
2018 International Conference on Artificial Intelligence and Data Processing, IDAP 2018