El Yazısı Rakam Tanıma Problemi için Havuzlama Yöntemlerinin Karşılaştırılması

Loading...
Thumbnail Image

Date

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Institute of Electrical and Electronics Engineers Inc.

Access Rights

info:eu-repo/semantics/closedAccess

Abstract

Desen tanıma sistemlerinin tasarımında, el yazısı rakamlarının tanınması için güncel bir yaklaşım olarak evrişimli sinir ağları (convolutional neural network) kullanılmaktadır. Evrişimli sinir ağlarının çok katmanlı bir yapıya ve her bir katmanda çok sayıda öğeye sahip olması karmaşıklık düzeyini artırmaktadır. Karmaşıklık düzeyinin artması bu ağlar için optimum konfigürasyonun keşfedilmesini de epeyce zorlaştırmaktadır. Bu zorluğu aşmak ve görüntüleri başarılı bir şekilde sınıflandırmak için evrişimli sinir ağlarının katmanlarını bağımsız bir şekilde modellemek etkili bir çözüm olabilir. Bu makale çalışmasında evrişimli sinir ağlarının üç temel katmanından biri olan havuzlama (pooling) katmanının optimum tekniklerle tasarlanması üzerine araştırmalar yapılmıştır. Bu amaçla öncelikle temel bir evrişimli ağ yapısı oluşturulmuştur. Devamında ise MNIST veri seti kullanarak farklı havuzlama yöntemlerinin, bu ağların sınıflandırma performansı üzerinde etkisi araştırılmıştır. Yapılan çalışmada, literatürde en çok kullanılan ortalama ve maksimum havuzlama yöntemlerinin yanında Mixed havuzlama, Stochastic havuzlama, rastgele havuzlama, Gauss havuzlama, medyan havuzlama, minimum havuzlama yöntemleri de kullanılmıştır. Deneysel sonuçlar en yüksek doğruluk değerinin Mixed havuzlama, en düşük doğruluk değerlerinin minimum havuzlama yöntemine ait olduğunu göstermiştir.
Convolutional Neural Networks (CNNs) are used as a current approach to the recognition of handwritten digits for the design of pattern recognition systems. The fact that Convolutional neural networks have a multilayered structure and a large number of items in each layer increases the level of complexity. Increasing the level of complexity makes extremely difficult to discover the optimum configuration for these networks. Modelling the layers of convolutional neural networks independently may be an effective solution to overcome this difficulty and successfully classify images. In this paper, we have investigated the design of the pool layer, which is one of the three basic layers of convoluted neural networks, with optimum techniques. For this purpose primarily a basic convolutional network structure is formed. Then effect of different pooling methods on the classification performance of these networks was investigated using the MNIST dataset. In this study, in addition to the average and maximum pooling methods commonly used in the literature, Mixed pooling, Stochastic pooling, random pooling, Gaussian pooling, median pooling, minimum pooling methods are also used. Experimental results show that the Mixed pooling method has highest accuracy and minimum pooling method has the lowest accuracy .

Description

2018 International Conference on Artificial Intelligence and Data Processing, IDAP 2018 -- 28 September 2018 through 30 September 2018 -- -- 144523

Keywords

Convolutional neural network, Handwritten digit recognition problem, Pooling Methods

Journal or Series

2018 International Conference on Artificial Intelligence and Data Processing, IDAP 2018

WoS Q Value

Scopus Q Value

Volume

Issue

Citation