Bebek ağlamalarının makine öğrenmesi algoritmalarıyla sınıflandırılması
Yükleniyor...
Dosyalar
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Düzce Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
İnsanlar sürekli olarak birbirleriyle iletişim halindedirler ve bunu genellikle dil aracılığıyla gerçekleştirirler. Yeni doğan bir bebeğin bu beceriyi kazanana kadar kendini ifade etmek için en etkili yolu ağlamaktır. Bebek ağlamaları genellikle yetişkinler tarafından rahatsız edici ve anlamsız olarak algılanabilirken, aslında birçok bilgi içerebilirler. Bu bilgiler doğru yöntemler kullanılarak analiz edildiğinde bebeğin ağlama nedenini ortaya koyabilir. Bebeğin sağlığı ve mutluluğu için ağlama nedeninin anlaşılması çok önemlidir. Bu tez çalışmasında, bebek ağlaması sinyallerindeki bilgi ses işleme yöntemleri kullanılarak anlamlandırılmaya ve makine öğrenimi algoritmalarıyla sınıflandırılmaya çalışılmıştır. Bu doğrultuda beş ayrı sınıfa ayrılmış bebek ağlaması ses sinyalleri içeren bir veri seti kullanılmış, veri seti üzerinde verileri eşit parçalara bölme yöntemi uygulanarak her bölme işlemi için ayrı veri seti oluşturulmuştur. Daha sonra her veri seti üzerinde öznitelik çıkarma işlemleri uygulanmış ve sınıflandırma algoritmaları ile performans değerleri ölçülmüştür. Bu ölçüm sonuçları incelenmiş ve kullanılan veri artırma yöntemi ile oluşturulan veri setleri üzerinde daha yüksek performans değerleri elde edildiği görülmüştür. Kullanılan altı algoritma oluşturulan veri setleri ile modellenmiş ve en yüksek performans skoru Extreme Gradient Boosting (XGBoost) algoritması ile %99,51 olarak bulunmuştur.
People are constantly in communication with each other, and they generally do this through language. Until a newborn baby acquires this skill, crying is the most effective way for them to express themselves. While baby cries may be perceived as disturbing and meaningless by adults, they actually contain a lot of information. When these pieces of information are analyzed using appropriate methods, the reason behind the baby's crying can be revealed. Understanding the cause of the baby's cries is crucial for their health and happiness. In this thesis study, an attempt has been made to interpret baby cries using signal processing techniques and classify them with machine learning algorithms. For this purpose, a dataset containing baby cry audio signals categorized into five classes was used. The dataset was divided into equal parts for each partitioning process, and a separate dataset was created for each part. Then, feature extraction processes were applied to each dataset, and performance values were measured using classification algorithms. These measurement results were examined, and it was observed that higher performance values were achieved on the datasets generated using the data augmentation method. Six algorithms were modeled with the generated datasets, and the highest performance score of 99.51% was obtained with the Extreme Gradient Boosting (XGBoost) algorithm.
People are constantly in communication with each other, and they generally do this through language. Until a newborn baby acquires this skill, crying is the most effective way for them to express themselves. While baby cries may be perceived as disturbing and meaningless by adults, they actually contain a lot of information. When these pieces of information are analyzed using appropriate methods, the reason behind the baby's crying can be revealed. Understanding the cause of the baby's cries is crucial for their health and happiness. In this thesis study, an attempt has been made to interpret baby cries using signal processing techniques and classify them with machine learning algorithms. For this purpose, a dataset containing baby cry audio signals categorized into five classes was used. The dataset was divided into equal parts for each partitioning process, and a separate dataset was created for each part. Then, feature extraction processes were applied to each dataset, and performance values were measured using classification algorithms. These measurement results were examined, and it was observed that higher performance values were achieved on the datasets generated using the data augmentation method. Six algorithms were modeled with the generated datasets, and the highest performance score of 99.51% was obtained with the Extreme Gradient Boosting (XGBoost) algorithm.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control