Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data

Yükleniyor...
Küçük Resim

Tarih

2019

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

By the recent developments about the information technologies, companies can store their data faster and easierwith lower costs. All transactions (sales, current card, invoicing, etc.) performed in companies during the daycombine at the end of the day to form big datasets. It is possible to extract valuable information through thesedatasets with data mining. And this has become more important for companies in terms of today's conditions wherethe competition in the market is high. In this study, a dataset of a company selling car maintenance and repairproducts in Turkey is used. Association Rules are applied on this dataset for determining the items which arebought together by the customers. These rules, which are calculated specifically for the company, can be used toredefine the sales and marketing strategies, to revise the storage areas efficiently, and to create sales campaignssuitable for the customers and regions. These algorithms are also called Frequent Itemset Mining Algorithms. Themost recent 11 algorithms from these are applied to this dataset in order to compare the performances accordingto metrics like memory usage and execution times against varying support values and varying record numbers byusing SPMF platform. Three different datasets are created by using the whole dataset like 6-months, 12-monthsand 22-months. According to the experiments, it can be said that executon times generally increases inversely withthe support values as nearly all algorithms have higher execution time values for the lowest support value of 0.1.dEclat_bitset algorithm has the most efficient performance for 6-months and 12-months dataset. But Eclatalgorithm can be said to be the most efficient algorithm for 0.7 and 0.3 support values; on the other handdEclat_bitset is the most efficient algorithm for 0.3 and 0.1 support values on 22-months dataset.
Bilgi teknolojilerindeki son gelişmeler sayesinde, şirketler verilerini daha düşük maliyetlerle daha hızlı ve daha kolay saklayabilirler. Gün içinde şirketlerde gerçekleştirilen tüm işlemler (satışlar, cari kartlar, faturalama vb.), günün sonunda birleştirilir ve büyük veri setleri oluştururlar. Bu veri setlerinden veri madenciliği aracılıyla değerli bilgiler elde edilmesi mümkündür. Pazardaki rekabetin yüksek olduğu günümüz şartları açısından bu durum şirketler için çok daha önemli hale gelmiştir. Bu çalışmada Türkiye’de araç bakım ve servis ürünleri satan bir şirketin veriseti kullanılmıştır. Bu verisetine, müşteriler tarafından birlikte satın alınmış olan ürünlerin tespiti için Birliktelik Kuralları uygulanmıştır. Şirketlere özgü olarak çıkarımı yapılan bu kurallar şirketlerin satış ve pazarlama stratejilerinin belirlenmesinde, depoların verimli bir şekilde kullanımlarında ve müşteriler ya da bölgelere göre uygun satış kampanyaları oluşturulmasında kullanılabilir. Birliktelik kuralları aynı zamanda Sık Satılan Ürün Algoritmaları olarak da isimlendirilebilmektedir. Bu algoritmalardan en güncel 11 tanesi SPMF yazılımı kullanılarak bu veri setine uygulanmış ve bu algoritmaların değişken destek değerleri ve değişken kayıt sayılarına bağlı olarak performansları, bellek kullanım miktarları ve işlem süreleri açısından karşılaştırılmıştır. Başlangıçtaki veri seti, 6 aylık, 12 aylık ve 22 aylık kayıt içerecek şekilde 3 ayrı veri seti haline getirilmiştir. Deney sonuçlarına bakıldığında, işlem zamanlarının genellikle destek değerleriyle ters orantılı olarak arttığı söylenebilir. Çünkü neredeyse tüm algoritmaların en düşük destek değeri olan 0,1 için daha yüksek işlem zamanı değerlerine sahip oldukları görülmüştür. 6 aylık ve 12 aylık veri setleri için dEclat_bitset algoritması en verimli performansı göstermiştir. Fakat 22 aylık veri setinde, 0,7 ve 0,3 destek değerleri için Eclat algoritması en verimli olarak görünürken; 0,3 ve 0,1 destek değerleri için dEclat_bitset algoritması en verimli olarak görünmektedir.

Açıklama

Anahtar Kelimeler

[No Keywords]

Kaynak

Düzce Üniversitesi Bilim ve Teknoloji Dergisi

WoS Q Değeri

Scopus Q Değeri

Cilt

7

Sayı

3

Künye