Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data

dc.authorid
dc.contributor.authorNaır, Melih
dc.contributor.authorKayaalp, Fatih
dc.date.accessioned2021-12-01T18:21:54Z
dc.date.available2021-12-01T18:21:54Z
dc.date.issued2019
dc.department[Belirlenecek]en_US
dc.description.abstractBy the recent developments about the information technologies, companies can store their data faster and easierwith lower costs. All transactions (sales, current card, invoicing, etc.) performed in companies during the daycombine at the end of the day to form big datasets. It is possible to extract valuable information through thesedatasets with data mining. And this has become more important for companies in terms of today's conditions wherethe competition in the market is high. In this study, a dataset of a company selling car maintenance and repairproducts in Turkey is used. Association Rules are applied on this dataset for determining the items which arebought together by the customers. These rules, which are calculated specifically for the company, can be used toredefine the sales and marketing strategies, to revise the storage areas efficiently, and to create sales campaignssuitable for the customers and regions. These algorithms are also called Frequent Itemset Mining Algorithms. Themost recent 11 algorithms from these are applied to this dataset in order to compare the performances accordingto metrics like memory usage and execution times against varying support values and varying record numbers byusing SPMF platform. Three different datasets are created by using the whole dataset like 6-months, 12-monthsand 22-months. According to the experiments, it can be said that executon times generally increases inversely withthe support values as nearly all algorithms have higher execution time values for the lowest support value of 0.1.dEclat_bitset algorithm has the most efficient performance for 6-months and 12-months dataset. But Eclatalgorithm can be said to be the most efficient algorithm for 0.7 and 0.3 support values; on the other handdEclat_bitset is the most efficient algorithm for 0.3 and 0.1 support values on 22-months dataset.en_US
dc.description.abstractBilgi teknolojilerindeki son gelişmeler sayesinde, şirketler verilerini daha düşük maliyetlerle daha hızlı ve daha kolay saklayabilirler. Gün içinde şirketlerde gerçekleştirilen tüm işlemler (satışlar, cari kartlar, faturalama vb.), günün sonunda birleştirilir ve büyük veri setleri oluştururlar. Bu veri setlerinden veri madenciliği aracılıyla değerli bilgiler elde edilmesi mümkündür. Pazardaki rekabetin yüksek olduğu günümüz şartları açısından bu durum şirketler için çok daha önemli hale gelmiştir. Bu çalışmada Türkiye’de araç bakım ve servis ürünleri satan bir şirketin veriseti kullanılmıştır. Bu verisetine, müşteriler tarafından birlikte satın alınmış olan ürünlerin tespiti için Birliktelik Kuralları uygulanmıştır. Şirketlere özgü olarak çıkarımı yapılan bu kurallar şirketlerin satış ve pazarlama stratejilerinin belirlenmesinde, depoların verimli bir şekilde kullanımlarında ve müşteriler ya da bölgelere göre uygun satış kampanyaları oluşturulmasında kullanılabilir. Birliktelik kuralları aynı zamanda Sık Satılan Ürün Algoritmaları olarak da isimlendirilebilmektedir. Bu algoritmalardan en güncel 11 tanesi SPMF yazılımı kullanılarak bu veri setine uygulanmış ve bu algoritmaların değişken destek değerleri ve değişken kayıt sayılarına bağlı olarak performansları, bellek kullanım miktarları ve işlem süreleri açısından karşılaştırılmıştır. Başlangıçtaki veri seti, 6 aylık, 12 aylık ve 22 aylık kayıt içerecek şekilde 3 ayrı veri seti haline getirilmiştir. Deney sonuçlarına bakıldığında, işlem zamanlarının genellikle destek değerleriyle ters orantılı olarak arttığı söylenebilir. Çünkü neredeyse tüm algoritmaların en düşük destek değeri olan 0,1 için daha yüksek işlem zamanı değerlerine sahip oldukları görülmüştür. 6 aylık ve 12 aylık veri setleri için dEclat_bitset algoritması en verimli performansı göstermiştir. Fakat 22 aylık veri setinde, 0,7 ve 0,3 destek değerleri için Eclat algoritması en verimli olarak görünürken; 0,3 ve 0,1 destek değerleri için dEclat_bitset algoritması en verimli olarak görünmektedir.en_US
dc.identifier.doi10.29130/dubited.581931
dc.identifier.endpage2000en_US
dc.identifier.issn2148-2446
dc.identifier.issue3en_US
dc.identifier.startpage1985en_US
dc.identifier.urihttps://doi.org/10.29130/dubited.581931
dc.identifier.urihttps://app.trdizin.gov.tr/makale/TXpnNU5qSTRPQT09
dc.identifier.urihttps://hdl.handle.net/20.500.12684/9325
dc.identifier.volume7en_US
dc.indekslendigikaynakTR-Dizinen_US
dc.language.isoenen_US
dc.relation.ispartofDüzce Üniversitesi Bilim ve Teknoloji Dergisi
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subject[No Keywords]en_US
dc.titlePerformance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Dataen_US
dc.typeArticleen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
9325.pdf
Boyut:
900.43 KB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text