Usage of heckman sample selection model in health studies: An application of prostate cancer patients
Yükleniyor...
Dosyalar
Tarih
2017
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Turkiye Klinikleri
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Objective: The objective of this study is to introduce theoretical characteristics of Heckman sample selection regression model,to clarify when it is required to be used and to show its usage in health area. Material and Methods: Heckman selection model, which is an appropriate tool for addressing the sample selection bias, was used for determining the risk factors of Gleason score for three datasets which have 2000 observations obtained from simulation study. The data was about the prostate cancer patients. In the data, there were benign tumor structures or stage 1 tumors in the study besides malign tumors but Gleason score was not calculated when tumor is benign. So sample selection bias is a matter for nonresponse Gleason score answers in our data. Also the model was performed for the datasets that have 0.30; 0.50 and 0.70 of censored proportion (nonresponse Gleason score) individual number by considering actual structures between variables with the help of simulation. Results: There was no significant relationship between Gleason score and smoking, family history. But we found that age, PSA(prostate specific antigen) and weight variables have significant relationship with Gleason score (p<0.001). Adjusted standard error value was the highest in dataset with 0.50 censored proportion, and the lowest in data set with highest censor proportion (0.70). Among models the lowest log likelihood value has been determined in model with 0.50 censor proportion. Conclusion: When there is sample selection bias on dependent variable, Heckman sample selection regression model can be suggested. In addition, researchers can have more accurate results by increasing the use of these models in health sciences. © 2017 by Türkiye Klinikleri.
ÖZET Amaç: Bu çalışmanın amacı, Heckman seçim regresyon modelinin teorik özelliklerini tanıtmak, hangi durumlarda kullanılması gerektiğini ve sağlık alanında kullanımını göstermektir. Gereç ve Yöntemler: Çalışmada örnek seçim yanlılığını gideren uygun bir model olan Heckman seçim modeli, Gleason skoruna etki eden risk faktörlerini araştırmak amacıyla simülasyon çalışmasından elde edilen 2000 gözleme sahip üç veri seti için kullanılmıştır. Veri setleri prostat kanserli hastaları içermektedir. Gleason skoru prostat kanseri hastalarında tümörün çeşidi malign olduğunda hesaplanan bir skor olmasına rağmen, çalışmamızda tümor yapısı olarak iyi huylu veya 1. evre tümörler de mevcut olduğundan, Gleason skoru hesaplanamayan birçok kişi sebebiyle örnek seçim yanlılığı söz konusudur. Model, gerçek yapıları dikkate alarak simülasyon yoluyla elde edilen sansür oranları (Gleason skoru hesaplanamayan) sırasıyla 0.30; 0.50 ve 0.70 olan üç farklı veri seti için kurulmuştur. Bulgular: Gleason skoru ile sigara içme durumu ve aile öyküsü değişkenleri arasında istatistiksel olarak anlamlı bir ilişki gözlenmemiştir. Ancak, Gleason skoru ile yaş, PSA ve ağırlık arasında anlamlı bir ilişki gözlenmiştir (p<0.001). Düzeltilmiş standart hata değeri en yüksek 0.50 sansür oranına sahip veri setinde ve en düşük değer ise sansür oranı 0.70 olan veri setinde elde edilmiştir. En düşük log olabilirlik değerine sahip model ise 0.50 sansür oranına sahip olan Heckman modelinde elde edilmiştir. Sonuç: Bağımlı değişken üzerinde seçim yanlılığı varlığında, Heckman seçim regresyon modellerinin kullanımı düşünülebilir. Ayrıca araştırmacılar, bu modellerin sağlık alanında kullanımını artırarak daha doğru sonuçlar elde edebilmektedir.
ÖZET Amaç: Bu çalışmanın amacı, Heckman seçim regresyon modelinin teorik özelliklerini tanıtmak, hangi durumlarda kullanılması gerektiğini ve sağlık alanında kullanımını göstermektir. Gereç ve Yöntemler: Çalışmada örnek seçim yanlılığını gideren uygun bir model olan Heckman seçim modeli, Gleason skoruna etki eden risk faktörlerini araştırmak amacıyla simülasyon çalışmasından elde edilen 2000 gözleme sahip üç veri seti için kullanılmıştır. Veri setleri prostat kanserli hastaları içermektedir. Gleason skoru prostat kanseri hastalarında tümörün çeşidi malign olduğunda hesaplanan bir skor olmasına rağmen, çalışmamızda tümor yapısı olarak iyi huylu veya 1. evre tümörler de mevcut olduğundan, Gleason skoru hesaplanamayan birçok kişi sebebiyle örnek seçim yanlılığı söz konusudur. Model, gerçek yapıları dikkate alarak simülasyon yoluyla elde edilen sansür oranları (Gleason skoru hesaplanamayan) sırasıyla 0.30; 0.50 ve 0.70 olan üç farklı veri seti için kurulmuştur. Bulgular: Gleason skoru ile sigara içme durumu ve aile öyküsü değişkenleri arasında istatistiksel olarak anlamlı bir ilişki gözlenmemiştir. Ancak, Gleason skoru ile yaş, PSA ve ağırlık arasında anlamlı bir ilişki gözlenmiştir (p<0.001). Düzeltilmiş standart hata değeri en yüksek 0.50 sansür oranına sahip veri setinde ve en düşük değer ise sansür oranı 0.70 olan veri setinde elde edilmiştir. En düşük log olabilirlik değerine sahip model ise 0.50 sansür oranına sahip olan Heckman modelinde elde edilmiştir. Sonuç: Bağımlı değişken üzerinde seçim yanlılığı varlığında, Heckman seçim regresyon modellerinin kullanımı düşünülebilir. Ayrıca araştırmacılar, bu modellerin sağlık alanında kullanımını artırarak daha doğru sonuçlar elde edebilmektedir.
Açıklama
Anahtar Kelimeler
Models; Neoplasm grading; Prostatic neoplasms; Selection bias; Statistical
Kaynak
Turkiye Klinikleri Journal of Medical Sciences
WoS Q Değeri
Scopus Q Değeri
Q4
Cilt
37
Sayı
4