[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما ::
:: دوره 2، شماره 1 - ( بهار 1394 ) ::
جلد 2 شماره 1 صفحات 24-32 برگشت به فهرست نسخه ها
جانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی
حمیدرضا طهماسبی ، ملیحه آموزگار، هادی آدینه
1. کارشناسی ارشد مهندسی کامپیوتر، مربی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران.
چکیده:   (7192 مشاهده)

مقدمه: وجود مقادیر مفقود در داده‌های پزشکی می‌تواند تمام فرآیند داده کاوی و تفسیرهای حاصل را تحت تأثیر قرار دهد. بنابراین برخورد با این مقادیر ضروری می‌باشد. در این پژوهش تأثیر روش‌های مختلف برخورد با مقادیر مفقود بر روی دقت کلاسه‌بندی داده‌های پزشکی مورد ارزیابی قرار گرفت.

 روش: در این مطالعه، تأثیر روش‌های معروف جانشینی مقادیر مفقود شامل Mean/mode، Hot Deck، K-Nearest Neighbor، Maximum Possible Value، All Possible Value، Case Deletion و Regression بر روی دقت کلاسه‌بندی مجموعه داده‌های پزشکی سرطان سینه، ناراحتی قلبی، بیماری‌های پوستی، هپاتیت، تیروئید، دیابت، تومور اولیه، بیماران کبدی، سرطان ریه و بعد از جراحی، به ازای شش نرخ مختلف مقادیر مفقود، ارزیابی شد. در آزمایش‌ها از دو کلاسه‌بند شبکه‌های عصبی و نزدیکترین k همسایه در نرم افزار داده کاوی Weka استفاده شد. برای تخمین دقت، از روش 10-Fold cross validation استفاده شد.

نتایج: نتایج نشان داد برای کلاسه‌بند شبکه‌های عصبی، همه روش‌های جانشینی در برابر نرخ‌های مختلف مقادیر مفقود، تأثیرات متفاوتی در دقت کلاسه‌بندی داشتند. برای کلاسه‌بند نزدیکترین k همسایه، روش جانشینی Mean/mode در مقایسه با سایر روش‌ها تقریباً با افزایش نرخ مقادیر مفقود، باعث افزایش دقت کلاسه‌بندی گردید. در مجموع، هیچ یک از روش‌های جانشینی به ازای همه نرخ-های مختلف مقادیر مفقود، همواره بیشترین دقت را نتیجه نداده و برتری نداشت.

نتیجه‌گیری: تحلیل نتایج نشان می‌دهد روش‌های جانشینی بررسی شده به ازای همه نرخ‌های مختلف از مقادیر مفقود شده لزوماً باعث بهبود دقت کلاسه‌بندی نگردیده و هیچ کدام از روش‌های جانشینی بررسی شده بهترین روش نیستند.

واژه‌های کلیدی: مقادیر مفقود، روش‌های جانشینی، داده کاوی پزشکی، کلاسه‌بندی
eprint link: http://eprints.kmu.ac.ir/id/eprint/24842
متن کامل [PDF 872 kb]   (1402 دریافت)    
نوع مطالعه: پژوهشي اصیل | موضوع مقاله: تخصصي
دریافت: ۱۳۹۴/۳/۱ | پذیرش: ۱۳۹۴/۳/۲۵
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

کد امنیتی را در کادر بنویسید >


XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Tahmasbi H, Amoozgar M, Adine H. Replacement of Missing Values and its Effect on the Classification Accuracy in Medical Data Mining. Journal of Health and Biomedical Informatics. 2015; 2 (1) :24-32
URL: http://jhbmi.ir/article-1-86-fa.html

طهماسبی حمیدرضا، آموزگار ملیحه، آدینه هادی. جانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی. مجله انفورماتیک سلامت و زیست پزشکی. 1394; 2 (1) :24-32

URL: http://jhbmi.ir/article-1-86-fa.html



دوره 2، شماره 1 - ( بهار 1394 ) برگشت به فهرست نسخه ها
مجله انفورماتیک سلامت و زیست پزشکی Journal of Health and Biomedical Informatics
Persian site map - English site map - Created in 0.05 seconds with 31 queries by YEKTAWEB 3657