کارشناسی ارشد مهندسی کامپیوتر گرایش نرمافزار، مربی، عضو هیات علمی گروه کامپیوتر، دانشگاه پیام نور، ایران
چکیده: (9627 مشاهده)
مقدمه: یکی از شایعترین بیماریها و علل مرگ و میر در دنیای امروز بیماریهای قلبی است. استفاده از تکنیکهای دادهکاوی برای ایجاد مدلهای پیشگویی کننده، جهت شناسایی افراد در معرض خطر برای کاهش عوارض ناشی از بیماری بسیار کمک کننده است. در این پژوهش با استفاده از درخت تصمیم C4.5 به روشهای پیشگیری و تشخیص این بیماری پرداخته میشود.
روش: این پژوهش از نوع کاربردی و توصیفی میباشد. در این پژوهش از دادههای استاندارد UCI و مجموعه داده Cleveland استفاده نمودیم. این پایگاه داده شامل 297 رکورد میباشد. تجزیه و تحلیل به کمک نرمافزار Weka با بهکارگیری متدولوژی CRISP3 انجام شده است. در بخش مدلسازی درخت تصمیم C4.5 با بهکارگیری متغیرهای ورودی و تعیین متغیر هدف ایجاد شد.
نتایج: با توجه به مدل استفاده شده مشخص شد که به ترتیب متغیرهای سطح بالای کلسترول، جنسیت، سن بالا، بالا بودن ماکزیمم ضربان قلب، اسکن تالیوم بالاتر از 3 و نوار قلب غیرنرمال بیشترین تأثیر را در ابتلا به بیماری عروق کرونر قلبی دارا هستند. همچنین به کمک درخت تصمیم ایجاد شده، قوانینی استخراج شده است که میتواند به عنوان الگویی در جهت پیشگویی احتمال ابتلا افراد به بیماری عروق کرونر قلبی استفاده شود. صحت مدل ایجاد شده با استفاده از درخت تصمیم بیش از 80 درصد بوده است.
نتیجهگیری: با توجه به محاسبات انجام شده، نرخ دستهبندی برابر با 72/6% و دقت الگوریتم C4.5 برابر با 80/2% بهدست آمد که در مقایسه با نتایج مطالعات انجام شده در حوزه دادهکاوی بیماری قلبی، دقت به دست آمده الگوریتم پیشنهادی قابل قبول است.
نوع مطالعه:
پژوهشي اصیل |
موضوع مقاله:
داده کاوی دریافت: 1395/9/25 | پذیرش: 1396/4/25