مقدمه: یکی از تحولات مهم علم ژنتیک، ظهور فناوری ریزآرایه و تولید دادههای بیانژنی است که امکان مطالعه رفتار هزاران ژن را به طور همزمان فراهم میکند. خوشهبندی یکی از روشهای دادهکاوی است که در تحلیل دادههای بیانژنی مورد استفاده قرار میگیرد. از آنجا که عملکرد روشهای خوشهبندی به شدت تحت تأثیر دادهها است، نتیجه خوشهبندی همواره با عدم قطعیت روبهرو بوده و الگوریتمی وجود ندارد که بتوان آن را برای تمام دادهها، کارا قلمداد نمود. در این تحقیق، در تحلیل دادههای بیانژنی از خوشهبندی اجماعی (ترکیب نتایج چندین الگوریتم خوشهبندی) به جای اجرای یک الگوریتم منفرد استفاده شده است.
روش: این مقاله عملکرد خوشهبندی اجماعی را بر روی سه مجموعه داده بیانژنی Nutt-v3، Alizadeh-v2 وSU، توسط شاخص رند تعدیل یافته مورد ارزیابی قرار میدهد. برای پیادهسازی خوشهبندی اجماعی، دوازده خوشهبندی متفاوت حاصل از ترکیب چهار الگوریتم خوشهبندی با سه معیار عدم تشابه، به طور همزمان روی دادهها اجرا شدهاند. پس از ادغام نتایج، میزان تطابق خوشههای تخمینی با گروههای واقعی توسط شاخص رند تعدیل یافته سنجیده شده است.
نتایج: مقدار شاخص رند تعدیل یافته برای سه مجموعه داده Nutt-v3 ، Alizadeh-v2 و SU، به ترتیب برابر 1، 0/9 و 0/58به دست آمد که حاکی از دقت بالای روش پیشنهادی در کشف ساختارهای نهفته در دادهها است. همچنین الگوریتم طراحی شده، توانست تعداد واقعی خوشهها را بدون خطا تشخیص دهد.
نتیجهگیری: خوشهبندی اجماعی روشی توانمند برای خوشهبندی دادههای بیانژنی است. با توجه به دقت این روش در کشف ساختارهای واقعی، میتوان آن را با اطمینان جایگزین الگوریتمهای خوشهبندی منفرد نمود.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |