TY - JOUR T1 - A Novel Method of Gene Expression Data Clustering TT - روش نوین خوشه‌بندی داده‌های بیان‌ژنی JF - jhbmi JO - jhbmi VL - 3 IS - 3 UR - http://jhbmi.ir/article-1-153-fa.html Y1 - 2016 SP - 205 EP - 213 KW - Data mining KW - Ensemble clustering KW - Hierarchical clustering KW - Partition around medoids KW - Classic multidimensional scaling N2 - مقدمه: یکی از تحولات مهم علم ژنتیک، ظهور فناوری ریزآرایه و تولید داده‌های بیان‌ژنی است که امکان مطالعه رفتار هزاران ژن را به طور همزمان فراهم می‌کند. خوشه‌بندی یکی از روش‌های داده‌کاوی است که در تحلیل داده‌های بیان‌ژنی مورد استفاده قرار می‌گیرد. از آنجا که عملکرد روش‌های خوشه‌بندی به شدت تحت تأثیر داده‌ها است، نتیجه خوشه‌بندی همواره با عدم قطعیت روبه‌رو بوده و الگوریتمی وجود ندارد که بتوان آن را برای تمام داده‌ها، کارا قلمداد نمود. در این تحقیق، در تحلیل داده‌های بیان‌ژنی از خوشه‌بندی اجماعی (ترکیب نتایج چندین الگوریتم خوشه‌بندی) به جای اجرای یک الگوریتم منفرد استفاده شده است. روش: این مقاله عملکرد خوشه‌بندی اجماعی را بر روی سه مجموعه داده بیان‌ژنی Nutt-v3، Alizadeh-v2 وSU، توسط شاخص رند تعدیل یافته مورد ارزیابی قرار می‌دهد. برای پیاده‌سازی خوشه‌بندی اجماعی، دوازده خوشه‌بندی متفاوت حاصل از ترکیب چهار الگوریتم خوشه‌بندی با سه معیار عدم تشابه، به طور همزمان روی داده‌ها اجرا شده‌اند. پس از ادغام نتایج، میزان تطابق خوشه‌های تخمینی با گروه‌های واقعی توسط شاخص رند تعدیل یافته سنجیده شده است. نتایج: مقدار شاخص رند تعدیل یافته برای سه مجموعه داده Nutt-v3 ، ‌Alizadeh-v2 و SU، به ترتیب برابر 1، 0/9 و 0/58به دست آمد که حاکی از دقت بالای روش پیشنهادی در کشف ساختارهای نهفته در داده‌ها است. همچنین الگوریتم طراحی شده، توانست تعداد واقعی خوشه‌ها را بدون خطا تشخیص دهد. نتیجه‌گیری: خوشه‌بندی اجماعی روشی توانمند برای خوشه‌بندی داده‌های بیان‌ژنی است. با توجه به دقت این روش در کشف ساختارهای واقعی، می‌توان آن را با اطمینان جایگزین الگوریتم‌های خوشه‌بندی منفرد نمود. M3 ER -