Einipour A, Mosleh M, Ansari-Asl K. A Graph-Based Clustering Approach to Identify Cell Populations in Single-Cell RNA Sequencing Data. jhbmi 2020; 7 (1) :60-72
URL:
http://jhbmi.ir/article-1-420-fa.html
عینی پور امین، مصلح محمد، انصاری اصل کریم. ارائه یک روش خوشهبندی گراف-محور جهت شناسایی جمعیتهای سلولی در دادههای توالییابی RNA سلول-منفرد. مجله انفورماتیک سلامت و زیست پزشکی. 1399; 7 (1) :60-72
URL: http://jhbmi.ir/article-1-420-fa.html
گروه مهندسی کامپیوتر،واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران
چکیده: (3488 مشاهده)
مقدمه: استفاده از فناوری «توالی یابی RNA سلول-منفرد» باعث شناخت بهتر ساختارهای سلولی شده و دادههای با وضوح بسیار بالایی از بیان ژنهای مختلف هر سلول را در یک زمان واحد ارائه میدهد. یکی از زمینه های پرکاربرد در این حوزه، خوشهبندی داده ها بر اساس ژنهای بیان شده است که بعضاً منتج به شناسایی جمعیت های سلولی جدید میگردد. عملکرد روش های پیشنهادی عمدتاً به شکل جمعیت ها و ابعاد داده ها بستگی دارد؛ لذا توسعه یک روش که بتواند فارغ از این موانع به شناسایی جمعیت های سلولی بپردازد، بسیار مهم است.
روش: در روش پیشنهادی که یک روش کتابخانه ای بود، ابتدا تعداد جمعیتهای سلولی تخمین زده شد. این تخمین از آن جهت اهمیت دارد که در دنیای واقعی، اطلاعات اولیه مثل تعداد و نوع جمعیتهای سلولی در دسترس نیست. سپس با استفاده از یک کرنل گاوسی مبتنی بر گراف، ضمن کاهش ابعاد مسئله، اقدام به شناسایی جمعیتهای سلولی با روش خوشهبندی kmeans++ شد.
نتایج: نتایج پیادهسازی نشان داد که روش پیشنهادی میتواند نسبت به سایر روشهای یادگیری ماشین ارائه شده در این زمینه، بهبود قابل قبولی را حاصل کند. به عنوان مثال برای معیار ARI، مقادیر 100، 93/47 و 84/69 به ترتیب برای مجموعه دادههای سلول-منفرد Kolod، Buettner و Usoskin حاصل شد.
نتیجه گیری: روش پیشنهادی بدون هیچ اطلاعات اولیه در مورد تعداد و نوع جمعیتهای سلولی و فارغ از ابعاد بالای مسئله، میتواند اقدام به خوشهبندی و در نتیجه شناسایی جمعیتهای سلولی با دقت و کیفیت بالایی نماید.
نوع مطالعه:
پژوهشي اصیل |
موضوع مقاله:
بیوانفورماتیک دریافت: 1398/4/25 | پذیرش: 1398/9/23