دکتری تخصصی مهندسی پزشکی- بیوالکتریک، استادیار، گروه بیوانفورماتیک، دانشکده فناوریهای نوین پزشکی، دانشگاه علوم پزشکی اصفهان، اصفهان، ایران
چکیده: (1921 مشاهده)
مقدمه: دقت و زمان لازم برای آنالیز دادههای نسل نوین توالییابی (NGS) بسته به ابزارهای استفاده شده برای همترازی، فراخوانی واریانت، حاشیهنویسی، اولویتبندی و فیلترینگ واریانتها، تسلط افراد به تحلیل و تفسیر دادهها و ظرفیت محاسباتی آزمایشگاه متفاوت بوده و بهینهسازی آن یک مسئله چالش برانگیز است.
روش: یک نرمافزار کاربردی به منظور بهینهسازی مرحله سوم آنالیز دادههای NGS طراحی و با زبان برنامهنویسی C# پیادهسازی شد. در این مطالعه روند حاشیهنویسی، فیلترینگ و تفسیر دادههای NGS برای بیماری ناشنوایی غیرسندرمیک با وراثت اتوزومی مغلوب به طور اختصاصی بهینه شده است.
نتایج: داده مربوط به بیماری که دارای یک جهش بیماریزای تأیید شده توسط آنالیز ژنتیکی فامیلی بود و تعداد واریانتهای اولیه در فایل حاصل از آنالیز مراحل اولیه وی شامل 671829 واریانت میشد توسط نرمافزار پیادهسازی شده مورد تحلیل قرار گرفت. بعد از انجام مرحله اولویت بندی خودکار واریانتها با استفاده از فایل BED، تعداد واریانتها 508 شد. با توجه به شجرهی خانوادگی بیمار در مرحله بعدی آنالیز واریانتهای هوموزیگوت انتخاب شدند و به این ترتیب تعداد واریانتها به 187 رسید. بعد از اعمال آستانه فراوانی جمعیتی 0/6% در پایگاههای داده genomAD و ExAC تعداد واریانتهای باقیمانده به ترتیب 110 و 3 واریانت شد. پاتوژن شناسایی شده نهایی با نتیجهی توالییابی سنگر که به منظور بررسی همتفکیکی واریانت مورد نظر در خانواده انجام شده بود، همخوانی داشت. مدت زمان آنالیز توسط نرمافزار طراحی شده بر روی یک کامپیوتر شخصی متوسط 15 دقیقه بود.
نتیجهگیری: نرمافزار طراحی شده کاملاً گرافیکی و بدون نیاز به کدنویسی است که علاوه بر قابلیت مقایسه و یکپارچه کردن فایلهای ورودی، امکان ایجاد یک دیتابیس داخلی از فایلهای آنالیز شده، امکان اعمال محدودیت ناحیه آنالیز و آستانهگذاری بر فیلدهای مختلف پایگاههای داده انتخابی توسط کاربر را دارد.
نوع مطالعه:
پژوهشي اصیل |
موضوع مقاله:
بیوانفورماتیک دریافت: 1398/11/15 | پذیرش: 1399/4/1