التسلسل الخالي من المحاذاة

في المعلوماتية الحيوية , طرق تحليل التسلسلات الخالية من المحاذاة إلى تسلسلات جزيئية وبيانات مهيكلة تقدم بدائل عن طرق التسلسلات التي تعتمد على المحاذاة الانبثاق والحاجة لتحليل انواع مختلفة من البيانات تولدت عن طريق البحوث الحيوية، قدمت نهوضا في مجال المعلومات الحيوية.^[1] التسلسلات الجزيئية والبيانات المهيكلة حمض نووي ريبوزي منقوص الأكسجين , حمض نووي ريبوزي, وبروتين, جوانب تعبير جيني أو بيانات المصفوفة الدقيقة للاحماض النووية, مسار أيضي (الايض الاستقلابي) هي بعض الانواع الاساسية للبيانات التي تم تحليلها في المعلومات الحيوية. فيما بينهم، بيانات التسلسلات تزيد بمعدل متسارع وذلك يعود إلى ظهور الجيل التالي من تقنيات التسلسل. منذ نشأة المعلومات الحيوية، ظل تحليل التسلسلات مجال البحث الرئيسي مع تطبيقات واسعة المدى في تحليل قواعد البيانات، التعليقات التوضيحية للجينوم, علم الجينوم المقارن, نسالة جزيئية (علم الوراثة الجزيئي), تنبؤ بالمورثات الجيني. الطرق الرائدة لتحليل التسلسلات تعتمد على تسلسلات المحاذاة سواء كانت عالمية أو محلية، زوجية أو متعددة. ^[2]^[3] الطرق التي تعتمد على المحاذاة تقدم نتائج ممتازه بشكل عام عندما تكون التسلسلات قيد الدراسة وثيقة الصلة ويمكن محاذاتها بشكل موثوق، ولكن عندما تكون التسلسلات متباينة، لن نتمكن من الحصول على محاذاة موثوقة وبالتالي تطبيقات تسلسلات المحاذاة تكون محدودة. سلبية اخرى للتسلسلات التي تعتمد على المحاذاة هي تعقيقداتها الحسابية واستهلاكها للوقت وبالتالي يقل استخدامها عند التعامل مع بيانات تسلسل واسعة النطاق. نتج عن ظهور الجيل التالي من تقنيات التسلسل توليد بيانات تسلسلات ضخمة. ^[4]حجم هذه البيانات يفرض تحديات على خوارزميات التسلسلات التي تعتمد على المحاذاة من خلال تجميعها، توضيحها (بوضع ملاحظات), مقارنتها مع دراسات مشابهه.

طرق خالية من المحاذاة

يمكن تصنيف الطرق الخالية من المحاذاة على نطاق واسع إلى خمس فئات :أ) طرق تعتمد على تردد، ب) طرق تعتمد على طول السلاسل الفرعية الشائعة، ج) طرق تعتمد على عدد مطابقات الكلمات (المباعدة) ، د ) طرق تعتمد على المحاذاة الدقيقة، هـ) طرق تستند إلى نظرية المعلومات و) طرق تعتمد على التمثيل البياني. تم استخدام مناهج خالية من المحاذاة في عمليات البحث عن التشابه المتسلسل ^[5] ، تجميع وتصنيف التسلسلات، ومؤخرًا في علم الوراثة النمائي.^[6]

المصادر

"Bioinformatics. Introduction". The Yale Journal of Biology and Medicine. 85 (3): 305–8. September 2012. PMC . PMID 23189382.
"The many faces of sequence alignment". Briefings in Bioinformatics. 6 (1): 6–22. March 2005. doi:. PMID 15826353.
"Pairwise sequence alignment--it's all about us!". Briefings in Bioinformatics. 7 (1): 113–5. March 2006. doi:. PMID 16761368.
"Upcoming challenges for multiple sequence alignment methods in the high-throughput era". Bioinformatics. 25 (19): 2455–65. October 2009. doi:10.1093/bioinformatics/btp452. PMC . PMID 19648142.
"Biological evaluation of d2, an algorithm for high-performance sequence comparison". Journal of Computational Biology. 1 (3): 199–215. 1994. doi:10.1089/cmb.1994.1.199. PMID 8790465.
"Next-generation phylogenomics". Biology Direct. 8: 3. January 2013. doi:10.1186/1745-6150-8-3. PMC . PMID 23339707.

موسوعات ذات صلة :

موسوعة علم الأحياء