معلومة

3.7: الأسس الاحتمالية لمحاذاة التسلسل - علم الأحياء

3.7: الأسس الاحتمالية لمحاذاة التسلسل - علم الأحياء


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

كما هو موضح أعلاه ، تستخدم خوارزمية بلاست مصفوفة تسجيل (استبدال) لتوسيع قائمة دبليو ميرس من أجل البحث عن تسلسل مطابق تقريبًا وتحديده أثناء تمديد البذور. لكن كيف نبني هذه المصفوفة في المقام الأول؟ كيف تحدد قيمة (s left (x_ {i}، y_ {j} right) ) في المحاذاة العامة / المحلية؟

الفكرة وراء مصفوفة التسجيل هي أن درجة المحاذاة يجب أن تعكس احتمال أن يكون تسلسلان متماثلان متماثلان ، أي احتمال أن يتشارك تسلسلان لهما مجموعة من النيوكليوتيدات في الأصل المشترك. لهذا ، ننظر إلى نسب الاحتمالية بين فرضيتين.

1. الفرضية 1: - أن المحاذاة بين التسلسلين ترجع إلى الصدفة وأن التسلسل في الواقع غير مرتبط.

2. الفرضية 2: - أن المحاذاة ترجع إلى أصل مشترك وأن التسلسلات مرتبطة بالفعل.

بعد ذلك ، نحسب احتمال ملاحظة محاذاة وفقًا لكل فرضية. العلاقات العامة (س ، ص | يو) هو احتمال محاذاة x مع y بافتراض أنهما غير مرتبطين ، بينما العلاقات العامة (س ، ص | ص) هو احتمال

المحاذاة ، على افتراض أنها مرتبطة. بعد ذلك ، نحدد درجة المحاذاة على أنها سجل لنسبة الاحتمالية بين الاثنين:

[ ابدأ {المعادلة}
S equiv log frac {P ( mathbf {x}، mathbf {y} mid R)} {P ( mathbf {x}، mathbf {y} mid U)}
نهاية {المعادلة} عدد ]

نظرًا لأن مجموع السجلات هو سجل للمنتجات ، يمكننا الحصول على النتيجة الإجمالية للمحاذاة عن طريق إضافة درجات المحاذاة الفردية. هذا يعطينا احتمال المحاذاة بالكامل ، بافتراض أن كل محاذاة فردية مستقلة. وبالتالي ، فإن درجة المصفوفة المضافة تعطينا بالضبط احتمال ارتباط التسلسلين ، وأن المحاذاة ليست بسبب الصدفة. بشكل أكثر رسمية ، بالنظر إلى حالة محاذاة البروتينات ، للتسلسلات غير ذات الصلة ، فإن احتمال وجود محاذاة بقايا n بين x و y هو منتج بسيط لاحتمالات التسلسلات الفردية نظرًا لأن أزواج البقايا مستقلة.

هذا هو،

[ ابدأ {المعادلة}
تبدأ {محاذاة}
mathbf {x} & = left {x_ {1} ldots x_ {n} right }
mathbf {y} & = left {y_ {1} ldots x_ {n} right }
q_ {a} & = P ( text {amino acid} a)
P ( mathbf {x}، mathbf {y} mid U) & = prod_ {i = 1} ^ {n} q_ {x_ {i}} prod_ {i = 1} ^ {n} q_ { y_ {i}}
نهاية {محاذاة}
نهاية {المعادلة} عدد ]

بالنسبة للتسلسلات ذات الصلة ، لم تعد أزواج البقايا مستقلة لذا يجب علينا استخدام مفصل مختلف

الاحتمال ، بافتراض أن كل زوج من الأحماض الأمينية المتوافقة قد تطور من سلف مشترك:

[ ابدأ {المعادلة}
تبدأ {محاذاة}
p_ {a b} & = P ( text {التطور أدى إلى} a text {in} mathbf {x} text {and} b text {in} mathbf {y})
ف ( mathbf {x}، mathbf {y} mid R) & = prod_ {i = 1} ^ {n} p_ {x_ {i} y_ {i}}
نهاية {محاذاة}
نهاية {المعادلة} عدد ]

ثم يتم إعطاء نسبة الاحتمالية بين الاثنين من خلال:

[ ابدأ {المعادلة}
تبدأ {محاذاة}
frac {P ( mathbf {x}، mathbf {y} mid R)} {P ( mathbf {x}، mathbf {y} mid U)} & = frac { prod_ {i = 1} ^ {n} p_ {x_ {i} y_ {i}}} { prod_ {i = 1} ^ {n} q_ {x_ {i}} prod_ {i = 1} ^ {n} q_ { y_ {i}}}
& = frac { prod_ {i = 1} ^ {n} p_ {x_ {i} y_ {i}}} { prod_ {i = 1} ^ {n} q_ {x_ {i}} q_ {y_ {أنا}}}
نهاية {محاذاة}
نهاية {المعادلة} عدد ]

نظرًا لأننا نريد في النهاية حساب مجموع الدرجات والاحتمالات التي تتطلب إضافة منتجات ، فإننا نأخذ سجل المنتج للحصول على ملخص سهل:

[ ابدأ {المعادلة}
تبدأ {محاذاة}
S & equiv log frac {P ( mathbf {x}، mathbf {y} mid R)} {P ( mathbf {x}، mathbf {y} mid U)}
v & = sum_ {i} log left ( frac {p_ {x_ {i} y_ {i}}} {q_ {x_ {i}} q_ {y_ {i}}} right)
& equiv sum_ {i} s left (x_ {i}، y_ {i} right)
نهاية {محاذاة}
نهاية {المعادلة} عدد ]

وبالتالي ، يتم إعطاء درجة مصفوفة الاستبدال للزوج المحدد أ ، ب

[ ابدأ {المعادلة}
s (a، b) = log left ( frac {p_ {a b}} {q_ {a} q_ {b}} right)
نهاية {المعادلة} عدد ]

ثم يتم استخدام التعبير أعلاه لإخراج مصفوفة الاستبدال مثل BLOSUM62 للأحماض الأمينية. من المثير للاهتمام ملاحظة أن درجة تطابق الحمض الأميني مع نفسه تعتمد على الحمض الأميني نفسه لأن تكرار التكرار العشوائي للحمض الأميني يؤثر على المصطلحات المستخدمة في حساب درجة احتمالية المحاذاة. ومن ثم ، فإن هذه المصفوفات لا تلتقط تشابه تسلسل المحاذاة فحسب ، بل تلتقط أيضًا التشابه الكيميائي لمختلف الأحماض الأمينية.

الخوارزميات ذات الصلة بـ BLAST: Califino-Rigoutsos’93، Buhler’01، and Indyk-Motwani’98


شاهد الفيديو: أحياء صف عاشر - اسس تصنيف الحيوانات تماثل الجسم (قد 2022).


تعليقات:

  1. Aineislis

    من الأفضل أن أكون صامتا

  2. Anastagio

    إنه لأمر مؤسف للغاية بالنسبة لي ، لا يمكنني مساعدتك بأي شيء. لكن من المؤكد أنك ستجد القرار الصحيح. لا تيأس.

  3. Cyprian

    أعتقد أنك كنت مخطئا. أنا متأكد. اكتب لي في PM.

  4. Sebastyn

    أعتذر ، لكنه لا يأتي في طريقي. هل هناك متغيرات أخرى؟

  5. Akicage

    هل يمكن إكمال الفراغ؟



اكتب رسالة