مستوحاة من ChatGPT، يتوقع Google DeepMind حدوث 71 مليون طفرة جينية! يقوم الذكاء الاصطناعي بفك الشفرة الوراثية للجينات البشرية في العلوم

المصدر الأصلي: Xinzhiyuan

مصدر الصورة: تم إنشاؤها بواسطة Unbounded AI‌

بعد أن أطلق نموذج التنبؤ بالبروتين AlphaFold موجة على مستوى تسونامي في عالم الذكاء الاصطناعي، بشرت عائلة Alpha ببداية جديدة.

اليوم، أصدر Google DeepMind نموذجًا جديدًا للذكاء الاصطناعي يسمى AlphaMissense، والذي يمكنه التنبؤ بـ 71 مليون "طفرة خاطئة".

على وجه التحديد، من بين 89% من "الطفرات الخاطئة" التي تنبأ بها AlphaMissense بنجاح، كان 57% منها مسببًا للأمراض و32% حميدة.

عنوان الورقة:

فقط 0.1% من الطفرات يمكن تأكيدها من قبل الخبراء البشريين.

ومن أجل أن يتمكن الباحثون من فهم تأثيرها المحتمل بشكل أفضل، قامت جوجل أيضًا بنشر الكتالوج الكامل الذي يضم عشرات الملايين من "الطفرات الخاطئة".

لطالما كان اكتشاف السبب الكامن وراء ذلك أحد أكبر التحديات في علم الوراثة البشرية.

الطفرات الخاطئة هي طفرات جينية يمكن أن تؤثر على وظيفة "البروتينات البشرية" ويمكن أن تؤدي إلى أمراض مثل التليف الكيسي، وفقر الدم المنجلي، والسرطان.

تُظهر ولادة AlphaMissense الإمكانات الهائلة للذكاء الاصطناعي في المجال الطبي، وخاصة في علم الوراثة.

إنه ذو أهمية كبيرة لفهم العلاقة بين التنوع الوراثي والمرض وتطوير علاجات دوائية مستهدفة.

بعد AlphaFold، قد يصبح AlphaMissense هو الذكاء الاصطناعي الذي يمكنه تغيير العالم ومن المتوقع أن يتغلب على مشاكل علم الوراثة البشرية!

** ما هي "الطفرة الخاطئة"؟ **

الطفرة الخاطئة هي طفرة جينية تستخدم في مجالات الطب الحيوي والبيولوجيا الجزيئية لوصف الجينات المشفرة للبروتين:

يؤدي استبدال حرف واحد في DNA إلى حمض أميني مختلف في البروتين.

إذا كنت تفكر في الحمض النووي كلغة، فإن استبدال حرف واحد يمكن أن يغير الكلمة ويغير معنى الجملة تمامًا.

في هذه الحالة، تؤدي التغييرات في الحمض النووي إلى تغييرات في الأحماض الأمينية التي تؤثر على وظيفة البروتين.

يحمل الشخص العادي أكثر من 9000 طفرة خاطئة.

بشكل عام، معظم هذه الطفرات الخاطئة حميدة ولها تأثير ضئيل على جسم الإنسان. لكن القلة المتبقية مسببة للأمراض ويمكن أن تعطل وظيفة البروتين بشدة.

يمكن استخدام الطفرات الخاطئة لتشخيص الأمراض الوراثية النادرة، لأن عددًا قليلًا أو حتى طفرة واحدة قد تسبب المرض بشكل مباشر.

بالإضافة إلى ذلك، فهي مهمة لدراسة الأمراض المعقدة، مثل مرض السكري من النوع الثاني، والذي قد يكون ناجمًا عن العديد من الأنواع المختلفة من المتغيرات الجينية.

ولذلك، فإن تصنيف الطفرات الخاطئة يعد خطوة مهمة في فهم التغيرات البروتينية التي قد تساهم في الإصابة بالمرض.

ومن بين أكثر من 4 ملايين طفرة خاطئة ظهرت في البشر، تم تصنيف 2% فقط من قبل الخبراء على أنها مسببة للأمراض أو حميدة.

ويمثل هذا حوالي 0.1% فقط من جميع الطفرات الخاطئة المحتملة والبالغ عددها 71 مليونًا.

تم تصنيف الطفرات المتبقية على أنها "طفرات ذات أهمية غير معروفة" بسبب نقص البيانات التجريبية أو السريرية حول التأثيرات ذات الصلة.

لكن مع AlphaMissense، حصلنا على أوضح صورة حتى الآن لتأثيرات الطفرة:

يستطيع AlphaMissense تصنيف 89% من الطفرات بدقة تصل إلى 90% في قاعدة بيانات للطفرات المرضية المعروفة.

مبني على أساس AlphaFold، مستوحى من نموذج ChatGPT الكبير

إذن، كيف تم بناء AlphaMissense بالضبط؟

منذ إطلاقهما، تنبأ AlphaFold وAlphaFold 2 ببنية جميع البروتينات المعروفة علميًا تقريبًا من خلال تسلسل الأحماض الأمينية الخاصة بها، أي أكثر من 200 مليون بروتين.

في هذا الصدد، قام باحثو Google بتكييف النموذج استنادًا إلى AlphaFold (المشار إليه فيما يلي باسم AF)، حتى يتمكنوا من التنبؤ بإمراض الطفرات الخاطئة التي تغير حمضًا أمينيًا واحدًا في البروتين.

ببساطة، مبدأ العمل الكامل لـ AlphaMissense هو: أخذ تسلسل الأحماض الأمينية كمدخل والتنبؤ بإمراضية جميع التغييرات المحتملة في الأحماض الأمينية الفردية في موضع معين في التسلسل.

من أجل تدريب نموذج AlphaMissense، يجب أن يتم تنفيذه على مرحلتين:

المرحلة الأولى

تدريب الشبكة العصبية مثل AF. هذه الشبكة العصبية مستوحاة من نماذج كبيرة مثل ChatGPT.

ومن خلال التنبؤ بهوية الأحماض الأمينية المقنعة في مواضع عشوائية في محاذاة تسلسلات متعددة (MSA)، فإنه يتيح التنبؤ ببنية السلسلة الواحدة، بالإضافة إلى نمذجة لغة البروتين.

أجرى الباحثون بعض التعديلات المعمارية الطفيفة على الرجفان الأذيني وزادوا من أوزان الخسارة لنمذجة لغة البروتين، مع الاستمرار في تحقيق أداء تنبؤي مماثل للبنية إلى الرجفان الأذيني.

بعد التدريب المسبق، يمكن بالفعل استخدام رأس نمذجة اللغة المقنعة للتنبؤ بتأثير الطفرة عن طريق حساب نسبة احتمالية السجل بين الأحماض الأمينية المرجعية واحتمالات الأحماض الأمينية البديلة، كما هو الحال في محول MSA ونمذجة القياس التطوري (EMS).

أثبتت هذه الشبكات العصبية أنها جيدة في التنبؤ بهياكل البروتين وتصميم بروتينات جديدة، وهي مفيدة بشكل خاص للتنبؤ المتغير لأنها تعرف بالفعل أي التسلسلات ذات مصداقية وأيها ليست كذلك.

المرحلة الثانية

في هذه المرحلة، قام الباحثون بضبط النموذج على البروتينات البشرية، ووضعوا تسلسلات الطفرات للخط الثاني من MSA، وأضافوا أهدافًا مختلفة لتصنيف الإمراض.

ثم اتبع طريقة PrimateAI لتسمية الطفرات في المجموعات البشرية والرئيسية.

تعتبر الطفرات الشائعة حميدة، والطفرات التي لم يسبق لها مثيل تعتبر مسببة للأمراض.

بمجرد أن بدأ النموذج في تجاوز مجموعة التحقق من الصحة (2,526 متغيرًا من كلين، مع أعداد متساوية من المتغيرات الحميدة والممرضة لكل جين)، توقف الباحثون عن التدريب.

ومع ذلك، لا يتنبأ AlphaMissense بالتغيرات في بنية البروتين بعد الطفرات أو التأثيرات الأخرى على استقرار البروتين.

وبدلاً من ذلك، يستخدم "حدس" AlphaFold حول البنية لتحديد الطفرات المحتملة المسببة للأمراض في البروتينات.

على وجه التحديد، يتم استخدام قاعدة بيانات تسلسل البروتين ذات الصلة ومعلومات السياق الهيكلي للطفرة لإنشاء درجة مستمرة بين 0 و1 لتقريب احتمالية حدوث الطفرة المسببة للأمراض.

تسمح هذه النتيجة المستمرة للمستخدمين بتحديد عتبة لتصنيف الطفرات على أنها مسببة للأمراض أو حميدة، اعتمادًا على متطلبات الدقة الخاصة بهم.

كيف يصنف AlphaMissense الطفرات الضائعة البشرية

في التقييم التجريبي، حقق AlphaMissense أحدث التنبؤات عبر مجموعة واسعة من المعايير الجينية والتجريبية، كل ذلك دون الحاجة إلى تدريب واضح على مثل هذه البيانات.

يتفوق AlphaMissense على الأساليب الحسابية الأخرى عند تصنيف المتغيرات من Clin. Clin هو أرشيف بيانات عام حول العلاقة بين التنوع البشري والمرض.

كما كانت AlphaMissense هي الطريقة الأكثر دقة للتنبؤ بالنتائج المعملية، مما يشير إلى أنها كانت متسقة مع طرق مختلفة لقياس القدرة المرضية.

يتفوق AlphaMissense على الأساليب الحسابية الأخرى في التنبؤ بتأثيرات متغيرات الخطأ

** الذكاء الاصطناعي يغير علم الوراثة **

قبل عام، أصدر Google DeepMind 200 مليون بنية بروتينية تم التنبؤ بها باستخدام AlphaFold.

وقد ساعدت هذه المبادرة ملايين العلماء حول العالم على تسريع الأبحاث ومهدت الطريق لاكتشافات جديدة.

والآن، قام AlphaMissense، المبني على AlphaFold، بتعميق الفهم العالمي للبروتينات من خلال تتبع أصل الحمض النووي.

ومرة أخرى، فإن الخطوة الأساسية في ترجمة هذا البحث هي التعاون مع المجتمع العلمي.

يعمل Google DeenpMind مع Genomics England لاستكشاف كيف يمكن لتنبؤات AlphaMissense أن تساعد في دراسة وراثة الأمراض النادرة.

قام جينوم إنجلترا بمقارنة نتائج AlphaMissense مع البيانات المجمعة مسبقًا حول القدرة المرضية للطفرات البشرية المعروفة.

تتوافق نتائج التقييم مع تنبؤات AlphaMissense، والتي توفر لـ AlphaMissense معيارًا حقيقيًا.

قام Google DeepMind بنشر جدول بحث عن الطفرات الخاطئة وتوقعات موسعة مشتركة لجميع بدائل تسلسل الأحماض الأمينية المفردة الممكنة والتي يبلغ عددها 216 مليونًا في أكثر من 19000 بروتين بشري.

تتضمن البيانات المنشورة أيضًا متوسط القيمة المتوقعة لكل جين، وهو ما يشبه مقياس القيود التطورية للجين، مما يشير إلى مدى أهمية هذا الجين لبقاء الكائن الحي.

الأمثلة التي تنبأ بها AlphaMissense متراكبة على الهياكل التي تنبأ بها AlphaFold

(الأحمر = من المتوقع أن يكون مسببًا للأمراض، الأزرق = من المتوقع أن يكون حميدًا، الرمادي = غير مؤكد)

اليسار: الوحدة الفرعية بيتا الهيموجلوبين (بروتين HBB). الاختلافات في هذا البروتين يمكن أن تسبب فقر الدم المنجلي.

على اليمين: البروتين المنظم للتوصيل عبر الغشاء للتليف الكيسي (بروتين CFTR). يمكن أن تؤدي الاختلافات في هذا البروتين إلى التليف الكيسي.

علاوة على ذلك، تعاون Google DeepMind أيضًا مع EMBL-EBI. من خلال متنبئ تأثير الطفرة Ensembl، سيتمكن الباحثون من تطبيق نتائج التنبؤ الخاصة بـ AlphaMissense بسهولة أكبر.

من المعتقد أن AlphaMissense سيساعد في المستقبل القريب في حل المشكلات الأساسية في علم الجينوم والعلوم البيولوجية بأكملها.

مراجع:

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت