ChatGPT'den ilham alan Google DeepMind, 71 milyon genetik mutasyon öngörüyor! Yapay Zeka, Bilimde İnsan Genlerinin Genetik Kodunu Çözüyor

Orijinal kaynak: Xinzhiyuan

Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur

Protein tahmin modeli AlphaFold, yapay zeka dünyasında tsunami seviyesinde bir dalga başlattıktan sonra, Alpha ailesi yeni bir başlangıcın habercisi oldu.

Bugün Google DeepMind, 71 milyon "yanlış anlamlı mutasyonu" tahmin edebilen yeni bir AI modeli olan AlphaMissense'i yayınladı.

Spesifik olarak, AlphaMissense tarafından başarılı bir şekilde tahmin edilen %89 "yanlış anlamlı mutasyonların" %57'si patojenik ve %32'si iyi huyluydu.

Kağıt adresi:

Mutasyonların yalnızca %0,1'i insan uzmanlar tarafından doğrulanabiliyor.

Araştırmacıların bunun olası etkisini daha iyi anlayabilmesi için Google, on milyonlarca "yanlış anlamlı mutasyon" kataloğunun tamamını da kamuoyuna açıkladı.

Altta yatan nedeni keşfetmek uzun zamandır insan genetiğindeki en büyük zorluklardan biri olmuştur.

Yanlış mutasyonlar, "insan proteinlerinin" işlevini etkileyebilen ve kistik fibroz, orak hücreli anemi ve kanser gibi hastalıklara yol açabilen genetik mutasyonlardır.

AlphaMissense'in doğuşu, yapay zekanın tıp alanında, özellikle de genetik alanında büyük potansiyelini ortaya koyuyor.

Genetik çeşitlilik ile hastalık arasındaki ilişkinin anlaşılması ve hedefe yönelik ilaç tedavilerinin geliştirilmesi açısından büyük önem taşımaktadır.

AlphaFold'un ardından AlphaMissense, dünyayı değiştirebilecek ve insan genetiğindeki sorunların üstesinden gelmesi beklenen bir yapay zeka haline gelebilir!

**"Yanlış anlamlı mutasyon" nedir? **

Yanlış anlamlı mutasyon, biyotıp ve moleküler biyoloji alanlarında protein kodlayan genleri tanımlamak için kullanılan bir genetik mutasyondur:

DNA'daki tek bir harfin yer değiştirmesi, proteinde farklı bir amino asit oluşmasına neden olur.

DNA'yı bir dil olarak düşünürseniz, tek bir harfin değiştirilmesi bir kelimeyi, bir cümlenin anlamını tamamen değiştirebilir.

Bu durumda DNA'daki değişiklikler, proteinin işlevini etkileyen amino asitlerde değişikliklere yol açar.

Ortalama bir insan 9.000'den fazla hatalı mutasyon taşıyor.

Genel olarak konuşursak, bu hatalı mutasyonların çoğu iyi huyludur ve insan vücudu üzerinde çok az etkisi vardır. Ancak geri kalan birkaçı patojeniktir ve protein fonksiyonunu ciddi şekilde bozabilir.

Nadir genetik hastalıkların teşhisinde hatalı mutasyonlar kullanılabilir, çünkü birkaç hatta tek bir hatalı mutasyon doğrudan hastalığa neden olabilir.

Ayrıca, birçok farklı genetik varyantın neden olabileceği tip II diyabet gibi karmaşık hastalıkların incelenmesi için de önemlidirler.

Bu nedenle yanlış anlamlı mutasyonların sınıflandırılması, hangi protein değişikliklerinin hastalığa katkıda bulunabileceğini anlamada önemli bir adımdır.

İnsanlarda ortaya çıkan 4 milyondan fazla hatalı mutasyonun yalnızca %2'si uzmanlar tarafından patojenik veya iyi huylu olarak etiketlendi.

Bu, tüm olası 71 milyon yanlış anlamlı mutasyonun yalnızca %0,1'ini temsil eder.

Geri kalan mutasyonlar, ilgili etkilere ilişkin deneysel veya klinik veri eksikliği nedeniyle "önemi bilinmeyen mutasyonlar" olarak sınıflandırıldı.

Ancak AlphaMissense ile mutasyonun etkilerine dair şimdiye kadarki en net görüntüyü elde ettik:

AlphaMissense, bilinen hastalık mutasyonlarından oluşan bir veritabanında mutasyonların %89'unu %90'lık bir eşik doğruluğu ile sınıflandırabilir.

ChatGPT'nin büyük modelinden ilham alınarak AlphaFold temel alınarak oluşturulmuştur

Peki AlphaMissense tam olarak nasıl oluşturuldu?

Yayınlanmalarından bu yana, AlphaFold ve AlphaFold 2, bilim tarafından bilinen hemen hemen tüm proteinlerin, amino asit dizilerinden, 200 milyondan fazla proteinin yapısını tahmin etti.

Bu bağlamda Google araştırmacıları, bir proteindeki tek bir amino asidi değiştiren yanlış anlamlı mutasyonların patojenitesini tahmin edebilmek için AlphaFold'a (bundan sonra AF olarak anılacaktır) dayalı modeli uyarladılar.

Basitçe söylemek gerekirse, AlphaMissense'in tüm çalışma prensibi şudur: bir amino asit dizisini girdi olarak almak ve dizideki belirli bir pozisyondaki tüm olası tek amino asit değişikliklerinin patojenitesini tahmin etmek.

AlphaMissense modelini eğitmek için iki aşamada gerçekleştirilmesi gerekir:

İlk aşama

Bir sinir ağını AF ile aynı şekilde eğitin. Bu sinir ağı, ChatGPT gibi büyük modellerden ilham almıştır.

Çoklu dizi hizalamalarında (MSA) rastgele konumlarda maskelenen amino asitlerin kimliğini tahmin ederek, tek zincirli yapı tahmininin yanı sıra protein dili modellemesine de olanak tanır.

Araştırmacılar AF'de bazı küçük mimari değişiklikler yaptı ve protein dili modellemesi için kayıp ağırlıklarını artırırken AF ile karşılaştırılabilir yapı tahmin performansı elde etmeye devam etti.

Ön eğitimden sonra maskeli dil modelleme kafası, MSA Transformer ve Evrimsel Ölçekleme Modellemesinde (EMS) olduğu gibi, referans amino asit ile alternatif amino asit olasılıkları arasındaki log-olabilirlik oranını hesaplayarak mutasyon etkisi tahmini için zaten kullanılabilir.

Bu sinir ağlarının, protein yapılarını tahmin etme ve yeni proteinler tasarlama konusunda iyi olduğu kanıtlanmıştır ve hangi dizilerin güvenilir, hangilerinin güvenilir olmadığını zaten bildikleri için varyant tahmini için özellikle faydalıdır.

ikinci sahne

Bu aşamada araştırmacılar, insan proteinleri üzerindeki modele ince ayar yaptılar, MSA'nın ikinci satırı için mutasyon dizilerini belirlediler ve değişken patojenite sınıflandırma hedeflerini eklediler.

Daha sonra insan ve primat popülasyonlarındaki mutasyonları etiketlemek için PrimateAI yöntemini izleyin.

Yaygın mutasyonlar iyi huylu olarak kabul edilir ve daha önce hiç görülmemiş mutasyonlar patojenik olarak kabul edilir.

Model, doğrulama setine (gen başına eşit sayıda iyi huylu ve patojenik varyant içeren 2.526 Clin varyantı) aşırı uyum sağlamaya başladığında, araştırmacılar eğitimi durdurdu.

Ancak AlphaMissense, mutasyonların ardından protein yapısındaki değişiklikleri veya protein stabilitesi üzerindeki diğer etkileri tahmin etmez.

Bunun yerine, proteinlerdeki olası hastalığa neden olan mutasyonları tanımlamak için AlphaFold'un yapı hakkındaki "sezgisini" kullanıyor.

Spesifik olarak ilgili bir protein dizisi veri tabanı ve mutasyonun yapısal bağlam bilgisi, mutasyonun patojenik olasılığını yaklaşık olarak tahmin etmek amacıyla 0 ile 1 arasında sürekli bir puan oluşturmak için kullanılır.

Bu sürekli puan, kullanıcıların doğruluk gereksinimlerine bağlı olarak mutasyonları patojenik veya iyi huylu olarak sınıflandırmak için bir eşik seçmesine olanak tanır.

AlphaMissense insandaki yanlış anlamlı mutasyonları nasıl sınıflandırır?

Deneysel değerlendirmede, AlphaMissense, geniş bir yelpazedeki genetik ve deneysel kıyaslamalarda, bu tür veriler üzerinde açık bir eğitim gerektirmeden, son teknoloji tahminlere ulaştı.

AlphaMissense, Clin'deki varyantları sınıflandırırken diğer hesaplama yöntemlerinden daha iyi performans gösteriyor. Clin, insan çeşitliliği ve hastalıklar arasındaki ilişkiye dair halka açık bir veri arşividir.

AlphaMissense aynı zamanda laboratuvar sonuçlarını tahmin etmenin en doğru yoluydu ve patojeniteyi ölçmenin farklı yollarıyla tutarlı olduğunu gösteriyordu.

AlphaMissense, yanlış anlam değişken etkilerini tahmin etmede diğer hesaplama yöntemlerinden daha iyi performans gösteriyor

Yapay zeka genetiği değiştiriyor

Bir yıl önce Google DeepMind, AlphaFold kullanılarak tahmin edilen 200 milyon protein yapısını yayınladı.

Bu girişim dünya çapında milyonlarca bilim insanının araştırmaları hızlandırmasına yardımcı oldu ve yeni keşiflerin önünü açtı.

Artık AlphaFold'u temel alan AlphaMissense, DNA'nın kökeninin izini sürerek dünyanın protein anlayışını daha da derinleştirdi.

Yine, bu araştırmayı tercüme etmenin önemli adımlarından biri bilim topluluğuyla işbirliği yapmaktır.

Google DeenpMind, AlphaMissense'in tahminlerinin nadir hastalıkların genetiğinin incelenmesine nasıl yardımcı olabileceğini keşfetmek için Genomics England ile birlikte çalışıyor.

Genom İngiltere, AlphaMissense'in bulgularını bilinen insan mutasyonlarının patojenitesi hakkında daha önce derlenmiş verilerle çapraz referans olarak kullandı.

Değerlendirme sonuçları, AlphaMissense'e gerçek dünya karşılaştırması sağlayan AlphaMissense'in tahminleriyle tutarlıdır.

Google DeepMind, yanlış mutasyonlara ilişkin bir arama tablosu yayınladı ve 19.000'den fazla insan proteinindeki tüm olası 216 milyon tek amino asit dizisi değişiminin genişletilmiş tahminlerini paylaştı.

Yayınlanan veriler aynı zamanda her bir gen için ortalama tahmin edilen değeri de içeriyor; bu, bir genin evrimsel kısıtlamalarının ölçüsüne benzer ve o genin bir organizmanın hayatta kalması için ne kadar önemli olduğunu gösteriyor.

AlphaMissense tarafından tahmin edilen örnekler, AlphaFold tarafından tahmin edilen yapıların üzerine bindirilmiştir

(Kırmızı = patojen olduğu tahmin ediliyor, mavi = iyi huylu olduğu tahmin ediliyor, gri = belirsiz)

Sol: Beta-hemoglobin alt birimi (HBB proteini). Bu proteindeki varyasyonlar orak hücreli anemiye neden olabilir.

Sağ: Kistik fibroz transmembran iletkenlik düzenleyici protein (CFTR proteini). Bu proteindeki varyasyonlar kistik fibrozise yol açabilir.

Ayrıca Google DeepMind, EMBL-EBI ile de iş birliği yaptı. Ensembl mutasyon etkisi tahmincisi sayesinde araştırmacılar, AlphaMissense'in tahmin sonuçlarını daha kolay uygulayacak.

Yakın gelecekte AlphaMissense'in genomik ve tüm biyolojik bilimlerdeki temel sorunların çözülmesine yardımcı olacağına inanılıyor.

Referanslar:

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)