YAPAY ZEKA VE PROTEİN KATLANMALARI
İremnur Gülten-AFSÜ Tıp Fakültesi
Google AI- DeepMind tarafından geliştirilen AlphaFold isimli yapay zeka (AI) ağı bilim dünyasının en büyük soru işaretlerinden biri olan amino asit dizisinden yola çıkarak canlı yaşamının temelini oluşturan protein moleküllerinin 3 boyutlu yapısının hesaplanıp hesaplanamayacağı önerisine cevap bulmak adına büyük bir ilerleme gösterdi.
Deepmind-Alpha Fold , Critical Assessment of Structure Prediction (Yapı Tahmininin Kritik Değerlendirmesi) yani kısaca CASP olarak adlandırılan iki yılda bir düzenlenen protein yapısı tahmin yarışmasında yaklaşık 100 rakip takımı geride bırakarak mükemmele yakın bir başarı gösterdi. Proteinlerin yapısını bir atomun genişliği içinde tahmin edebilen bir derin öğrenme sistemi olan Alpha Fold’un en son sürümü, biyolojinin en büyük zorluklarından birini aşmış bulunuyor.
CASP’yi yürüten ekibin başındaki isim olan Maryland Üniversitesi’nden biyolog John Moult, elde edilen bu başarıyı “Ciddi bir sorunu çözmek için yapay zekanın ilk kullanımı” sözleriyle özetleyerek yapay zeka ve biyoloji dünyasının buluştuğu bu ortak noktanın önemini belirtti.
Alpha Fold un bu başarısı neden bu kadar önemli? Protein katlanmaları ve bu katlanmaların hesaplanması neden bu kadar önemli? Şimdi biraz bunlara değinerek Alpha Fold daha iyi tanımaya çalışalım.
CASP Nedir?
CASP yani Yapı Tahmininin Kritik Değerlendirmesi yarışmasından biraz bahsedelim. CASP, kurucusu olan Profesör John Moult önderliğinde iki yıllık aralıklarla düzenlenen bir yarışma.
CASP komitesi yarışmaya katılan yapı tahmin programlarını değerlendirmek için çok yakın zamanda deneysel olarak belirlenmiş ( hatta hala değerlendirilme aşamasında bulunan) protein yapılarını seçer. Ve bu seçimleri kamuoyuyla paylaşmazlar. Yani katılımcıların proteinlerin yapısını körü körüne tahmin etmeleri gerekmektedir. Tahmin işlemi sonlandıktan sonra CASP komitesi tahmin sonuçlarıyla deneysel sonuçları karşılaştırarak değerlendirmeye alır.
CASP tarafından tahminlerin doğruluğunu ölçmek için kullanılan ana ölçü, 0-100 arasında değişen Küresel Mesafe Testidir (GDT). Profesör Moult’a göre, 90 GDT civarında bir puan alan yapı tahmin programı gayri resmi olarak deneysel yöntemlerden elde edilen sonuçlarla örtüşme kabiliyetine sahiptir.
Kısaca Protein Nedir ?
Sözlük tanımına bakacak olursak eğer proteinler kendi yapıtaşları olan amino asitlerin zincir halinde birbirlerine bağlanması sonucu oluşan büyük organik bileşiklerdir.
Proteinler bütün canlıların vücudunda bulunan, neredeyse bütün metabolik olayların gerçekleşmesini sağlayan biyolojik yapılardır. Hücre zarının ve hemen hemen tüm enzimlerin yapısına katılma, birçok hormonda bulunma, temel yapıcı onarıcı aynı zamanda düzenleyici ve enerji verici olarak vücutta yer alma proteinlerin görevlerine verilecek örneklerden sayılabilir.
Protein Katlanması Nedir?
Proteine 3 boyutlu şeklini, yani işlevsel halini veren yapısındaki aminoasit dizilimidir. Doğada bulunan 20 çeşit aminoasit bir zincirdeki gibi dizilerek proteinleri meydana getirir ve her bir protein için hangi çeşit aminoasitin hangi sırayla dizileceği DNA tarafından önceden belirlenmiştir.
Bir proteinin belirli bir vazifeyi yerine getirebilmesi için 3 boyutlu şeklinin de o vazifeye uygun olması, yani proteinin uygun şekilde katlanması gerekmektedir. Bu katlanma işlemi belli seviyelere ayrılarak incelenebilir.
Protein Katlanmasının Önemi Nedir?
Bir protein, birçok karmaşık bükülme, dönme ve dolanma ile kendisini katlayan bir amino asit şeridinden veya bu şeritlerin birleşmesiyle meydana gelir. Bu yapı proteinin ne yapacağını belirler. Proteinlerin ne yaptığını anlamak, yaşamın temel mekanizmalarını, ne zaman işe yarayıp ne zaman yaramadığını anlamanın en önemli adımıdır. Bunu anlayabilmek için de amino asit diziliminin nasıl olacağından katlanma şekillerinin belirlenmesine kadar ki sürecin temelini oluşturan DNA büyük önem taşımaktadır.
DNA okumasıyla canlı vücudundaki proteinlerin işleyişinin beklenen şekilde olup olmayacağı hakkında bir ön bilgi edinebiliriz. Aynı zamanda protein katlanmaları yani diğer bir deyişle proteinin hangi işleve uygun olduğu hakkında bir tahminde bulunabilmemiz mümkün olabilir.
Bu öngörü sayesinde şu an küresel sağlık sorunu olarak görülen Alzheimer gibi protein birikmesi sonucu gelişen hastalıkların nedenlerini eksiksiz olarak belirleyebilir ve uygun tedavi yöntemlerini geliştirilebiliriz. Bir başka örnek olarak erken tanı koymaya engel olabilecek kadar az semptom gösteren çeşitli kanser türlerini tespit etmek için belirlenen yöntemleri daha da duyarlı hale getirerek ön tanıyı mümkün kılabilir. Ayrıca canlılığın gezegenimizin üzerinde nasıl başladığına dair yürütülen çalışmaların hızlanmasına ve aydınlatılmasına yardımcı olabilir.
Protein Katlanması Sorunu ve Alpha Fold
1972 Nobel Kimya Ödülü’nü kazanan Christian Anfinsen, teorik olarak amino asit dizisinin proteinin yapısını tam olarak belirlemesi gerektiğini öne süren bir hipotez yayınlamıştı. Bu hipotezin ortaya atılmasıyla birlikte bu alandaki araştırmalar hızlandı.Kriyo-elektron mikroskobu (2017 yılında Nobel Kimya Ödülüyle ödüllendirilmiştir) , nükleer manyetik rezonans ve x-ışını kristalografisi gibi çözüm yolları bu arayışta öncü olmuşlardır.
Bir proteinin tamamlanmış 3 boyutlu yapısına ulaşırken teorik olarak katlanabileceği yolların sayısı astronomik sayılarla tanımlanma sorunuysa çözülememişti.1969’da Cyrus Levinthal, tipik bir proteinin tüm olası konfigürasyonlarını kaba kuvvet hesaplamasıyla sayma işleminin bilinen evrenin yaşından daha uzun süreceğini belirtti. Levinthal ayrıca tipik bir protein için 10 ^ 300 olası konformasyon olduğunu tahmin etti. (Levinthal paradoksu)
Ayrıca yaklaşık 200 milyon bilinen proteine ek olarak her yıl 30 milyon tane daha keşfedilmekteydi. Ve bu yeni, eski bilene proteinlerin 10 ^ 300 (en az) konformasyon seçeneği bulunmaktadır. Kullanılan yöntemlerin çok pahalı ve aşırı yavaş olması bu kadar fazla olasılığa sahip problemin çözümünde istenen verimin alınmasını engelliyordu.
İşte bu bahsedilen 50 yılı aşkın bir süredir var olan sorun ve zorlukların bütününe bilim dünyası tarafından protein katlama problemi ismi verilmişti taki Deepmind-Alpha Fold devreye girinceye kadar.
Deepmind-Alpha Fold ve Getirdiği Çözüm
DeepMind tarafından geliştirilen Alpha Fold protein yapısının tahminlerini gerçekleştiren bir yapay zeka programıdır. Alpha Fold un son sürümü geçen sene katıldığı CASP14 (Yapı Tahmininin Kritik Değerlendirmesi) yarışmasının sonuçlarına göre şu an alanının en başarılı yapay zeka programı seçildi. Alpha Fold tüm hedeflerde genel olarak 92.4 GDT medyan puanına ulaşmıştır. Tahminlerinde (bir atomun genişliğiyle karşılaştırılabilecek kadar küçük olan 0.16 nanometre) 1,6 Angstromluk ortalama hataya sahip olan Alpha Fold yarışmanın en zorlu modelleme kategorisinde yer alan serbest modelleme alanında bile 87.0 GDT’lik bir puana ulaşmıştır.
Alpha Fold un yakaladığı bu doğruluk oranları neredeyse kriyo-elektron mikroskobu gibi proteinlerin yapısını haritalamak için geliştirilen laboratuvar tekniklerinin ölçümleriyle birebir. Ama Alpha Fold un önde olduğu bir avantaj bulunmakta: hız. Laboratuvar yöntemlerinin her protein modelini hesaplayarak doğru sonuca ulaşması yıllarca deneme yanılma gerektirebilir. Deepmind-Alpha Fold ise sadece birkaç gün içinde bir proteinin şeklini bulabilir. Alpha Ford’un son sürümünün eğitim sürecinde kullanılan veri tabanı yaklaşık 170.000 bilinen ve bilinmeyen yapıdaki protein dizilerini içeriyor.
Yapay Zeka ve Gelecek
Alpha Fold hala ilerlemeye, kendini geçmeye devam ediyor. Ancak tüm bilimsel araştırmalarda olduğu gibi, hala cevaplanmayı bekleyen birçok soru var. Birden çok proteinin nasıl kompleks oluşturduğu veya %100 doğru bir modellemenin nasıl yapılacağı hakkında öğrenilecek çok şey var.
Deepmind-Alpha Fold, modellemesi bilinmeyen yüz milyonlarca proteini keşfetme potansiyeliyle bilinen hastalıkların anlaşılmasını sağlamanın yanında gelecekte yeni bir salgına karşı da yararlı olabileceğine dair umut veriyor.
Yapay Zeka ve Akla Bile Gelmeyeni Bilmeye Doğru
Christian Anfinsen yıllar önce öne sürdüğü hipotez üzerinde çalışmalarına devam ederken belki bu ilerlemeyi hayal bile edememişti. Bu açıklanan ilerleme, yapay zekanın bilginin sınırlarını genişletmede insanlığına en yararlı araç olacağını gösteriyor.
Canlılıkla, yaşamla alakalı her alanda insanlığın bu zamana kadar bildikleri Alpha Fold gibi örneklerle hızla ilerleyen yapay zeka sayesinde yeniden şekillenecek. Evrenimizin bilinmeyen birçok yönü var. Buna rağmen bir yerlerde veri kümeleri tekrar derleniyor, eğitim ve test setleri belirleniyor, yapay zeka modelleri çalışmaya başlıyor ve evrenin bilinmezlikleri biraz daha çözülüyor.
Gelecek gerçekten de heyecan verici!
Kaynakça
Callaway, E. (2020, Kasım 30). ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature: https://www.nature.com/articles/d41586-020-03348-4 adresinden alındı
DeepMind. (2020, Kasım 30). AlphaFold: a solution to a 50-year-old grand challenge in biology. DeepMind: https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology adresinden alındı
DeepMind. (2020, Ocak 15). AlphaFold: Using AI for scientific discovery. DeepMind: https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery adresinden alındı
Dursunkaya, B. (2012, Aralık 16). İkincil Protein Yapısı. Evrim Ağacı: https://evrimagaci.org/ikincil-protein-yapisi-5633 adresinden alındı
Heaven, W. D. (2020, Kasım 30). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. MIT Technology Review: https://www.technologyreview.com/2020/11/30/1012712/deepmind-protein-folding-ai-solved-biology-science-drugs-disease/ adresinden alındı
Hutson, M. (2019, Temmuz 22). AI protein-folding algorithms solve structures faster than ever. Nature: https://www.nature.com/articles/d41586-019-01357-6 adresinden alındı
Vikipedi. (2020, Aralık 6). Protein yapısı. Vikipedi: https://tr.wikipedia.org/wiki/Protein_yap%C4%B1s%C4%B1#:~:text=D%C3%B6rd%C3%BCnc%C3%BCl%20yap%C4%B1%20birka%C3%A7%20protein%20veya,dis%C3%BClf%C3%BCr%20ba%C4%9Flar%C4%B1%20taraf%C4%B1ndan%20stabilize%20edilir. adresinden alındı
Görsel
https://deepmind.com/research/case-studies/alphafold