Ang Lasker Basic Medical Research Award ngayong taon ay iginawad kina Demis Hassabis at John Jumper para sa kanilang mga kontribusyon sa paglikha ng AlphaFold artificial intelligence system na hinuhulaan ang three-dimensional na istraktura ng mga protina batay sa unang pagkakasunud-sunod ng mga amino acid.
Ang kanilang mga resulta ay malulutas ang isang problema na matagal nang nagpagalit sa siyentipikong komunidad at nagbubukas ng pinto sa pagpapabilis ng pananaliksik sa buong biomedical na larangan. Ang mga protina ay may mahalagang papel sa pag-unlad ng sakit: sa Alzheimer's disease, sila ay tumiklop at magkakasama; Sa kanser, nawala ang kanilang regulatory function; Sa inborn metabolic disorder, ang mga ito ay dysfunctional; Sa cystic fibrosis, napupunta sila sa maling espasyo sa cell. Ilan lamang ito sa maraming mekanismo na nagdudulot ng sakit. Ang mga detalyadong modelo ng istruktura ng protina ay maaaring magbigay ng mga atomic na configuration, magmaneho sa disenyo o pagpili ng mga molekulang may mataas na kaugnayan, at mapabilis ang pagtuklas ng gamot.
Ang mga istruktura ng protina ay karaniwang tinutukoy ng X-ray crystallography, nuclear magnetic resonance at cryo-electron microscopy. Ang mga pamamaraan na ito ay mahal at matagal. Nagreresulta ito sa mga umiiral nang 3D protein structure database na may humigit-kumulang 200,000 structural data lamang, habang ang DNA sequencing technology ay nakagawa ng higit sa 8 milyong protein sequence. Noong 1960s, sina Anfinsen et al. natuklasan na ang 1D sequence ng mga amino acid ay maaaring kusang at paulit-ulit na matiklop sa isang functional na three-dimensional na conform (Larawan 1A), at ang molecular na "chaperones" ay maaaring mapabilis at mapadali ang prosesong ito. Ang mga obserbasyong ito ay humahantong sa isang 60-taong hamon sa molecular biology: paghula sa 3D na istraktura ng mga protina mula sa 1D sequence ng mga amino acid. Sa tagumpay ng Human Genome Project, ang aming kakayahang makakuha ng 1D amino acid sequence ay lubos na napabuti, at ang hamon na ito ay naging mas apurahan.
Ang paghula ng mga istruktura ng protina ay mahirap para sa ilang kadahilanan. Una, lahat ng posibleng three-dimensional na posisyon ng bawat atom sa bawat amino acid ay nangangailangan ng maraming paggalugad. Pangalawa, ang mga protina ay gumagawa ng maximum na paggamit ng complementarity sa kanilang kemikal na istraktura upang mahusay na i-configure ang mga atom. Dahil ang mga protina ay karaniwang may daan-daang hydrogen bond na "donor" (karaniwan ay oxygen) na dapat ay malapit sa hydrogen bond na "acceptor" (karaniwan ay nitrogen na nakagapos sa hydrogen), maaaring napakahirap maghanap ng mga conformation kung saan halos lahat ng donor ay malapit sa acceptor. Pangatlo, may mga limitadong halimbawa para sa pagsasanay ng mga pang-eksperimentong pamamaraan, kaya kinakailangan na maunawaan ang mga potensyal na three-dimensional na pakikipag-ugnayan sa pagitan ng mga amino acid batay sa mga pagkakasunud-sunod ng 1D gamit ang impormasyon sa ebolusyon ng mga nauugnay na protina.
Ang physics ay unang ginamit upang imodelo ang pakikipag-ugnayan ng mga atomo sa paghahanap para sa pinakamahusay na conformation, at isang paraan ang binuo upang mahulaan ang istraktura ng mga protina. Sina Karplus, Levitt at Warshel ay ginawaran ng 2013 Nobel Prize sa Chemistry para sa kanilang trabaho sa computational simulation ng mga protina. Gayunpaman, ang mga pamamaraan na nakabatay sa pisika ay mahal sa computation at nangangailangan ng tinatayang pagpoproseso, kaya hindi mahuhulaan ang mga tiyak na three-dimensional na istruktura. Ang isa pang diskarte na "batay sa kaalaman" ay ang paggamit ng mga database ng mga kilalang istruktura at pagkakasunud-sunod upang sanayin ang mga modelo sa pamamagitan ng artificial intelligence at machine learning (AI-ML). Ang Hassabis at Jumper ay naglalapat ng mga elemento ng parehong physics at AI-ML, ngunit ang pagbabago at paglukso sa pagganap ng diskarte ay pangunahing nagmumula sa AI-ML. Malikhaing pinagsama ng dalawang mananaliksik ang malalaking pampublikong database na may mga mapagkukunang pang-industriya na grade computing upang lumikha ng AlphaFold.
Paano natin malalaman na "nalutas" nila ang structural prediction puzzle? Noong 1994, itinatag ang kumpetisyon ng Critical Assessment of Structure Prediction (CASP), na nakakatugon bawat dalawang taon upang subaybayan ang pag-unlad ng structural prediction. Ibabahagi ng mga mananaliksik ang 1D sequence ng protina na ang istraktura ay nalutas nila kamakailan, ngunit ang mga resulta ay hindi pa nai-publish. Hinuhulaan ng predictor ang three-dimensional na istraktura gamit ang 1D sequence na ito, at independiyenteng hinuhusgahan ng evaluator ang kalidad ng mga hinulaang resulta sa pamamagitan ng paghahambing sa mga ito sa three-dimensional na istraktura na ibinigay ng experimentalist (ibinigay lamang sa evaluator). Ang CASP ay nagsasagawa ng mga tunay na blind review at nagtatala ng mga pana-panahong pagtalon sa pagganap na nauugnay sa pamamaraang pagbabago. Sa ika-14 na Kumperensya ng CASP noong 2020, ang mga resulta ng hula ng AlphaFold ay nagpakita ng napakalaking pagganap kaya inanunsyo ng mga organizer na nalutas na ang problema sa paghula ng istruktura ng 3D: ang katumpakan ng karamihan sa mga hula ay malapit sa mga pang-eksperimentong sukat.
Ang mas malawak na kahalagahan ay ang gawain ni Hassabis at Jumper na nakakumbinsi na nagpapakita kung paano mababago ng AI-ML ang agham. Ipinapakita ng pananaliksik nito na ang AI-ML ay maaaring bumuo ng mga kumplikadong siyentipikong hypotheses mula sa maraming data source, na ang mga mekanismo ng atensyon (katulad ng mga nasa ChatGPT) ay makakatuklas ng mga pangunahing dependency at ugnayan sa mga pinagmumulan ng data, at na ang AI-ML ay maaaring humatol sa sarili ng kalidad ng mga resulta ng output nito. Ang AI-ML ay mahalagang gumagawa ng agham.
Oras ng post: Set-23-2023




