Хиймэл оюун ухаан ба уураг судлалд гарсан үсрэлт

ТОЙМ
adiyakhuu@montsame.mn
2020-12-04 22:00:40

Биологийн шинжлэх ухааны өмнө тулгамдаад байсан гол тооцооллуудын нэгийг хиймэл оюун ухаан амжилттай гүйцэтгэж чадлаа. Одоо түүний тусламжтайгаар уургийн гурван хэмжээст бүтцийн аминхүчлийн дарааллыг урьдчилан тодорхойлж болох нь. Бүтцийн биологийн салбарын тэргүүлэх мэргэжилтнүүд болон уураг эвхэх туршилтыг /2 жил тутамд хийж буй/ санаачлагчид Их Британийн DeepMind компанийн судлаачдын гайхамшигт амжилтын талаар зарлан мэдэгдлээ. Хиймэл оюун ухааны салбарт судалгаа явуулдаг тус компанийн хэрэглэсэн аргачлал нь цаашид ихээхэн үр өгөөжтэй бөгөөд жишээ нь, шинээр эм гарган авах судалгааны ажлууд эрс түргэсэх болно гэж Америкийн Science сэтгүүлд нийтлэлч Роберт Ф. Сервис (Robert F. Service) дүгнэн бичсэнийг орчуулан толилуулъя.


“DeepMind-ын эрдэмтдийн баг итгэмээргүй гайхамшигт зүйлийг гүйцэлдүүлж чадсан бөгөөд энэ нь бүтцийн биологийн хөгжлийн хэтийн төлөв, уургийн судалгааг үндсээр нь өөрчлөх болно” гэж Европын биоинформатикийн хүрээлэнгийн хүндэт захирал Жанет Торнтон үнэлжээ. Мэрилэндийн их сургуулийн бүтцийн биологийн судлаач Жон Моулт ярихдаа “энэ мөчийг хүртэл амьд явна гэж би хэзээ ч бодож байгаагүй” гээд эрдэмтэд аминхүчлийн дарааллыг тодорхойлохоор 50 жилийн турш оролдсоор ирснийг дурдлаа.


Энд чухамдаа юуны тухай яриад байна вэ? Хүний бие организмд олон арван мянган янз бүрийн уургууд байдаг бөгөөд уураг бүр нь хэдэн арваас хэдэн зуугаар тоологдох аминхүчлүүдээс тогтох гинжин хэлхээг үүсгэж байдаг. Аминхүчлүүдийн дараалал нь тэдгээрийн хоорондох хязгааргүй олон тооны харилцан үйлдлийг урьдчилан тодорхойлдог. Ингэснээр маш нарийн 3 хэмжээст бүтцүүд бий болдог бөгөөд эдгээр нь уургийн шинж чанарыг тодорхойлдог байна. Уургийн ийм бүтцүүдийн талаарх мэдээллийг эрдэмтэд олж авснаар шинэ эм гарган авах боломжтой болно. Мөн уургийг дурын бүтэцтэй нийлэгжүүлэх боломжтой болсноор ферментүүд гарган авах явц түргэснэ. Ингэснээр ферментүүдийн тусламжтайгаар био түлш үйлдвэрлэж, хуванцар хог хаягдлыг бүрэн задалдаг болно. 


Гурван хэмжээст уургийн бүтцийг тайлж кодлох ажлыг эрдэмтэд хэдэн арван жилийн туршид хийж байгаа бөгөөд үүнийн тулд рентген кристаллографын, криогенийн цахилгаан микроскопын гэх мэт аргуудыг ашигласаар иржээ. Гэхдээ эдгээр аргыг хэрэглэхэд сар жилээр тоологдох урт хугацаа шаардагддаг ба тэр бүр үр дүнд хүрдэггүй. Одоогоор шинжлэх ухаанд мэдэгдэж буй 200 сая гаруй уургийн бүтцээс ердөө 170 мянга орчмыг нь “тайлж уншаад” байна.


Хэрвээ тухайн тодорхой нэг уургийн дараалалд хамаарах бүх хэлхээ холбоог тодорхойлж чадах аваас уургийн орон зайн бүтцийг урьдчилан таамаглах боломжтой гэсэн дүгнэлтийг эрдэмтэд бүр 1960-аад оны үед хийжээ. Гэтэл уураг тус бүрт аминхүчлийн хэдэн зуун хэлхээ байдаг бөгөөд тэдгээр нь хоорондоо янз бүрийн арга замаар харилцан үйлчилж байдаг. Тэгэхээр нэг аминхүчлийн дараалалд ногдох ийм бүтцийн боломжит тоо нь асар олон байх нь тодорхой. Үүнийг тооцоолох ажлыг компьютерийн эрдэмтэд эхлүүлсэн боловч явц нь тун удаан байлаа.  


1994 онд Жон Моулт мэргэжил нэгт нөхөдтэйгээ хамтран CASP гэдэг нэртэй өргөн хэмжээний туршилтыг 2 жил тутамд нэг удаа явуулж эхэллээ. Туршилтанд оролцогчдод бүтэц нь тодорхойгүй 100 орчим аминхүчлийн дарааллыг өгсөн ба тэдний нэг хэсэг нь дараалал бүрийн бүтцийг тооцоолсон бол нөгөө хэсэг нь бүтцийг лабораторийн туршилтаар тодорхойлжээ. Дараа нь GDT буюу нарийвчлалыг хэмжих үзүүлэлтийн /0-ээс 100 хүртэл/ тусламжтайгаар тооцооллын дүнг лабораторийн судалгааны дүнтэй харьцуулсан байна. Ингэхдээ GDT нь 90-ээс дээш байх тохиолдолд тооцооллын дүн нь лабораторийн туршилтын үзүүлэлттэй үндсэндээ нийцнэ гэж үзжээ.   


Ингээд 1994 он гэхэд, эрдэмтдийн тооцоолсон жижиг энгийн бүтэцтэй уургуудын бүтэц нь туршилтынхтай тохирч байв. Харин том, нарийн төвөгтэй бүтэц бүхий уургуудын хувьд тооцоолол дөнгөж 20 GDT байсан нь М.Планкийн нэрэмжит хөгжлийн биологийн хүрээлэнгийн хувьслын биологич Андрей Лупас-ын хэлснээр “жинхэнэ бүтэлгүйтэл” байлаа. Гэвч 2016 онд хоорондоо өрсөлдөж буй эрдэмтдийн багууд хамгийн нарийн бүтэцтэй уургуудын GDT-ийг 40 -д хүргэж чадсан байна.   


Улмаар 2018 онд DeepMind компани анх удаагаа өрсөлдөөнд оролцож, AlphaFold гэдэг алгоритмаа санал болгов. Уг алгоритм нь асар олон өгөгдөлд /эл тохиолдолд одоо мэдэгдэж буй уургуудын бүтэц, дарааллын талаарх/ дүн шинжилгээ хийж, давтамж зүй тогтлыг илрүүлдэг. Уралдаанд DeepMind тун хялбархнаар ялалт байгуулж, уургийн бүтэц бүр дээр өрсөлдөгчдөөсөө 15 хувиар түрүүлэн тасарч, хамгийн хүнд бодлогуудыг бодохдоо GDT-ийн 60 оноо авчээ.

Гэсэн хэдий ч AlphaFold алгоритм хариуцсан ажилтан Жон Жамперийн дүгнэснээр, 60 оноо гэдэг бол практикт ашиглахад дэндүү бүдүүн тоймын тооцоолол байжээ. Ингээд илүү нарийвчилсан үр дүнд хүрэхийн тулд Жампер мэргэжил нэгт нөхдийнхөө хамт зураг эвлүүлэх тоглоомын зарчимд тулгуурласан “анхаарал төвлөрүүлэх алгоритм”-ыг ашигласан байна. Эхлээд жижиг тасархайнуудаар жижиг хэсгүүдийг /аминхүчлийн хэлхээний хэсгүүд/ бий болгоод, дараа нь эдгээр жижиг хэсгүүдээ нэгтгэн том хэмжээтэй бүхэл цогц болгоно. Энэ ажилд машин сургалтын 128 процессор бүхий компьютерийн сүлжээ ашигласан бөгөөд одоогоор мэдэгдэж буй 170 мянган уургийн бүтэц дээр алгоритмыг сургаж чадсан байна.      


Үр дүн нь ч гарлаа!  Энэ онд AlphaFold алгоритм уургийн бүтэц дээр дунджаар GDT-ийн 92,4 оноо авсан бол илүү нарийн төвөгтэй бүтэцтэй уургууд дээр 87 оноо авсан нь хамгийн өндөр нарийвчлалтай таамаглалаас 25 оноогоор илүү байжээ гэсэн үг . Тэр ч байтугай эсийн мембран дотор байдаг, янз бүрийн өвчнийг “хариуцдаг” уургуудын бүтцэд хүртэл дүн шинжилгээ хийжээ. Энэ оны уралдаанд оролцсон бүх эрдэмтдийн хийсэн тооцоолол илүү нарийвчлалтай болсон байна. Өмнө нь рентген кристаллографын аргаар үүнийг тодорхойлоход хүндрэлтэй байсан юм. Рентген кристаллограф гэдэг нь рентген цацрагаар бөмбөгдүүлсэн талстжсан уургуудын дифракцийг ашиглан биологийн макромолекулуудын гурван хэмжээст бүтцийг тодорхойлох хуучин арга юм.      


Харин CASP туршилтыг санаачлагчид DeepMind-ын алгоритмд бага зэрэг эргэлзсэн байна. Ингээд Андрей Лупас эртний бичил организмуудын бүлгийн төлөөлөгч болох архей бактерийн уургийн мембраны бүтцийг тодорхойлох зорилт тавьжээ. Түүний тэргүүлсэн судалгааны баг энэ уургийн талст бүтцийн рентгенграммыг / рентген цацрагаар авсан гэрэл зураг/ гарган авахаар 10 жилийн турш ажилласан боловч чадаагүй байсан юм.


Харин AlphaFold алгоритм үүнийг ямар ч түвэггүйгээр гүйцэтгэж, голдоо мушгиа хэлбэрийн хоёр салаа бүхий гурван найрлагат уургийн тодорхой дүрслэлийг гаргаж иржээ.  Эрдэмтэд AlphaFold-ын уг загварыг туршилтын өгөгдлүүдтэй харьцуулахад хоорондоо үнэхээр төгс тохирч байлаа.  


CASP туршилтанд оролцогчдод тавьсан болзлуудын нэг бол DeepMind компани нь бусдын адилаар өөрийн алгоритмын нарийн ширийн зүйлүүдийг ил болгож, бусад эрдэмтэд  түүнийг нь давтах хийх явдал юм. Энэ бол туршигчдын хувьд “бэлэг” гэсэн үг. Учир нь, уургийн бүтцийг урьдчилан тодорхойлсноор рентген судалгаа, криогенийн цахилгаан микроскопийн тусламжтайгаар олж авсан тодорхой бус өгөгдлүүдийг зөв болгож боловсруулахаас гадна SARS-CoV-2 гэх мэт аюултай шинэ патогенүүдийн уургийн бүтцийг богино хугацаанд тогтоох боломжтой болно. Энэ нь аюултай патогенүүдийг блоклож чадах молекулуудыг хайж олоход чухал алхам болох юм.  


Гэсэн хэдий ч AlphaFold алгоритмын хувьд хүчрэхгүй бодлого гэж бий. Тухайлбал, угсрах үед бие биенийхээ байрлалыг алдагдуулж буй 52 жижиг сегментүүдийн холимог болох уургуудын нэгэнд анализ хийх явцад AlphaFold-ын ажиллагаа мэдэгдэхүйц удааширч байсан  тохиолдол бий. Тэгэхээр одоо AlphaFold-ыг дээр дурдсан бүтцүүдийг задлан шинжилж сургах хэрэгтэй болох нь. Түүнээс гадна, эсийн дотор маш чухал үүргүүдийг хамтран гүйцэтгэдэг уургийн нэгдлүүдэд анализ хийж сургах шаардлагатай.

Гэвч маш хүнд бодлогуудыг бодсоны дараа дахиад л өөр хүнд бодлогууд гарч ирэх нь эргэлзээгүй. “Энэ бол төгсгөл биш, биднийг олон шинэ бодлого тооцооллууд хүлээж байна” гэж Европын биоинформатикийн хүрээлэнгийн хүндэт захирал Жанет Торнтон хэллээ.


Б.Адъяахүү


Эх сурвалжууд: https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures  

https://inosmi.ru/science/20201203/248673025.html

 

 

Холбоотой мэдээ