91精品视频密臀91尤物_亚洲精品美女色诱在线播放_91富婆推油精品偷啪_中文字幕少妇偷人激情在线看_亚洲午夜高清免费观看

設為首頁 | 添加收藏
新聞中心
廣州市皓博儀器儀表有限公司
地址:廣州市番禺區(qū)洛浦街上漖村迎賓路99號卓維商務樓201A
TEL:020-34702588      020-34703386
FAX:020-34702518
行業(yè)動態(tài) 您的當前位置:首頁 > 新聞中心 > 行業(yè)動態(tài)
人工智能工具正在設計全新的蛋白質,可能會改變醫(yī)學
[ 發(fā)布日期:2023-7-13 9:13:11    閱讀次數(shù):639 ]
“好吧。我們開始吧。”西雅圖華盛頓大學(UW)的計算化學家David Juergens即將設計出一種蛋白質,經過30多億年的修補,進化從未產生過這種蛋白質。在視頻通話中,Juergens打開了他參與開發(fā)的人工智能(AI)工具的云版本,該工具名為RFdiffusion。這種神經網絡,以及其他類似的神經網絡,正在幫助將定制蛋白質的創(chuàng)造——直到最近,這還是一種高度技術性且常常不成功的追求——帶入主流科學。

這些蛋白質可以構成疫苗、療法和生物材料的基礎。“這是一個完全變革的時刻,”馬薩諸塞州薩默維爾的生物技術公司Generate Biomedicines的聯(lián)合創(chuàng)始人兼首席技術官格Gevorg Grigoryan說。該公司將蛋白質設計應用于藥物開發(fā)。

這些工具的靈感來自人工智能軟件,該軟件可以合成逼真的圖像,比如Midjourney軟件,今年,該軟件被用來制作教皇弗朗西斯(Pope Francis)穿著設計師設計的白色羽絨服的照片。研究人員發(fā)現(xiàn),類似的概念方法可以根據(jù)設計者指定的標準大量生產出現(xiàn)實的蛋白質形狀——這意味著,例如,可以快速繪制出與另一種生物分子緊密結合的新蛋白質。早期的實驗表明,當研究人員制造這些蛋白質時,一部分有用的蛋白質確實按照軟件的建議發(fā)揮作用。

研究人員說,在過去的一年里,這些工具徹底改變了設計蛋白質的過程。紐約市哥倫比亞大學的計算生物學家Mohammed AlQuraishi說:“這是一種能力的爆炸。”他的團隊已經開發(fā)出一種這樣的蛋白質設計工具。“你現(xiàn)在可以創(chuàng)造出具有受歡迎品質的設計。”

華盛頓大學的計算生物物理學家David Baker說:“你正在為一個問題構建一個定制的蛋白質結構。”他所在的團隊(包括Juergens)開發(fā)了射頻擴散。該團隊于2023年3月發(fā)布了該軟件,本周在《Nature》雜志上發(fā)表了一篇描述神經網絡的論文。(預印本于2022年底發(fā)布,幾乎與此同時,其他幾個團隊,包括AlQuraishi的2和Grigoryan的3,也報告了類似的神經網絡)。

Grigoryan補充說,蛋白質設計師現(xiàn)在第一次擁有了可復制和強大的工具,可以圍繞這些工具創(chuàng)建一個新的產業(yè)。“下一個挑戰(zhàn)是,你要用它做什么?”

Juergens將他想要的蛋白質的一些規(guī)格輸入到一個類似于在線稅收計算器的網絡表格中。它必須有100個氨基酸長,形成對稱的兩種蛋白質復合物,稱為同型二聚體。許多細胞受體采用這種結構,一種新的同型二聚體可能是一種合成的細胞信號分子,華盛頓大學的計算生物化學Joe Watson說,他參與開發(fā)了射頻擴散,也在視頻通話中。但今天早上的設計并不是為了做任何事情,只是像一個現(xiàn)實的蛋白質。

幾十年來,研究人員一直在努力構建新的蛋白質。起初,他們試圖將現(xiàn)有蛋白質的有用部分拼湊在一起,比如催化化學反應的酶的口袋。這種方法依賴于對蛋白質如何折疊和工作的理解,以及直覺和大量的試驗和錯誤??茖W家們有時會篩選數(shù)千種設計,以確定其中一種能達到預期效果。

Baker說,AlphaFold(由總部位于倫敦的人工智能公司DeepMind開發(fā),現(xiàn)為谷歌DeepMind)和其他基于人工智能的模型帶來了一個靈光一現(xiàn)的時刻,這些模型可以從氨基酸序列中準確預測蛋白質結構。設計師們意識到,這些經過真實蛋白質序列和結構訓練的神經網絡,也可以幫助從零開始創(chuàng)造蛋白質。

在過去的幾年里,Baker的團隊和該領域的其他人已經發(fā)布了一系列基于人工智能的蛋白質設計工具。這些工具使用的一種方法被稱為幻覺,它包括創(chuàng)建一串隨機的氨基酸,然后由AlphaFold或類似的工具RoseTTAFold進行優(yōu)化,直到它看起來像神經網絡認為可能折疊成特定結構的東西。另一種被稱為inpainting的方法是獲取蛋白質序列或結構的特定片段,并使用RoseTTAFold在其周圍構建分子的其余部分。

但這些工具遠非完美。實驗傾向于表明,通過幻覺方法設計的結構在實驗室中制造時并不總是形成折疊良好的蛋白質,例如,最終在試管底部成為粘稠物。產生幻覺的方法除了制造小的蛋白質外,還很難制造任何東西(盡管其他研究人員在2月份的一篇預印本中展示了如何利用這種技術來設計更長的分子)。當給予較短的片段時,Inpainting在形成蛋白質方面也做得很差。即使這種方法確實產生了一個理論上的蛋白質結構,它也無法為一個問題提供多種解決方案,從而增加成功的幾率。

這就是近幾個月發(fā)布的射頻擴散和類似的蛋白質設計人工智能的用線。它們基于與生成真實圖像的神經網絡相同的原理,例如Stable Diffusion, DALL-E和Midjourney。這些“擴散”網絡是在數(shù)據(jù)上訓練的,無論是圖像還是蛋白質結構,然后這些數(shù)據(jù)逐漸變得嘈雜,最終與開始的圖像或結構沒有相似之處。然后,網絡學會對數(shù)據(jù)進行“去噪”,反向執(zhí)行任務。

像RFdiffusion這樣的網絡是在成千上萬個真實的蛋白質結構上進行訓練的,這些結構存儲在一個叫做蛋白質數(shù)據(jù)庫(PDB)的存儲庫中。當這個網絡產生一種新的蛋白質時,它開始時完全是噪音:氨基酸的隨機組合。Watson解釋說:“你要問的是產生噪音的蛋白質是什么。經過幾輪去噪后,它產生了一種類似于真實的——但卻是新的——蛋白質的東西。

當Baker的團隊測試RF擴散時,除了蛋白質的長度外,沒有提供任何指導,網絡產生了多種多樣的、看起來很真實的蛋白質,與在PDB中訓練過的任何蛋白質都不同。

但研究人員也能夠在去噪過程中指導程序根據(jù)特定的設計約束來制造蛋白質,這一過程被稱為條件反射。

例如,Baker的團隊對射頻擴散進行了條件反射,使其產生包含特定折疊的蛋白質,或者可以附著在另一個分子表面的蛋白質(這是一種相互作用,是結合的基礎)。Grigoryan的團隊甚至開發(fā)了一種名為Chroma的擴散網絡,然后對其進行調節(jié),使蛋白質的形狀與英語中使用的26個大寫字母以及阿拉伯數(shù)字相似。

噪聲信號

Juergens的電腦屏幕最初顯示的是噪音,即人工智能系統(tǒng)開始時隨機排列的氨基酸。它們被描繪成紅色的、污濁的、像小孩子手指畫一樣的字跡。它們一幀接一幀地變形成越來越復雜的形狀,具有類似蛋白質的特征,如被稱為α-螺旋的緊密螺旋形狀和被稱為β-薄片的折疊式帶狀形狀。“這是一個很好的混合拓撲結構,”Juergens微笑著說,因為他欣賞這個只花了幾分鐘就完成的發(fā)明。“這看起來不錯。”

這個工具在貝克的實驗室里得到了廣泛的應用。“與一年前相比,設計過程幾乎面目全非,”他說。神經網絡在效率低下、困難或不可能使用其他方法的設計挑戰(zhàn)方面表現(xiàn)出色。

在他們研究報告的一項分析中,研究人員從另一種蛋白質的片段開始,比如免疫細胞識別的病毒蛋白質的一部分,并讓基于人工智能的工具大量生產100種不同的新蛋白質,看看有多少會包含所需的基序。該團隊對25種不同的初始形狀進行了挑戰(zhàn)。結果并不總是包含起始片段,但RF擴散產生了至少一種蛋白質,可以用于23個基序,相比之下,有15個基序用于幻覺,12個基序用于繪畫。

射頻擴散也被證明擅長于使蛋白質自組裝成復雜的納米顆粒,這種納米顆??赡苣軌蜉斔退幬锘蛞呙绯煞帧R郧暗娜斯ぶ悄芊椒ㄒ部梢灾圃爝@類蛋白質,但Watson說,射頻擴散的設計要復雜得多。

像RF擴散這樣的神經網絡在設計能夠粘附到另一種特定蛋白質上的蛋白質時,似乎真的很有效果。貝克的研究小組利用該網絡制造出了與癌癥、自身免疫性疾病和其他疾病相關的蛋白質緊密結合的蛋白質。他說,一個尚未發(fā)表的成功是為一種名為腫瘤壞死因子受體的難以靶向的免疫信號分子設計了強大的粘合劑——抗體藥物的靶標,每年產生數(shù)十億美元的收入。Watson說:“這擴大了蛋白質的空間,我們可以制造粘合劑,并為其制造有意義的治療方法。”

真實的測試

貝克的團隊制作了如此多的設計,以至于測試它們是否按預期工作已經成為一個嚴重的瓶頸。位于馬薩諸塞州劍橋市的微軟研究院(Microsoft Research)生物醫(yī)學機器學習研究員Kevin Yang說:“一個學習機器的人可以設計出足夠100個生物學家忙上幾個月的設計。”他的團隊已經開發(fā)出了自己的基于擴散的蛋白質設計工具。

但早期跡象表明,RFdiffusion公司的產品是貨真價實的。在他們的研究中描述的另一個挑戰(zhàn)中,Baker的團隊要求該工具設計含有p53關鍵片段的蛋白質,p53是一種在許多癌癥中過度活躍的信號分子(也是一種搶手的藥物靶點)。研究人員設計了95種軟件(通過改造細菌來表達蛋白質),其中一半以上保持了p53與其天然目標MDM2結合的能力。最好的設計比天然的p53強1000倍。Watson說,當研究人員嘗試用幻覺來完成這項任務時,這些設計——盡管預計會起作用——并沒有在試管中成功。

總的來說,Baker表示,他的團隊發(fā)現(xiàn),10-20%的RFdiffusion設計與預期目標的結合程度足夠強,足以發(fā)揮作用,相比之下,早期的前ai方法的這一比例不到1%。(Watson說,以前的機器學習方法無法可靠地設計粘合劑)。華盛頓大學的一位同事,生物化學家Matthias Gloegl說,最近他的成功率已經接近50%,這意味著只需一兩個星期就能想出可行的設計,而不是幾個月。“這真的很瘋狂,”他說。

馬薩諸塞州劍橋市哈佛大學的進化生物學家Sergey Ovchinnikov表示,截至6月底,基于云的RFdiffusion每天約有100名用戶。澳大利亞悉尼大學(University of Sydney)的生化學家Joel Mackay一直在嘗試利用射頻擴散技術來設計能夠與他實驗室研究的其他蛋白質結合的蛋白質,其中包括控制細胞中基因活性的轉錄因子分子。他發(fā)現(xiàn)設計過程很簡單,并使用計算機建模來驗證,理論上,蛋白質應該與轉錄因子結合。

Mackay現(xiàn)在正在測試這些蛋白質在細胞中產生時是否能像預期的那樣改變基因表達。他祈求好運,因為這樣的發(fā)現(xiàn)相當于一種在細胞內開關特定轉錄因子的簡單方法,而不是使用可能需要數(shù)年才能識別的藥物,如果它們能被發(fā)現(xiàn)的話。他說:“如果這種方法對我們這種類型的蛋白質有效,它將徹底改變游戲規(guī)則。”

未來的改進

英國牛津大學的免疫信息學家Charlotte Deane說,像射頻擴散這樣的最新模型是一個“階段性的改變”。但關鍵挑戰(zhàn)依然存在。她說:“這將激勵人們看到我們能把這些擴散方法推進多遠。”她和其他科學家及生物技術公司特別感興趣的一個應用是設計更復雜的結合蛋白,如抗體,或T細胞(一種免疫細胞)使用的蛋白質受體。這些蛋白質具有與它們的靶標互鎖的柔性環(huán),這與RF擴散迄今為止擅長的三明治狀平面界面相反,他們在抗體方面取得了進展。

一般來說,設計生物分子是具有挑戰(zhàn)性的,因為它們的功能取決于軟性區(qū)域,軟性區(qū)域使它們能夠采用許多不同的形狀。事實證明,使用人工智能很難對這些特征進行建模。“如果問題是,我們能否與其他物質結合并抑制它,”Ovchinnikov說,“我認為這個問題將通過這些方法得到解決。但為了做一些更復雜的事情,更像大自然,你需要引入一些靈活性。”

加州大學舊金山分校的計算生物學家Tanja Kortemme正在使用射頻擴散技術設計可以用作傳感器或開關來控制細胞的蛋白質。她說,如果一個蛋白質的活性位點取決于幾個氨基酸的位置,人工智能網絡做得很好,但它很難設計具有更復雜活性位點的蛋白質,這需要更多的關鍵氨基酸到位——這是她和她的同事們正在努力解決的一個挑戰(zhàn)。

Yang說,最新擴散方法的另一個限制是它們無法產生與天然蛋白質有很大不同的蛋白質。他說,這是因為人工智能系統(tǒng)只接受了科學家已經描述過的現(xiàn)有蛋白質的訓練,并傾向于創(chuàng)造出與這些蛋白質相似的蛋白質。要想產生更像外星人的蛋白質,可能需要更好地理解賦予蛋白質功能的物理原理。

這可能會使設計蛋白質更容易執(zhí)行自然蛋白質從未進化過的任務。“還有很大的增長空間,”Yang說。

AlQuraishi說,最新的蛋白質設計工具已經被證明在創(chuàng)造可以完成特定任務的蛋白質方面非常強大——只要這種功能可以用形狀來描述,比如要結合的蛋白質的表面。但是,他補充說,像RF擴散這樣的工具還不能處理其他類型的規(guī)格,比如制造一種可以進行特定反應的蛋白質,而不管它的形狀——當“你知道你想要什么,但你不知道它的幾何形狀是什么”。

Grigoryan說,未來的蛋白質設計工具還需要有能力根據(jù)不同的標準大量生產蛋白質。一種潛在的治療蛋白不僅要與它的靶標結合,而且要不與其他蛋白結合,而且要具有易于批量生產的特性。

研究人員正在探索的一個方向是,是否可以使用簡單的語言文本描述來設計蛋白質,類似于提供給Midjourney等圖像生成工具的提示。“你真的可以想象,我們將能夠寫出一種蛋白質的描述,并將它們合成和測試,”Watson說。

Grigoryan和他的同事已經朝著這個目標邁出了一步。在2022年12月的預印本中,他們訓練Chroma將描述附加到其設計中,并根據(jù)文本規(guī)范發(fā)布設計,包括“具有CHAD結構域的蛋白質”(一種包含多個螺旋的蛋白質形狀)或“氨基轉移酶的晶體結構”(參與制造和分解蛋白質的酶)。

今天早上,Juergens在幾分鐘內創(chuàng)造出的蛋白質只是蛋白質三維結構的一個模型。然后,Juergens使用另一種人工智能工具來繪制氨基酸序列,這些氨基酸應該折疊成這種結構。作為最后的檢查,他將這些序列插入AlphaFold,看看該軟件是否預測出與設計相匹配的折疊結構。它們是正確的,AlphaFold的預測與設計的平均差異只有1氫原子的寬度。

Watson說:“我們認為這是設計上的成功。”剩下唯一要做的就是觀察這種蛋白質在現(xiàn)實生活中的表現(xiàn)。


(文章來源:www.ebiotrade.com/newsf

[返回]
代理品牌:
Copyright © 2003-2022 gzhopeco.com, All Rights Reserved 粵ICP備12085960號-2 版權所有 廣州市皓博儀器儀表有限公司
地址:廣州市番禺區(qū)洛浦街上漖村迎賓路99號南座201A  TEL:020-34702588 FAX:020-34702518

  技術支持:互信網絡