91精品视频密臀91尤物_亚洲精品美女色诱在线播放_91富婆推油精品偷啪_中文字幕少妇偷人激情在线看_亚洲午夜高清免费观看

設為首頁 | 添加收藏
新聞中心
廣州市皓博儀器儀表有限公司
地址:廣州市番禺區(qū)洛浦街上漖村迎賓路99號卓維商務樓201A
TEL:020-34702588      020-34703386
FAX:020-34702518
行業(yè)動態(tài) 您的當前位置:首頁 > 新聞中心 > 行業(yè)動態(tài)
一種新的計算技術可以更容易地設計有用的蛋白質
[ 發(fā)布日期:2024-4-9 8:43:06    閱讀次數(shù):305 ]

為了設計出具有有用功能的蛋白質,研究人員通常從具有理想功能的天然蛋白質開始,比如發(fā)出熒光燈,然后對其進行多輪隨機突變,最終產(chǎn)生優(yōu)化版本的蛋白質。

這個過程產(chǎn)生了許多重要蛋白質的優(yōu)化版本,包括綠色熒光蛋白(GFP)。然而,對于其他蛋白質,已證明很難產(chǎn)生優(yōu)化版本。麻省理工學院的研究人員現(xiàn)在已經(jīng)開發(fā)出一種計算方法,可以基于相對少量的數(shù)據(jù),更容易地預測導致更好蛋白質的突變。

利用這個模型,研究人員產(chǎn)生了帶有突變的蛋白質,這些突變被預測會導致改進版本的綠色熒光蛋白和來自腺相關病毒(AAV)的蛋白質,AAV用于為基因治療提供DNA。他們希望它也可以用于開發(fā)神經(jīng)科學研究和醫(yī)學應用的額外工具。

“蛋白質設計是一個難題,因為從DNA序列到蛋白質結構和功能的映射非常復雜。序列中可能有一個很大的蛋白質發(fā)生了10次變化,但每一次中間變化都可能對應于一個完全沒有功能的蛋白質。這就像試圖找到通往山脈流域的路,但沿途有崎嶇的山峰擋住了你的視線。“目前的工作試圖使河床更容易找到,”Ila Fiete說,她是麻省理工學院大腦和認知科學教授,麻省理工學院麥戈文大腦研究所的成員。

麻省理工學院人工智能與健康工程學院杰出教授Regina Barzilay和麻省理工學院電氣工程與計算機科學托馬斯·希貝爾教授Tommi Jaakkola也是關于這項工作的一篇開放獲取論文的資深作者,該論文將于5月在國際學習表征會議上發(fā)表。麻省理工學院的研究生Andrew Kirjner和Jason Yim是這項研究的主要作者。其他作者包括麻省理工學院博士后Shahar Bracha和捷克技術大學研究生Raman Samusevich。

優(yōu)化蛋白質

許多天然存在的蛋白質都具有可用于研究或醫(yī)學應用的功能,但它們需要一點額外的工程來優(yōu)化它們。在這項研究中,研究人員最初對開發(fā)可在活細胞中用作電壓指示器的蛋白質感興趣。這些蛋白質是由一些細菌和藻類產(chǎn)生的,當檢測到電勢時就會發(fā)出熒光。如果將這種蛋白質用于哺乳動物細胞,研究人員就可以在不使用電極的情況下測量神經(jīng)元的活動。

盡管數(shù)十年的研究一直在研究如何讓這些蛋白質在更快的時間尺度上產(chǎn)生更強的熒光信號,但它們還沒有變得足夠有效,無法廣泛使用。Barzilay在麥戈文研究所愛德華·博伊登的實驗室工作,他聯(lián)系了Fiete的實驗室,看看他們是否能在一種計算方法上合作,這種方法可能有助于加快優(yōu)化蛋白質的過程。

Fiete說:“這項工作體現(xiàn)了人類的意外發(fā)現(xiàn),這是許多科學發(fā)現(xiàn)的特點。”它源于楊潭集體靜修(Yang Tan Collective retreat),這是麻省理工學院(MIT)多個研究中心的研究人員的科學會議,在K. Lisa Yang的共同支持下,他們肩負著不同的使命。我們了解到,我們對大腦如何學習和優(yōu)化建模的一些興趣和工具可以應用于完全不同的蛋白質設計領域,正如博伊登實驗室所做的那樣。”

對于研究人員可能想要優(yōu)化的任何給定蛋白質,通過在序列中的每個點交換不同的氨基酸,可以產(chǎn)生幾乎無限數(shù)量的可能序列。有這么多可能的變體,不可能用實驗測試所有的,所以研究人員轉向計算建模,試圖預測哪些是最有效的。

在這項研究中,研究人員著手克服這些挑戰(zhàn),利用來自GFP的數(shù)據(jù)開發(fā)和測試一個計算模型,該模型可以預測更好的蛋白質版本。

他們首先在實驗數(shù)據(jù)上訓練一種被稱為卷積神經(jīng)網(wǎng)絡(CNN)的模型,這些實驗數(shù)據(jù)包括GFP序列及其亮度——他們想要優(yōu)化的特征。

該模型能夠基于相對少量的實驗數(shù)據(jù)(來自大約1000個GFP變體)創(chuàng)建一個“適應度景觀”——一個三維地圖,描繪了給定蛋白質的適應度以及它與原始序列的差異。

這些景觀包含代表更適合蛋白質的峰和代表不太適合蛋白質的谷。預測一種蛋白質達到適合度峰值所需要遵循的路徑是很困難的,因為通常一種蛋白質在達到附近的更高適合度峰值之前,需要經(jīng)歷一種使其不太適合的突變。為了克服這個問題,研究人員使用了一種現(xiàn)有的計算技術來“平滑”健身景觀。

一旦景觀中的這些小凸起被平滑,研究人員就會重新訓練CNN模型,并發(fā)現(xiàn)它能夠更容易地達到更高的適應度峰值。該模型能夠預測優(yōu)化后的GFP序列,其中含有多達7種不同的氨基酸,與他們開始使用的蛋白質序列相比,其中最好的蛋白質估計比原始蛋白質更適合2.5倍。

Kirjner說:“一旦我們有了這個代表模型認為在附近的景觀,我們就把它平滑,然后我們在更平滑的景觀版本上重新訓練模型。”“現(xiàn)在從你的起點到頂端有一條平滑的路徑,現(xiàn)在模型可以通過迭代地進行小改進來達到這一目標。對于不平滑的風景來說,這通常是不可能的。”

概念驗證

研究人員還表明,這種方法在鑒定腺相關病毒(AAV)的病毒衣殼的新序列方面效果很好,AAV是一種通常用于傳遞DNA的病毒載體。在這種情況下,他們優(yōu)化了衣殼包裝DNA有效載荷的能力。

Bracha說:“我們使用GFP和AAV作為概念驗證,表明這是一種適用于非常有特征的數(shù)據(jù)集的方法,正因為如此,它應該適用于其他蛋白質工程問題。”

研究人員現(xiàn)在計劃將這種計算技術用于Bracha在電壓指示蛋白上產(chǎn)生的數(shù)據(jù)。

“幾十個實驗室已經(jīng)為此研究了20年,但仍然沒有更好的東西,”她說。“我們希望,現(xiàn)在通過生成更小的數(shù)據(jù)集,我們可以在計算機上訓練一個模型,并做出比過去20年的人工測試更好的預測。”


(文章來源:www.ebiotrade.com/newsf/2024-4

 

[返回]
代理品牌:
Copyright © 2003-2022 gzhopeco.com, All Rights Reserved 粵ICP備12085960號-2 版權所有 廣州市皓博儀器儀表有限公司
地址:廣州市番禺區(qū)洛浦街上漖村迎賓路99號南座201A  TEL:020-34702588 FAX:020-34702518

  技術支持:互信網(wǎng)絡