OpenAI 要研究人類(lèi)長(zhǎng)壽問(wèn)題了??推出新模型GPT-4b micro。
可以設(shè)計(jì)出將普通細(xì)胞轉(zhuǎn)化為干細(xì)胞的蛋白質(zhì)。
據(jù) MIT 科技評(píng)論消息,這是 OpenAI 首個(gè)專(zhuān)注于生物數(shù)據(jù)的大模型,也是OpenAI 首次公開(kāi)聲稱(chēng)其模型可以帶來(lái)意想不到的科學(xué)發(fā)現(xiàn)。
聯(lián)合創(chuàng)始人丁勝,為清華藥學(xué)院創(chuàng)始院長(zhǎng)(于 2022 年 6 月卸任院長(zhǎng),仍繼續(xù)在藥學(xué)院任教并從事研究工作)。
直到 ChatGPT 推出之后,2023 年 3 月世界才知道,這位神秘投資人正是 OpenAI CEO 奧特曼本曼。
Retro Bioscience 也開(kāi)始被稱(chēng)為" 抗衰界的 OpenAI"。
山中因子是一組蛋白質(zhì),可以將人類(lèi)皮膚細(xì)胞轉(zhuǎn)化為看起來(lái)更年輕的干細(xì)胞。不過(guò),這種細(xì)胞 " 重編程 " 效率并不高,需要數(shù)周時(shí)間,且經(jīng)實(shí)驗(yàn)室培養(yǎng)皿處理的細(xì)胞中不到 1% 能完成再生。
為此,OpenAI 開(kāi)發(fā)了名為 GPT-4b micro 的新模型,用于提出改進(jìn)蛋白質(zhì)因子功能的方法。
OpenAI 用大量物種的蛋白質(zhì)序列實(shí)例以及蛋白質(zhì)相互作用相關(guān)信息訓(xùn)練了 GPT-4b micro。
其工作方式與谷歌的 AlphaFold 大不相同,AlphaFold 用于預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),山中因子則是一類(lèi)異常松散且無(wú)固定結(jié)構(gòu)的蛋白質(zhì)。
Retro 的科學(xué)家嘗試引導(dǎo)模型生成可能的山中蛋白質(zhì)重新設(shè)計(jì)方案,使用的是類(lèi)似于 "few-shot" 的提示,即用一系列帶有答案的示例作為上下文提示,隨后添加一個(gè)需要模型生成答案的新示例。
盡管基因工程師可以在實(shí)驗(yàn)室中通過(guò)一定的方法引導(dǎo)分子進(jìn)化,但受限于實(shí)驗(yàn)條件,他們通常只能測(cè)試有限的可能性,但對(duì)于典型長(zhǎng)度的蛋白質(zhì)來(lái)說(shuō),其改造方式幾乎是無(wú)限的。
OpenAI 的模型卻能經(jīng)常生成含顯著改動(dòng)的設(shè)計(jì)建議,其中三分之一的蛋白質(zhì)氨基酸被改變。
我們立即將這個(gè)模型應(yīng)用到了實(shí)驗(yàn)室,并得到了實(shí)際的成果。
OpenAI 也介紹道,研究人員根據(jù)模型的建議對(duì)兩個(gè)山中因子進(jìn)行了改造,根據(jù)初步測(cè)量結(jié)果,其效果提升了 50 倍以上。
OpenAI 研究員 John Hallman、Aaron Jaech 和 Retro 的 Rico Meinl 是該模型的開(kāi)發(fā)負(fù)責(zé)人。
John Hallman 表示:
從整體來(lái)看,這些蛋白質(zhì)的性能似乎比科學(xué)家自己設(shè)計(jì)的要好得多。
不過(guò),在研究結(jié)果發(fā)表之前,外界科學(xué)家無(wú)法驗(yàn)證這些結(jié)果的真實(shí)性。并且該模型目前也未對(duì)外開(kāi)放使用,目前只有一個(gè)定制化的展示案例。GPT-4b micro 是如何得出這些猜測(cè)的,也仍然不清楚。
關(guān)于模型的未來(lái)走向,Aaron Jaech 表示是否單獨(dú)發(fā)布或整合到 OpenAI 主流推理模型中,尚未確定。
值得一提的是,OpenAI 還特別強(qiáng)調(diào),Altman 并未直接參與這項(xiàng)工作,且公司從未根據(jù) Altman 的其他投資作出決策。
參考鏈接:https://www.technologyreview.com/2025/01/17/1110086/openai-has-created-an-ai-model-for-longevity-science/