ChatGPT资讯站 chatgpt资讯 这家位于阿姆斯特丹的 AI 初创公司如何打造“蛋白质配方 ChatGPT”

这家位于阿姆斯特丹的 AI 初创公司如何打造“蛋白质配方 ChatGPT”

这家位于阿姆斯特丹的 AI 初创公司如何打造“蛋白质配方 ChatGPT”缩略图

NVIDIA首席执行官黄仁勋在探讨如何利用ChatGPT探索生成式人工智能解决诸如塑料降解、碳排放减少等现实挑战时,一家欧洲的人工智能初创公司Cradle正悄然利用DNA和蛋白质序列的大型语言模型(LLM)应对这些难题,并且实际应用案例已初见端倪。

工程生物学的革新(法学硕士视角)

Cradle,这家位于欧洲的生物技术初创企业,正借助人工智能的力量,助力科学家以更快、更经济的方式设计和优化蛋白质。其专长在于运用生成式人工智能技术对酶、疫苗、肽和抗体等蛋白质形式进行革新。

与ChatGPT类似,用户只需向Cradle的系统输入一个方程式或描述,系统便能生成相应的答案或解决方案。在Cradle的平台上,用户输入DNA序列或分子的特性,并指明所需的功能,如与特定细胞物质结合、保持稳定或溶于水等。

“系统会生成一系列更有可能实现所需功能的序列,这些序列在实验室中的成功率远高于传统方法,”Cradle的负责人格里肯解释道,“我们不是在生成图片,而是在生成分子。”

Cradle的训练模型与GPT类似,采用填充法,即删除DNA或蛋白质序列中的部分信息,并要求模型进行填充。这种模型在提升性能和效率方面取得了显著进步,相较于传统方法,其改进幅度约为两倍。

“谷歌、Facebook等公司虽然在机器学习研发方面取得了诸多成果,但并未致力于构建易于生物学家使用的工具,”格里肯指出。

Cradle致力于开发专有模型,这些模型受到如基于Transformer的BERT等开源模型的启发。然而,就生物学领域的技术能力而言,格里肯坦言:“我们仍处于GPT 0.5的阶段。”

数据与反馈循环的挑战

蛋白质数据的稀缺性限制了此类模型的快速发展,尤其是与利用互联网海量信息训练GPT模型相比。为了构建有效的训练集并加速学习进程,Cradle设立了内部实验室。

此外,这些模型的反馈循环缓慢也是一大障碍。与GPT模型能够即时获得反馈不同,Cradle的模型从生成结果到获得反馈需要长达三个月的时间,且每个数据点的成本在30美元至1000美元之间。

让世界更美好

Cradle在医学研究领域解决了诸多现实问题,特别是在时间、成本和物流方面。例如,通过开发在室温下稳定的药物,Cradle使得疫苗等医疗产品能够更容易地在全球范围内分发。

格里肯表示:“如果我们能减少研发疾病治疗方法或转向生物基产品所需的时间和金钱,那么市场上将涌现更多此类产品。”

谈及创办Cradle的灵感时,格里肯开玩笑说:“我有两个小女儿。二十年后,她们可能会问我地球面临危机时我在做什么。如果我的回答是‘我在一家广告公司工作’,那显然不是最好的答案。所以,我要尽我所能利用我的时间。”

凭借在谷歌等大型科技公司工作的丰富经验,格里肯建议每个人都应在大型科技公司工作一段时间,积累经验后再去创造新的价值。

目前,Cradle已筹集到总计2970万美元的资金,并在荷兰阿姆斯特丹和瑞士苏黎世设有两个办事处。

本文来自网络,不代表ChatGPT资讯站立场,转载请注明出处:https://gpt4.nbping.com/chatgptzx/908.html
返回顶部