重新想象噪音的形状可以改进分子模型

陈飘初
导读 韧性自然来自一个来自世界M之子之都的家伙。在田纳西州的哥伦比亚,埃利奥特佩里曼,一个土生土长的人,曾在劳伦斯柏克莱国家实验室工作过(

韧性自然来自一个来自世界M之子之都的家伙。在田纳西州的哥伦比亚,埃利奥特佩里曼,一个土生土长的人,曾在劳伦斯柏克莱国家实验室工作过(《坚强》自然出自一个来自“世界之都”的家伙)。艾略特佩里曼,田纳西州哥伦比亚人,曾在劳伦斯柏克莱实验室实习。去年秋天,他开始通过伯克利实验室的本科生研究计划,与能源研究与应用高等数学中心(CAMERA)的科学家彼得兹瓦特(Peter Zwart)合作。

CAMERA旨在确定实验科学的领域,这些领域可以借助应用数学的新见解。这些跨学科的研究人员开发了必要的算法工具,并作为用户友好的软件提供。兹瓦特让田纳西大学计算机科学和物理学专业的佩里曼参加了一个他最喜欢的项目“比尔在黑屋子里找猫”。

这种情况下难以捉摸的猫是一个数学问题,一段时间以来一直困扰着实验结晶学研究:如何以更真实的方式对数据中噪声的存在进行建模。

结晶学是确定分子的原子结构的不可或缺的工具,这反过来使研究人员能够了解它们的行为和功能。当聚焦光束对准纯化的结晶样品时,光从原子衍射,检测器记录衍射光。当样品旋转时,衍射图案的二维图像在各个方向被捕获。然后,将该算法应用于衍射数据,以重建样品中原子排列的三维图像。

兹瓦特解释说,当你从衍射数据中确定或求解结构时,你需要将模型与你的观察结果联系起来。兹瓦特解释说,他是伯克利实验室分子生物物理学和集成生物成像系的成员。用于执行该操作的目标函数被称为最大似然函数。他指出,如果你的数据很好,它们确实可以很好地工作,但当数据中的噪声量增加时(这将在更高的分辨率下发生),当前的方法无法提供最佳答案。

在这种情况下,目标函数不足的原因是计算只有一步,就是积分,通过分析是做不到的。也就是说,你可以通过纸笔数学把一个表达式转换成一个代码。以前处理这个问题的尝试要么只是忽略了积分步骤,要么提出了一个仅适用于实验或技术的方案的近似值。因此,兹瓦特和佩里曼回到基础,尝试了许多不同的机器学习方法,以最有效的方式尽可能准确地得出一个近似值。

在佩里曼为期16周的实习期间,他花了四分之三的时间得出结论,大多数起初看似有希望的道路实际上都是死胡同。佩里曼说,“我会尝试一些东西,但我花了一段时间来弄清楚这是成功还是失败,因为你不知道一个全新的问题。”当他们意识到人们已经做了30年的共同假设,他们可以改善,事情终于响了。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!