深度学习和生物信息学工具可以对聚糖分子进行深入研究

翟义荷
导读 我们从小就被告知不要吃太多的糖,但事实上,我们的身体里充满了糖。每一个活细胞,甚至病毒的表面都覆盖着一团乱七八糟的多糖:单糖我们从

我们从小就被告知不要吃太多的糖,但事实上,我们的身体里充满了糖。每一个活细胞,甚至病毒的表面都覆盖着一团乱七八糟的多糖:单糖我们从小就被告知不要吃太多的糖,但事实上,我们的身体里充满了糖。每一个活细胞的表面,甚至是病毒,都覆盖着一团多糖:单糖的长链和支链通过共价键连接在一起。这些细胞表面糖对于调节细胞间的接触是必不可少的,包括细菌对健康宿主细胞的附着。多糖也存在于所有其他生物聚合物中,包括蛋白质和RNA,它们的存在会影响聚合物的稳定性和功能。

尽管多糖无处不在且非常重要,但由于多糖的复杂性,人们对其仍知之甚少。多糖不仅有组成DNA和RNA分子的四个核苷酸“字母”,还有数百个不同的单糖“字母”,可以串在一起形成长度和分支看似无限的序列。此外,由于各种酶与细胞内和细胞外条件的相互作用,单个聚糖的序列可以改变,而不会发生基因突变。

现在,一群来自哈佛大学Wise生物灵感工程研究所和麻省理工学院(MIT)的科学家通过开发新的机器学习和生物信息学方法破解了聚糖密码,使研究人员能够系统地研究聚糖并识别其序列,这些序列在微生物与其宿主细胞的相互作用和其他未知功能中发挥作用。这些工具在今天发表在Cell HostMicrobe上的一篇新文章中进行了介绍,并作为免费的Wyss WebApp在线提供。研究人员可以使用它们对成千上万的多糖进行分析。

“我们创建的基于语言的模型可以用来预测人类免疫系统是否以及如何检测到给定的聚糖,从而帮助我们确定表面带有这种聚糖的细菌菌株是否可能是致病的。”第一作者Daniel Bojar博士说,他是Wyss研究所和麻省理工学院的博士后。“这些资源还使人们能够研究参与分子模拟和免疫逃逸的聚糖序列,从而扩大我们对宿主-微生物相互作用的理解。”

语法规则

由于聚糖是所有活细胞类型的最外层,它们必须参与感染过程,不仅参与原核细菌与真核宿主细胞结合的相互作用,还参与免疫系统细胞之间的相互作用。这造成了一场进化军备竞赛。细菌聚糖进化成模拟宿主细胞上发现的聚糖,从而避免免疫检测。宿主的聚糖被修饰,这样病原体就不能再利用它们来获得它们。为了追溯这种聚糖序列的发展历史,并确定有意义的趋势和模式,研究团队转向了机器学习算法,特别是自然语言处理(NLP),该算法此前已被证明在分析其他生物聚合物(如RNA和蛋白质)方面取得了成功。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!