免费试用|化学界的“ChatGPT”:逆合成软件SYNTHIA™,加速新分子的合成

广告

作者:X-MOL

2023-10-13

“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”

——温斯顿教授,麻省理工学院

作为二十一世纪三大尖端技术之一(基因工程、纳米科学、人工智能),人工智能在近三十年来获得了迅速的发展,在很多学科领域都获得了广泛应用,并取得了丰硕的成果。那您了解过什么是化学合成中的AI吗?

快速找到有价值分子的有效合成路线,一直是研发科学家心中的白月光。近些年来,尽管已有多个自主设计的软件平台在该领域取得很大的进展,但这些程序往往一次只能规划一步,并且计算机辅助合成设计仍局限在相对简单的目标分子上。

对于包括天然产物、药物分子等复杂结构的化合物,需要考虑各种复杂情况及多步合成的能力,而仅仅依靠面向数据的人工智能( AI )方法,是不足以设计出复杂分子的可靠有效合成路径的。

韩国蔚山国家科学技术学院(UNIST)的Bartosz Grzybowski教授实验室一直以来,致力于开发一种名为SYNTHIA™( 更名前叫:Chematica) 的混合合成专家/ AI系统。

逆合成软件已证明不仅可以有效地设计出具有高价值且与医学相关的化合物分子,并已将其扩展至更复杂的天然产物合成设计。

如需了解更多关于默克逆合成软件SYNTHIA™的内容,或是想获得相关培训和试用机会,扫描二维码填写信息,我们将尽快与您联系!

数量有限,先到先得

SYNTHIA™由有机化学家和计算机科学家历经18年精心设计,采用基于强大的反应规则数据库的先进精细算法。该数据库目前已包含10万多种手动编码的反应规则,并且仍在不断扩大。

为了验证Synthia™设计路线的可靠性,默克诚邀6位化学家进行了一项验证实验项目,选择了一系列具有高价值的医药化合物分子,在一定的筛选条件下,让Synthia™给出相应的合成路线,然后根据Synthia™设计的路线进行实验室合成。

六位科学家在规定限期内,在最少的反应路线优化下成功完成所有预设化合物的合成。并且相比于之前已有的合成路线,根据给出的路线进行合成,可以节约成本,增加产量,以及减少反应步数。该成果被报道在期刊上。详细内容参阅下属参考文献。

波兰科学院有机化学研究所及韩国蔚山国家科技术大学(UNIST)在Nature上联合发表了一篇关于逆合成软件SYNTHIA™应用于复杂天然产物的合成的文章。

课题组对由人工智能驱动的计算机辅助合成软件SYNTHIA™(更名前叫Chematica)加以改进,使得进阶版的SYNTHIA™可以为复杂的天然产物设计合成路径,并通过类似于人机对比的图灵测试和合成验证来评估其合成能力。

图灵测试(The Turing test):指测试者与被测试者(一个人和一台机器) 隔开的情况下,通过一些装置(如键盘) 向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。

合成化学版的图灵测试:即相当一部分专家认为机器设计的合成路线是由人类设计的。

为验证新版SYNTHIA™( 更名前叫Chematica) 的合成能力,作者收集了40种反应的合成方法:其中20种来自文献期刊报道,另外20种由SYNTHIA™设计。文献选出的路径(以下简称为文献路径)涵盖了1999-2019年这段时期各大期刊的代表路径,期刊包含Org.Lett., J. Org. Chem, Angew. Chem., J. Am. Chem. Soc., Synlett。

从SYNTHIA™选出的路径从平均质量、原子数量、立体中心或环各个方面与文献路径具有相似的复杂性。

研究人员诚邀18位合成专家对给定路线进行人与机器感知可能性的评分(man-vs-machine, 用MVM表示),即判断给定路径是由人设计的还是由机器设计的。评分范围为0-10,MVM=0表示“一定是人设计的”,MVM=10表示“一定是机器设计的”。另一个标准为,判断合成路径的设计精巧度(Elegance,用E表示),E=0表示“毫无新意”,E=10表示“绝妙设计”。另外值得注意的是,MVM与E并不相关。

从所有路径的MVM得分分析,SYNTHIA™比从文献提取到的路径高0.6分,得分为MVMman=4.58,MVMmachine=5.17。而从设计精巧度来说,SYNTHIA™设计的路径被认为是更精巧独特,得分为Eman=4.55,Emachine=4.75。

接着,作者选取了三种复杂程度不同的天然产物分子进行验证实验。

第一种是结构相对简单的分子(–) -Dauricine (这是一种有效的自噬阻断剂和抗癌剂,到文章发表前仅通过Bischler-Napieralski反应以外消旋形式合成过);

第二个选取的是结构少许复杂的Tacamonidine的iboga alkaloid分子(是最近分离得到,但尚未合成的的iboga alkaloid);

第三个分子选取的是结构相对更复杂的分子是Lamellodysidine A(这是一种桥接的多环倍半萜,具有独特且复杂的结构,迄今为止仍不能完全合成,这使得对其合成路径的探究具有挑战性和意义)。

SYNTHIA™为上述三个目标设计了多条路径,研究人员从中选择了最佳路径。在实验验证的过程中,不允许对给出的路线进行任何更改。但是,进行合成的有机化学家可以调整反应条件(如温度、溶剂、特定碱、催化剂等),以便进行反应优化。最终,SYNTHIA™预测的通过实验验证的有16条路径,总共包括超过 70个单独的反应。详细内容参阅下属参考文献。

2020年,密西根大学的化学家 Tim Cernak课题组利用默克AI逆合成软件Synthia™对12种尚在研究阶段的抗新冠药物展开了逆合成研究,在此次报道中,他们为其中11个候选药物分子找到了新的合成路线,使其合成能使用廉价易得的原料、高效且避开已有专利。

同时他们还通过实验验证了其中两种药物合成路线的可行性和经济性,分别包括阿比多尔(umifenovir,3)的4条新合成路线以及溴己新(bromhexine,2)的一步法合成路线。Cernak教授已经为所有新合成路线申请了专利,但他表示目的不在于获利,而是希望在未来授权给制药商以保证这些药物能以低价供应给需要的人。详细内容参阅下属参考文献。

正如默克公司的化学家Danielle Schultz所说:“如果你要向全世界供应一种药物,你的原料必须像糖一样便宜、容易获得。”

默克逆合成软件SYNTHIA™可以轻松自定义搜索条件,对已知或者全新分子进行合成路线设计。针对每个分析步骤,SYNTHIA™不仅仅关注反应中的局部相互作用,还考虑整个分子以及潜在冲突和选择性问题,还会考虑反应的立体选择性和区域选择性。SYNTHIA™探索创新和已知的解决方案,排除不可行选择,为化学研究人员提供更有前景的合成路线。

如需了解更多关于默克逆合成软件SYNTHIA™的内容,若您对相关培训和试用机会感兴趣,扫描下方二维码,我们将尽快与您联系。

数量有限,先到先得

化学合成挑战赛

第五届compound challenge化学合成挑战赛即将展开,该竞赛旨在设计目标分子的最佳合成路线。在挑战赛期间,参与者可以免费使用Synthia Lite逆合成软件进行路线设计。最终提交的合成路径将经过评审团的审查,以确定最佳的合成路线,并将在真实实验室条件下进行测试。最佳路线的团队将赢得10000欧元的奖金,并获得6个月SYNTHIA™软件免费试用权限。

赛程:目标分子发布前一周,参赛者将获得Synthia™权限,以及相关使用教程;参赛者需要在收到目标分子的48小时之内提交合成路径。

评审:所有参赛队伍将共同选出前五十个(Top50)最优的合成路径,之后默克评审将选出最终前五支优胜队伍(Top5);前五支优胜队伍的合成路径将会在真实实验室(CRO)进行验证;最终的优胜队伍,将根据合成步数,合成产率等相关指标来确认;

立即参与:第五届合成挑战赛的报名时间为2023年9月6日至2023年10月27日。

可扫描二维码了解并报名:

SYNTHIA™中国地区负责人:

李女士(Merck)

电话:+8615901229845

Email:ida.li@merckgroup.com

[1] Chem, 2018, 4, 522–532;

[2] Nature, 2020, 588 83-88;

[3]ChemRxiv, 2020, DOI:10.26434/chemrxiv.12765410.v1