用于分子生成的数据高效性图语法学习
近年来分子生成问题收到了很多关注。但是现有的方法都是基于深度神经网络,需要在很大的数据集上训练。在实践中,由于劳动密集型实验和数据收集,特定类别化学数据集的规模通常是有限的(例如,几十个样本)。这对深入学习生成模型全面描述分子设计空间提出了相当大的挑战。另一个主要挑战是只产生物理上可合成的分子。这对于基于神经网络的生成模型来说是一项非常重要的任务,因为相关的化学知识只能从有限的训练数据中提取和概括。此篇论文中,作者提出了一个数据高效性的生成模型,可以从比普通基准小几个数量级的数据集中学习。此方法的核..