用于分子生成的数据高效性图语法学习
社区首页 (3649)
请编写您的帖子内容
社区频道(8)
显示侧栏
卡片版式
全部
运营指南
问题求助
交流讨论
学习打卡
社区活动
Ada助手
活动专区
最新发布
最新回复
标题
阅读量
内容评分
精选

89
评分
回复
用于分子生成的数据高效性图语法学习
近年来分子生成问题收到了很多关注。但是现有的方法都是基于深度神经网络,需要在很大的数据集上训练。在实践中,由于劳动密集型实验和数据收集,特定类别化学数据集的规模通常是有限的(例如,几十个样本)。这对深入学习生成模型全面描述分子设计空间提出了相当大的挑战。另一个主要挑战是只产生物理上可合成的分子。这对于基于神经网络的生成模型来说是一项非常重要的任务,因为相关的化学知识只能从有限的训练数据中提取和概括。此篇论文中,作者提出了一个数据高效性的生成模型,可以从比普通基准小几个数量级的数据集中学习。此方法的核..
复制链接 扫一扫
分享

104
评分
回复
Nat. Commun.|概率蛋白质序列模型的生成能力
本文介绍了由坦普尔大学Vincenzo Carnevale和Allan Haldane共同通讯发表在Nature Communications的研究成果:本文提出了一个新的标准来度量蛋白质序列生成模型(GPSM)的准确性和生成能力,并使用该标准比较了不同GPSM的生成能力。与之前的度量标准相比,能够直接测量高阶边缘值,衡量GPSM捕获高阶协变的能力,对GPSM的准确性和生成能力有更加直接和科学的度量。1.背景介绍蛋白质多序列比对(MSA)突变模式解码的最新研究进展突出了突变协变在确定蛋白质功能.
复制链接 扫一扫
分享

105
评分
回复
一小时讲懂图神经网络在分子上的应用
介绍:图神经网络在分子上的应用是当前的研究热点。这个课件主要目标是用一小时给领域初学者讲清楚基础知识和背景,当前的研究热点,以及重要的工作。更重要的是,该课件内附很多领域内数据、公开赛、算...
复制链接 扫一扫
分享

84
评分
回复
NeurIPS-21 | MGSSL: 基于官能团的分子属性预测图网络自监督预训练
本文介绍一篇来自中国科学技术大学刘淇教授课题组和腾讯量子实验室联合发表的一篇文章。该文章提出了基于官能团的分子属性预测图网络自监督预训练方法MGSSL。MGSSL结合化学领域知识,在大量无标签分子数据中划分官能团和构建官能团树,并进一步通过官能团生成式自监督任务,使得预训练的图网络可以学习到官能团的结构和语义信息,提高下游分子属性预测任务的效果。1.研究背景分子属性预测任务对于药物合成和筛选具有重要意义,例如新冠病毒药物筛选。传统通过实验和理论计算的方法的得到分子属性耗时且昂贵。近年来,基于深.
复制链接 扫一扫
分享

90
评分
回复
Nat. Aging︱老药新用发现——西地那非有助于预防或治疗老年痴呆
2021年12月6日,克利夫兰医学中心Lerner研究所方坚松博士(第一作者,现广州中医药大学副研究员)等联合在Nature 子刊Nature Aging上在线发表了题为“Endophenotype-based in silico network medicine discovery combined with insurance record data mining identifies sildenafil as a candidate drug for Alzheimer’s disease”的研究.
复制链接 扫一扫
分享

77
评分
回复
RDKit | 基于RDKit探索化学空间-smiles悬停
环境Win10 RDKit2021.09.2 Python=3.7基于RDKit探索化学空间-smiles悬停导入库import sysimport osimport pandas as pdimport numpy as npimport altair as altfrom rdkit import Chemfrom rdkit import rdBasefrom rdkit.Chem import AllChemfrom rdkit.Chem import
复制链接 扫一扫
分享

78
评分
回复
OpenMM | PDBFixer 用于蛋白质预处理
PDBFixer 用于蛋白质预处理
复制链接 扫一扫
分享

94
评分
回复
DeepMind | 通过去噪来进行分子性质预测的预训练
今天给大家带来的是牛津大学的Sheheryar Zaidi和DeepMind公司的Michael Schaarschmidt联合发表的文章《Pre-training via Denoising for Molecular Property Prediction》。从3D结构中预测分子性质的数据有限,这对神经网络的泛化造成了挑战。作者介绍了一种预训练技术,它利用平衡状态下3D分子结构的大型数据集来为下游任务学习有意义的表示。受最近噪声正则化的启发,作者的预训练目标是基于去噪的。依赖于去噪自动编码器和分数比配之
复制链接 扫一扫
分享

112
评分
回复
Nature Medicine | 组学和人工智能推动肝病生物标志物的发现
新技术可以对无症状的酒精相关肝病进行无创检测和分期;进一步完善这种方法可以改变临床管理并改善患者的预后。酒精相关肝病(ALD)是全球肝病的主要原因之一,占与肝硬化有关的死亡人数的四分之一以上。脂肪变性、酒精性肝炎和纤维化是明显的组织病理学特征,标志着ALD向肝硬化的发展,然而这种发展往往是无症状和非特异性的,这使得早期诊断极具挑战性。ALD经常是通过异常的肝脏测试结果或影...
复制链接 扫一扫
分享

97
评分
回复
Nat. Mach. Intel. | 通过课程学习方法优化分子从头设计模型
本文介绍由瑞典分子人工智能研究所的Atanas Patronov团队发表在Nature Machine Intelligence的研究成果。作者将课程学习应用于药物发现中。在全新的设计平台中实现课程学习(CL),并将其应用于不同复杂性的分子设计问题中。结果表明,与标准的基于策略的强化学习相比,课程学习能够加速学习效率和优化模型输出的质量。分子设计需要在化学空间中进行多参数优化(MPO)搜索,估计在1023-1060个分子的范围内。之前的分子设计方法有虚拟筛选(VS)等,但随着深度学习的兴起,深度学习已逐渐替
复制链接 扫一扫
分享

117
评分
回复
Nat. Comm. | 使用Tensor-cell2cell对细胞通讯进行环境感知去卷积
本文介绍由美国加州大学圣地亚哥分校生物工程系Nathan E. Lewis通讯发表在 Nature Communications 的研究成果:作者介绍了Tensor-cell2cell,这是一种基于张量分解的无监督方法,它通过同时说明细胞的多个阶段、状态或位置来破译上下文驱动的细胞间通信。为此,Tensor-cell2cell揭示了与不同表型状态相关并由细胞类型和配体-受体对的独特组合决定的上下文驱动的通信模式。Tensor-cell2cell有力地改进和扩展了现有工具的分析能力。作者发现,Tensor-c
复制链接 扫一扫
分享

95
评分
回复
Nat. Commun.| 机器学习对可突变的治疗性抗体的亲和力和特异性进行共同优化
这次为大家分享的是来自nature communications上的一篇题为《Co-optimization of therapeutic antibody affinity and specificity using machine learning models that generalize to novel mutational space》的文章,来自密歇根大学生物界面研究所、生物医学工程系、化学工程系项目组的Peter M.Tessier团队。治疗性抗体的开发需要高亲和力分子的选择以及其他类药物
复制链接 扫一扫
分享

107
评分
回复
IBM | 增强配体与靶标契合的小分子图生成模型
今天给大家介绍的是IBM研究团队发表在arxiv上的一项有关分子生成的研究。作者提出一种可以编码3D蛋白质-配体接触的图生成模型,该模型利用条件VAE从而可以预测在靶标结合口袋内的分子相互作用,从而实现特定活性的分子生成。实验结果表明,与基于配体2D生成方法相比,该方法生成的分子与多巴胺D2受体的结合口袋更契合。该研究展现了蛋白靶标的结构信息如何增强分子生成。小分子生成模型基于一系列深度学习架构设计的,其通常是要生成具有所需物化性质的分子,以增强化学家的创造力,并扩展传统数据方法或物理方法的规模。大部分模型
复制链接 扫一扫
分享

137
评分
回复
Science | 化学合成自动智能化--ChemPU中化学合成文献数据库的数字化和验证
现代有机化学的大多数实验都需要事先用文献中的程序来制备反应物。将最常见的此类程序自动化可以为研究界节省大量的时间,同时也有利于众包的优化。Rohrbach等人将100多个流行的协议翻译成可在合成机器上执行的格式,然后他们对其中的一半进行了实验验证。作者还建立了一个开放的数据库,新的可执行协议可以被添加到其中。——JSY尽管潜力巨大,但合成化学的自动化在过去几十年中才取得了渐进式的进步。研究人员提供了一个包含 100 个分子的自动可执行化学反应数据库,这些分子代表了当代有机合成中发现的反应范围。这些反应包..
复制链接 扫一扫
分享

92
评分
回复
人工智能时代的糖信息学
人工智能(AI)方法已经并正在越来越多地被整合到生物信息学及其糖科学分支(即糖信息学)中实施的预测软件中。人工智能技术在过去几十年中不断发展,它们在糖科学中的应用还不广泛。这种有限的应用部分是由于糖类数据的特殊性造成的,众所周知,这些数据是难以产生和分析的。尽管如此,随着时间的推移,糖学、糖蛋白组学和糖结合数据的积累已经达到了一定程度,即使是最新的深度学习方法也能提供性能良好的预测.
复制链接 扫一扫
分享

93
评分
回复
Nat. Methods | scBasset:基于DNA序列的单细胞ATAC-seq卷积神经网络建模
作者提出了一种基于DNA序列的卷积神经网络方法(scBasset)来对scATAC数据进行建模。实验表明,通过利用可及性峰值下的DNA序列信息和神经网络模型的表达能力,scBasset在scATAC和单细胞多组数据集的各种任务中展现了最先进的性能,包括细胞类型识别、scATAC去噪、数据集成和转录因子活性推断。
复制链接 扫一扫
分享

92
评分
回复
抗体优化新方法:通过AI预测亲和力和自然度
利用人工智能对抗体进行优化的基于高通量亲和数据训练的深层语境语言模型(deep contextual language models trained on high-throughput affinity data),并运用名为ACE和SPR的方法,用于生成抗体结合亲和力的相对传统方法而言更优的测量,然后基于两种不同的抗体证明了可以定量预测未知抗体序列变体的结合。
复制链接 扫一扫
分享

91
评分
回复
Bioinformatics | MICER: 用于分子图像字幕的预训练编码-解码架构
该文章受编码器-解码器架构的启发,提出了MICER分子图像识别架构,结合迁移学习、注意力机制和几种数据构造策略增强不同数据集的有效性和可塑性;并评估了不同因素对该架构的影响以及数据集错误分析,为后续研究提供方向。该方法在构造的数据集以及基准测试集上较传统的方法取得了显著的提升。
复制链接 扫一扫
分享

85
评分
回复
RDKit | 建立溶解度预测的LightGBM回归模型
基于RDKit建立溶解度预测的LightGBM回归模型
复制链接 扫一扫
分享
为您搜索到以下结果: