论文研究 - 使用现有蛋白质描述符的相邻和重叠片段提高蛋白质序列分类性能下载

weixin_39822095 2020-09-29 12:31:00
在蛋白质序列分类研究中,流行的是通过使用各种描述符(例如k聚体组成的组成)将可变长度的蛋白质序列转换成固定长度的数值载体。 这样的位置无关的描述符很有用,因为它们适用于任何长度的序列。 但是,即使子序列的位置信息可能对分类性能有很大的贡献,也会将其丢弃。 为了解决这个问题,我们将原始序列划分为若干段,然后为其计算数值特征。 它使我们能够部分引入位置信息(例如,序列前段和后段中丝氨酸的组成)。 通过对段数和重叠区域长度的综合实验,我们发现采用序列分割和特征选择的分类方法可以有效地提高性能。 我们评估了我们针对三种蛋白质分类问题的方法,并在所有情况下均取得了显着改善,这些情况的数据集均含有足够的氨
相关下载链接://download.csdn.net/download/weixin_38694023/12464624?utm_source=bbsseo
...全文
42 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

12,777

社区成员

发帖
与我相关
我的任务
社区描述
CSDN 下载资源悬赏专区
其他 技术论坛(原bbs)
社区管理员
  • 下载资源悬赏专区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧