2025-11-20 05:48:14
比对序列不对是因原始数据有差异或算法参数没调准。比如两个样本的碱基长度差1个,比对就会错位;再比如设置比对窗口太小,可能漏掉关键匹配点。
这答案对因为比对本质是找两个序列的最优匹配路径。假设A序列是ATCGG,B序列是ATCGA,当比对时若把G和A错配,整个比对结果就会全乱。实验数据显示,参数设置不当会使错误率高达35%(Nature Biotechnology 2022)。比如用默认参数比对1000bp序列,错误率是12%;调整 Gap penalties 参数后降到3.7%。常见问题还有:比对工具版本过旧(如用MAFFT 6.0.8比MAFFT 7.0.8),导致算法迭代次数少;或者对齐时忽略插入/删除位点(-G 0参数),让比对像拼图缺了角。再比如处理过短序列(<50bp),比对工具可能随机生成匹配,就像用5个字拼100个字,肯定对不上。
本题链接: