栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 系统运维 > 运维 > Linux

2021-10-29【微生物】丨qiime2样品预处理表格自动化脚本

Linux 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

2021-10-29【微生物】丨qiime2样品预处理表格自动化脚本

目录
  • 摘要
  • 工具与方法
  • 使用命令
  • 结果展示
  • 总结

摘要

前段时间研究16S/ITS的分析,对qiime2的分析流程有了一定了解,分析方面已经有一套流程了,后续会进行整理发布。在分析之前,软件需要提供预处理文件,包括一份样品数据表格(双端测序数据格式),一份样品分组表格。这两个之前都是手动生成,分组表格是没什么办法的,每个项目的分组情况都不一样,但是样品数据表格是可以研究一下自动生成的。在此记录一下。

工具与方法

使用语言:bash

使用命令

第一部分是从供应商拿到的项目数据里面提取原始数据。放到01.data中备用

for i in */00.RawData/*/*.raw_1.fq.gz;
do 
i=${i%.raw_1.fq.gz};
mv {${i}.raw_1.fq.gz,${i}.raw_2.fq.gz} ./;
done

接下来就需要通过样品名获取完整的样品数据路径,并且打印qiime2需要的表格格式。

echo -e "idtforward-absolute-filepathtreverse-absolute-filepath" >> all_sample.txt;
for i in *.raw_1.fq.gz;
do 
i=${i%.raw_1.fq.gz};
echo -e "${i}t`pwd`/${i}.raw_1.fq.gzt`pwd`/${i}.raw_2.fq.gz" >> all_sample.txt;
done

命令介绍
echo -e “” : 识别并打印双引号里面的分隔符,这样确保输出格式正确;
pwd :在echo内执行路径获取命令,补充样品的绝对路径;
">> " :覆盖输入到文档中,如果是单个大于号输入,将清除先前文档,最后文档中只有最后一行。

结果展示

总结

其实文档本来手动操作也不难,用excel也能做。但考虑到qiime2要求绝对路径,每次修改都有些麻烦,因此优化了这部分内容。如果大家有更好的建议,欢迎加群讨论,或者加我VX:bbplayer2021邀请进群。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/361311.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号