seqtk批量抽取reads - 代码天地

seqtk批量抽取reads

企业开发 2023-07-02 00:16:21 阅读次数: 0

有些时候样本里面的reads数存在差异，有的几十万条，有的几万条，这个时候通常用seqkit进行抽取

常用的抽取模式有：

指定条数（10000）抽取：

seqtk sample -s 100 sample1.fq 10000 | gzip > sample1.fq

seqtk sample -s 100 sample2.fq 10000 | gzip > sample2.fq

按比例抽取（0.6）

seqtk sample -s 100 sample1.fq 0.6 | gzip > sample1.fq

seqtk sample -s 100 sample2.fq 0.6 | gzip > sample2.fq

面对多个样本需要处理的情况可用

for f in *; do seqtk sample -s 100 $f 0.5 | gzip > temp/$f; done

不过有一个小疑问为什么按比例抽取有时候不是原始数据的reads*0.6，这个地方我暂时没明白，如果有人知道望留言，感谢！

猜你喜欢

转载自blog.csdn.net/whiteof/article/details/130387271

seqtk批量抽取reads

seqtk抽取测序数据

kettle 批量抽取多个表数据

intronic reads and unspliced reads differences spliced reads

抽取

Python 文本文件内容批量抽取

在HHDI中利用Excel模板批量创建数据抽取任务

读取Unique reads

RNAseq测序reads定位

samtools获取uniq reads

数据传输：同构异IP数据源批量抽取实践

知识抽取-事件抽取

flink实时数仓(八):优化flink实现全量拉取模块抽取mysql中数据(批量同步)

seqtk 一款快速处理fasta/fastq 文件的小程序

Human life almost reads like a poem

Mysql Scalability(4)Amoeba - Separate Reads and Writes

Mysql Scalability(3)Amoeba - Proxy - Reads and Writes

【转录组入门】06：reads计数

small RNA seq筛选reads长度

直接路径读 - direct path reads

how Lordec maps the long reads to DeBruijn Graph

详解HDFS Short Circuit Local Reads

HDFS Short-Circuit Local Reads

reads count文件转化为fasta格式文件(uniq reads)

reads count文件转化为fasta格式文件(redundant reads)

CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读

数据抽取

随机抽取

抽取JDBCTemplate

事件抽取

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

学习笔记(01):Python入门教程-计算机如何区分数字和字符

命令行提示符_颜色

五步轻松搞定Linux下的文件同步(备份)

Visio 2010，如何打开多个窗口

西安新起点|MBA考研十大热门城市

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

【蓝桥杯】ADV-73 数组输出

[DeeplearningAI笔记]卷积神经网络4.11一维和三维卷积

Java 逻辑运算符

Python爬虫入门——2. 5 利用正则表达式爬取豆瓣电影 Top 250

每日归档

更多

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)