利用sed命令将基因id中的分号替换成横线 - 代码天地

利用sed命令将基因id中的分号替换成横线

业界资讯 2024-11-06 19:34:07 阅读次数: 0

由于自己在运行以下命令时报错，后来发现是基因ID中存在分号所致（因为genome.gtf文件本身最后一行的信息就是利用分号进行分隔的）

gtftk count -i genes_all.gtf > genes_all.gtf.count

利用sed命令进行替换

#检查基因id是否存在分号
# awk -F "\t" '$NF ~ /"\S+;\S*"/' genome.gtf |less
mv genome.gtf tmp.gtf
#替换
sed 's/\( "\S*\);\(\S*"\)/\1-\2/g' tmp.gtf > genome.gtf

sed 是一个流编辑器，用于对文本进行过滤和转换。这个命令 sed 's/\( "\S*\);\(\S*"\)/\1-\2/g' 是一个 sed 命令的替换（s）操作，用于查找和替换文本。让我们逐步分析这个命令：

s：表示替换操作。
/\( "\S*\);\(\S*"\)/：这是替换操作的搜索模式，它使用了正则表达式和分组。
- \( 和 \)：这些是分组的开始和结束标记，它们将正则表达式的一部分分组，以便在替换模式中引用。
- "\S*"：匹配一个双引号，后面跟着任意数量的非空白字符（\S 表示非空白字符），直到遇到另一个双引号。这个模式匹配了两个这样的字符串。
- \(\S*\)：这是第二个分组，匹配任意数量的非空白字符。
/\1-\2/g：这是替换模式。
- \1 和 \2：这些是反向引用（指定打印第几个括号中的内容），分别引用了搜索模式中的两个分组。
- -：这是要插入在两个分组之间的字符。
- g：全局替换标志，表示替换每一行中所有匹配的文本，而不是只替换第一个匹配。

综合来看，这个 sed 命令的作用是：

在每一行中查找所有符合模式 "非空白字符序列";"非空白字符序列" 的文本。
将找到的文本替换为第一个分组的内容（即第一个双引号内的非空白字符序列），后面紧跟一个短横线 -，然后是第二个分组的内容（即第二个双引号内的非空白字符序列）。

例如，如果输入文本是：

"value1";"value2"
"another1";"another2"

使用这个 sed 命令后，输出将是：

复制

value1-value2
another1-another2

这个命令在处理具有特定格式的文本时非常有用，比如在处理CSV（逗号分隔值）文件时，你可能需要将某些字段合并，并用短横线连接。

扫描二维码关注公众号，回复： 17515440 查看本文章

猜你喜欢

转载自blog.csdn.net/hgz2020/article/details/143467332

利用sed命令将基因id中的分号替换成横线

sed将换行符替换成逗号

Java将\替换成/

将字符串中的换行替换成空

将https替换成http

将 Unicode 编码替换成汉字

利用onerror将页面异常图片替换成随即图

sublime中替换成换行

Centos8 将 rm -rf 命令替换成移动到回收站

js字符替换将<br>替换成/n

pytorch框架中目标检测模型中如何将iou替换成Ciou的代码

js将当前tr列中的文字替换成表单

将一个字符串中的空格替换成20%。

[C/C++]将字符串中的空格替换成‘%20’

【算法】将字符串中的空格替换成指定字符串

将一个字符串中的每个空格替换成

C语言将字符串中数字字符替换成$字符

如何将字符串中的空格替换成其他的符号(答题心得)

PTA：将字符串中数字字符替换成# (10分)（C语言）

将字符串中的所有空格替换成%20

hive：编写java代码，将文本中的分隔符替换成\001

如何把//替换成/**/

请实现一个函数，把字符串 s 中的每个空格替换成百分号20。

将mysql数据库替换成mariaDB问题

Sublime Text 将 Tab 替换成 2个空格

Python将英文标点替换成空格

将 Npm 的源替换成淘宝的源

notepad++: 将字符串替换成换行

将npm镜像地址替换成淘宝

将字符串的某几位替换成星号

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)