一、前言
数据库网址
本文复现文章步骤(重要)
- 预测成分靶点,对应步骤【二】和【三】
- 转化靶点为基因名,对应步骤【四】
- 取成分靶点和疾病靶点交集做韦恩图,对应步骤【五】
二、PharmMapper预测成分潜在靶点
因为PharmMapper需要小分子化合物(药物)的
mol2
/SDF
结构文件,所以需要事先去Pubchem
数据库或者TCMSP
数据库下载好。
一般是2D结构的SDF更加通用,有时候SDF格式提交任务失败,需要看下SDF是否是v3000的 sdf,是的话该网站不支持,需要用OpenBabel之类的软件转化一下。
网站首页和引用
网站首页如下,我们主要关注的是Submit Job
:
要注意的是,如果我们的论文里面使用了PharmMapper
,那么要将该网站首页最下方的参考文献也引用到论文里。
提交任务
我们来到Submit Job
页面,如下:
这里必须要上传SDF
文件(2D或者3D的都可以)或者MOL2
结构文件。
邮箱地址可以随便填一个,甚至不用是正确的邮箱形式。不过建议填写正确的邮箱地址,因为任务完成时会往你邮箱里面发送通知。
任务描述可填可不填。
保持默认选项,直接Submit
即可。随后它就会提交任务(这里需要等待一会),然后给我们一个Job Id
,即任务ID,我们需要保存好它,然后去到Check Job
页面
查看任务结果
看到任务还是进行中。
等待一段时间,任务完成后,如下:
点击View result
(这里也要等待一会),如下:
这里可以看到Ligand:
后面跟着CID
号,然后下面一行告诉我们上传了什么文件,备注是什么。
其中有用的数据列有PDB ID
(但是导出数据之后就不见这个PDB ID
了)Normalized Fit Score
(标准化打分),一般根据后者筛选数据。
拉到页面最底下可以看到下载选项
搜索结果处理
打开下载的数据文件,文件命名是以JOB ID
命名的,建议改掉。
可以看到有用的数据列为Norm Fit
(标准化打分)和Uniplot
(Uniprot ID)
一般筛选标准化打分≥0.9的数据。
三、SwissTarget预测成分潜在靶点
该网站只能通过单个成分的SMILES号预测。
网站首页和搜索
网站首页如下:
左上角的Homo spiens
是人类种的意思,一般不需要更改。
然后将我们成分的SMILES
序列号粘贴进去,然后等待右侧2D
结构渲染出来,确认下是否是我们想要的活性成分的结构。然后点击Predict targets
选择Export results
的第二个图标,保存为csv
格式的文件,文件名一般都是SwissTargetPrediction.csv
,注意改名。
搜索结果处理
打开结果来看一下:
第一列Target
是靶点的全名,第二列Common name
是靶点的通用名,也就是常用的基因名,一般我们只要这一列(有时候前三列都有点作用)。
然后F
列代表着作用在该靶点上的可能性,我们一般根据这个由大到小排列,然后进行筛选。
筛选标准有:
- 选取结果集的前5/10/15/20个。
- probability>0.1或>0或>0.9或>中位数等。
- 最常使用的标准应该是probability>0(依据来自于本人统计的2024年中文被引>0的网药文章)
然后我们依次将前面步骤得到的中药活性成分都重复如上步骤,得到各个成分的潜在靶点,汇总并去重,范围一般是几十到几百个。
四、Uniprot数据库转化为基因名
这里Entry
指的是Uniprot ID
,Gene names
中加粗的才是基因名。
五、成分靶点和疾病靶点取交集做韦恩图
excel操作
见如下文章:
https://jingyan.baidu.com/article/c1a3101ea6c0afde656debca.html
在线网站制作
韦恩图推荐Venny 2.1
:https://bioinfogp.cnb.csic.es/tools/venny/index.html
取交集推荐:https://uutool.cn/txt-intersection/