Python 爬虫 爬取单个基因 表格数据的生物学功能 (urllib+正则表达式):

Python 爬虫 爬取单个基因的生物学功能(urllib+正则表达式):

import re
import urllib
from urllib import request
url = 'https://www.ncbi.nlm.nih.gov/gene/?term=FUT1'   #  查找FUT1基因的网址
response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')   #  对response  进行解码
print(content)
print(type(content))
p =re.findall('<td>(.*?)</td>',content)     #  (.*?)为正则表达式的目标区域
print('FUT1:',p[0])

猜你喜欢

转载自blog.csdn.net/qq_40256654/article/details/83859445
今日推荐