想要抓取数据,进行抓包分析,找到数据包,发现请求头有加密参数Portal-Sign,返回的数据内容也进行了加密。
直接搜索加密参数,找到加密位置,发现是在拦截器中,那么凭经验,解密位置肯定也在下面的拦截器中。
打印一下参数,看有没有找对位置,发现找对了,直接进入f.getSign函数
打上断点,分析,发现是d函数,结果一致的。再打印一下参数。这个函数接收表单数据t,返回加密数据。
直接复制函数在js中,缺什么补充什么。 r["a"] 是固定值,复制下来。
发现u没有被定义
找到u函数,就在d函数上方,复制下来。
然后接下来是l,都在更上面
接着是最重要的s函数。
进入s函数
发现似乎是MD5加密,我们可以去在线加密网站验证一下。加密内容是:
B3978D054A72A7002063637CCDF6B2E5BeginTime2024-01-17 00:00:00createTime[]EndTime2024-07-17 23:59:59GGTYPE1KINDGCJSpageNo3pageSize20timeType6total3556ts1721183028929
加密后结果小写之后是:
b3cb44e0121be6814b1fa7a765ac7d93
在线加密MD5结果是,发现结果是一样的:
改写最终代码,导入加密库。
const CryptoJS = require('crypto-js')
t = {
"ts": 1721183028929,
"pageNo": 3,
"pageSize": 20,
"total": 3556,
"KIND": "GCJS",
"GGTYPE": "1",
"timeType": "6",
"BeginTime": "2024-01-17 00:00:00",
"EndTime": "2024-07-17 23:59:59",
"createTime": []
}
var r = 'B3978D054A72A7002063637CCDF6B2E5';
function l(t, e) {
return t.toString().toUpperCase() > e.toString().toUpperCase() ? 1 : t.toString().toUpperCase() == e.toString().toUpperCase() ? 0 : -1
};
function u(t) {
for (var e = Object.keys(t).sort(l), n = "", a = 0; a < e.length; a++)
if (void 0 !== t[e[a]])
if (t[e[a]] && t[e[a]]instanceof Object || t[e[a]]instanceof Array) {
var i = JSON.stringify(t[e[a]]);
n += e[a] + i
} else
n += e[a] + t[e[a]];
return n
};
function d(t) {
for (var e in t)
"" !== t[e] && void 0 !== t[e] || delete t[e];
var n = r + u(t);
return CryptoJS.MD5(n).toString().toLocaleLowerCase()
};
console.log(d(t))
// 结果为 b3cb44e0121be6814b1fa7a765ac7d93
好了,请求头参数的加密已经解决了,现在来分析返回内容的解密。加密内容再请求拦截器,那么解密肯定在响应拦截器洛,在下方疑似位置打上断点。
打上断点,分析参数
很明显b是解密函数,进入b函数,发现疑似是ASE的解密,r["e"],r["i"]都是固定的,分别作为密钥和向量。
复制代码,并改写
var key = 'EB444973714E4A40876CE66BE45D5930';
var i = 'B5A8904209931867';
var data = ''
function data_decrpted(t) {
var e = CryptoJS.enc.Utf8.parse(key)
, n = CryptoJS.enc.Utf8.parse(i)
, decrypted_data = CryptoJS.AES.decrypt(t, e, {
iv: n,
mode: CryptoJS.mode.CBC,
padding: CryptoJS.pad.Pkcs7
});
return JSON.parse(decrypted_data.toString(CryptoJS.enc.Utf8))
};
console.log(data_decrpted(data))
{
// PageTotal: 178,
// PageNo: 2,
// Total: 3555,
// PageSize: 20,
// Table: [
// {
// KIND: 'GCJS',
// TITLE: '招标公告',
// GGTYPE: '1',
// NAME: '莆田无废城市建设(木兰溪流域及北岸区)固废综合治理及循环利用项目全过程咨询',
// M_ID: 256910,
// PLATFORM_CODE: '11350300696621488X',
// PLATFORM_NAME: '莆田市行政服务中心',
// TM1: '2024-07-16 09:18:01',
// AREACODE: '350392',
// AREANAME: '莆田市湄洲湾北岸经济开发区',
// PROTYPE_TEXT: '房屋建设',
// PROTYPE: 'A01',
// M_DATA_SOURCE: '0301',
// M_TM: '2024-07-16 09:18:01',
// M_PROJECT_TYPE: '1',
// TM: '2024-07-16 09:18:01',
// IS_NEW: false
// },
// {
// KIND: 'GCJS',
// TITLE: '招标公告',
// GGTYPE: '1',
// NAME: '惠安县城南文教园(校友活动中心及学生发展中心)建设运营一体化(招标公告)',
// M_ID: 256909,
// PLATFORM_CODE: '12350500MB03536900',
// PLATFORM_NAME: '泉州市公共资源交易中心',
// TM1: '2024-07-16 00:00:08',
// AREACODE: '350521',
// AREANAME: '惠安县',
// PROTYPE_TEXT: '房屋建设',
// PROTYPE: 'A01',
// M_DATA_SOURCE: '0502',
// M_TM: '2024-07-16 00:00:08',
// M_PROJECT_TYPE: '1',
// TM: '2024-07-16 00:00:08',
// IS_NEW: false
// },
// {
// KIND: 'GCJS',
// TITLE: '招标公告',
// GGTYPE: '1',
// NAME: '洛江城市数据管理大脑指挥中心暨社会治理中心(招标公告)',
// M_ID: 256908,
// PLATFORM_CODE: '12350500MB03536900',
// PLATFORM_NAME: '泉州市公共资源交易中心',
// TM1: '2024-07-16 00:00:06',
// AREACODE: '350504',
// AREANAME: '洛江区',
// PROTYPE_TEXT: '房屋建设',
// PROTYPE: 'A01',
// M_DATA_SOURCE: '0502',
// M_TM: '2024-07-16 00:00:06',
// M_PROJECT_TYPE: '1',
// TM: '2024-07-16 00:00:06',
// IS_NEW: false
// },
// {
// KIND: 'GCJS',
// TITLE: '招标公告',
// GGTYPE: '1',
// NAME: '福建外运福州南通物流中心(三期)工程(监理)(二次招标)-招标公告',
// M_ID: 256894,
// PLATFORM_CODE: '12350100MB02709751',
// PLATFORM_NAME: '福州市公共资源交易服务中心',
// TM1: '2024-07-15 21:05:35',
// AREACODE: '350121',
// AREANAME: '闽侯县',
// PROTYPE_TEXT: '房屋建设',
// PROTYPE: 'A01',
// M_DATA_SOURCE: '0102',
// M_TM: '2024-07-15 21:05:35',
// M_PROJECT_TYPE: '1',
// TM: '2024-07-15 21:05:35',
// IS_NEW: false
// },
// {
// KIND: 'GCJS',
// TITLE: '招标公告',
// GGTYPE: '1',
// NAME: '莆田市城乡供水一体化--莆田农村“一户一表”及老旧管网改造工程(涵江区三江口镇一户一表改造项目)设计施工总承包
// 项目',
// M_ID: 256893,
// PLATFORM_CODE: '11350300696621488X',
// PLATFORM_NAME: '莆田市行政服务中心',
// TM1: '2024-07-15 20:36:02',
// AREACODE: '350303',
// AREANAME: '涵江区',
// PROTYPE_TEXT: '水利',
// PROTYPE: 'A07',
// M_DATA_SOURCE: '0301',
// M_TM: '2024-07-15 20:36:02',
// M_PROJECT_TYPE: '1',
// TM: '2024-07-15 20:36:02',
// IS_NEW: false
// },
// {
// KIND: 'GCJS',
// TITLE: '招标公告',
// GGTYPE: '1',
// NAME: '福建省云霄第一中学新校区迁建项目全过程咨询服务招标公告',
// M_ID: 256892,
// PLATFORM_CODE: '12350600489954028U',
// PLATFORM_NAME: '漳州市公共资源交易中心',
// TM1: '2024-07-15 19:05:30',
// AREACODE: '350622',
// AREANAME: '云霄县',
// PROTYPE_TEXT: '房屋建设',
// PROTYPE: 'A01',
// M_DATA_SOURCE: '0601',
// M_TM: '2024-07-15 19:05:30',
// M_PROJECT_TYPE: '1',
// TM: '2024-07-15 19:05:30',
// IS_NEW: false
// },
最终python代码和js代码见下
import requests
import time
import execjs
import pprint
time_stamp = round(time.time()*1000)
cookies = {
'ASP.NET_SessionId': 'cacgnldh1bbaqtr2qaoq12zs',
}
json_data = {
'pageNo': 10,
'pageSize': 20,
'total': 3555,
'AREACODE': '',
'M_PROJECT_TYPE': '',
'KIND': 'GCJS',
'GGTYPE': '1',
'PROTYPE': '',
'timeType': '6',
'BeginTime': '2024-01-17 00:00:00',
'EndTime': '2024-07-17 23:59:59',
'createTime': [],
'ts': time_stamp,
}
js_code = execjs.compile(open('demo.js','r',encoding='utf-8').read())
get_sign = js_code.call('get_sign',json_data)
print('获取的portal-sign为:',get_sign)
headers = {
'Accept': 'application/json, text/plain, */*',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Cache-Control': 'no-cache',
'Connection': 'keep-alive',
'Content-Type': 'application/json;charset=UTF-8',
'Origin': 'https://ggzyfw.fj.gov.cn',
'Pragma': 'no-cache',
'Referer': 'https://ggzyfw.fj.gov.cn/business/list',
'Sec-Fetch-Dest': 'empty',
'Sec-Fetch-Mode': 'cors',
'Sec-Fetch-Site': 'same-origin',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36',
'portal-sign': get_sign,
'sec-ch-ua': '"Not/A)Brand";v="8", "Chromium";v="126", "Google Chrome";v="126"',
'sec-ch-ua-mobile': '?0',
'sec-ch-ua-platform': '"Windows"',
}
response = requests.post('https://ggzyfw.fj.gov.cn/FwPortalApi/Trade/TradeInfo', cookies=cookies, headers=headers, json=json_data)
print(response.json())
data = response.json()['Data']
get_decrypted_data = js_code.call('data_decrypted',data)
pprint.pprint(get_decrypted_data)
const CryptoJS = require('crypto-js')
t = {
"ts": 1721183028929,
"pageNo": 3,
"pageSize": 20,
"total": 3556,
"KIND": "GCJS",
"GGTYPE": "1",
"timeType": "6",
"BeginTime": "2024-01-17 00:00:00",
"EndTime": "2024-07-17 23:59:59",
"createTime": []
}
var r = 'B3978D054A72A7002063637CCDF6B2E5';
function l(t, e) {
return t.toString().toUpperCase() > e.toString().toUpperCase() ? 1 : t.toString().toUpperCase() == e.toString().toUpperCase() ? 0 : -1
};
function u(t) {
for (var e = Object.keys(t).sort(l), n = "", a = 0; a < e.length; a++)
if (void 0 !== t[e[a]])
if (t[e[a]] && t[e[a]]instanceof Object || t[e[a]]instanceof Array) {
var i = JSON.stringify(t[e[a]]);
n += e[a] + i
} else
n += e[a] + t[e[a]];
return n
};
function get_sign(t) {
for (var e in t)
"" !== t[e] && void 0 !== t[e] || delete t[e];
var n = r + u(t);
return CryptoJS.MD5(n).toString().toLocaleLowerCase()
};
var key = 'EB444973714E4A40876CE66BE45D5930';
var i = 'B5A8904209931867';
function data_decrypted(t) {
var e = CryptoJS.enc.Utf8.parse(key)
, n = CryptoJS.enc.Utf8.parse(i)
, decrypted_data = CryptoJS.AES.decrypt(t, e, {
iv: n,
mode: CryptoJS.mode.CBC,
padding: CryptoJS.pad.Pkcs7
});
return JSON.parse(decrypted_data.toString(CryptoJS.enc.Utf8))
};