c# 【电影搜索引擎】采集电影站源码

最近在做一个聚合搜索引擎,根据电影名,得到资源链接, 并且必须和自己的QQ电影资源机器人兼容, 根据电影名自动回复电影链接。 

资源网站:http://www.wxtv.net/api.php/provide/vod/?ac=list&wd=电影关键词, 可根据该站提供的API接口, 得到json数据。 

比如, https://www.wxtv.net/api.php/provide/vod/?ac=list&wd=鬼吹灯, 可以得到json格式, vod_id是电影ID, vod_name:电影名称,vod_time:更新时间。 

拿到json数据后, 可通过Jobject解析这个json, 拼接出该站的具体url。 

核心代码如下: 

 1             StringBuilder result = new StringBuilder();
 2             msg = ReplaceTitle(msg);
 3             msg = Regex.Replace(msg, "[ \\[ \\] \\^ \\-_*×――(^)(^)$%~!@#$…&%¥—+=<>《》!!???::•`·、。,;,.;\"‘’“”-]", "");
 4             string html = HttpClientGetHtmls("https://www.wxtv.net/api.php/provide/vod/?ac=list&wd=" + msg);
 5             JObject model = JObject.Parse(html); //解析json
 6             if (model != null)
 7                 foreach (var item in model["list"])
 8                 {
 9                     var id = item["vod_id"];
10                     var dyname = item["vod_name"];
11                     string url = "https://www.wxtv.net/voddetail/" + id + ".html?formQQ=" + formqq;
12                     var s = SinaShortUrl(url);
13                     result.Append(dyname + ":" + s + "\r\n");
14                 }
15             return result.ToString();

猜你喜欢

转载自www.cnblogs.com/jackrebel/p/12729050.html
今日推荐