[Java爬虫HttpClient_Demo1] - 代码天地

[Java爬虫HttpClient_Demo1]

其他 2020-02-15 10:37:25 阅读次数: 0

项目托管平台: 码云地址：

https://gitee.com/HDMBS/JavaSpiderDemo.git

本程序依赖Maven_Jar！！！
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
<version>4.5.3</version>
</dependency>

<dependency>
<groupId>net.sourceforge.htmlcleaner</groupId>
<artifactId>htmlcleaner</artifactId>
<version>2.9</version>
</dependency>

public static void main(String[] args) {
//可以根据访问网站的地区来确定是否try catch ;国内基本用不到try catch ,国外因为延迟等各种原因需要try catch;

// 访问网址
final String URL = "https://www.tuicool.com/";

// 创建可关闭的HttpClient实例对象(新版本才可以)相当于创建了一个模拟浏览器
CloseableHttpClient httpclient = HttpClients.createDefault()

// 一般爬虫请求都用Get，Get请求在HTTP请求协议里代表安全的查看:这个请求对象里可以添加http的请求头等
HttpGet httpGet = new HttpGet(URL)

try {
// 用浏览器模拟对象httpClient，发送一个Get请求:可以通过这个响应对象获得很多http的响应信息
respond = httpclient.execute(httpGet);

} catch (ClientProtocolException e) {
System.out.println("1HTTP协议异常!!!!!!!!!!!!!!!!!!!!!!!!!!");
e.printStackTrace();
} catch (IOException e) {
System.out.println("2IO异常!!!!!!!!!!!!!!!!!!!!!!!!!!");
e.printStackTrace();
}

// 获取返回的网页实体
HttpEntity entity = respond.getEntity();
try {
// 获取网页实体对象转换为字符串，并指定最终编码
entitys = EntityUtils.toString(entity, "utf-8");
} catch (ParseException e1) {// 解析异常
e1.printStackTrace();
} catch (IOException e1) {// io异常
e1.printStackTrace();
}
System.out.println(entitys);

try {
// 关闭流资源
httpclient.close();
} catch (IOException e) {
e.printStackTrace();
}

try {
// 关闭流资源
respond.close();
} catch (IOException e) {
e.printStackTrace();
}

萧子山

发布了29 篇原创文章 · 获赞 9 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37977176/article/details/78708305

[Java爬虫HttpClient_Demo1]

java爬虫之基于httpclient的简单Demo(二)

JAVA——基于HttpComponents(HttpClient)的简单网络爬虫DEMO

Java网络爬虫 HttpClient

Java爬虫①HttpClient

Java HttpClient爬虫请求

Java爬虫-01快速入门 HttpClient+JSoup详解 (附各种Demo）

[Java爬虫HttpClient_Demo3更换高匿IP并设置超时断连]

[Java爬虫HttpClient_Demo2模拟浏览器并抓取Web图片]

Java爬虫之 HttpClient 的使用

Java爬虫入门--HttpClient简介

【Java爬虫】HttpClient快速入门

java爬虫-HttpClient小练习

【Java爬虫】HttpClient样例

Java爬虫HTTPClient -- POST简单爬虫测试

Java爬虫HTTPClient -- GET简单爬虫测试

java爬虫Demo1 爬取图片到本地

[Java爬虫_页面Jsoup解析Demo1]

java爬虫demo

HttpClient的Demo

java爬虫httpclient循环重定向的处理

Java爬虫入门(二)——HttpClient请求

JAVA网络爬虫（三）：HttpClient获取HTML

网络爬虫之java HttpClient-Post

网络爬虫之java HttpClient-Get

Java爬虫HttpClient -- 配置请求参数

Java爬虫HTTPClient -- 连接池

httpclient下载网页源码---java基础爬虫

Java网络爬虫技术《一》 HttpClient

Java代码 httpClient请求响应爬虫

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)