java——获取网页源代码 - 代码天地

java——获取网页源代码

其他 2018-09-23 07:46:41 阅读次数: 0


import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;



//数据抓取核心类
public class Copy {

    // 获取网页数据
    /*
     * @param url:目标网址
     * 
     * @param encoding：编码
     */
    public static String getHtmlResourceByUrl(String url, String encoding) {


        StringBuffer buffer=new StringBuffer();
        InputStreamReader isr=null;

        try {
            // 建立网络连接
            URL urlObj = new URL(url);
            // 打开网络连接
            URLConnection uc = urlObj.openConnection();
            /*
             * io 流
             * 从服务器下载源码到本地
             * */
            isr =new InputStreamReader(uc.getInputStream(),encoding);//建立文件的输入流
            BufferedReader reader =new BufferedReader(isr);//缓冲

            String line=null;
            while ((line=reader.readLine())!=null) {

                buffer.append(line+"\n");

            }


        } catch (Exception e) {
            e.printStackTrace();
        }
        finally{

                try{
                if(null!=isr)isr.close();}
                catch(IOException e){
                    e.printStackTrace();
                }
        }
        return buffer.toString();

    }

    // 主函数
    public static void main(String[] args) {

        String htmlString=getHtmlResourceByUrl("http://www.qq.com", "gbk");
        System.out.println(htmlString);

    }

}

猜你喜欢

转载自blog.csdn.net/qq_41251963/article/details/82215721

java——获取网页源代码

NodeJS 获取网页源代码

python获取网页源代码

CefGlue获取网页源代码

JAVA 获取网页源代码保存到本地文件

java——获取网页源代码存储到本地

利用requests获取网页的源代码

七、教程篇-《获取网页源代码》

（2）获取网页源代码——Python

python爬虫获取网页源代码

获取下载网页源代码

.net语言获取网页的源代码

java+selenium+new——获取网页源代码driver.getPageSource()

java/js获取网页代码

获取网页源代码案例碰到重定向302的问题

手写网络爬虫获取网页源代码

PHP获取网页的 Html源代码输出并执行

python 动态指定header获取网页源代码的函数

android webview获取网页源代码，js执行前后

导医网网页源代码

查看网页源代码的方法

c#利用WebClient和WebRequest获取网页源代码的比较

获取(导出)Spring的源代码

Jenkins获取Gitlab源代码

java查看源代码

java源代码

Java学习源代码

个人简历网页版源代码

网页轮播图多特效源代码

模拟登录界面网页源代码

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)