我第一个java爬虫 - 代码天地

我第一个java爬虫

其他 2019-02-20 22:01:10 阅读次数: 0

先定一个网页字符串的匹配规则

 String regex = "https://[\\w+\\.?/?]+\\.[A-Za-z]+";

URLConnection创建一个connection

通过将connection作为一个输入流

通过一个匹配器，如果URL满足匹配规则，就输出控制台

package com.cellstrain.icell.util;

import java.io.*;
import java.net.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * java爬虫
 */
public class Robot {
    public static void main(String[] args) {
        URL url = null;
        URLConnection urlconn = null;
        BufferedReader br = null;
        PrintWriter pw = null;

        String regex = "https://[\\w+\\.?/?]+\\.[A-Za-z]+";//url匹配规则
        Pattern p = Pattern.compile(regex);
        try {
            url = new URL("https://www.rndsystems.com/cn");
            urlconn = url.openConnection();
            br = new BufferedReader(new InputStreamReader(
                    urlconn.getInputStream()));
            String buf = null;
            while ((buf = br.readLine()) != null) {
                Matcher buf_m = p.matcher(buf);
                while (buf_m.find()) {
                    System.out.println(buf_m.group());
                }
            }

        } catch (MalformedURLException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                br.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

猜你喜欢

转载自blog.csdn.net/TangXiaoPang/article/details/87739202

我第一个java爬虫

我的第一个爬虫

我的第一个JAVA

我的第一个python爬虫

我的第一个用python写的爬虫

学习笔记--我的第一个爬虫项目

我的第一个成功的爬虫程序

我的第一个Python爬虫——谈心得

我的第一个豆瓣短评爬虫

我的第一个完整的小说爬虫

Python--我的第一个爬虫

我的第一个爬虫和测试

Scrapy - 第一个爬虫和我的博客

【系列教程一】谁说 java 不能做爬虫？我第一个不服！

我用Java写的第一个爬虫Demo-爬图片

爬虫苦训第一天，我的第一个爬虫！！！

我我，，我的第一个爬虫程序，竟然这么有趣！！

我的第一个java 文件

Java Web初探，我的第一个Servlet

我的第一个java web表白情书

我的第一个Java程序-Hello World!

我的第一个Java程序

我的第一个JAVA程序 hello world

我的第一个正式的Java后端程序

[Java]我的世界第一个插件

我的Java第一个程序

我的第一个Java程序-HelloWorld

这是我的第一个Java代码

我的第一个flink_java程序

实现我的第一个Java程序

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)