图的几类问题分析及搜索引擎的两种基本抓取策略

其他 2021-01-30 19:25:44 阅读次数: 0

人工智能–搜索问题

有3个传教士和3个野人来到河边准备渡河，河岸有一条船，每次最多可坐2个人。问传教士为安全起见，应如何规划摆渡方案，使得在任何时刻，在河两岸以及船上传教士人数不能少于野人人数？
在每一次渡河后，都会有几种渡河方案供选择，究竟哪种方案最有利？这就是搜索问题。

分析：

适用情况：难以获得求解所需的全部信息；更没有现成的算法可供求解使用。
概念：依靠经验，利用已有知识，根据问题的实际情况，不断寻找可利用知识，从而构造一条代价最小的推理路线，使问题得以解决的过程称为搜索

对这类问题，一般我们都转换为状态空间的搜索问题。
如传教士和野人问题，可用在河左岸的传教士人数、野人人数和船的情况来表示。即，初始时状态为（3，3，1），结束状态为（0，0，0），而中间状态可表示为（2，2，0）、（3，2，1）等等。

这类问题的解，就是一个合法状态的序列，其中序列中第一个状态是问题的初始状态，而最后一个状态则是问题的结束状态。
在这里插入图片描述

数码难题

在一个3×3的方框内放有8个编号的小方块，紧邻空位的小方块可以移入到空位上，通过平移小方块可将某一布局变换为另一布局。请给出从初始状态到目标状态移动小方块的操作序列。

搜索引擎的两种基本抓取策略

在这里插入图片描述

深度优先

在这里插入图片描述

广度优先

在这里插入图片描述
两种策略结合=先广后深 +权重优先

先把这个页面所有的链接都抓取一次
再根据这些URL的权重来判定
URL的权重高，就采用深度优先，
URL权重低，就采用宽度优先或者不抓取

怎样避免重复访问？

解决思路：设置辅助数组 visited [n ]，用来标记每个被访问过的顶点。

初始状态为0
i 被访问，改 visited [i]为1，防止被多次访问

猜你喜欢

转载自blog.csdn.net/younow22/article/details/112058353

图的几类问题分析及搜索引擎的两种基本抓取策略

Nutch开源搜索引擎crawl的两种方式比较

Solr搜索引擎第三篇-两种部署模式详解

简单分析搜索引擎蜘蛛的爬取策略

搜索引擎索引的策略

搜索引擎对网页抓取

过滤搜索引擎的抓取数据

vue 搜索引擎抓取（SEO）

读书笔记博客实战之搜索引擎索引和流量涨跌策略分析[图]

搜索引擎CACHE策略研究

搜索引擎网页搜集策略

搜索引擎索引之索引更新策略

对搜索引擎的基本要求

ES搜索引擎基本操作

网站搜索引擎特点分析

垂直搜索引擎深度分析

Hive分析搜索引擎的数据

如何让搜索引擎抓取AJAX内容

行业垂直搜索引擎网页抓取项目

Robots 限制搜索引擎蜘蛛抓取哪些文件

禁止搜索引擎爬虫抓取网站方法小结

提交自己网站信息让搜索引擎抓取

搜索引擎蜘蛛抓取网页规则

搜索引擎（蜘蛛）抓取内容规则

搜索引擎

搜索引擎的基本原理（以及MetaSeeker搜索引擎）

搜索引擎-倒排索引的基本知识

搜索引擎蜘蛛的爬取过程以及策略

搜索引擎对库中网页的维护策略

搜索引擎爬取网站策略

今日推荐

周排行

TryParse的使用方法小结

Android之高仿手机QQ聊天

关于在java中关键字private能否用来修饰类的问题

去雾算法总结

前端面试题：事件防抖，函数节流，事件防抖和函数节流的区别

随堂小测

【OpenCV + Python】归一化函数cv2.normalize()的原理讲解

05: redis 主从复制

python3-基础5

持续更新-使用 Maven Module 搭建spring boot项目（整合Spring Security、Spring Social、spring OAuth）第一篇

每日归档

更多

2025-03-18(0)

2025-03-17(0)

2025-03-16(0)

2025-03-15(0)

2025-03-14(0)

2025-03-13(0)

2025-03-12(0)

2025-03-11(0)

2025-03-10(0)

2025-03-09(0)