什么是“爬虫”呢?

如题所述

推荐答案 2022-03-29

爬虫指网络爬虫。

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。网络爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。

网络爬虫的产生背景

随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎（Search Engine），例如传统的通用搜索引擎AltaVista，Yahoo!和Google等，作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是，这些通用性搜索引擎也存在着一定的局限性。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/ettBWzvvXvBWtOzveB.html

其他回答

第1个回答 2022-12-16

网络爬虫(又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者)，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
/iknow-pic.cdn.bcebos.com/d788d43f8794a4c2851e1fb402f41bd5ad6e3974"target="_blank"title="点击查看大图"class="ikqb_img_alink">/iknow-pic.cdn.bcebos.com/d788d43f8794a4c2851e1fb402f41bd5ad6e3974?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="https://iknow-pic.cdn.bcebos.com/d788d43f8794a4c2851e1fb402f41bd5ad6e3974"/>
蚂蚁(ant)，自动检索工具(automaticindexer)，或者(在FOAF软件概念中)网络疾走(WEB
scutter)，是一种“自动化浏览网络”的程序，或者说是一种网络机器人。它们被广泛用于互联网搜索引擎或其他类似网站，以获取或更新这些网站的内容和检索方式。
它们可以自动采集所有其能够访问到的页面内容，以供搜索引擎做进一步处理(分检整理下载的页面)，而使得用户能更快的检索到他们需要的信息。
网络爬虫始于一张被称作种子的统一资源地址(URLs)列表。当网络爬虫访问这些统一资源定位器时，它们会甄别出页面上所有的超链接，并将它们写入一张"待访列表"，即所谓"爬行疆域"(crawl
frontier)。
此疆域上的统一资源地址将被按照一套策略循环访问。如果爬虫在他执行的过程中复制归档和保存网站上的信息，这些档案通常储存，使他们可以被查看。阅读和浏览他们的网站上实时更新的信息，并保存为网站的“快照”。大容量的体积意味着网络爬虫只能在给定时间内下载有限数量的网页，所以要优先考虑其下载。
高变化率意味着网页可能已经被更新或者删除。一些被服务器端软件生成的URLs(统一资源定位符)也使得网络爬虫很难避免检索到重复内容。

官方服务

官方网站官方网站

相似回答

Python爬虫是什么?答：网络爬虫为一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。将根据一定的搜索策略从队列中选择下一步要抓取的网页URL...

请问什么是网络爬虫啊?是干什么的呢?答：网络爬虫（又被称为爬虫，网络机器人，在FOAF社区中间，更经常的称为网页追逐者）是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。主要用于搜索引擎,它将一个网站的所有内容与链接进行阅读，并建立相关的全文索引到数据库中，然后跳到另一个网站。当人们在网络上(如google)搜索关键字时，其实...

请问什么是网络爬虫啊?是干什么的呢?答：网络爬虫是一种程序,主要用于搜索引擎,它将一个网站的所有内容与链接进行阅读,并建立相关的全文索引到数据库中,然后跳到另一个网站.样子好像一只大蜘蛛.当人们在网络上(如google)搜索关键字时,其实就是比对数据库中的内容,找出与用户相符合的.网络爬虫程序的质量决定了搜索引擎的能力,如google的搜索引擎...

python爬虫技术可以干什么答：网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。爬虫可以做什么？模拟浏览器打开网页，获取网页中我们想要的那部分数据。从技术层面来说就是...

请问什么是网络爬虫啊?是干什么的呢?视频时间 09:54

什么是爬虫软件呢答：一、简介 1、名称：又被称为网页蜘蛛，网络机器人。2、解释：是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。3、背景：随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。二、功能 1、对抓取目标的描述或定义。2、对网页或数据的分析与...

爬虫uva uvb是什么意思?答：简单地说，爬虫是一种程序，可以自动获取互联网上的信息。其中，UVA和UVB是两种不同的紫外线辐射类型。UVA是一种长波紫外线，其波长在315-400纳米之间，会使皮肤老化，导致皮肤皱纹和色素沉积。 UVB则是一种短波紫外线，其波长在280-315纳米之间，是导致晒伤和皮肤癌的主要原因之一。爬虫在获取UVB信息...

python为什么要叫爬虫不叫蟒蛇?答：答: 是这样的，Python并不是爬虫,它的英文单词本意呢就是蟒蛇，后来呢，有科学家研究了一种计算机语言，并把它命名为Python。所以有时候你仔细去看Python的图标，它就是一个盘着的蟒蛇。然后Python有一个很重要的用途就是爬虫。除了用于爬虫之外呢，它也可以用于数据分析，网站制作，桌面应用制作等等。...

家里墙面爬虫子怎么办答：那么，怎么办才能有效地消除家里的墙面爬虫子呢？第一步，保持家庭卫生。墙面爬虫子是喜欢在脏乱的环境中滋生和繁殖，所以保持家庭的清洁卫生是非常重要的。每天定期打扫家里，注意清理角落和墙角，特别是厨房和卫生间要特别注意。第二步，使用驱虫剂。如果发现家里的墙面爬虫子比较多，就可以使用驱虫剂...

大家正在搜

python为什么叫爬虫爬虫能做什么爬虫爬取数据小爬虫爬虫啥意思爬虫入门爬虫开发反爬虫爬虫技术