互联网上的任何东西都可以爬取吗?

如题所述

推荐答案 2020-05-13

写爬虫的小伙伴要注意，爬虫一时爽，但不是一直爬一直爽。
如果你的爬虫触犯了法律，可是要承担责任的哦，那么什么样的爬虫才算是安全的爬虫呢?
现在我来结合一下实际情况，给几点建议吧：
1、爬虫访问频次要控制，别把对方服务器搞崩溃了
虽然你爬取的信息都是公开的，也不涉及公民隐私，爬取的数据也不用于违法获利，只是自己弄着玩，但是如果你的爬虫太疯狂了，一分钟请求1万次，导致对方服务器应接不暇，不能处理正常业务了，对不起，你这种属于违法行为，这种爬虫等同于进行黑客攻击了，你让人家不能正常工作了，损害了对方的利益
2、涉及到个人隐私的信息你不能爬
其实这很好理解，你希望你自己的电话号，身份证号，家庭住址，工作单位，行踪轨迹这些隐私信息被别人用爬虫抓取么?当然不希望，别人抓了你的这些信息，你肯定想去报警对不对，让警察去抓那个坏蛋，ok，你不要去做那个坏蛋。
3、突破网站的反爬措施，后果很严重
正规的网站都会在根目录下放置
robots.txt，这里就规定了哪些能爬，哪些不能爬，谁可以爬。对于那种反爬特别严重的，例如淘宝，你最好别去爬，如果你真的利用你的高智商突破了淘宝的反爬措施，那么恭喜你，你已经违法了。
4、不要用爬取的数据做不正当竞争
比如你把大众点评的评论数据都爬下来了，然后自己搞了一个xx点评，这肯定不行，人家辛辛苦苦的积累的数据，你轻轻松松的弄下来，直接拿来主义，跟人家搞竞争，你不违法谁违法。
5、付费内容，你不要抓
既然是付费内容，说明这东西价值很高，付费才能看，你弄下来了，你想干啥?你私自传播，就对网站造成了潜在损失。
6、最后一条，突破网站反爬措施的代码，最好不要上传到网上
你技术很牛逼，能突破网站的反爬措施，你把这些代码发布到网上，比如github，你自己没做啥坏事，可是想做坏事的人利用了你的代码，入侵了网站，那么，这种情况下，你也是有责任的，这个听起来有点冤，但确实存在这样的风险，所以，最好还是不要这么干。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WXzjee7WvjWvBXW7WtX.html

其他回答

第1个回答 2020-05-13

不可能的，互联网时代最核心的就是数据的安全性，一般大公司都会有自己的核心数据的，这些数据是不可能让其他公司来爬取的。

相似回答

...功能?用户可以通过它任意下载互联网上任何东西吗?还是仅能下载它提供...答：1、云端集成了大量丰富的软件资源，将其分门别类，查找也很容易。 2、云端中软件的安装和卸载也很简单，下载后即可完成安装过程，右键即可简单的删除卸载。 3、关闭云端程序，云端中软件一切遗留文件信息均会消失。“云端”的优点 1、软件虚拟化，使用时动态安装软件，不使用时软件在系统中瞬间“...

使用Wifi无线上网安全吗?交易时会给盗窃吗?答：通过未加保护的无线局域网，新手也可以轻易地接进宽带网络联接中。一旦Wi-Fi用户发现了网络，用户就可以点击，然后进入这个网络。一些宽带用户甚至喜欢开放自己的网络，然而，分享的可能不仅仅是互联网接入。 Gartner分析师Richard Hunter说：“那些盗取别人带宽的人绝不只是单纯地为了带宽，他们还会同时盗取数据。

在这个大数据互联网时代,我们还有隐私可言吗?答：现在的手机都有定位功能，只要你没有关闭，你去过的地方，系统里面都会有记录，而且系统能分析出你家的住所，哪里是单位。就拿我们平时都爱看的抖音来说，刷抖音刷久了，抖音后台数据就会根据数据分析我们的爱好，把类似的视频都推送给我们；还有我们买东西的拼多多，拼小圈好友可以看到我们购买在拼多多...

网络警察可以看到我电脑里的东西吗?答：你电脑上的东西他们是看不到的（除非他们黑了你的电脑），而你上网浏览的东西则可以，因为没有加密，如果是加密了的那就没办法了（例如浏览gamil邮箱）你下载的电影，如果还在下载，他们可以追踪到连接，或者直接劫取内容。安装还原卡，重启后你的上网记录并不会消失，也可以恢复。只有当存有上网记录的...

任何学习资源都可以从互联网上获得,我们为什么还要去学校?答：在互联网的时代，几乎任何学习资源都可以从手掌上获得，那么我们为什么还要去学校和各种培训机构呢？1.专业化(也有一些玩套路的)，可以说是借力，自己把外界的东西进行转化输出变成自己的，需要一个过程和辅助的；在这个鱼龙混杂的信息时代不是所有人(大部分也难)做到善于提取有用/可以用的信息 2，(1)...

互联网的简称和全称答：1 互联网简介互联网简称internet,全称internetwork。始于1969年(己酉年)的美国,又称因特网,是全球性的网络,是一种公用信息的载体,这种大众传媒比以往的任何一种通讯媒体都要快。这种将计算机网络互相联接在一起的方法可称作“网络互联”,在这基础上发展出覆盖全世界的全球性互联网络称“互联网”,即是“互相连...

计算机网络未来的发展前景答：1.网络无处不在，任何东西都要连入互联网，那时估计也没有太多的网络终端，只需要几种集成的网络终端即可，将各种功能集成到同一台网络终端上面，我们可以随时随地的无缝的接入互联网。2.带宽成本大大降低，上网将会是非常非常便宜的。但是网速就快的是我们无法想象的。3.安全问题一直是网络的非常值得...

...等等都连上互联网,随便找个能上网的终端就可以检测、控制。_百度...答：是你说的这么回事，实际应用会更广泛一些，智能家居应用是其中一种。物联网现在还是个比较新的概念，实际应用还很少，后面发展空间很大。

网络的好处和坏处视频时间 00:23

大家正在搜

互联网是什么东西怎么爬取网站上的数据爬取网站上的数据怎么爬取网站上的图片怎么爬取网站上的视频互联网的普及网络和互联网互联网的应用有哪些互联网属于什么网