数据采集的渠道主要有哪些

如题所述

第1个回答  2023-05-18

1、网站日志文件:是做原始的数据获取方式,主要在服务端完成,在网站的应用服务器配置相应的写日志的功能就能实现。

优势:完整的服务端请求记录,包括爬虫等的请求;

缺陷:(1)、日志的获取和清洗过滤成本较高;(2)、无用日志对统计干扰造成数据不准确;(3)灵活性有限(页面端很多操作无法记录)。

2、Web Beacons:实现方式是在需要统计的网站页面或者模块上嵌入一个1*1像素的透明图片,用户完全察觉不到,当用户访问该网友的同时会请求透明图片,并完成页面访问的记录工作,就像是在纸上画一个不易察觉的小点来标记那张纸。它实现了日志记录服务器与网站应用服务器的分离。

优势:(1)、日志服务器与应用服务器分离;(2)、数据获取的可控性使日志处理成本降低。

缺陷:(1)、需要在页面植入小图片;(2)、获取信息比较有限;(3)、无法获取蜘蛛等不请求图片的访问记录。

3、JS页面标记:是Web Beacons的改进,是在页面端嵌入JS标记代码,当用户访问网页时同时执行JS代码,JS代码会将一些统计需要的信息以URL参数的形式附带在图片请求地址的后面,然后再向服务器请求图片,这样日志服务器就可以获取比较完整的访问数据啦。

优势:(1)、数据获取的可控性和灵活性较高;(2)、可以对页面端操作进行记录;(3)、获取的数据比较完整丰富。

缺陷:(1)、需要在页面植入JS标记代码;(2)、当用户禁用JS功能时无法获取数据;(3)、无法获取蜘蛛等不请求JS的访问记录。

logo设计

创造品牌价值

¥500元起

APP开发

量身定制,源码交付

¥2000元起

商标注册

一个好品牌从商标开始

¥1480元起

公司注册

注册公司全程代办

¥0元起

    官方电话官方服务
      官方网站八戒财税知识产权八戒服务商企业需求数字市场
相似回答