Page 1 of 1

了解 Google Analytics Bot 和 Spider 过滤

Posted: Wed Dec 04, 2024 9:19 am
by suiiiii777
问我们网站的机器人。

应避免使用哪种类型的机器人,以及最好允许使用哪种类型的机器人?下面深入探讨如何识别和控制网站和流量分析中的机器人流量。

您的 Google Analytics 数据中的机器人流量到底是什么?
机器人、蜘蛛和其他软件应用程序在互联网上运行自动任务。它们的数量比你想象的要多得多。事实上,根据统计,超过 40% 的互联网活动都涉及机器人。

这是一个相当大的数字,互联网上几乎一半的领域都充斥着机器人。当然,有些机器人是有益的,比如 Reddit 和 Google 上的机器人,但有太多机器人试图窃取你的敏感信息。

无论好坏,机器人都不是人类,因此在 Google Analytics 上识别机器人流量非常重要。

识别你的机器人流量
确定机器人流量的来源和范围可能很棘手,因为不必要的关注和不寻常的点击的名称和来源点在不断变化。以下是如何在 Google Analytics 中排除机器人流量:

转到管理部分内的查看设置,然后单击 拉脱维亚 电话号码 资源 选项“排除所有已知机器人和蜘蛛的点击”。许多营销人员担心此选项会改变他们收集的数据,但事实并非如此,所以不必担心。
或者,您可以尝试创建一个过滤器来排除您已经识别的流量,方法是创建一个新视图,在该视图中您将取消选中您的机器人设置并添加一个使用 HostName、SourceName 等排除流量的新过滤器。在开始使用过滤器之前,请先测试它以查看它是否正常工作,之后,您可以使用主视图。
考虑使用引荐排除列表。它位于跟踪信息<属性列<管理部分下。通过这样做,您可以从 Google Analytics 中的数据中排除所有域。然后,如果您发现任何可疑域,您可以将其从未来的列表中永久删除。
什么是好机器人和坏机器人?
如何区分好机器人和坏机器人机器人流量是指任何不来自真人的流量。好的机器人负责自动执行任务。一些例子包括语音助手,如 Alexa、Cortana 和 Siri。最常见的好机器人类型是:

网站健康检查机器人
商业爬虫
来自搜索引擎的机器人(Google、Bing)
将网站转换为移动内容的机器人
所有这些类型的机器人在保持网站有效运行方面都发挥着至关重要的作用。阻止良性机器人进入您的网站可能会对您的流量产生不利影响,因此请谨慎行事。

Image

然后是坏机器人。这些机器人负责发送垃圾邮件和窃取敏感信息。大多数人启动机器人来从网站上抓取和爬取数据,然后将内容上传到他们的网站。以下是一些最常见的坏机器人类型:

网络抓取工具(用于道德抓取目的的除外)
垃圾邮件机器人
黑客机器人
试图冒充某人的机器人
按主机名过滤
您可以使用特定主机名在 Google Analytics 中创建视图过滤器。为此,您需要在媒介源报告上为您的主机名添加第二个维度,以确保它是机器人流量,然后为您的主机名创建包含过滤器。

有时,您的网站可能不是受到实际垃圾邮件的攻击,而是受到随机跟踪代码(也称为“幽灵垃圾邮件”)的攻击。 按主机名进行过滤是一种无需人工干预即可一次性清除大量垃圾邮件流量的绝佳方法。

一体化网站分析工具