Awario crawler 详细信息

所属公司

Link-Assistant.Com

官方文档

Awario crawler

爬虫状态

活动

AwarioSmartBot和AwarioRssBot是通过发送合法的网络爬虫Awario发现和收集新的和更新的网络数据。

User-Agent

AwarioSmartBot/1.0 (+https://awario.com/bots.html; bots@awario.com)

爬虫类别

营销

首次出现时间

2021-09-03 14:18:31

最后一次出现时间

2025-05-18 10:51:46

是否遵守 robots.txt 协议

遵守

IP 地址总数

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	2a01:4f8:221:15a3::2		DE
2	138.201.19.21	srv10.awar.io	DE
3	136.243.70.68	rtc-fetcher1.awar.io	DE
4	138.201.252.169	datanode9.webmeup.com	DE

User-Agent

AwarioRssBot/1.0 (+https://awario.com/bots.html; bots@awario.com)

爬虫类别

营销

首次出现时间

2022-12-25 08:13:18

最后一次出现时间

2023-01-10 00:29:11

是否遵守 robots.txt 协议

遵守

IP 地址总数

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	195.201.58.104	srv11.awar.io	DE
2	88.99.136.237	rss-crawler2.awar.io	DE
3	88.99.62.159	rss-crawler1.awar.io	DE
4	88.99.2.203	rss-crawler3.awar.io	DE

User-Agent

Mozilla/5.0 (compatible; AwarioBot/1.0; +https://awario.com/bots.html)

爬虫类别

营销

首次出现时间

2023-03-16 16:00:00

最后一次出现时间

2025-04-03 22:57:09

是否遵守 robots.txt 协议

遵守

说明：

AwarioBot/1.0 收集互联网公开数据，为互联网营销人员提供服务。

为什么要抓取我的网站？

AwarioSmartBot 和 AwarioRssBot 收集Awario 应用程序进一步使用的 Web 数据，让互联网营销人员找到谁在网上提及他们的品牌。

如果 AwarioSmartBot/AwarioRssBot 爬虫访问过您的页面，这意味着它的内容从未被收集和分析过，也不需要刷新。因此，您不会看到 AwarioSmartBot/AwarioRssBot 爬虫对同一页面的重复请求。

使用robots.txt进行拦截

AwarioSmartBot 和 AwarioRssBot 是：

仅收集任何随机访问者都可以访问的公开信息。如果您认为爬虫收集了一些敏感信息，请将其从公共访问中删除。
不能使您的网站超载并对其造成任何伤害——Awario 机器人被设计得非常有礼貌，它们最多每 3 秒只能进行 1 次点击。此外，您可以根据 robots.txt 文件中的说明轻松减慢机器人速度。

然而，即使 Awario 机器人是无害的，您仍然可能希望防止机器人抓取您的网站。最简单快捷的方法是使用“robots.txt”。此文本文件包含有关机器人应如何处理您的站点数据的说明。

使用 robots.txt 文件，您可以阻止 Awario 爬虫进入您的站点或减慢它们的速度，如以下示例所示：

阻止您网站的特定部分：

User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /private/

阻止整个网站被访问：

User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /

放慢抓取速度：

User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Crawl-delay: 10

IP 地址总数

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	65.21.113.200	pot19.webmeup.com	FI
2	65.21.113.199	pot20.webmeup.com	FI
3	94.130.207.87	pot19.webmeup.com	DE
4	94.130.237.168	pot61.webmeup.com	DE
5	94.130.219.237	pot5.webmeup.com	DE
6	46.4.107.145	pot35.webmeup.com	DE
7	116.202.246.181	node01.belprime.net	DE