爬虫识别

搜狗蜘蛛更改 PTR 记录 了解详情

Awario crawler

爬虫识别 - 资源 > 营销 > Awario crawler
Awario crawlerAwario crawler 概况

Link-Assistant.Com

Awario crawler

Awario crawler status 活动

Awario crawler 说明

AwarioSmartBot和AwarioRssBot是通过发送合法的网络爬虫Awario发现和收集新的和更新的网络数据。

AwarioSmartBot/1.0
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
遵守
IP 地址总数
3
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 138.201.19.21 srv10.awar.io DE DE flag
2 136.243.70.68 rtc-fetcher1.awar.io DE DE flag
3 138.201.252.169 datanode9.webmeup.com DE DE flag
AwarioRssBot/1.0
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
遵守
IP 地址总数
4
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 195.201.58.104 srv11.awar.io DE DE flag
2 88.99.136.237 rss-crawler2.awar.io DE DE flag
3 88.99.62.159 rss-crawler1.awar.io DE DE flag
4 88.99.2.203 rss-crawler3.awar.io DE DE flag
AwarioBot/1.0
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
遵守
说明:

AwarioBot/1.0 收集互联网公开数据,为互联网营销人员提供服务。

为什么要抓取我的网站?

AwarioSmartBot 和 AwarioRssBot 收集Awario 应用程序 进一步使用的 Web 数据,让互联网营销人员找到谁在网上提及他们的品牌。

如果 AwarioSmartBot/AwarioRssBot 爬虫访问过您的页面,这意味着它的内容从未被收集和分析过,也不需要刷新。因此,您不会看到 AwarioSmartBot/AwarioRssBot 爬虫对同一页面的重复请求。

使用robots.txt进行拦截

AwarioSmartBot 和 AwarioRssBot 是:

  • 仅收集任何随机访问者都可以访问的公开信息。如果您认为爬虫收集了一些敏感信息,请将其从公共访问中删除。
  • 不能使您的网站超载并对其造成任何伤害——Awario 机器人被设计得非常有礼貌,它们最多每 3 秒只能进行 1 次点击。此外,您可以根据 robots.txt 文件中的说明轻松减慢机器人速度。

然而,即使 Awario 机器人是无害的,您仍然可能希望防止机器人抓取您的网站。最简单快捷的方法是使用“robots.txt”。此文本文件包含有关机器人应如何处理您的站点数据的说明。

使用 robots.txt 文件,您可以阻止 Awario 爬虫进入您的站点或减慢它们的速度,如以下示例所示:

阻止您网站的特定部分:

User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /private/

阻止整个网站被访问:

User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /

放慢抓取速度:

User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Crawl-delay: 10
IP 地址总数
5
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 94.130.207.87 pot19.webmeup.com DE DE flag
2 94.130.237.168 pot61.webmeup.com DE DE flag
3 94.130.219.237 pot5.webmeup.com DE DE flag
4 46.4.107.145 pot35.webmeup.com DE DE flag
5 116.202.246.181 node01.belprime.net DE DE flag
返回顶部