爬虫识别

是否应该让 GPTBot/1.2 抓取网站 了解详情

umich.edu crawler

爬虫识别 - 资源 > 未分类 > umich.edu crawler
umich.edu crawlerumich.edu crawler 概况

密歇根大学

umich.edu crawler status 活动

umich.edu crawler 说明

该爬虫明确标注来自 密歇根大学(University of Michigan)。

LinuxGetUrl/2.0
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
不明
说明:

根据其命名 ClosedAI Engine(可能是在致敬或调侃 OpenAI),这通常是一个学术性质的 AI 模型训练数据采集项目,或者是针对互联网内容分布、反爬机制绕过等领域的网络科学研究。

IP 地址总数
2
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 34.31.50.55 55.50.31.34.bc.googleusercontent.com US US flag
2 34.30.242.36 36.242.30.34.bc.googleusercontent.com US US flag
twoogle498
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
不明
说明:

该爬虫通常用于 Censys 项目或相关的网络测量研究(Web Measurement)。Censys 是全球知名的互联网资产扫描平台,最初由 UMich 的研究团队开发,旨在对全球 IPv4 地址空间进行协议分析和安全审计。

IP 地址总数
1
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 68.179.129.53 d179-68-53-129.evv.wideopenwest.com US US flag
Avengineers-Crawler/1.0
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
不明
说明:

Avengineers 这一名称通常与 Autonomous Vehicle Engineers(自动驾驶工程师) 缩写相关。密歇根大学拥有全美顶尖的自动驾驶研究机构(如 Mcity 和 UMTRI),该爬虫很可能服务于自动驾驶、智能交通系统或车联网相关的学术研究。

IP 地址总数
1
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 34.28.2.219 219.2.28.34.bc.googleusercontent.com US US flag
CELTurbo-eecs498/1.1
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
不明
说明:

CELTurbo-eecs498/1.1 是密歇根大学(UMich)专门用于计算机科学教育与课程项目的爬虫变体。

IP 地址总数
1
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 18.223.164.95 ec2-18-223-164-95.us-east-2.compute.amazonaws.com US US flag
返回顶部