搜索引擎与爬虫

UserAgent 解析

UserAgent 解析

我们在软件开发过程中,需要解析一些 UserAgent 的信息,根据不同的 UserAgent 做对应的处理。

常见的 UserAgent 解析方式有如下两种:

库解析 UserAgent

不同的语言有不同的解析 UserAgent 库,例如在 Python 中有 user-agentsua-parsePython User Agent ParserPython User Agents……

上面这些库经过测试,功能都大同小异,都能够满足基本要求,但是解析结果还是有一些问题,有的时候设备版本识别有问题,有的时候浏览器识别有问题。

在线 UserAgent 解析

我们也可以通过在线 UserAgent 解析,可以很轻松的帮我们解析 UserAgent,在线 UserAgent 解析的用法可以参考这篇文章:useragent在线查找,这篇文章写的很详细,在此不再过多赘述。

优劣比较

库解析 UserAgent 虽然有一些问题,但是如果是需要大批量的解析,或者是集成到发布软件还是一个很不错的选择。

在线 UsreAgent 解析工具,虽然解析的信息比较全:可以解析浏览器名称、浏览器版本、操作系统名称、操作系统版本、是否是爬虫、爬虫名称、爬虫分类等,到目前为止还没有提供 API,所以大批量解析可能存在问题,但是如果查询 UserAgent 的信息不多,还是一个不错的选择。

总结

介绍了两种方式解析 UserAgent:库解析 UserAgent 与在线 UserAgent 解析,同时对于这两种方式存在的优劣经行了一个比较,具体情况我们可以采用不同的方式解析 UserAgent。

通过以上介绍,你是不是觉得 UserAgent 解析很简单?