如上图,此处的XPath可以自定义修改,以下教大家如何修改

本工具批量查询神马,通过直接搜索 <域名> 获取首页的html源码(不翻页)并进行判断,通过自定义的XPath获取指定位置的代码的a标签,程序会自动获取此a标签的href值,检测是否为 包含当前查询的域名 即为神马已收录域名。

多说一句,神马不支持 site:<域名> 搜索,故变通了一下只搜索域名,获取第一页相应位置是否有此域名,无论是中文还是域名均可检测出来。

以下使用 baidu.com 做演示

请查看以上图片!

说明:当前神马需要自定义的XPath有三项需要设置,左上即第一项最为重要,用于判断是否收录,经过分析使用a标签的href值可以准确判断中文与域名两种显示内容。左下项用于指定二级选项使用,对域名显示百分百准确,中文显示则忽略。右侧项则用于违禁词判断使用,不适用违禁词可不修改。当然,指定二级选项不使用也可不修改。

除了百度,其他家很少更新html页面源码结构,自定义XPath功能一般很少修改,若失效可以反馈给我修改最为合适,欢迎失效了群内反馈哦。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。