爬虫问题:求各位帮忙看看这个网址怎么爬取

爬虫问题:求各位帮忙看看这个网址怎么爬取

问题描述:

我想通过搜索值,获取下一级页面的网址,但是这个网址经过重定向处理,里面的docId是加工过的,不用selenium+浏览器的方法,我该如何获取这个docId值?

网址:https://patentscope2.wipo.int/search/en/search.jsf

我输入的docId是 US20180094236

图片说明

跳转页面后docId变成了 US214329541

图片说明

图片说!明
图片说明
图片说明

我这儿测试随机就行。不知道是不是可靠。。