+-

我正在尝试自动从科学直接下载文章
例如:
例如:
url = 'http://www.sciencedirect.com/science/article/pii/S1053811913010240'
我可以使用浏览器毫无问题地访问文章,但是我尝试使用Python的请求,urllib2和机械化模块没有成功.由于我需要下载许多文章,因此不能手动进行.
Wget也不起作用.
例如.
wget http://www.sciencedirect.com/science/article/pii/S1053811913010240
返回:
HTTP request sent, awaiting response... 404 Not Found
任何想法可能是什么问题?
最佳答案
它们可能无法正常工作,因为Web服务器不喜欢用户代理.也许它正在尝试阻止批量下载.
如果您使用wget指定一个用户代理,它将起作用.用你的例子.
wget -U "Mozilla/5.0" "https://www.sciencedirect.com/science/article/pii/S1053811913010240"
点击查看更多相关文章
转载注明原文:python-从sciencedirect自动下载 - 乐贴网