+-
python-从sciencedirect自动下载
我正在尝试自动从科学直接下载文章
例如:

url = 'http://www.sciencedirect.com/science/article/pii/S1053811913010240'

我可以使用浏览器毫无问题地访问文章,但是我尝试使用Python的请求,urllib2和机械化模块没有成功.由于我需要下载许多文章,因此不能手动进行.

Wget也不起作用.

例如.

wget http://www.sciencedirect.com/science/article/pii/S1053811913010240

返回:

HTTP request sent, awaiting response... 404 Not Found

任何想法可能是什么问题?

最佳答案
它们可能无法正常工作,因为Web服务器不喜欢用户代理.也许它正在尝试阻止批量下载.

如果您使用wget指定一个用户代理,它将起作用.用你的例子.

wget -U "Mozilla/5.0" "https://www.sciencedirect.com/science/article/pii/S1053811913010240"
点击查看更多相关文章

转载注明原文:python-从sciencedirect自动下载 - 乐贴网