python-从sciencedirect自动下载

我正在尝试自动从科学直接下载文章
例如：

url = 'http://www.sciencedirect.com/science/article/pii/S1053811913010240'

我可以使用浏览器毫无问题地访问文章,但是我尝试使用Python的请求,urllib2和机械化模块没有成功.由于我需要下载许多文章,因此不能手动进行.

Wget也不起作用.

例如.

wget http://www.sciencedirect.com/science/article/pii/S1053811913010240

HTTP request sent, awaiting response... 404 Not Found

任何想法可能是什么问题？

最佳答案

它们可能无法正常工作,因为Web服务器不喜欢用户代理.也许它正在尝试阻止批量下载.

如果您使用wget指定一个用户代理,它将起作用.用你的例子.

wget -U "Mozilla/5.0" "https://www.sciencedirect.com/science/article/pii/S1053811913010240"

点击查看更多相关文章

转载注明原文：python-从sciencedirect自动下载 - 乐贴网

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

python – 安装pgdb：pg_config工具不可用

Python 6年前 33

Python 6年前 61

Python 4年前 31

Python 6年前 1684

Python 4年前 34

Python 6年前 36

Python 6年前 34

Python 6年前 559

Python 6年前 68

Python 6年前 20

Python 5年前 49

Python 6年前 5880