解决Python下载法兰克福证券交易所文件失败问题
许多开发者在使用Python下载网络文件时,可能会遇到从blob URL下载文件失败的情况。本文以法兰克福证券交易所的Excel文件下载为例,详细说明如何解决此问题。
问题描述: 直接使用urllib或wget库从法兰克福证券交易所下载文件(例如,“主数据”文件),下载的文件大小异常小且内容无法读取。这是因为原始URL指向一个blob URL,它并非指向实际文件,而是浏览器中的一个数据块。
解决方案: 问题根源在于服务器在未识别用户代理的情况下拒绝了访问请求。解决方法是模拟浏览器请求,伪造一个用户代理。
立即学习“Python免费学习笔记(深入)”;
以下提供Python 3和Python 2的解决方案代码:
Python 3 代码:
import urllib.request as requesturl = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx'# 模拟Safari浏览器用户代理headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}req = request.Request(url, headers=headers)with request.urlopen(req) as response: file_content = response.read() # 将文件内容写入本地文件 with open('downloaded_file.xlsx', 'wb') as f: f.write(file_content)print("文件下载成功!")
登录后复制
本文来自互联网或AI生成,不代表软件指南立场。本站不负任何法律责任。
如若转载请注明出处:http://www.down96.com/tutorials/368.html