在 3.x 版本之后,
当前版本为 3.5.2
在3之后的版本,此模块不再独立存在(即你安装的时候系统提示你此模块不存在),而是合并到了 中,叫做 . 和 .error。
整个模块分为.,.parse,.error。
例子:
其中 .() 变成 ..()
.() 变成 ..()
之间的区别
在中国,和不能互换。
总体来说,它是的增强,但是它具有的一些功能。
您可以通过在 中设置参数来修改标头。如果您访问网站并想更改用户代理(可以伪装您的浏览器),您应该使用 。
支持设置编码函数,在模拟登录的时候经常需要post编码后的参数,所以如果想在不使用第三方库的情况下完成模拟登录就需要使用它。
通常用于
官方文档地址
翻译的是3.5.2版本,对应
总体介绍
原文地址:
相应的翻译是 21.6. . — 对于 URL
- - - - - - URL处理模块
源代码:Lib//
是一个收集了多个模块来处理 URL 的包:
.打开并浏览URL中的内容
.error 包含发生的错误或异常。
.parse 解析 URL
.解析.txt文件
。
原文地址:
. — 一个用于打开 URL 的可扩展库
源代码:Lib//.py
. 定义了一些方法和类,帮助将 URL(主要是 HTTP)开放给复杂的世界 - 基本和摘要式身份验证、重定向等等。
————-. 该模块定义了以下功能:——————–
..()
..(url,数据=无,[,]*,=无,=无,=False,=无)
打开URL网址,这可以是字符串也可以是对象。
data 必须是一个字节对象,指定要发送到服务器的附加数据或 None。data 也可以是一个对象,在这种情况下,如果不需要这样的数据,则必须在开头指定内容长度。目前,HTTP 是唯一以这种方式请求数据的,当提供 data 参数时,HTTP 请求将执行 POST 请求而不是 GET 请求。
数据应为 x-www-form- 中标准应用程序格式的缓冲区。.() 函数接受映射或序列集合并返回该格式的 ASCII 文本字符串。在用作数据参数之前,应将其编码为字节。
该模块使用HTTP/1.1协议,并在HTTP请求头中包含:close。
可选的第二个超时参数用于阻止连接请求等操作(如果未指定,则将使用全局默认超时设置)。这实际上仅适用于 HTTP、HTTPS 和 FTP 连接。
如果指定,它必须是描述各种 SSL 选项的 ssl..txt 文件。单击以了解更多详细信息。
可选的和参数指定一组受 HTTPS 请求信任的 CA 证书。 应该指向包含一组 CA 证书的文件,而 应该指向散列证书文件的目录。有关更多信息,请参阅 ssl..s()。
该参数被忽略。
此函数始终返回一个充当(上下文)管理器的对象,并提供以下方法
对于 HTTP 和 HTTPS URL,此函数返回的 http.. 对象略有不同。除了上述三种新方法之外,此属性还包含与属性相同的信息 - 服务器返回的原因 - 而不是响应标头,正如文档中指定的那样。
FTP、文件和数据请求url以及明确的句柄和类,该函数返回一个..对象。
..() 将会引发协议错误。
请注意,可能会返回 None ,当没有处理程序处理请求时会发生这种情况(尽管已安装并使用全局默认值来确保这种情况不会发生)。
此外,如果检测到代理设置(例如,当设置了*环境变量时),默认安装可确保通过代理处理请求。
从 2.6 版及更早版本开始,遗留的.. 已停止使用;..() 对应于旧的.. 代理处理,它是通过字典参数完成的.. 可以使用对象。
3.2 版的变化:添加了和。
在 3.2 版更改: 如果可能的话,现在支持 HTTPS 虚拟主机(即,如果 ssl. 为真)。
3.2 版本中的新功能:数据可以是对象。
3.3 版的变化:已添加。
3.4.3 版本的变化:已添加。
..()
安装一个实例作为全局默认值。如果要使用此功能,则必须安装一个实例;否则,只需调用 .open() 而不是 .open()。这样,代码就不会检查是否为 true,并且任何具有适当接口的类都可以工作。
..([,…])
返回处理程序实例的顺序链。处理程序可以是 的实例,也可以是 的子类(在这种情况下,必须调用不带参数的构造函数)。除非处理程序包含以下类或其子类的实例,否则以下类的实例将位于处理程序之前:(如果检测到代理设置)、 、 、 ler、 、 、 、 。
如果安装了 SSL 支持(即如果可以导入 ssl 模块),它也将被添加。
子类还可以通过改变其属性来修改其在处理程序列表中的位置。
..(小路)
使用本地语法中的路径中的 URL 路径组件将路径名转换为路径。这不会生成完整的 URL。它返回引用的 quote() 函数的值。
..(小路)
将路径部分转换为本地路径语法。这不接受完整的 URL。此函数使用解码的 path() 方法。
..()
此函数返回调度程序到代理服务器 URL 映射。以不区分大小写的方式扫描所有操作系统的指定环境变量,如果找不到,则在 Mac OS X 系统配置和 Mac OS X 上的系统注册表中查找代理信息。如果大写和小写环境变量都存在(或不同),则小写优先。
请注意,如果已设置环境变量(这通常表示您正在 CGI 脚本环境中运行),则环境变量(大写)将被忽略。这是因为客户端可以使用该变量来注入“Proxy:”HTTP 标头。如果您需要在 CGI 环境中使用 HTTP 代理,请明确使用它,或确保变量名称为小写(或至少带有后缀)。
——提供以下课程:——————————————
类..(url,数据=无,={},=无,=False,=无)
该类是一个抽象的URL请求。
url 应该是一个包含有效 URL 的字符串。
data 必须是一个字节对象,指定要发送到服务器的附加数据或 None。data 也可以是一个对象,在这种情况下,如果不需要这样的数据,则必须在开头指定内容的长度。目前,HTTP 是唯一以这种方式请求数据的,当提供 data 参数时,HTTP 请求将执行 POST 请求而不是 GET 请求。
数据应为 x-www-form- 中标准应用程序格式的缓冲区。.() 函数接受映射或序列集合并返回该格式的 ASCII 文本字符串。在用作数据参数之前,应将其编码为字节。
应为字典,使用每个键和值作为参数调用 if()。这通常用于“欺骗”User-Agent 标头的值,通过使用浏览器标识自身 - 一些常见的 HTTP 服务器仅允许来自浏览器的请求,而不允许脚本。例如,可能将自身标识为“/5.0 (X11; U; Linux i686) Gecko/<name>/2.0.0.11”。2.6() 中的默认用户代理字符串为“-/2.6”。
带有数据参数的 -Type 的一个例子是发送字典 {"-Type":"/x-www-form-"}。
最后两个参数只是为了正确处理第三方 HTTP:
原始请求应发送到的主机,如 RFC 2965 中定义。默认为 http..(self)。这是用户发起的原始请求的主机名或 IP 地址。例如,如果请求的是 HTML 文档中的图像,则这应该是包含该图像的页面的请求主机。
表示请求是否应为不可验证的,如 RFC 2965 所定义。默认值为 False。不可验证的请求是指用户无法选择启用自动获取图像的请求。例如,如果请求的是 HTML 文档中的图像,并且用户未选择退出自动获取图像,则该值应为 True。
方法应为一个字符串,表示将使用的 HTTP 请求方法(例如“HEAD”)。如果提供,则其值存储在属性中并由 () 使用。子类可以通过在类本身上设置属性来指示默认方法。
在 3.3 版更改: 在 类中添加了 . 参数。
在 3.4 版更改: 默认的 . 可能出现在类级别。
种类..
该类打开 URL 并一起传递连接。它管理连接处理程序并从错误中恢复。
种类..
这是所有注册处理程序的基类。
种类..
处理重定向的类
类别..(=无)
扫一扫在手机端查看
-
Tags : urllib2.request python3
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。