01 HTTP概述

  • HTTP使用的是可靠的数据传输协议,可以使开发人员专注于应用程序的细节,而不用考虑因特网中存在的一些缺陷和问题。

1.3 资源

  • Web服务器是Web资源的宿主。Web资源是Web内容的源头

媒体类型

MIME(Multipurpose Internet Mail Extension)类型,原本是为了解决电子邮件中的问题,HTTP也使用。用来描述媒体内容。MIME是文本标记,由主要对象类型和子类型组成,如

  • text/html

  • text/plain

  • image/png

URI

URI包括URL和URN。但是由于URN很少用,所以URI和URL基本上可以互换使用。

  • URL:描述了特定服务器上某资源的特定位置

  • URN:是资源的特定名称,与位置无关。如无论RFC 2141文档位于何处,都可以用urn:ietf:urf:2141来命名

1.5 报文

HTTP报文是纯文本。包括三个部分:

  • 起始行

  • 首部字段

  • 主体

1.8 Web的组件结构

包括

  • 代理

  • 缓存

  • 网关(gateway)

    • 网关是一种特殊的服务器。通常用于将HTTP流量转换为其他协议。网关对客户端是透明的。客户端以为自己在和资源服务器通信

  • 隧道

  • Agent代理

    • 常见的Agent代理有Web浏览器、Web机器人(如爬虫)等