DNS( Domain Name System)是“域名系统”的英文缩写,是一种组织成域层次结构的计算机和网络服务命名系统,它用于TCP/IP网络,它所提供的服务是用来将主机名和域名转换为IP地址的工作。DNS就是这样的一位“翻译官”,它的基本工作原理可用下图来表示:
域名系统作为一个层次结构和分布式数据库,包含各种类型的数据,包括主机名和域名。DNS数据库中的名称形成一个分层树状结构称为域命名空间。
根域:DNS域名使用中规定由尾部句点'.'来指定名称位于根或者更高层次的域层次结构。
顶级域:用来指示某个国家、地区或者组织。采用三个字符,如com -> 商业公司,edu -> 教育机构,net -> 网络公司,gov -> 非军事政府机构等等。
二级域:个人或者组织在Internet使用的注册名称。采用两个字符,如:cn -> 代表中国,jp -> 日本,uk -> 英国,hk -> 香港等等。
主机:主机名处于域名空间结构中的最底层,主机名和域名结合构成FQDN,主机名是FQDN最左端的部分。
DNS是应用层协议,事实上他是为其他应用层协议工作的,包括不限于HTTP和SMTP以及FTP,用于将用户提供的主机名解析为IP地址。 具体过程如下: ①用户主机上运行着DNS的客户端,就是我们的PC机或者手机客户端运行着DNS客户端了。 ②浏览器将接收到的url中抽取出域名字段,就是访问的主机名,比如http://www.baidu.com/,并将这个主机名传送给DNS应用的客户端。 ③DNS客户机端向DNS服务器端发送一份查询报文,报文中包含着要访问的主机名字段(中间包括一些列缓存查询以及分布式DNS集群的工作)。 ④该DNS客户机最终会收到一份回答报文,其中包含有该主机名对应的IP地址。 ⑤一旦该浏览器收到来自DNS的IP地址,就可以向该IP地址定位的HTTP服务器发起TCP连接。
四、DNS服务的体系架构
DNS服务的作用:把域名解析为IP地址,将IP地址解析为域名。
假设运行在用户主机上的某些应用程序(如Webl浏览器或者邮件阅读器)需要将主机名转换为IP地址。这些应用程序将调用DNS的客户机端,并指明需要被转换的主机名。(在很多基于UNIX的机器上,应用程序为了执行这种转换需要调用函数gethostbyname())。用户主机的DNS客户端接收到后,向网络中发送一个DNS查询报文。所有DNS请求和回答报文使用的UDP数据报经过端口53发送(至于为什么使用UDP,请参看为什么域名根服务器只能有13台呢? - 郭无心的回答)经过若干ms到若干s的延时后,用户主机上的DNS客户端接收到一个提供所希望映射的DNS回答报文。这个查询结果则被传递到调用DNS的应用程序。因此,从用户主机上调用应用程序的角度看,DNS是一个提供简单、直接的转换服务的黑盒子。但事实上,实现这个服务的黑盒子非常复杂,它由分布于全球的大量DNS服务器以及定义了DNS服务器与查询主机通信方式的应用层协议组成。
DNS的一种简单的设计模式就是在因特网上只使用一个DNS服务器,该服务器包含所有的映射,在这种集中式的设计中,客户机直接将所有查询请求发往单一的DNS服务器,同时该DNS服务器直接对所有查询客户机做出响应。尽管这种设计方式非常诱人,但它不适用当前的互联网。因为当今的因特网有着数量巨大并且在持续增长的主机,这种集中式设计会有单点故障,通信容量(上亿台主机发送的查询DNS报文请求,包括但不限于所有的HTTP请求,电子邮件报文服务器,TCP长连接服务),远距离的时间延迟(澳大利亚到纽约的举例),维护开销大(因为所有的主机名-IP映射都要在一个服务站点更新)等问题。
DNS服务器一般分三种,根DNS服务器,顶级DNS服务器,权威DNS服务器。
当 DNS 客户机需要查询程序中使用的名称时,它会查询本地DNS 服务器来解析该名称。客户机发送的每条查询消息都包括3条信息,以指定服务器应回答的问题。 ● 指定的 DNS 域名,表示为完全合格的域名 (FQDN) 。 ● 指定的查询类型,它可根据类型指定资源记录,或作为查询操作的专门类型。 ● DNS域名的指定类别。 对于DNS 服务器,它始终应指定为 Internet 类别。例如,指定的名称可以是计算机的完全合格的域名,如im.qq.com,并且指定的查询类型用于通过该名称搜索地址资源记录。 DNS 查询以各种不同的方式进行解析。客户机有时也可通过使用从以前查询获得的缓存信息就地应答查询。DNS 服务器可使用其自身的资源记录信息缓存来应答查询,也可代表请求客户机来查询或联系其他 DNS 服务器,以完全解析该名称,并随后将应答返回至客户机。这个过程称为递归。 另外,客户机自己也可尝试联系其他的 DNS 服务器来解析名称。如果客户机这么做,它会使用基于服务器应答的独立和附加的查询,该过程称作迭代,即DNS服务器之间的交互查询就是迭代查询。
DNS的查询过程如下所示:
1、在浏览器中输入www . qq .com 域名,操作系统会先检查自己本地的hosts文件是否有这个网址映射关系,如果有,就先调用这个IP地址映射,完成域名解析。 2、如果hosts里没有这个域名的映射,则查找本地DNS解析器缓存,是否有这个网址映射关系,如果有,直接返回,完成域名解析。 3、如果hosts与本地DNS解析器缓存都没有相应的网址映射关系,首先会找TCP/ip参数中设置的首选DNS服务器,在此我们叫它本地DNS服务器,此服务器收到查询时,如果要查询的域名,包含在本地配置区域资源中,则返回解析结果给客户机,完成域名解析,此解析具有权威性。 4、如果要查询的域名,不由本地DNS服务器区域解析,但该服务器已缓存了此网址映射关系,则调用这个IP地址映射,完成域名解析,此解析不具有权威性。 5、如果本地DNS服务器本地区域文件与缓存解析都失效,则根据本地DNS服务器的设置(是否设置转发器)进行查询,如果未用转发模式,本地DNS就把请求发至13台根DNS,根DNS服务器收到请求后会判断这个域名(.com)是谁来授权管理,并会返回一个负责该顶级域名服务器的一个IP。本地DNS服务器收到IP信息后,将会联系负责.com域的这台服务器。这台负责.com域的服务器收到请求后,如果自己无法解析,它就会找一个管理.com域的下一级DNS服务器地址(http://qq.com)给本地DNS服务器。当本地DNS服务器收到这个地址后,就会找http://qq.com域服务器,重复上面的动作,进行查询,直至找到www . qq .com主机。 6、如果用的是转发模式,此DNS服务器就会把请求转发至上一级DNS服务器,由上一级服务器进行解析,上一级服务器如果不能解析,或找根DNS或把转请求转至上上级,以此循环。不管是本地DNS服务器用是是转发,还是根提示,最后都是把结果返回给本地DNS服务器,由此DNS服务器再返回给客户机。 从客户端到本地DNS服务器是属于递归查询,而DNS服务器之间就是的交互查询就是迭代查询。
HTTP/1.1 相⽐比 HTTP/1.0 性能上的改进:
使⽤用 TCP ⻓长连接的⽅方式改善了了 HTTP/1.0 短连接造成的性能开销。⽀支持管道(pipeline)⽹网络传输,只要第⼀一个请求发出去了了,不不必等其回来,就可以发第⼆二个请求出去,可以减少整体的响应时间。
但 HTTP/1.1 还是有性能瓶颈: 请求 / 响应头部(Header)未经压缩就发送,⾸首部信息越多延迟越⼤大。只能压缩 Body 的部分; 发送冗⻓长的⾸首部。每次互相发送相同的⾸首部造成的浪费较多; 服务器器是按请求的顺序响应的,如果服务器器响应慢,会招致客户端⼀一直请求不不到数据,也就是队头阻塞; 没有请求优先级控制; 请求只能从客户端开始,服务器器只能被动响应。
HTTP/2 协议是基于 HTTPS 的,所以 HTTP/2 的安全性也是有保障的。
那 HTTP/2 相⽐比 HTTP/1.1 性能上的改进:
1. 头部压缩 HTTP/2 会压缩头(Header)如果你同时发出多个请求,他们的头是⼀一样的或是相似的,那么,协议会帮你消除重复的部分。 这就是所谓的 HPACK 算法:在客户端和服务器器同时维护⼀一张头信息表,所有字段都会存⼊入这个表,⽣生成⼀一个索引号,以后就不不发送同样字段了了,只发送索引号,这样就提⾼高速度了了。 2. ⼆二进制格式 HTTP/2 不不再像 HTTP/1.1 ⾥里里的纯⽂文本形式的报⽂文,⽽而是全⾯面采⽤用了了⼆二进制格式,头信息和数据体都是 ⼆二进制,并且统称为帧(frame): 头信息帧和数据帧。
这样虽然对⼈人不不友好,但是对计算机⾮非常友好,因为计算机只懂⼆二进制,那么收到报⽂文后,⽆无需再将明 ⽂文的报⽂文转成⼆二进制,⽽而是直接解析⼆二进制报⽂文,这增加了了数据传输的效率。
3HTTP/2 的数据包不不是按顺序发送的,同⼀一个连接⾥里里⾯面连续的数据包,可能属于不不同的回应。因此,必须要对数据包做标记,指出它属于哪个回应。每个请求或回应的所有数据包,称为⼀一个数据流( Stream )。每个数据流都标记着⼀一个独⼀一⽆无⼆二的编号,其中规定客户端发出的数据流编号为奇数, 服务器器发出的数据流编号为偶数客户端还可以指定数据流的优先级。优先级⾼高的请求,服务器器就先响应该请求,
4. 多路路复⽤用 HTTP/2 是可以在⼀一个连接中并发多个请求或回应,⽽而不不⽤用按照顺序⼀一⼀一对应。移除了了 HTTP/1.1 中的串串⾏行行请求,不不需要排队等待,也就不不会再出现「队头阻塞」问题, 降低了了延迟,⼤大幅度提⾼高了了连接的利利⽤用率。举例例来说,在⼀一个 TCP 连接⾥里里,服务器器收到了了客户端 A 和 B 的两个请求,如果发现 A 处理理过程⾮非常耗时,于是就回应 A 请求已经处理理好的部分,接着回应 B 请求,完成后,再回应 A 请求剩下的部分。
5. 服务器器推送 HTTP/2 还在⼀一定程度上改善了了传统的「请求 - 应答」⼯工作模式,服务不不再是被动地响应,也可以主动向客户端发送消息。举例例来说,在浏览器器刚请求 HTML 的时候,就提前把可能会⽤用到的 JS、 CSS ⽂文件等静态资源主动发给客户端, 减少延时的等待,也就是服务器器推送(Server Push,也叫 Cache Push)。
HTTP/2 有哪些缺陷? HTTP/3 做了了哪些优化? HTTP/2 主要的问题在于,多个 HTTP 请求在复⽤用⼀一个 TCP 连接,下层的 TCP 协议是不不知道有多少个HTTP 请求的。所以⼀一旦发⽣生了了丢包现象,就会触发 TCP 的重传机制,这样在⼀一个 TCP 连接中的所有的 HTTP 请求都必须等待这个丢了了的包被重传回来。
HTTP/1.1 中的管道( pipeline)传输中如果有⼀一个请求阻塞了了,那么队列列后请求也统统被阻塞住了了 HTTP/2 多个请求复⽤用⼀一个TCP连接,⼀一旦发⽣生丢包,就会阻塞住所有的 HTTP 请求。
这都是基于 TCP 传输层的问题,所以 HTTP/3 把 HTTP 下层的 TCP 协议改成了了 UDP!
UDP 发⽣生是不不管顺序,也不不管丢包的,所以不不会出现 HTTP/1.1 的队头阻塞 和 HTTP/2 的⼀一个丢包全部重传问题。 大家都知道 UDP 是不不可靠传输的,但基于 UDP 的 QUIC 协议 可以实现类似 TCP 的可靠性传输。
QUIC 有⾃自⼰己的⼀一套机制可以保证传输的可靠性的。当某个流发⽣生丢包时,只会阻塞这个流, 其他流不不会受到影响。 TLS3 升级成了了最新的 1.3 版本,头部压缩算法也升级成了了 QPack 。
HTTPS 要建⽴立⼀一个连接,要花费 6 次交互,先是建⽴立三次握⼿手,然后是 TLS/1.3 的三次握⼿手。QUIC 直接把以往的 TCP 和 TLS/1.3 的 6 次交互合并成了了 3 次,减少了了交互次数。
所以, QUIC 是⼀一个在 UDP 之上的伪 TCP + TLS + HTTP/2 的多路路复⽤用的协议。 QUIC 是新协议,对于很多⽹网络设备,根本不不知道什什么是 QUIC,只会当做 UDP,这样会出现新的问题。所以 HTTP/3 现在普及的进度⾮非常的缓慢,不不知道未来 UDP 是否能够逆袭 TCP。
SSL/TLS 是什么?
SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS与SSL在传输层对网络连接进行加密。
SSL:(Secure Socket Layer,安全套接字层),位于可靠的面向连接的网络层协议和应用层协议之间的一种协议层。SSL通过互相认证、使用数字签名确保完整性、使用加密确保私密性,以实现客户端和服务器之间的安全通讯。该协议由两层组成:SSL记录协议和SSL握手协议。
TLS:(Transport LayerSecurity,传输层安全协议),用于两个应用程序之间提供保密性和数据完整性。该协议由两层组成:TLS记录协议和TLS握手协议。
SSL是Netscape开发的专门用户保护Web通讯的,目前版本为3.0。最新版本的TLS 1.0是IETF(工程任务组)制定的一种新的协议,它建立在SSL 3.0协议规范之上,是SSL 3.0的后续版本。两者差别极小,可以理解为SSL 3.1,它是写入了RFC的。
IP 在 TCP/IP 参考模型中处于第三层,也就是⽹网络层。⽹网络层的主要作⽤用是: 实现主机与主机之间的通信,也叫点对点(end to end)通信。
⽹网络层与数据链路路层有什什么关系呢?
其实很容易易区分,在上⾯面我们知道 IP 的作⽤用是主机之间通信⽤用的,⽽而 MAC 的作⽤用则是实现「直连」的两个设备之间通信,⽽而 IP 则负责在「没有直连」的两个⽹网络之间进⾏行行通信传输。举个⽣生活的栗栗子,⼩小林林要去⼀一个很远的地⽅方旅⾏行行,制定了了⼀一个⾏行行程表,其间需先后乘坐⻜飞机、地铁、公交⻋车才能抵达⽬目的地,为此⼩小林林需要买⻜飞机票,地铁票等。⻜飞机票和地铁票都是去往特定的地点的,每张票只能够在某⼀一限定区间内移动,此处的「区间内」就如同通信⽹网络中数据链路路。在区间内移动相当于数据链路路层,充当区间内两个节点传输的功能,区间内的出发点好⽐比源 MAC 地址,⽬目标地点好⽐比⽬目的 MAC 地址。
在 TCP/IP ⽹网络通信时,为了了保证能正常通信,每个设备都需要配置正确的 IP 地址,否则⽆无法实现正常的通信。IP 地址(IPv4 地址)由 32 位正整数来表示, IP 地址在计算机是以⼆二进制的⽅方式处理理的。⽽而⼈人类为了了⽅方便便记忆采⽤用了了点分⼗十进制的标记⽅方式,也就是将 32 位 IP 地址以每 8 位为组,共分为 4组,每组以「 . 」隔开,再将每组转换成⼗十进制。
IP 地址的分类
什么是 A、 B、 C 类地址?