浅谈 HTTP 和 HTTPS

jspeng

发布于：2019年3月21日

前言

说起 HTTP 协议让我想起了之前做的 socket 聊天，自己定义了一套规则比如定义一个特殊字符 socket 读到了这个特殊字符就代表这是一整句结束显示到界面，发送文件还定义的是一个 Magic Number 告诉 socket 不要按照字符串解析了。

现在想起来我当时做的事情就是自定义协议用来规范客户端和服务端的通讯而 HTTP 协议就是干这个事情的来规范服务器和客户端的请求&响应标准。

简单介绍 HTTP

HTTP 是基于 TCP/IP 协议，也叫超文本传输协议(HyperText Transfer Protocol) 默认端口 80。

在《图解 HTTP》书中指出正确的名字应该叫做超文本转移协议。

特点

请求&响应: 客户端发送请求服务器响应请求
无状态(stateless): 在传输过程中 HTTP 不会保留之前的历史信息等待服务器响应之后断开连接要传输数据时必须重新连接。

之所以 HTTP 设计足够简单是为了更快的处理大量事务确保协议的可伸缩性

因为无法保留用户的数据，所以后面引入了 cookie 机制这里就不做介绍了。

命令

在 HTTP 中一共 10 种命令(也就是我们现在所说的方法 Method) 来告诉服务器应该采用哪些方式处理

方法	说明	协议版本
GET	获取资源	1.0/1.1
POST	传输实体主体	1.0/1.1
PUT	传输文件	1.0/1.1
HEAD	获取报文首部	1.0/1.1
DELETE	删除文件	1.0/1.1
OPTIONS	查看支持的方法	1.1
TRACE	追踪路径	1.1
CONNECT	连接代理	1.1

LINK 和 UNLINK 已经在 1.1 的版本中移除

这里最常用的还是 GET/POST 如果你的服务是 RESTful 接口那应该会用到 PUT/DELETE/OPTIONS

报文

在 HTTP 传输的信息叫做 HTTP 报文，报文是由 (报文首部) 和 (报文主体) 构成它们就是由数据构成的字符串文本。

HTTPS 介绍

由于 HTTP 是明文传输，所以很容易遭到中间人攻击，所以使用了 SSL 来进行加密 HTTP 传输内容，SSL 和 HTTP 的组合使用叫做 HTTPS。

它是在 HTTP 之上添加了一层加密协议，客户端和服务端每一次传输的数据都需要经过一层特殊处理即加密/解密所以在速度上逊于 HTTP，这个东西的目的只有一个: 保证你发送/接收的数据都是你的服务器在处理，因为在 HTTPS 没有出现之前如何保证你接收的数据是来自你的服务器是一个难题。

然而 SSL 并不是为了 HTTP 加密而开发的加密技术，SSL 最初是由网景公司开发不认识？最先开发浏览器那家公司，3.0版本之后交给了 IETF。

我们大致了解了这两个协议之后来看看这个 S 到底安全在哪里？

对 HTTP 进行中间人攻击

或许你现在正在遭受你的运营商使用中间人攻击篡改数据添加广告来实现盈利，这是经常发生的事情但是放心我的网站已加上了 HTTPS 所以不会出现这种情况。

如果你是 windows 可以使用 Wireshark，MacOs 使用大名鼎鼎的花瓶(Charles)，

通过 Charles 进行拦截,拦截后我们能看到在 Charles 拦截时 HTTP 使用明文传输所以我们可以利用并更改这些数据。

在我攻击的那几秒中发生了什么？

HTTP 在传输的过程中是以明文传输的，如果这里面包含了你的密码中间人一样的能够获取到并用你的身份来进行操作，尽管有的网站对密码进行了加密中间人只需要获取到登陆之后的 cookie 即可来完成身份的伪造。

对 HTTPS 进行中间人攻击

这次就选用本站来做个演示。

能看到正常访问情况下在地址的前面会带上一个小锁的标志，这代表当前的网站是安全的即使用了 HTTPS

按照同样的方法来进行中间人但是在一开始的时候就出现了问题

能看到在花瓶中无法解析这个数据包请求前面也有一个小锁的标志接下来该怎么办呢？

这个时候就需要明白这个 S 到低做了什么？

先来说一说这个 HTTPS 采用的加密算法

HTTPS 是采用 SSL 的非对称加密算法也叫公开密钥密码。

所谓非对称加密算是指加密和解密的密钥都不是同一个，明文加密后能够获取到两个密钥一个叫做公钥(public key)在互联网进行传输的，还有一个叫做私钥(private key) ,它们应该成套出现需要注意的是公钥和私钥都能够用来加密和解密

用公钥加密用私钥解密叫做加密传输
用私钥加密用公钥解密叫做认证签名

对称加密刚好是相反，它指加密和解密秘钥都是用的同一个，通过秘钥加密明文也通过秘钥解密密文这种算法安全性取决于秘钥的安全性因为秘钥一旦丢失获取到的密文可以直接进行解密也就无任何安全可言了。

在 HTTPS 中，如果使用了对称加密算法那如何保证秘钥安全的送达客户端？我们又好像回到了最开始的问题，如果不发送秘钥浏览器拿到了密文也无法进行解密，发送了秘钥中间人也能获取到那就无意义了这是一个死循环。

为了大家更好的理解非对称加密的特点，我举一个例子。

我生成了一套密钥，并把公钥写在了我的网站上。(公钥公开私钥保留)

你现在想给我发送邮件，但是想加密邮件的内容所以就使用了我的公钥加密了邮件的内容并且给我发了过来

我收到邮件后发现是一串密文，我尝试用我的私钥解密发现解开了这个时候我就知道有人用我的公钥给我发送了邮件

以上就完成一次数据的加密传输，尽管私钥和公钥在数学上面有一些关联但是想要破解真的是太难了。

由于 SSL 有两个密钥，发送的密文使用公钥进行加密的私钥并不会传递所以就有了第三方的数组认证机构 (CA,Certificate Authority),而现代浏览器比如 Chrome 在开发时就会注入主流的认证机构密钥(公钥和私钥)，所以我们如果想要给网站加上 HTTPS 支持只需要向第三方机构申请安全证书即可剩下的浏览器会帮我们处理。

即使这样真的可以防止中间人攻击吗？你如何保证第三方认证机构不会把证书授权给那些不法分子呢？因为信仰不同？你想多了只要赚钱这些第三方一样的会把证书发布给他们。在花瓶中是能够处理 HTTPS 的数据包因为花瓶自带了证书(笑)

先来打开 SSL 代理

看到了吗？我们一样能够获取到内容，那有的人就会问了不是说 HTTPS 可以保证安全吗？为什么还能够进行中间人攻击？接下来就要介绍 SSL 的第二个特征

SSL 数字证书

上面说到过，使用私钥加密用公钥解密的表示认证签名还是举一个例子来说明

我发布了一篇文章，这个时候如何证明文章是我本人发的？我会在文章最底部留下一串密文

这个密文是通过文章内容 MD5 之后的密文然后再通过我的私钥加密的
private_key.encode(MD5.encode(article.content));

大家因为都有我的公钥，所以去尝试解密如果这里解密失败不用想了不是我发的，如果解密成功发现得到了一串 MD5 然后自己加密文章内容看一看出来的结果是不是我给的 MD5 如果正确就代表这篇文章确实是我本人发的如果不正确就是被中间人修改了。

因为中间人并不知道我的私钥，一旦文章的内容发生改变 MD5 值就会发生改变，匹配不上大家自然知道这个文章并不是本所发如果这个时候中间人自作聪明独自修改了我给的密文，那就更简单了只要它修改了大家都有我的公钥通过我的公钥必定解密失败解密都失败了那就更不是本人发的了。

这个就是数字证书的作用: 确保数据不被中间人修改。

介绍完了数字证书，继续演示中间人攻击

如果你使用的是 Chrome

能看到浏览器已经知道当前网站被中间人攻击了。

HTTPS 使用了混淆加密

因为 HTTPS 在性能上远不如 HTTP，大概是 2-100 倍但是使用者基本感觉不到为什么？因为1毫秒的100倍也才100毫秒谁能感觉到呀！

不过 HTTPS 还是给出了一个比较合理的解决方法，即混淆加密。

什么是混淆加密？我在来举个例子

我和一个小伙伴使用加密的方式聊天，比如使用微信

但是我发现每次都要用私钥解密公钥加密就太麻烦了呀！

所以我们规定在第一次发送消息的时候我们采用非对称加密的方式，然后把对称加密方式的密钥放进来(比如 DES)

后面我们聊天就不用这么麻烦了，因为我们拿到了一个对称加密的密钥后面的消息过来只需要 decode 就行了也不用验证是不是对方发过来的，因为每次的首次会话都会改变对称密钥这样轻松多了。

自造 HTTPS 的可能？

最近在知乎上面看了这个问题，所谓无知者无畏为什么我们不能自己造轮子呢？

我们自己定义一套协议并且不公开只有公司自己知道加密方式和解密方式有没有这个可能？

我想这个问题没有对错有兴趣的同学可以去知乎看看。

最后

真实的情况可能远远比我文章说的复杂，但是希望这篇文章能让你基本了解 http 和 https 的区别，学无止境。

更新于：2019年3月21日

http

网络协议

vue3.0初体验有哪些实用新功能

尤雨溪：Vue 3.0 计划掘金译文关于安装Vue CLI 的包名称由 vue-cli 改成了 @vue/cli 1234npm install -g @vue/cli安装完成后查看版本...

50 行代码实现一个简单的 WEB 服务器

前言：这里的简单是只实现网站根目录的访问，一个完整的 WEB 服务器实现是很复杂的可参考 nginx。 WEB 服务器的原理是先监听一个 Socket 端口，当 TCP 请求完成握手之后 ...