一、什么是同源策略

同源策略(Same origin policy)是一种约定,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,则浏览器的正常功能可能都会受到影响。可以说Web是构建在同源策略基础之上的,浏览器只是针对同源策略的一种实现。

当协议、域名、端口号,有一个或多个不同时,有希望可以访问并获取数据的现象称为跨域访问,同源策略限制下 cookielocalStoragedomajaxIndexDB 都是不支持跨域的。

但是有三个标签是允许跨域加载资源:

  1. <img src=XXX>
  2. <link href=XXX>
  3. <script src=XXX>
URL                               说明                是否允许通信
http://www.a.com/a.js
http://www.a.com/b.js             同一域名下           允许

http://www.a.com:8000/a.js
http://www.a.com/b.js             同一域名,不同端口    不允许

http://www.a.com/a.js
https://www.a.com/b.js            同一域名,不同协议    不允许

http://www.a.com/a.js
http://a.com/b.js                 主域相同,子域不同    不允许

http://www.b.com/a.js
http://www.a.com/b.js             不同域名            不允许


二、CORS

CORS是一个W3C标准,全称是跨域资源共享(Cross-Origin Resource Sharing)。它允许浏览器向跨源服务器,发出XMLHttpRequest请求,从而克服了AJAX只能同源使用的限制。

1. 简介

CORS需要浏览器和服务器同时支持。目前,所有浏览器都支持该功能,IE浏览器不能低于IE10。
(IE8+:IE8/9需要使用XDomainRequest对象来支持CORS。)

整个CORS通信过程,都是浏览器自动完成,不需要用户参与。对于开发者来说,CORS通信与同源的AJAX通信没有差别,代码完全一样。浏览器一旦发现AJAX请求跨源,就会自动添加一些附加的头信息,有时还会多出一次附加的请求,但用户不会有感觉。
(因此,实现 CORS 通信的关键是服务器。只要服务器实现了 CORS 接口,就可以跨源通信。)

2. 请求分类

  • 简单请求(simple request) 请求方式为HEAD、POST 或者 GET
    http头信息不超出一下字段:Accept、Accept-Language 、 Content-Language、 Last-Event-ID、 Content-Type(限于三个值:application/x-www-form-urlencoded、multipart/form-data、text/plain)
  • 非简单请求(not-so-simple request) 凡是不满足上述条件,就属于非简单请求。
    比如请求方法是PUTDELETE,或者Content-Type字段的类型是application/json

3. 简单请求

对于简单请求,浏览器直接发出CORS请求。具体来说,就是在头信息之中,增加一个Origin字段。

GET /cors HTTP/1.1
Origin: http://api.bob.com
Host: api.alice.com
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0
...

Origin字段用来说明,本次请求来自哪个源(协议 + 域名 + 端口)。服务器根据这个值,决定是否同意这次请求。
如果Origin指定的源,不在许可范围内,服务器会返回一个正常的HTTP回应。
浏览器发现,这个回应的头信息没有包含Access-Control-Allow-Origin字段(详见下文),就知道出错了,从而抛出一个错误,被XMLHttpRequest的onerror回调函数捕获。
注意,这种错误无法通过状态码识别,因为HTTP回应的状态码有可能是200。
如果Origin指定的域名在许可范围内,服务器返回的响应,会多出几个头信息字段。

Access-Control-Allow-Origin: http://api.bob.com
Access-Control-Allow-Credentials: true
Access-Control-Expose-Headers: FooBar
Content-Type: text/html; charset=utf-8

上面的头信息之中,有三个与CORS请求相关的字段,都以Access-Control-开头

Access-Control-Allow-Origin:该字段是必须的。它的值要么是请求时Origin字段的值,要么是一个*,表示接受任意域名的请求
Access-Control-Allow-Credentials: 该字段可选。它的值是一个布尔值,表示是否允许发送Cookie。默认情况下,Cookie不包括在CORS请求之中。设为true,即表示服务器明确许可,Cookie可以包含在请求中,一起发给服务器。这个值也只能设为true,如果服务器不要浏览器发送Cookie,删除该字段即可。
Access-Control-Expose-Headers:该字段可选。CORS请求时,XMLHttpRequest对象的getResponseHeader()方法只能拿到6个基本字段:Cache-Control、Content-Language、Content-Type、Expires、Last-Modified、Pragma。如果想拿到其他字段,就必须在Access-Control-Expose-Headers里面指定。

withCredentials 属性

上面说到,CORS请求默认不发送Cookie和HTTP认证信息。如果要把Cookie发到服务器,一方面要服务器同意,指定Access-Control-Allow-Credentials字段。

另一方面,开发者必须在AJAX请求中打开withCredentials属性。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
// IE8/9需用window.XDomainRequest兼容
let xhr = new XMLHttpRequest();

// 前端设置是否带cookie
xhr.withCredentials = true;

xhr.open('post', 'http://www.domain.com:8080/login', true);
xhr.setRequestHeader('Content-Type', 'application/x-www-form-urlencoded');
xhr.send('user=admin');

xhr.onreadystatechange = function() {
if (xhr.readyState == 4 && xhr.status == 200) {
alert(xhr.responseText);
}
};

否则,即使服务器同意发送Cookie,浏览器也不会发送。或者,服务器要求设置Cookie,浏览器也不会处理。

需要注意的是,如果要发送Cookie,Access-Control-Allow-Origin就不能设为星号,必须指定明确的、与请求网页一致的域名。同时,Cookie依然遵循同源政策,只有用服务器域名设置的Cookie才会上传,其他域名的Cookie并不会上传,且(跨源)原网页代码中的document.cookie也无法读取服务器域名下的Cookie。

4. 非简单请求

非简单请求的CORS请求,会在正式通信之前,增加一次HTTP查询请求,称为”预检”请求preflight

浏览器先询问服务器,当前网页所在的域名是否在服务器的许可名单之中,以及可以使用哪些HTTP动词和头信息字段。只有得到肯定答复,浏览器才会发出正式的XMLHttpRequest请求,否则就报错。

let url = 'http://api.alice.com/cors';
let xhr = new XMLHttpRequest();
xhr.open('PUT', url, true);
xhr.setRequestHeader('X-Custom-Header', 'value');
xhr.send();

浏览器发现,这是一个非简单请求,就自动发出一个”预检”请求,要求服务器确认可以这样请求。下面是这个”预检”请求的HTTP头信息。

OPTIONS /cors HTTP/1.1
Origin: http://api.bob.com
Access-Control-Request-Method: PUT
Access-Control-Request-Headers: X-Custom-Header
Host: api.alice.com
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0
...

“预检”请求用的请求方法是OPTIONS,表示这个请求是用来询问的。头信息里面,关键字段是Origin,表示请求来自哪个源。

除了Origin字段,”预检”请求的头信息包括两个特殊字段。

  • Access-Control-Request-Method:该字段是必须的,用来列出浏览器的CORS请求会用到哪些HTTP方法,上例是PUT。
  • Access-Control-Request-Headers:该字段是一个逗号分隔的字符串,指定浏览器CORS请求会额外发送的头信息字段,上例是X-Custom-Header

预检请求的回应

服务器收到”预检”请求以后,检查了Origin、Access-Control-Request-Method和Access-Control-Request-Headers字段以后,确认允许跨源请求,就可以做出回应。

HTTP/1.1 200 OK
Date: Mon, 01 Dec 2008 01:15:39 GMT
Server: Apache/2.0.61 (Unix)
Access-Control-Allow-Origin: http://api.bob.com
Access-Control-Allow-Methods: GET, POST, PUT
Access-Control-Allow-Headers: X-Custom-Header
Content-Type: text/html; charset=utf-8
Content-Encoding: gzip
Content-Length: 0
Keep-Alive: timeout=2, max=100
Connection: Keep-Alive
Content-Type: text/plain

上面的HTTP回应中,关键的是Access-Control-Allow-Origin字段,表示api.bob.com可以请求数据。 该字段也可以设为星号,表示同意任意跨源请求。
如果浏览器否定了”预检”请求,会返回一个正常的HTTP回应,但是没有任何CORS相关的头信息字段。这时,浏览器就会认定,服务器不同意预检请求,因此触发一个错误,被XMLHttpRequest对象的onerror回调函数捕获。控制台会打印出如下的报错信息。

服务器回应的其他CORS相关字段如下:

Access-Control-Allow-Methods: GET, POST, PUT
Access-Control-Allow-Headers: X-Custom-Header
Access-Control-Allow-Credentials: true
Access-Control-Max-Age: 1728000

Access-Control-Allow-Methods:该字段必需,它的值是逗号分隔的一个字符串,表明服务器支持的所有跨域请求的方法。注意,返回的是所有支持的方法,而不单是浏览器请求的那个方法。这是为了避免多次”预检”请求。
Access-Control-Allow-Headers:如果浏览器请求包括Access-Control-Request-Headers字段,则Access-Control-Allow-Headers字段是必需的。它也是一个逗号分隔的字符串,表明服务器支持的所有头信息字段,不限于浏览器在”预检”中请求的字段。
Access-Control-Allow-Credentials:该字段与简单请求时的含义相同。
Access-Control-Max-Age:该字段可选,用来指定本次预检请求的有效期,单位为秒。上面结果中,有效期是20天(1728000秒),即允许缓存该条回应1728000秒(即20天),在此期间,不用发出另一条预检请求。

浏览器正常请求回应
一旦服务器通过了”预检”请求,以后每次浏览器正常的CORS请求,就都跟简单请求一样,会有一个Origin头信息字段。服务器的回应,也都会有一个Access-Control-Allow-Origin头信息字段。

PUT /cors HTTP/1.1
Origin: http://api.bob.com
Host: api.alice.com
X-Custom-Header: value
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0...

浏览器的正常CORS请求。上面头信息的Origin字段是浏览器自动添加的。下面是服务器正常的回应。

Access-Control-Allow-Origin: http://api.bob.com
Content-Type: text/html; charset=utf-8

5. 与JSONP的比较

CORS与JSONP的使用目的相同,但是比JSONP更强大。
JSONP只支持GET请求,CORS支持所有类型的HTTP请求。JSONP的优势在于支持老式浏览器,以及可以向不支持CORS的网站请求数据。


三、WebSocket

Websocket是HTML5的一个持久化的协议,它实现了浏览器与服务器的全双工通信,同时也是跨域的一种解决方案。

WebSocket和HTTP都是应用层协议,都基于 TCP 协议。但是 WebSocket 是一种双向通信协议,在建立连接之后,WebSocket 的 server 与 client 都能主动向对方发送或接收数据。同时,WebSocket 在建立连接时需要借助 HTTP 协议,连接建立好了之后 client 与 server 之间的双向通信就与 HTTP 无关了。

我们推荐使用Socket.io,它很好地封装了webSocket接口,提供了更简单、灵活的接口,也对不支持webSocket的浏览器提供了向下兼容。

html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>WebSocket</title>
</head>
<body>
<div>Try Me:<input type="text"></div>
<script>
// 创建 webSocket
const socket = new WebSocket('ws://localhost:3000');
// 连接上触发
socket.onopen = function () {
socket.send('Hello World!');
}
socket.onconnect = function () {
// 监听服务端消息
socket.onmessage = function (e) {
console.log(e.data);
}
}
// 监听服务端关闭
socket.onclose = function () {
console.log('Server socket has closed.');
}
document.getElementsByTagName('input')[0].onblur = function () {
socket.send(this.value);
};
</script>
</body>
</html>
Node.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
const http = require('http');
const socket = require('ws');
const fs = require('fs');
// 启http服务
const server = http.createServer(function (req, res) {
const content = fs.readFileSync('./html.html');
res.writeHead(200, { 'Content-type': 'text/html' });
res.write(content);
res.end();
});
server.listen('8000');
console.log('Server is running at port 8000...');
// 监听socket连接
const wss = new socket.Server({ port: 3000 });

wss.on('connection', function (client) {
// 接收信息
client.on('message', function (msg) {
client.send('我接收到了:' + msg);
console.log('data from client: ---> ' + msg);
if (msg === '666') {
client.send(999);
}
});
// 断开处理
client.on('close', function () {
console.log('Client socket has closed.');
});
});

该协议不实行同源政策,只要服务器支持,就可以通过它进行跨源通信。

GET / HTTP/1.1
Upgrade: websocket
Connection: Upgrade
Host: example.com
Origin: http://example.com
Sec-WebSocket-Key: sN9cRrP/n9NdMgdcy2VJFQ==
Sec-WebSocket-Version: 13

上面代码中,有一个字段是Origin,表示该请求的请求源(origin),即发自哪个域名。

正是因为有了Origin这个字段,所以WebSocket才没有实行同源政策。因为服务器可以根据这个字段,判断是否许可本次通信。如果该域名在白名单内,服务器就会做出如下回应。

HTTP/1.1 101 Switching Protocols
Upgrade: websocket
Connection: Upgrade
Sec-WebSocket-Accept: HSmrc0sMlYUkAGmm5OPpG2HaGWk=
首部字段名 说明
Connection 必须设置 Upgrade,表示客户端希望连接升级。
Upgrade 必须设置 Websocket,表示希望升级到 Websocket 协议。
Sec-WebSocket-Key 是随机的字符串,服务器端会用这些数据来构造出一个 SHA-1 的信息摘要。
Sec-WebSocket-Version 表示支持的 Websocket 版本。RFC6455 要求使用的版本是 13,之前草案的版本均应当弃用。
Sec-WebSocket-Accept 由Sec-WebSocket-Key进行BASE-64编码返回。
Sec-WebSocket-Extensions 协议扩展。


四、postMessage

window.postMessage(message,targetOrigin)方法是 HTML5 新引进的特性,可以使用它来向其它的 window 对象发送消息,无论这个 window 对象是属于同源或不同源。

调用 postMessage 方法的 window 对象是指要接收消息的那一个 window 对象,该方法的第一个参数 message 为要发送的消息,类型只能为字符串;第二个参数 targetOrigin 用来限定接收消息的那个 window 对象所在的域,如果不想限定域,可以使用通配符 *。

页面https://www.williamife.com/a.html的代码:

1
2
3
4
5
6
7
8
9
10
11
12
<iframe src="https://williamife.com/b.html" id="myIframe"
onload="test()" style="display: none;">
<script>
// 1. iframe载入 "https://williamife.com/b.html"页面后会执行该函数
function test() {
// 2. 获取 https://williamife.com/b.html 页面的 window 对象,
let iframe = document.getElementById('myIframe');
let win = iframe.contentWindow;
// 然后通过 postMessage 向 https://williamife.com/b.html 页面发送消息
win.postMessage('我是来自https://www.williamife.com/a.html页面的消息', '*');
}
</script>

页面 https://williamife.com/b.html 的代码:

1
2
3
4
5
6
7
<script type="text/javascript">
// 注册 message 事件用来接收消息
window.onmessage = function(e) {
e = e || event; // 获取事件对象
console.log(e.data); // 通过 data 属性得到发送来的消息
}
</script>


五、JSONP

由于 script 标签不受浏览器同源策略的影响,允许跨域引用资源。因此可以通过动态创建 script 标签,然后利用 src 属性进行跨域,这也就是 JSONP 跨域的基本原理。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
// 1. 定义一个 回调函数 handleResponse 用来接收返回的数据
function handleResponse(data) {
console.log(data);
};

// 2. 动态创建一个 script 标签,并且告诉后端回调函数名叫 handleResponse
let body = document.getElementsByTagName('body')[0];
let script = document.gerElement('script');
script.src = 'https://www.williamife.cn/json?callback=handleResponse';
body.appendChild(script);

// 3. 通过 script请求 `https://www.williamife.cn/json?callback=handleResponse`,

// 4. 后端能够识别这样的 URL 格式并处理该请求,
// 然后返回 handleResponse({"name": "william"}) 给浏览器

// 5. 浏览器在接收到 handleResponse({"name": "william"}) 之后立即执行 ,
// 也就是执行 handleResponse 方法,获得后端返回的数据,这样就完成一次跨域请求了。

JSONP只能发GET请求,因为本质上script加载资源就是GET,那么如果要发POST请求怎么办呢?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
const requestPost = ({url, data}) => {
// 首先创建一个用来发送数据的iframe.
const iframe = document.createElement('iframe')
iframe.name = 'iframePost'
iframe.style.display = 'none'
document.body.appendChild(iframe)
const form = document.createElement('form')
const node = document.createElement('input')
// 注册iframe的load事件处理程序,如果你需要在响应返回时执行一些操作的话.
iframe.addEventListener('load', function () {
console.log('post success')
})

form.action = url
// 在指定的iframe中执行form
form.target = iframe.name
form.method = 'post'
for (let name in data) {
node.name = name
node.value = data[name].toString()
form.appendChild(node.cloneNode())
}
// 表单元素需要添加到主文档中.
form.style.display = 'none'
document.body.appendChild(form)
form.submit()

// 表单提交后,就可以删除这个表单,不影响下次的数据发送.
document.body.removeChild(form)
}
// 使用方式
requestPost({
url: 'http://localhost:8080/api/iframePost',
data: {
msg: 'helloIframePost'
}
})


六、window.name

浏览器窗口有window.name属性。这个属性的最大特点是,无论是否同源,只要在同一个窗口里,前一个网页设置了这个属性,后一个网页可以读取它。

1
2
3
4
5
6
7
// 这里是要传输的数据,大小一般为2M,IE和firefox下可以大至32M左右
// 数据格式可以自定义,如json、字符串
window.name = "这是a页面的内容";
setTimeout(function(){
window.location.href= b.html;
console.log(window.name); //"这是a页面的内容"
},2000);

有时候我们的需求是在a页面内,获得ccc上的数据,并且页面不能进行刷新。

对于这种需求,我们不能通过window.location.href更新页面来获得数据,我们可以用一个隐藏的iframe作为中间的代理,iframe的src为https://xxx.ccc.com/xxx,在iframe页面加载完毕的时候,我们再让iframe与当前页面属于同一个域下,我们就可以拿到window.name了。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
let boo = false;
let iframe = document.createElement('iframe');
let loadData = function() {
if (boo) {
//获取window.name
let data = iframe.contentWindow.name;
console.log(data);
//销毁数据
iframe.contentWindow.document.write('');
iframe.contentWindow.close();
document.body.removeChild(iframe);
} else {
boo = true;
// 设置的代理文件,iframe重新载入
iframe.contentWindow.location = "b.html";
}
};
iframe.src = 'https://xxx.ccc.com/xxx';
if (iframe.attachEvent) {
iframe.attachEvent('onload', loadData);
} else {
iframe.onload = loadData;
}
document.body.appendChild(iframe);

优点: window.name容量很大,可以放置非常长的字符串;
缺点: 必须监听子窗口window.name属性的变化,影响网页性能。


七、location.hash

与 window.name 跨域的情况相同,是不同域的页面间的参数传递,需要借助 iframe 标签,A 页面和 B 页面是同域的 ,C 页面是独立的域。

HTML A
1
2
3
4
5
6
7
8
<!-- https://www.williamife/a.html -->
<iframe src="http://www.c.html#123" id="frame"></iframe>
<script>
// 使用 hashchange 事件接收来自 B 页面设置给 A 页面的 hash 值
window.onhashchange = function() {
console.log(location.hash);
}
</script>
HTML C
1
2
3
4
5
// 打印 A 页面引入 C 页面设置的 hash 值
console.log(location.hash);
let iframe = document.createElement('iframe');
iframe.src = 'https://www.williamife/b.html#456';
document.body.appendChild(iframe);
HTML B
1
2
// 将 C 页面引入 B 页面设置的 hash 值设置给 A页面
window.parent.parent.location.hash = location.hash;


八、document.domain

这种跨域的方式最主要的是要求主域名相同。

页面https://www.williamife.com/a.html的代码:

1
2
3
4
5
6
7
8
9
10
<iframe src="https://williamife.com/b.html" id="myIframe"
onload="test()" style="display: none;">

<script type="text/javascript">
document.domain = 'williamife.com';//设置成主域
function test(){
//contentWindow 可取得子窗口的 window 对象
console.log(document.getElementById('iframe').contentWindow);
}
</script>

页面 https://williamife.com/b.html 的代码:

1
2
3
4
<script type="text/javascript">
//在iframe载入这个页面也设置document.domain,使之与主页面的document.domain相同
document.domain = 'williamife.com';
</script>


九、图像 Ping

由于 img 标签不受浏览器同源策略的影响,允许跨域引用资源。因此可以通过 img 标签的 src 属性进行跨域,这也就是图像 Ping 跨域的基本原理。

直接通过下面的例子来说明图像 Ping 实现跨域的流程:

1
2
3
4
5
6
7
let img = new Image();
// 通过 onload 及 onerror 事件可以知道响应是什么时候接收到的,但是不能获取响应文本
img.onload = img.onerror = function() {
console.log("Done!");
}
// 请求数据通过查询字符串形式发送
img.src = 'https://www.williamife.com/getinfo?name=william';

优点:
用于实现跟踪用户点击页面或动态广告曝光次数有较大的优势。

缺点:
只支持 GET 请求。
只能浏览器与服务器的单向通信,因为浏览器不能访问服务器的响应文本。


十、其它方案

1. WebServer: nginx

Nginx
1
2
3
4
5
6
7
8
9
10
11
server{
# 监听9099端口
listen 9099;
# 域名是localhost
server_name localhost;
#凡是localhost:9099/api这个样子的,
#都转发到真正的服务端地址https://www.williamife.com
location ^~ /api {
proxy_pass https://www.williamife.com;
}
}
JavaScript
1
2
3
4
5
6
7
8
9
10
11
12
13
// 请求的时候直接用回前端这边的域名http://localhost:9099,这就不会跨域,
// 然后Nginx监听到凡是localhost:9099/api这个样子的,
// 都转发到真正的服务端地址https://www.williamife.com
fetch( 'http://localhost:9099/api/iframePost' , {
method: 'POST' ,
headers: {
'Accept': 'application/json',
'Content-Type': 'application/json'
},
body: JSON.stringify({
msg: 'helloIframePost'
})
})

2. Node中间件: http-proxy-middleware

node + webpack + webpack-dev-serve
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
module.exports = {
entry: {},
module: {},
...
devServer: {
proxy: {
'/api': {
target: 'http://xxxxxxxx:8000', // 代理服务器路径
pathRewrite: {'^/api' : '/'}, // 重写路径
changeOrigin: true
}
...
}
}
}

3. canvas: getImageData,toDataURL

可移步至张鑫旭的文章查看


参考文章: