储存性能由硬件属性限制，而网络应用则由网络链接限制。计算机的其他部分都远快于网络链接部分。

好的网络代码拥抱网络链接的限制。你需要知道背后到底发生了什么来得到更好的结果。尽管这样，还是有机会在限制之下构建高效的网络世界。

基础问题

网络问题有三个因素：吞吐量、延迟以及可靠性。吞吐量是数据的传输率。延迟是数据从一个兰链接到另一个所需要的时间。Round Trip Time（RTT）是一次连接收到返回需要的时间。

可靠性是之前没有提到的一个因素。如果你绘制一个三角形，那硬件马上就会工作，如果你需要从硬件上读取，你也不需要担心任何复杂的错误情况。

网络传输完全不一样。不仅仅是网络包可能乱序，而且他们也可能损坏、切断甚至是丢失。在最底层你不知道到底发生了啥。

成功的网络系统需要处理这些问题。

传输的类型

每一个操作系统在发布的时候都实现了伯克利Socket。在Mac和Linux上，都是从原始实现派生出来的。在WIndows上有WinSock，作为伯克利API的超集。有一些别的不一样的技术，但是总的来说网络技术伯克利已经定义了标准。

第一个差异是可靠性。你可以自己处理也可以交给系统。这主要在TCP和UDP上区分。在UDP里面你可以发送和接受报文，但是没有固定的链接的概念。数据报文可能丢失、失败或者乱序。你需要自己处理这种情况。实际网络的特性暴露在你面前，你可以更少卷入操作系统中。

TCP，Transmission Control Protocol，你发数据类似于文件系统的时候。数据保证是按顺序交付的。另外一方面，网络栈保证数据按照另一端的发送顺序收到并且保证无丢失。这通过一些开销保证有效实现。

另一个网络之间的差异是客户端服务端构架和对等的。不同的游戏采用不同的方法来做。游戏类型和玩家人数来决定使用哪种方式。还有很多其他资料在性能方面讨论这方面，所以可以看一下章节最后的推荐资料。

现在讨论一下更多可靠性的细节已经在游戏中时如何起作用的。

有两个主要的需要思考传输的条件：可靠性和顺序性。

数据交付可靠或者不可靠。可靠的表示除非链接断开，否则一定会在另一侧接收到。而不可靠则是有一定概率数据丢失，虽然成功率还是比较高的。

是否按顺序则是保证你是否发送信息123然后收到也是按照123.

按照这种区分可以看到4种类型的报文：

可靠有序
可靠无序
不可靠有序
不可靠无序

在接下来的部分我们可以看到不同类型的游戏使用不同的报文类型。

有一点需要理解的是TCP的实现基于UDP的报文，这意味着你可以自己实现TCP类似的协议，而且你可以有更多的控制权。

在这章的末尾，我们会讨论中间件。一些开源一些闭源，可以帮助你在网络游戏中工作。

游戏状态和事件

我们已经讨论了从网络获取数据buffer的不同方式。一旦你有能力控制数据流，你可以继续讨论不同的交付需求以及不同的数据。两个主要的游戏数据，一个是事件以及最近的游戏状态数据。

事件一般就是RPC，一般需求时可靠的。

而近期的状态基本就是状态同步之类（非帧同步）的，有大量的object的属性需要同步，一般来说非可靠也是可以接受的。

比如门有没有开，你可以通过1bit的数据来表示。但是如果是乱序数据的话最好是要拒绝老的数据，或者已经处理过的数据，在TCP上容易处理，UDP的话就需要小心一些。

不光是门。Gameplay相关的大部分数据都需要通过网络状态同步。

你要模拟每个端的行为的时候这个方法可能不是很好。大部分近期状态都是近似结果。举个例子玩家控制需要在每一帧非常吻合，并且符合玩家输入。否则作弊就可能发生，并且有artifacts，例如玩家穿墙。

解决方法是从客户端发消息的逻辑转移到服务器计算逻辑。这样服务器可以回放客户端的移动，服务器是权威的话就可以发送全精度的玩家更新信息。P2P的情况下可以吧客户端替换成玩家端，而把服务器替换成其他玩家端。

带宽和bit打包和网络包

当我们发送消息前，我们需要知道如何编码网络包。之前我们已经知道了有大量的游戏状态需要同步，如果我们分开把这些状态同步出去，那是大量的网络包，导致大量的overhead。

**首先带宽保证还原度。**你更有效利用带宽或者你可以用更多的带宽，那么有更多的状态可以同步出去，那大家的世界状态也就更一致。比如每个人都可以获得全精度的世界，在每个包里面，但这基本上是不可能的，所以系统必须能够在每个包里面发送足够多的状态。

你想要尽可能减少更新，基本的工具就是如何打包数据。你应该能有更多的方式去打包数据。Ken一对浮点等用不同的精度去打包，比如生命值不需要太多的位去打包。整数经常在可知范围内所以也可以更高效打包。

在你使用bitstream打包之后，你可以使用一些编码科技。下图显示了如何将这些方法整合起来。

View of the game protocol-encoding stack. At the lowest level is the network transport that transmits bytes. Above this, the bitstream, which allows bit-level encoding. Above this, various context-specific options like LZW, Huffman encoding, or decimation. And on top, the various kinds of updates that your game sends.

哈夫曼编码对string有用，你或许想要一个共享的字符串池，然后用index索引而不是发送整个字符串。你可以使用LZW压缩对于大体量数据。有更多的高级技术例如：算数编码利用统计学的优势来组织。

你的更新越少，你就可以在包内发送更多的数据，更有效的按优先级排序，用户的体验也就越好。

**其次是有效得让数据优先级排序。**对于每一个网络包，你希望填入最重要的数据，然后发送更少的重要数据如果你有空间的话。对于最近的状态你可以用启发式地进行发送，而非通过时间来判断。通过举例或者游戏重要性来判断。一个飞向玩家的发射物远比一个缓慢移动的载具更重要。

**第三个是只发送你必须发送的。**为了保存带宽并且防止作弊。检查可能需要花一些工作，如果你有任何的区域，潜在可见性集，或者一个最小的视锥，可以工作得很好。基本上差不多准确到最差的情况就可以了。你可以从玩家眼睛中发射线来判断是不是可见。跳过不可见物体可以帮你节省大量的带框。跳过更新不可见物体有巨大的好处。客户端不知道除了和玩家有接触的事物以外的世界的变化，可以节约带宽以及处理起性能。

裁剪和优先级更新不一样。在低优先级更新你或许希望客户端知道物体的更新。比如树可能是很低优先级但是依旧油管。另一方面，墙的另一侧的敌人的移动对于玩家而言是非常重要的，但是你可能会希望省略它的信息来防止作弊。

你的网络包里还有一些需要注意的。保证网络包不要太大。最大的网络包差不多1400bytes是安全的（现在已经过时了吧）再大的网络包就可能出现丢包的情况，损坏或者切断。一个快速说明：以太网的MTU（Maximum transmission unit）是1500bytes。因为大部分英特网基于以太网，所以这是一个比较合适的尺寸。如果你减去包头的体积，压缩和传输的overhead，差不多就在1400bytes左右。选择这个大小给你一些缓冲的区间。

保证你有规律的发送网络包。路由器给使用带宽的人进行分发。如果你的带宽使用变化很大，路由器倾向于分配给其他使用带宽的用户。所以最好发送固定的尺寸以固定的频率。举个例子，你或许每秒发送10个800byte的包。你可以基于玩家连接、服务器负载来决定这个值。

如何优化网络

优化网络代码也遵循相同的周期：profile、改变、再次测量，就和其他的优化工作一样。瓶颈有点不一样。计算一般不是瓶颈，因为网络连接更慢。为了优化玩家体验，意味着你需要降低延迟，并且保持还原度。

首先让操作系统做你想做的事情。大部分应用程序端到端传输大数据，比如FTP，不关心系统内部发生了什么。操作系统本身就支持，只不过有延迟。

如果你的网络IO线程在主线程，你会希望去使用非阻塞IO，这样你就可以去做其他有价值的工作，例如绘制之类的。大部分操作系统通过设置fcntl或者ioctl之类的都可以做到。write和read一次性返回传输队列中的数据，read和rev可以等待数据完成或者直接返回表明没有数据可用。如果连接是阻塞的，就需要等待，默认保证协议可以正常运行。因为连接表现得像文件系统，如果是非阻塞的，那么应用程序可以检测是否有新的数据然后正确的进行处理。

网络性能的关键是——处理它。拥抱网络本身就有的问题。操作系统企图通过buffer和延迟来让网络看上去像线性流。

说到buffer需要注意Nagle算法。你在发送很多小包的时候会带来网络的overhead，大概是40bytes的数据会附带，实际上是无用数据。通过将小包合并来降低overhead。你可以通过TCP_NODELAY（POSIX的一部分）来关闭这个功能，如果你希望更多对TCP包地控制就可以打开。

有时候让TCP去做你想做的事情有点蠢。虽然有时候你确实会用到TCP，但是大部分时候最好自己在UDP之上进行实现，因为像Nagel算法有时候并不是光在操作系统中需要处理的东西，在每个端都会发生。网络调度可以根据当前的网络情况来动态调整。病毒检查会延迟交付，直到知道所有的数据是安全的为止。TCP更容易通过每个连接的基础去理解，但是会干扰对客户端或服务器的理解。

UDP是控制更好的选择。因为它是无连接的，大部分调度硬件和软件不干涉它。而且直接暴露了网络的特性：乱序、延迟、丢包等。

另一个问题是过于频繁的网络通信超过了目前带宽。所以压缩在现在的发展这么好。

压缩让你有了trade-off的机会，你可以把计算力和带宽使用做一个tradeoff。就像jpg在压缩后需要等待解压才能使用。

最好的优化带宽的使用方法是添加一个Counter来计算各个种类的数据使用占比。

另一个性能的overhead来自于连接。一般P2P的压力会更大。大部分的网络服务都可能遭到拒绝服务攻击。你需要同时考虑连接处理和连接活跃的时候的性能消耗。

在连接处理过程中有玩家无效的风险。如果设计得不好，那很容易就发起大量的连接用完所有的服务器资源。正常的玩家都因为网络情况或者防火墙一直重试，无法连接，浪费资源。

好的解决方案是通过验证码来避免简单的客户端网络连接。

连接时的计算复杂度过高也会严重影响连接数量。

小心DNS查找，通过名字来查找（gethostbyname）是非常慢的。

一般的方法是把DNS查找放在另外一个线程，这样就可以非阻塞。

拥抱失败

在本地网上任何游戏都能跑得很快，所以在测试的时候需要添加一些丢包、弱连接。好的方法是拥抱失败：

假装高延迟：测试高延迟的情况，100ms是比较好的假设。一些游戏中的玩家深圳可以到达500ms的延迟。保证你的游戏不会因为短期的网络问题而down掉，因为再好的网度可能有不好的时候。
预期中有丢包的情况：如果你用耳朵UDP。那20%的丢包也是正常的你要保证偶尔的20~30秒没有任何包的情况
每一个人都想攻击你：大部分时候DDOS攻击有计划的。但是也可能是周期性的大量请求。Bug也可能发生DoS，例如客户端疯狂重连。用最坏的情况做假设，解决代码中可能出问题的地方。

欺骗用户

最好的网络体验，就是欺骗用户。主要就是从游戏的状态上进行处理。

人类的眼睛对于跳变的东西特别敏感，但是如果是顺滑改变的则不会有这么高的注意力。

对于游戏状态也是用插值修改，位置不要直接设置还是顺滑移动。你可以通过预判的方式来在客户端先进行预表现，直到你得到服务器的确认。

这种方法称作dead reckoning。因为许多物体倾向于以固定模式移动，你可以按照这种方式尝试给不同的物体采用物理。线性差值一般都大差不差，如果不行的话就尝试自己猜未来的走向。你使用更多的数据就猜得越准。但是要小心的是你等待更新的时间越长，越可能出现错误的猜测。纠正错误可能会导致不自然的移动，误导玩家。

一般的场景

使用网络的场景一般有以下一些：

资源下载

大量游戏需要更新或者补丁。MMO可能要stream世界资源，或者游戏需要和web服务交互。所有这些都需要大量保证交付的有顺序的数据。

大部分的解决方案就是直接用TCP。在大部分的情况下如果你只需要直接使用HTTP。类似于libcurl的库可以很方便的传输。http很容易部署或者直接使用内容分发网络。

内容分发网络像亚马逊的CloudFront是第三方的服务器，可以优化大体积消息的交付。

流式传输音频或视频

音视频流更有挑战性。玩家语音需要实时性，所以需要做一些质量压缩。这是最简单的有损场景，因为数据只要尽快传过去就好了，即使丢失了也不用重传。

这种方法需要有损压缩，不过好的事情是有大量有损压缩的方案。

聊天

聊天是常见的请求，很容易实现。消息需要使用不丢失并且有序的方式传输。带宽不大，并且也很简单。

但是当你在面对成千上万个玩家的时候这个就会成为瓶颈。

你可以使用LZW压缩，Huffman编码或者查找表来降低带宽。也可以直接用zlib的compress在发送之前。

因为聊天不是延迟敏感的，所以也可以不放在最高优先级。

Gameplay

Gameplay更困难。延迟很重要，例如RTS或者FPS你只关心最近的状态，不像聊天需要了解每句话。

一种特殊情况是被每个玩家操作的物体。很明显这不是RTS或者FPS的需求。只发送最近的状态你无法感觉正确。这种情况下需要高进度返回服务器的状态，每个时间戳的移动，这样才能还原每个玩家的操作。

Profiling网络

在了解延迟以及其他的网络特性之后，有没有什么别的优化网络的可能性呢。怎么样才能提高玩家体验?

首先确定网络层代码是否足够高效。你应该小心定位是否有任何瓶颈，并且优化它。使用benchmark以及小心测量，来确定是否有浪费计算或者内存。在大部分的游戏中，网络代码使用了最少量的CPU时间，相比于渲染、物理和gameplay。

第二，暴露你的网络层行为，特别是包数量以及带宽如何使用的。添加计数代码可以看出每种类型的Object的更新频率和情况，以此来定位问题。

有时候一个物体可以导致大量的网络包，有可能是游戏中的物体数量导致的，也可能是因为实现得有问题。为了优化网络性能，你可以减少相关Object的数量，或者使用更少的update或者update的尺寸。降低精度或者更高效的编码。寻找机会不发送任何东西。

第三，小心客户端和服务器不通不的情况。这种情况应该尽可能减少，特别是涉及到玩家角色的。

最后侵略性地优化可察觉的延迟。玩家的输入和反馈应该只需要一帧，如果你想让你的游戏更顺滑的话。

如何在你的游戏中构建优良的网络环境

要正确得最大化潜在的网络性能，需要做大量的基础工作，很难正确设置，而且游戏之间都差不多。所以使用库会比较好。

有大量的网络游戏库。我们很推荐OpenTNL。开源并且对用户十分友好。

当然这不是唯一的选项：RakNet、ENet以及Quazal也是选择。Quake1到3都是开源的。UE2和3，unity3D以及Torque有好的网络。

额外的阅读：

‘‘Networking for Game Developers’’ (http://gafferongames.com/networking-for-game-programmers/) 系列文章。GDC08年的讲座“Robust, Efficient Networking”(http://coderhump.com/austin08/)。每一个游戏精粹书都有网络的文章。Yahn Bernier

的文章也不错。(http://developer.valvesoftware.com/wiki/Latency_Compensating_Methods_in_Client/Server_In-game_Protocol_Design_and_Optimization)

如果你决定使用你自己的网络层，最好一开始就设计到你的游戏中，并且在不利环境下大量测试。很多自己实现网络层的游戏到最后都有很多难以解决的困难。

Video Game Optimization——网络

基础问题

传输的类型

游戏状态和事件

带宽和bit打包和网络包

如何优化网络

拥抱失败

欺骗用户

一般的场景

资源下载

流式传输音频或视频

聊天

Gameplay

Profiling网络

如何在你的游戏中构建优良的网络环境

结论

发表回复取消回复

基础问题

传输的类型

游戏状态和事件

带宽和bit打包和网络包

如何优化网络

拥抱失败

欺骗用户

一般的场景

资源下载

流式传输音频或视频

聊天

Gameplay

Profiling网络

如何在你的游戏中构建优良的网络环境

结论

发表回复 取消回复

发表回复取消回复