fasthttp高性能之道（二）

在fasthttp高性能之道（一）中我们简要介绍了fasthttp项目的特点，以及Server端的一些实现思路，本篇将会把关注点从Server端移到Client端，分析一下fasthttp在Client端的实现又有哪些比较有意思的地方。

fasthttp包含四种Client，分别是：

Client
HostClient
PipelineClient
LBClient

我会重点介绍一下HostClient，Client和LBClient各自对HostClient进行了一些封装，PipelineClient相对特殊，实现上的差异点也会介绍一下。

两个例子

首先，和介绍Server一样，我们也来看两个例子：

package main

import (
	"log"

	"github.com/valyala/fasthttp"
)

func main() {
	status, body, err := fasthttp.Get(nil, "https://www.baidu.com")
	if err != nil {
		log.Fatal(err)
	}
	log.Printf("status: %v, body: %s", status, string(body))
}

这是一个使用默认Client的例子，这里我们直接调用fasthttp.Get就可以发起HTTP请求了，Get的第一个参数是保存body的byte数组切片，如果你希望重用这个对象，可以传递一个body数组的切片进去，这样可以减少GC。

如果希望更细粒度的控制各种参数，如超时、连接数限制等，可以看下面这个例子：

import (
	"log"
	"time"

	"github.com/valyala/fasthttp"
)

var (
	// HTTPClient global http client object
	client *fasthttp.Client = &fasthttp.Client{
		MaxConnsPerHost: 16384, // MaxConnsPerHost  default is 512, increase to 16384
		ReadTimeout:     5 * time.Second,
		WriteTimeout:    5 * time.Second,
	}
)

func main() {
	req := fasthttp.AcquireRequest()
	req.SetRequestURI("http://127.0.0.1:29898/api/v1/report")
	req.Header.SetMethod("POST")
	req.Header.SetContentType("text/plain")
	req.SetBody([]byte("hello world"))

	resp := fasthttp.AcquireResponse()

	defer fasthttp.ReleaseResponse(resp)
	defer fasthttp.ReleaseRequest(req)

	if err := client.Do(req, resp); err != nil {
		log.Fatal(err)
	}

	log.Println(resp)
}

上面的代码有两个地方需要注意：

MaxConnsPerHost是一个限流的参数，保证对一个Host最大的打开连接数，如果超过这个数字，则会直接拒绝，这里默认值是512，但如果你打算用来做压测之类的事情，需要增加这个值，比如这里我就增加到了16384。
AcquireRequest和AcquireResponse分别从requestPool和responsePool中获取对象，所以用完得记得调用ReleaseRequest和ReleaseResponse把他们还回去，另外需要注意，由于他们是从对象池中获取的，当release之后他们的值可能会被覆盖，相关的处理一定要在release之前进行。

HostClient

我们先从HostClient来分析，它也是Client的基础。

package main

import (
	"github.com/valyala/fasthttp"
	"log"
	"os"
)

var (
	client = &fasthttp.HostClient{
		Addr: "localhost:19898,localhost:29898",
	}
	body = make([]byte, 4096)
)

func main() {
	if len(os.Args) < 2 {
		log.Fatalf("Missing url")
	}
	urls := os.Args[1:]
	for _, url := range urls {
		statusCode, body, err := client.Get(body, url)
		if err != nil {
			log.Fatalf("Error when loading page %s through local proxy: %s", url, err)
		}
		if statusCode != fasthttp.StatusOK {
			log.Fatalf("Unexpected status code: %d. Expecting %d", statusCode, fasthttp.StatusOK)
		}
		log.Printf("body: %s\n", string(body))
	}
}

我们先通过上面的例子来了解HostClient一些有趣的特点，将上面的代码保存为hostclient.go，执行go build hostclient.go完成编译，然后找两个目录，分别执行python3 -m http.server 19898和python3 -m http.server 29898。

完成这些之后，我们执行./hostclient http://localhost:19898/a.txt http://localhost:19898/b.txt，观察两个python进程的请求日志，会发现第一个请求发送到了监听19898端口的服务，而第二个请求则发给了监听29898端口的服务。

接下来我们把请求地址改成别的，如./hostclient https://www.baidu.com http://www.jd.com，发现请求仍然是发送给了两个Python进程。

现在，让我们来总结一下：

Addr只有一个地址，且请求的URL就是在这个地址上的话，与其它语言的HTTP client没区别
Addr有多个地址，无论URL请求的是哪个，都会在这多个地址上轮转，即一定程度的load balance，所以可以基于此实现反向代理功能
请求URL与Addr不同的时候，Addr扮演了正向代理服务的角色

在深入到HostClient的实现内部之前，我们先来梳理一下HTTP Client的基本思路。我们知道HTTP(s)协议是构建在TCP之上的，作为一个Client，如果我们请求的地址是固定的，我们一般希望保持一个长连接，然后在这个连接之上发送HTTP报文。那么完成一次HTTP请求需要哪些工作呢？简单罗列一下，它一般包括：

DNS请求，将目标域名翻译成IP地址
建立一个到目标IP:PORT的TCP连接
通过TCP连接发送HTTP请求报文
接收HTTP响应报文
重复步骤3~4
结束请求，关闭连接

让那个我们先停下来思考一下，要实现一个高性能的HTTP Client，我们需要注意哪些问题呢？

首先，DNS请求不能太过频繁，如果每次建立连接都要进行DNS解析的话，对DNS服务器的冲击和对请求建连的开销就有点大了。

其次，TCP连接是很昂贵的，我们除了要保证尽可能地复用之外，还需要在连接不需要时，及早将其清理掉。

第三，HTTP的请求和响应是很频繁的，对于Request和Response对象，每次都分配显然是太浪费了，对象池技术在这里非常有用。

第四，如果一个Client同时建立了海量到同一个服务器的连接，那对服务器的压力是很大的，我们应当做一些限制和防范。

fasthttp为了解决这些问题有做了哪些事情呢？

引入了自己实现的TCPDialer，解决DNS和TCP连接管理的问题，关于这一块，我会在下一篇详细介绍
对MaxConns、MaxConnDuration、MaxIdleConnDuration、MaxIdemponentCallAttempts都可以进行控制
对Addr中的地址采用round-robin的方式进行循环

Do方法为HostClient执行请求的核心方法，它的代码如下：

func (c *HostClient) Do(req *Request, resp *Response) error {
	var err error
	var retry bool
	maxAttempts := c.MaxIdemponentCallAttempts
	if maxAttempts <= 0 {
		maxAttempts = DefaultMaxIdemponentCallAttempts
	}
	attempts := 0

	atomic.AddInt32(&c.pendingRequests, 1)
	for {
		retry, err = c.do(req, resp)
		if err == nil || !retry {
			break
		}

		if !isIdempotent(req) {
			// Retry non-idempotent requests if the server closes
			// the connection before sending the response.
			//
			// This case is possible if the server closes the idle
			// keep-alive connection on timeout.
			//
			// Apache and nginx usually do this.
			if err != io.EOF {
				break
			}
		}
		attempts++
		if attempts >= maxAttempts {
			break
		}
	}
	atomic.AddInt32(&c.pendingRequests, -1)

	if err == io.EOF {
		err = ErrConnectionClosed
	}
	return err
}

func (c *HostClient) do(req *Request, resp *Response) (bool, error) {
	nilResp := false
	if resp == nil {
		nilResp = true
		resp = AcquireResponse()
	}

	ok, err := c.doNonNilReqResp(req, resp)

	if nilResp {
		ReleaseResponse(resp)
	}

	return ok, err
}

从Do的实现可以看到，一开始通过for循环对请求进行重试，这里通过MaxIdemponentCallAttempts这个参数和isIdempotent这个判断，来避免在保证客户端请求正确性的基础上，过多地重试对服务端的冲击。而内部实现do则非常简单，基本上是简单封装一下doNonNilReqResp

doNonNilReqResp的主要实现如下（为阅读方便，省去了一些代码）：

func (c *HostClient) doNonNilReqResp(req *Request, resp *Response) (bool, error) {
	// ...
	atomic.StoreUint32(&c.lastUseTime, uint32(time.Now().Unix()-startTimeUnix))

	resp.Reset()

	// ...
	cc, err := c.acquireConn()
	if err != nil {
		return false, err
	}
	conn := cc.c

	resp.parseNetConn(conn)

	// ...
	bw := c.acquireWriter(conn)
	err = req.Write(bw)

	// ...
	c.releaseWriter(bw)

	// ...
	br := c.acquireReader(conn)
	// ...
	c.releaseReader(br)

	if resetConnection || req.ConnectionClose() || resp.ConnectionClose() {
		c.closeConn(cc)
	} else {
		c.releaseConn(cc)
	}

	return false, err
}

这才是真正干活的函数，acquireConn方法用于获取一个连接，当连接数过多的时候，它会直接返回错误，这样就对请求数做了限制，同时它会解析DNS和创建到Host的连接，内部实现也对这两块进行了优化，细节可以参照tcpdialer.go

之后的writer和reader就实现了数据的发送和读取，他们都用到了对象池的技术。

if resetConnection || req.ConnectionClose() || resp.ConnectionClose() {这一行需要注意，当请求方发送了Connection: Close的头或者服务方发送了Connection: Close的HTTP头的情况下，主动关闭连接。一般情况下释放当前连接，留作以后重用就可以了，但是当需要主动关闭连接以释放无用连接的时候，就需要作主动关闭了。

Client

查看Client结构体定义，可以看到它对HostClient进行了封装，里面包含了host到HostClient指针的映射，即：

	mLock sync.Mutex
	m     map[string]*HostClient
	ms    map[string]*HostClient

所以Do方法也只是对HostClient.Do的一些封装。需要注意的是，有一个mCleaner的协程，它会用于清理HostClient里面的无效连接。具体见Client.mCleaner方法。

PipelineClient

PipelineClient跟Client的差别，从名字就可以看出来，跟Client每收到一个Request，都等到Response返回再发送下一个Request不同，PipelineClient会持续的发送Request，同时持续的接收Response，从而很好地提高吞吐率。关于HTTP pipelining技术，可以参照wiki。

在HTTP/2中，类似的技术为multiplexing，事实上，HTTP/1.1标准下，支持pipelining的server不少，但browser却很少。而在实际工作中，我从没这么用过，但如果server是可控的，如希望提供高性能的RPC服务，那么使用PipelineClient是有价值的，一般情况下，建议使用Client。

LBClient

import (
    "fmt"
    "log"

    "github.com/valyala/fasthttp"
)

var (
    lbc fasthttp.LBClient
)

func main() {
    servers := []string{
        "127.0.0.1:8888",
        "127.0.0.1:9999",
    }

    for _, addr := range servers {
        c := &fasthttp.HostClient{
            Addr: addr,
        }
        lbc.Clients = append(lbc.Clients, c)
    }

    var req fasthttp.Request
    var resp fasthttp.Response
    for i := 0; i < 10; i++ {
        url := fmt.Sprintf("http://abcedfg/foo/bar/%d", i)
        req.SetRequestURI(url)
        if err := lbc.Do(&req, &resp); err != nil {
            log.Printf("Error when sending request: %s", err)
            continue
        }
        if resp.StatusCode() != fasthttp.StatusOK {
            log.Printf("unexpected status code: %d. Expecting %d", resp.StatusCode(), fasthttp.StatusOK)
            continue
        }

        log.Println(resp.Body())
    }
}

起两个server，一个在8888端口，一个在9999端口，然后执行上面的代码，通过log可以看到5个请求发给了8888端口，5个请求发给了9999端口。

而如果关掉9999端口的服务，再次测试，会发现，10个请求都发送给了8888端口。

LBClient其实只是在HostClient的基础上加入了轮询及healthcheck，让请求在不同的client上轮转，当某一个client出问题（比如下线）的时候，调度到其它client上。实现上，它在DoDeadline之外，多了一次Healthy检查，仅此而已。

func (c *lbClient) DoDeadline(req *Request, resp *Response, deadline time.Time) error {
	err := c.c.DoDeadline(req, resp, deadline)
	if !c.isHealthy(req, resp, err) && c.incPenalty() {
		// Penalize the client returning error, so the next requests
		// are routed to another clients.
		time.AfterFunc(penaltyDuration, c.decPenalty)
	}
	return err
}

很多人可能已经想到了，借助LBClient，可以很容易地实现一个反向代理服务，在fasthttp高性能知道的第四篇，我们会尝试实现一个这样的服务。

关于Client就介绍到这里，下一篇我们将深入到bytebufferpool，tcpdialer这样的模块内部，看下fasthttp为了提高性能，是怎么在内存分配，连接管理等等地方进行优化的。

Reference

fasthttp client internals