前言
最近学习了一下Tinyhttpd的源码,对http服务器的基本工作原理有了简单的理解,而Tinyhttpd一方面年头较为久远(上个世纪的代码),另一方面基本全部由C语言实现,因此便萌生了用C++从头造轮子的想法,同时加深对TCP、HTTP等协议,socket编程等理解。
HTTP服务器基本工作流程
一个最简单的HTTP服务器,其基本功能主要是接受来自浏览器的http请求,之后根据请求内容返回相应的http response。因此对于我们要实现的最基本的http服务器,首先要完成的就是接受请求和发送响应。
HTTP报文格式
HTTP请求
HTTP请求主要由请求头(header)和请求体(body)构成,中间使用了空行(\r\n)进行分隔,具体结构如图所示
以浏览器访问某一网站为例,在除去最开始的 “请求方法 URL 协议版本” 这一行后,剩余部分均为请求头部字段,没有列出的首行格式形如 GET /index.html http/1.1
HTTP响应
HTTP响应结构与请求类似,分为响应头和和响应体,中间以空行分隔。
响应头首行为 “协议版本 HTTP状态码“(OK可省略),剩余均为头部字段,按需求可自行添加。
基本的HTTP服务器实现
在理解了http服务器的简单工作流程和http请求相关格式后,我们便可以动手编写最基础的http服务器。为了方便各模块抽象,目前主要使用三个类进行基础维护,分别为:HttpServer、HttpRequest、HttpResponse
HttpRequest和HttpResponse
这两个类主要是便于进行http请求的解析与响应报文的构造,也可以方便的看出http请求和响应的简单结构。
HttpRequest结构如下,分别对应了请求报文格式,可以方便的读取头部各字段信息
1 | class HttpRequest{ |
HttpResponse结构如下,对于通用字段单独列出方便快速设置,同时提供自定义字段设置方法,而load_from_file则提供了文件读取相关功能,主要对应于解析请求中的url字段,找到服务器上相应文件进行返回。
1 | class HttpResponse{ |
HttpServer
HttpServer类主要用于维护单个服务器实例,也是服务器的最核心功能。目前的基本功能便是建立套接字,接受请求并返回,其类结构为
1 | class HttpServer{ |
其中startup函数用于创建套接字用于之后监听请求,HTTP协议基于的是TCP协议,因此套接字需正确设置,配置端口号、本地网卡IP等信息,这里为了便于使用,如果不指定端口号会随机使用某一可用端口。
1 | int on = 1; |
在创建了socket后,我们便可使用该socket监听发来的tcp数据包,从中识别出http请求,这部分工作交由start_listen()函数完成
1 | cout<<"httpd running on port "<<port<<endl; |
这里主要使用accept函数保存客户端socket相关信息,在接收到客户端发送的一条请求后,创建一个新的线程用于该请求的处理,具体处理部分如下,主要通过read读取原始数据存入buffer,将该信息交给HttpRequest类进行简单解析,同时利用HttpResponse类构造响应报文,使用send将该响应发送回客户端,之后关闭该套接字。
1 | int client = client_sock; |
至此一条http请求便可以被正确解析并返回,总体流程为:
- 创建server_socket
- 监听某一端口请求
- 接收数据解析请求
- 构造响应报文
- 发送响应,关闭客户端套接字
到这里一个具备基础功能的http服务器已经初具雏形,可以解析简单的http请求,同时根据请求路径读取本地的html文档进行返回,交由浏览器展示。之后我们会不断完善该服务器,实现更复杂的一些功能。