Tor源码分析十一 — 客户端执行流程(网络信息的下载续)
通过上一节中我们对连接和链路的重新描述,我们可以继续进行源码的分析了。在本节中,我们会开始着重讲述链路的建立,以及链路所基于的OR连接的建立,同时还有部分Libevent调度的再度分析。大家会明白,进行到此处之时,我们已经开始接触Tor系统最底层,最深藏着的连接机制以及调度机制。这个部分,是整个系统的精髓。后期几乎所有的应用请求连接处理等,都是重复地使用该部分的代码。
1. 链路建立以及OR连接的开始,circuit_establish_circuit
我们在此处重新分析下链路建立的函数:
/** Build a new circuit for purpose. If exit
* is defined, then use that as your exit router, else choose a suitable
* exit node.
*
* Also launch a connection to the first OR in the chosen path, if
* it's not open already.
*/
origin_circuit_t *
circuit_establish_circuit(uint8_t purpose, extend_info_t *exit, int flags)
{
origin_circuit_t *circ;
int err_reason = 0;
circ = origin_circuit_init(purpose, flags); //链路初始化;
if (onion_pick_cpath_exit(circ, exit) < 0 || //选取链路出口结点;
onion_populate_cpath(circ) < 0) { //选取链路入口结点及中间结点;
......
}
if ((err_reason = circuit_handle_first_hop(circ)) < 0) { //开始向链路第一个结点发送建立OR连接的请求;(OR连接建立于TLS连接之上)
......
}
return circ;
}
像之前我们所描述的那样,函数内部主用做的工作包括三点:初始化链路结构体;选择链路结点;建立到链路中第一个结点的连接。此处需要说明的是,初始化链路结构体和选择链路结点的操作均是简单的。所以我们在接下来的分析中,不再详细追究这两个部分操作的具体细则,而是将我们的重心放在链路建立的实际操作部分。如果对选择结点部分有疑问,可以细细分析上述的两个结点选择函数,相信在其中可以找到结点选择策略和相关机制。但是,结点如何选择并不是程序执行流程的重点,所以我们接下来还是要着重分析函数:circuit_handle_first_hop。
2. OR连接建立以及链路拓展,circuit_handle_first_hop
在客户端完成链路的初始化和链路中结点的选择之后,即将开始建立到第一个链路结点的OR连接。但是这个时候还有个复用的问题,也就是我们前面提到过的多条链路可以共享一个OR连接的情况。试想一下,当一条链路选择完所有链路中的结点,此时它要向第一个链路结点发送OR连接的请求。如果客户端主机到选中的结点主机已经存在一条OR连接,是否需要重新相连呢?显然,没有必要。所以我们可以在一条OR连接上复用多条链路。于是我们将会看到代码中出现判断是否已经存在可用OR连接的部分操作。接下来我们直接看代码:
/** Start establishing the first hop of our circuit. Figure out what
* OR we should connect to, and if necessary start the connection to
* it. If we're already connected, then send the 'create' cell.
* Return 0 for ok, -reason if circ should be marked-for-close. */
int
circuit_handle_first_hop(origin_circuit_t *circ)
{
......
firsthop = onion_next_hop_in_cpath(circ->cpath); //按序选中链路中第一个未标记为打开的结点;在该函数中,实际上每次选中的都是链路入口结点;
n_conn = connection_or_get_for_extend(firsthop->extend_info->identity_digest, //获得可以复用的OR连接;
&firsthop->extend_info->addr,
&msg,
&should_launch);
if (!n_conn) { /* not currently connected in a useful way. */ //如果没有可以复用的OR连接,则重新建立到首结点的OR连接;
circ->_base.n_hop = extend_info_dup(firsthop->extend_info);
if (should_launch) { //建立到首结点的OR连接执行函数:connection_or_connect
n_conn = connection_or_connect(&firsthop->extend_info->addr,
firsthop->extend_info->port,
firsthop->extend_info->identity_digest);
}
return 0;
} else { /* it's already open. use it. */ //如果有可以复用的OR连接,则发送create包以告知远端结点开启一条新的链路;
circ->_base.n_conn = n_conn;
if ((err_reason = circuit_send_next_onion_skin(circ)) < 0) {
......
}
}
return 0;
}
我们可以理解,复用与否,是针对链路首节点的OR连接而言的。对于其他结点,本地客户端是不直接与他们进行OR层次上的沟通的,而是通过链路拓展来进行交流。所以,针对第一个结点,本地客户端既要实现OR层次的互联,又要完成链路层次的交流,就是发送create包以告知链路的开启。针对其他结点,本地客户端只是通过向第一个结点发送链路层的命令包,以实现链路层面上的沟通。
从上述函数我们可以看到两个关键分支:向第一个结点发起OR连接请求的分支;复用OR连接,直接向第一个结点发起新链路开启命令的分支。我们这里按照系统的常规流程,先分析系统中一个OR连接都没有的情况。也就是说,我们此处默认系统中没有满足链路要求的OR连接,那么程序需要开始建立从本地到链路首结点的OR连接。
3. OR连接建立的细节
OR连接的建立是基于TLS连接的基础之上的,所以要想真正建立可用的OR连接,需要完成TLS握手。但是,握手过程需要通信双方经过数轮交换,很显然在一个函数中等待握手结束是极低效的。OR连接建立的细节部分,我们要将关注的重点放在系统是如何设计非阻塞式的TLS握手过程,从而实现高效运行。以下为代码分析:
/** Launch a new OR connection to addr:port and expect to
* handshake with an OR with identity digest id_digest.
*
* If id_digest is me, do nothing. If we're already connected to it,
* return that connection. If the connect() is in progress, set the
* new conn's state to 'connecting' and return it. If connect() succeeds,
* call connection_tls_start_handshake() on it.
*
* This function is called from router_retry_connections(), for
* ORs connecting to ORs, and circuit_establish_circuit(), for
* OPs connecting to ORs. //此处的注释可以说明本函数的重要性;
*
* Return the launched conn, or NULL if it failed.
*/
or_connection_t *
connection_or_connect(const tor_addr_t *_addr, uint16_t port,
const char *id_digest)
{
......
conn = or_connection_new(tor_addr_family(&addr));
/* set up conn so it's got all the data we need to remember */
connection_or_init_conn_from_address(conn, &addr, port, id_digest, 1);
conn->_base.state = OR_CONN_STATE_CONNECTING;
conn->is_outgoing = 1;
/* If we are using a proxy server, find it and use it. */
r = get_proxy_addrport(&proxy_addr, &proxy_port, &proxy_type, TO_CONN(conn));
if (r == 0) { //不使用代理;
......
} else { //使用代理
......//这个部分牵涉到代理的操作,暂时略去,后期会有代理和Bridge专题;
}
switch (connection_connect(TO_CONN(conn), conn->_base.address, //OR连接socket层次的建立操作;
&addr, port, &socket_error)) {
case -1://建立失败
/* If the connection failed immediately, and we're using
* a proxy, our proxy is down. Don't blame the Tor server. */
......
return NULL;
case 0://建立进行中,此情况为一般情况;
connection_watch_events(TO_CONN(conn), READ_EVENT | WRITE_EVENT); //将OR连接的读写事件加入Libevent事件监听队列;
return conn;
/* case 1: fall through *///建立完成,如果socket连接能够非常迅速地建立,则直接进入TLS握手阶段;
}
//此处开始TLS握手阶段,本函数中只有上述socket连接非常迅速地成功完成连接才会执行到此处;
if (connection_or_finished_connecting(conn) < 0) {
/* already marked for close */
return NULL;
}
return conn;
}
上述函数中,最重要的部分就是函数connetion_connect。该函数的作用是进行socket的建立,但是建立的结果因为进行的是非阻塞式的,所以会有三种结果:建立失败-1,正在建立中0,建立完成1。因为socket连接是非阻塞的,所以正在建立中和建立已完成两种情况均有可能出现。若建立完成,则可以直接开始TLS的握手连接;若建立正在进行中,则需要将连接加入Libevent的事件监听列表,以进行监听和后续操作。实际上,这个部分的重点,就是在连接无法马上完成之时的操作:将正在建立中的连接加入到Libevent事件监听队列。此处,我们就隐约感觉到了Tor系统是如何处理需要一定时间才能完成的连接建立操作的。实际上,Tor系统甚至将连接建立的过程都用Libevent事件调度系统来进行调度。当非阻塞的连接建立过程返回时并未完成连接建立操作,则系统将这样的连接加入到Libevent事件池中,下次事件主循环开始时发现该连接可以被操作,则继续该连接的建立和握手操作等。
介绍到此处,我们将OR连接的建立过程介绍完毕。在这个过程中,最重要的部分,就是对于socket连接建立返回值的处理。此时大家可能还没有见到如何对Libevent事件队列中被激活事件进行处理的主要过程,在后面的文章中,我们会再进入主循环的事件处理分析。实际上,就是对读写函数的分析:
1, conn_write_callback;
2, conn_read_callback;