创建一个TCP代理

代理技术

代理一般被我们用于“穿墙”,具体来说可以看这里,或者查wiki。理解代理背后的原理之后,便很容易知道,代理的作用不仅仅只是“穿墙”。例如我们可以把经过代理的流量拦截下来,修改或干其他你喜欢做的事情,再发送出去。相当于你送礼要经过第三方时,这个第三方可以对你的礼物做点手脚,比如抽点水什么的。


具体代码

import sys
import socket
import threading

def server_loop(local_host, local_port, remote_host, remote_port, receive_first):
    server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

    try:
        server.bind((local_host, local_port))  #监听本地端口,等待连接
    except:
        print("[!!] Failed to listen on %s:%d" % (local_host, local_port))
        print("[!!] Check for other listening sockets or correct permissions")
        sys.exit(0)
    print("[*] Listening on %s:%d" % (local_host, local_port))

    server.listen(5)

    while True:
        client_socket, addr = server.accept()

        #打印出本地连接信息
        print("[==>] Received incoming connection from %s:%d" % (addr[0], addr[1]))

        #开启一个线程与远程主机通信
        proxy_thread = threading.Thread(target=proxy_handler, args=(client_socket, remote_host, remote_port, receive_first))

        proxy_thread.start()

def main():
    if len(sys.argv[1:]) != 5:
        print("Usage: ./proxy.py [localhost] [localport] [remotehost] [remoteport] [receive_first]")
        print("Example: ./proxy.py 127.0.0.1 80 www.baidu.com 80 True")
        sys.exit(0)

    #设置本地监听
    local_host = sys.argv[1]
    local_port = int(sys.argv[2])

    # 设置远程目标
    remote_host = sys.argv[3]
    remote_port = int(sys.argv[4])

    #告诉代理在发送数据给远程主机之前,是否先连接远程主机和接受远程主机发过来的数据
    receive_first = sys.argv[5]

    if "True" in receive_first:
        receive_first = True
    else:
        receive_first = False

    server_loop(local_host, local_port, remote_host, remote_port, receive_first)

def proxy_handler(client_socket, remote_host, remote_port, receive_first):
    remote_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    remote_socket.connect((remote_host, remote_port))

    #如果receive_first为True,那么,我们先从远程主机接收数据
    if receive_first:
        remote_buffer = receive_from(remote_socket)
        hexdump(remote_buffer)

        # 发送给我们的响应处理
        remote_buffer = response_handler(remote_buffer)

        #如果我们有数据发送个本地客户端,发送它
        if len(remote_buffer):
            print("[<==] Sending %d bytes to localhost." % len(remote_buffer))

        #现在我们从本地循环读取数据,发给远程主机和本地主机
        while True:
            local_buffer = receive_from(client_socket)

            if len(local_buffer):
                print("[==>] Received %d bytes from localhost." % len(local_buffer))
                hexdump(local_buffer)

                #发送给我们的本地请求
                local_buffer = request_handler(local_buffer)

                #向远程主机发送数据
                remote_socket.send(local_buffer)
                print("[==>] Send to remote")

            #接受响应数据
            remote_buffer = receive_from(remote_socket)

            if len(remote_buffer):
                print("[==>] Received %d bytes from remote host." % len(remote_buffer))
                hexdump(remote_buffer)

                # 发送到响应处理程序
                remote_buffer = response_handler(remote_buffer)

                # 将响应发给本地socket
                client_socket.send(remote_buffer)
                print("[<==] Send to localhost")

            if not len(local_buffer) or not len(remote_buffer):
                client_socket.close()
                remote_socket.close()
                print("[*] No more data. Closing connections.
")

                break

def hexdump(src, length=16):
    result = []
    digits = 4 if isinstance(src, unicode) else 2

    for i in xrange(0, len(src), length):
        s = src[i:i+length]
        hexa = b' '.join(["%0*X" % (digits, ord(x)) for x in s])
        print(hexa)
        text = b''.join([x if 0x20 <= ord(x) < 0x7F else b'.' for x in s])
        result.append(b"%04X    %-*s    %s" % (i, length*(digits + 1), hexa, text))
        print(b'
'.join(result))

def receive_from(connection):
    buffer = ""

    #我们设置了两秒超时,这取决与目标的情况,可能需要调整
    connection.settimeout(2)

    try:
        while True:
            data = connection.revc(4096)
            if not data:
                break
            buffer += data
    except:
        pass

    return buffer

def request_handler(buffer):
    return buffer
def response_handler(buffer):
    return buffer

main()

这里要说的有几个函数:

  1. request_handler(buffer):这个函数是对请求的数据进行处理,上面代码中这个函数没有做任何事,你可以添加你喜欢的代码,让这个函数做你喜欢的事情。
  2. response_handler(buffer):这个函数是对响应的数据进行处理。具体用法与request_handler一样。
  3. hexdump(src, length=16):这个函数是将数据装换成十六进制,再按照一定的数量整齐排列在显示屏上。
def hexdump(src, length=16):
    result = []
    digits = 4 if isinstance(src, unicode) else 2
    for i in xrange(0, len(src), length):
        s = src[i:i+length]
        hexa = b' '.join(["%0*X" % (digits, ord(x)) for x in s])
        print(hexa)
        text = b''.join([x if 0x20 <= ord(x) < 0x7F else b'.' for x in s])
        result.append(b"%04X    %-*s    %s" % (i, length*(digits + 1), hexa, text))
        print(b'
'.join(result))

length为16,证明每16个字符就为一行。
%0*X:0表示当宽度不够时,用0来填充。如果宽度为2,便有1-->01,宽度为4时,便有1-->0001。星号表示宽度。在上面代码中,宽度由digital来决定。X代表用十六进制表示ord(x)。具体结合后面的输出变很容易明白。这个函数很有趣。


实验

为了完成ftp传输的代理实验,我可真的花了不少时间。因为在部署ftp服务器时,遇见了iptables,于是花了时间了解一下iptables。以前我就指导iptables了,只不过懂得不多。
先来看ftp实验,为了更快达到我们的目的,建议你直接将ftp服务器的防火墙给关了:service iptables stop(注意,不同发行版关闭防火墙的方式不一样)。

令我比较纳闷的地方在于,无论我如何设置,都无法成功连接到ftp服务器。也许是我用的ftp(我用的是vsftpd,而书里用的是proftpd)服务器自动屏蔽代理功能。已经搞了一个多的下午。这里就不搞了,先留个坑,以后知道原因再来补。


现在来看一下代理百度网址,注意,先得将浏览器的代理设置好(图中的端口从21改为80):

再来看结果:


后记

这篇博客写了两天多,因为遇见了很多难题,从ftp部署中遇到防火墙,从脚本执行遇到因升级python不当删除了系统很多重要程序以及库尔导致整个系统奔溃。再一次证明,学无止境。


原文地址:https://www.cnblogs.com/busui/p/6906724.html