cmdb客户端代码完善2

目录:

1.面试提问

2.完善采集端代码

3.唯一标识的问题

4.API的验证

1.面试会问到的问题:

#   1. 为啥要做CMDB?
# - 实现运维自动化, 而CMDB是实现运维自动化的基石
# - 之前公司统计资产的时候,使用Excel来统计, 为了年底资产审计方便,因此需要做CMDB
#
# 2. CMDB的架构以及你们公司采用的架构是啥?
# Agent
# ssh类
# saltstck
#
#
# 3. 你做这个项目的时候, 主要负责哪一块?
#
# - 数据的采集和发送
#
# a.数据的采集:
# - 高级的配置文件 (整合了自定制的配置文件和全局的配置文件)
# - 高内聚低耦合的思想, 实现了插件采集的可插拔式
#
# 参考了django的配置和django的中间件
#
# - 数据的二次清洗和加密
#
#
# - 数据的展示(图表部分)
#
# 4. 遇到了那些问题? 怎么解决的?
#
# - linux的命令不熟 -----> 找运维 或者 百度
# - 沟通问题, 和产品经理的沟通
# - 唯一标识的问题
#     几个人做的?做了多长时间?
#
# 刚开始:
#
# 1-2人做的客户端采集, 1人做API验证和数据清洗 ,1人做的数据的展示 (layui的 xadmin)
#
# 1-2个月的时间, 快速上线
#
#
# 后面:
#
# 1-2人做的客户端采集(代码的迭代), 1人做API验证和数据清洗,也负责用drf写接口 1个前端使用vue展示数据 (前后端分离的)
#
# 完善 1个月左右, 后面的时间就是不断的迭代, 维护, 完善整个项目的功能
5. 此项目花了多长时间? 几个人完成的?

3-4个人左右, 花的时间大概是 4个月:

1个月 : 调研, 排期, 开会选择方案
1-2个月 :项目快速上线 (不需要代码写的多么的好, 快快快) (2-3人 前后端不分离的项目)
1-2个月 :项目的完善 (代码的迭代,扩展性要高, 中间加一些产品经理提出的需求) (前后端分离的项目)

2.完善采集端代码

已经完成了采集数据,现在是要发送数据,一开始想到的是在启动文件中直接写代码

from lib.config.config import settings
import json
import requests

from src.plugins import PluginsManger

if __name__ == '__main__':
    if settings.MODE == 'agent':
        res = PluginsManger().execute()
        requests.post('http://127.0.0.1:8000', data=json.dumps(res))
    else:
        res = PluginsManger().execute()

而逻辑代码是不能写在启动文件中的,所以在src创一个文件client.py

from lib.config.config import settings
import json
import requests

from src.plugins import PluginsManger


 if settings.MODE == 'agent':
    res = PluginsManger().execute()
        requests.post('http://127.0.0.1:8000', data=json.dumps(res))
 else:
    res = PluginsManger().execute()

但是以上又是面向过程的思想,所以要面向对象的思想

服务端的IP地址写在custom_settings。py里

import os

BASEDIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))



MODE = 'agent'


SSH_USERNAME = 'root'

SSH_PASSWORD = '123'

SHH_PORT = 22


### APIurl地址
API_URL = 'http://127.0.0.1:8000/getInfo/'


DEBUG = True


PLUGINS_DICT = {
    'basic':'src.plugins.basic.Basic',
    'board': 'src.plugins.board.Board',
    'disk': 'src.plugins.disk.Disk',
    'memory': 'src.plugins.memory.Memory',
    'cpu':'src.plugins.cpu.Cpu',
    'nic':'src.plugins.nic.Nic'
}

client.py(先对agent采集模式进行测试)

from src.plugins import PluginsManger

import json

import requests

from lib.config.config import settings

class Agent(object):

    #收集数据并发送
    def collectAndPost(self):
        res = PluginsManger().execute()
        for k,v in res.items():
            print(k,v)
        requests.post(settings.API_URL, data=json.dumps(res))

start.py

from src.client import Agent

if __name__ == '__main__':
    Agent().collectAndPost()

起一个django  (我的是2.0版本)  服务端,应用项目是api

from django.contrib import admin
from django.urls import path,re_path

from api import views

urlpatterns = [
    path('admin/', admin.site.urls),
    re_path('getInfo/', views.getInfo),
]

将settings中drf注掉

#      a.   request.body中永远都是有数据的
#
#
# 当 Content-Type: application/x-www-form-urlencoded, request.POST中才会有值
# 当 Content-Type':"application/json" 这是采集端发送数据的头形式

views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):


    print(request.body)

    return  HttpResponse('ok')

shh, salt是通过服务端向db获取hostname主机名数据的,然后再朝客户端shh,salt返回数据库获取到的主机名列表

autoserver服务端

views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':   发送采集数据的话就是post请求
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        return ['c1.com', 'c2.com']  sshsalt发送get请求来获取主机名,返回主机名列表
#      python2:
#
# 进程池 有
# 线程池 无
#
# python3:
#
# 进程池 有
# 线程池 有

使用线程池的方式采集数据,因为可以提高效率,比如一次采集10台服务器的数据

先进行测试
s6.py
#### 线程池

import time
from concurrent.futures import ThreadPoolExecutor



def run(i):
    time.sleep(2)
    print(i)


p = ThreadPoolExecutor(10)

for i in range(100):
    p.submit(run, i)

client.py

from src.plugins import PluginsManger

import json

import requests

from lib.config.config import settings


class Base():    专门用来进行发送数据采集到的数据
    def post_data(self, server_info):
        requests.post(settings.API_URL, json=server_info)


class Agent(Base):  继承base

    #收集数据并发送
    def collectAndPost(self):
        server_info = PluginsManger().execute()
        for k,v in server_info.items():
            print(k,v)
        self.post_data(server_info)  调用函数


class SHHSalt(Base):  继承base
    def get_hostname(self):    发送get请求获取主机名列表
        hostname = requests.get(settings.API_URL)
        return ['c1.com', 'c2.com']    先自定义进行测试一下



    def run(self, hostname):
        server_info = PluginsManger(hostname).execute()
        self.post_data(server_info)


    def collectAndPost(self):

        hostnames = self.get_hostname()

        #单线程执行,循环速度比较慢
        # for hostname in hostnames:
        #
        #     server_info = PluginsManger().execute()
        #     self.post_data(server_info)




        from concurrent.futures import ThreadPoolExecutor

        p = ThreadPoolExecutor(10)
        for hostname in hostnames:
            p.submit(self.run, hostname)

在src新建script.py用于判断mode,再调用不同采集方式的发送数据的方式

script.py

from src.client import Agent

from src.client import SHHSalt

from lib.config.config import settings

def run():
    if settings.MODE == 'agent':
        obj = Agent()
    else:
        obj = SHHSalt()


    obj.collectAndPost()

start.py

from src.script import run
if __name__ == '__main__':
    run()

3.唯一标识码的问题

#      目标:将变更的信息通过程序的比对, 记录下来
#
# 第一天的时候:
#
# 采集数据:
# {'status': 10000, 'data': {'os_platform': 'linux', 'os_version': 'CentOS release 6.6 (Final) Kernel on an \m', 'hostname': 'c2.com'}}
#
# API清洗的时候:
# 因为是第一次, 数据库中并没有采集的数据
#
# 数据入库:
#
# server:1000条
# id sn os_platform os_version disk_size
# 1 dsadsa linux CentOS 250G
# ........
#
# 第二天的时候:
#
# 采集数据:
#
# {'status': 10000, 'data': {'os_platform': 'linux', 'os_version': 'CentOS release 6.6 (Final) Kernel on an \m', 'hostname': 'c2.com'}}
#
# {'status': 10000, 'data': {'0': {'slot': '0', 'pd_type': 'SAS', 'capacity': '300G', 'model': 'SEAGATE ST300MM0006 LS08S0K2B5NV'}, '1': {'slot': '1', 'pd_type': 'SAS', 'capacity': '279.396', 'model': 'SEAGATE ST300MM0006 LS08S0K2B5AH'}, '2': {'slot': '2', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1SZNSAFA01085L Samsung SSD 850 PRO 512GB EXM01B6Q'}, '3': {'slot': '3', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1AXNSAF912433K Samsung SSD 840 PRO Series DXM06B0Q'}, '4': {'slot': '4', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1AXNSAF303909M Samsung SSD 840 PRO Series DXM05B0Q'}, '5': {'slot': '5', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1AXNSAFB00549A Samsung SSD 840 PRO Series DXM06B0Q'}}}
#
# API清洗的时候:
#
# 应该在新的POST数据中选取一个 唯一 的字段, 然后到数据库中作为where条件, 获取到对应的数据
#
# 问题是 应该选取谁?
# 选取的是 sn 序列号(mac地址) 作为唯一的字段
#
# 用sn遇到的问题:
# 虚拟机和实体机共用一个sn, 导致数据不准确
#
# 解决的方案:
#
# a. 如果公司不需要采集虚拟机的信息, 使用sn没有问题
# b. 采用 hostname 作为唯一标识
#
# - 是允许开发可以临时修改主机名的
#
# 引入规则/原则, 流程:
#
# 第一天:
# 1. 给这些服务器分配唯一的主机名
#
# 2. 将分配好的主机名录入到后台管理的DBserver表中
#
# 3. 将采集的client客户端代码, 运行一次,
# 然后将得到的主机名地址保存到一个文件中
#
# 第二天:
#
#
# hostname = server_info['basic']['data']['hostname'] ### c10000.com
# res = open(os.path.join(settings.BASEDIR, 'config/cert'), 'r', encoding='utf-8').read()
#
# if not res.strip():
# #### 第一次采集, 将采集的hostname写入到一个文件中
# with open(os.path.join(settings.BASEDIR, 'config/cert'), 'w', encoding='utf-8') as fp:
# fp.write(hostname)
# else:
# #### 第二次采集的时候, 永远以第一次文件中保存的主机名为标准
# server_info['basic']['data']['hostname'] = res
#
#

 client.py 只有agent才用上

from src.plugins import PluginsManger

import json

import os

import requests

from lib.config.config import settings


class Base():
    def post_data(self, server_info):
        requests.post(settings.API_URL, json=server_info)


class Agent(Base):

    #收集数据并发送
    def collectAndPost(self):
        server_info = PluginsManger().execute()

        hostname = server_info['basic']['data']['hostname']

        res = open(os.path.join(settings.BASEDIR,'conf/cert'), 'r', encoding='utf-8').read()

        if not res.strip():
            # 第一次擦剂,将采集的hostname写入到一个文件中
            with open(os.path.join(settings.BASEDIR,'confcert'), 'w', encoding='utf-8')as fp:
                fp.write(hostname)
        else:
            # 第二次采集的时候, 永远以第一次文件中保存的主机名为标准
            server_info['basic']['data']['hostname'] = res

        # for k,v in server_info.items():
        #     print(k,v)
        self.post_data(server_info)


class SHHSalt(Base):
    def get_hostname(self):
        hostname = requests.get(settings.API_URL)
        return ['c1.com', 'c2.com']



    def run(self, hostname):
        server_info = PluginsManger(hostname).execute()
        self.post_data(server_info)


    def collectAndPost(self):

        hostnames = self.get_hostname()

        #单线程执行,循环速度比较慢
        # for hostname in hostnames:
        #
        #     server_info = PluginsManger().execute()
        #     self.post_data(server_info)




        from concurrent.futures import ThreadPoolExecutor

        p = ThreadPoolExecutor(10)
        for hostname in hostnames:
            p.submit(self.run, hostname)

 3.API验证

客户端test文件夹中新建测试文件先进行测试

test.py

#原始的方式请求数据
import requests


res = requests.get('http://127.0.0.1:8000/getInfo/')

print(res.text)

服务端autoserver进行接受,返回数据

views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']  #如果要返回列表或者字典必须要用jsonresponse发送不然会报错return HttpResponse('非常重要的数据')

客户端发送token

test.py

# 第一种方式
import requests
token = "dangerfad"

# 切记,进行token验证的时候一定是将token写在http的请求头中
requests.get('http://127.0.0.1:8000/getInfo/', headers={"token":token})

服务端views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']

         print(request.META)  #可以获取到HTTP_TOKEN也就是我发过来的token
return HttpResponse('非常重要的数据')

第一种方式完整版

client.py

# 第一种方式
import requests
token = "dangerfad"

# 切记,进行token验证的时候一定是将token写在http的请求头中
res = requests.get('http://127.0.0.1:8000/getInfo/', headers={"token":token})
print(res.text)

服务端views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']

         token = request.META
         server_token = "dangerfad"
         if token != server_token:
             return HttpResponse("token值是错误的")
         return HttpResponse('非常重要的数据')

 设置超时时间,失效token不能再访问

服务端views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']

         token = request.META.get('HTTP_TOKEN')
         print(token)
         client_md5_token,client_time = token.split('|')

         client_time = float(client_time)
         import time
         server_time = time.time()

         if server_time -client_time > 5:
             return HttpResponse('第一关【超时了】')


         server_token = "dangerfad"

         tmp = "%s|%s" % (server_token, client_time)

         import hashlib
         m = hashlib.md5()
         m.update(bytes(tmp, encoding='utf8'))
         server_md5_token = m.hexdigest()


         if server_md5_token !=client_md5_token:
             return HttpResponse("第二关数据被修改了")

         return HttpResponse('非常重要的数据')

客户端test.py

#第二种方式
import requests

token = "dangerfad"
import time
client_time = time.time()
tmp = "%s|%s"%(token, client_time)



import hashlib
m = hashlib.md5()
m.update(bytes(tmp, encoding='utf8'))
res = m.hexdigest()
print(res)

client_md5_token  = '%s|%s' %(res, client_time)


data = requests.get('http://127.0.0.1:8000/getInfo/', headers = {"token":client_md5_token})

print(data)

 以上还存在一些问题:

client向server在五秒之内发送请求过了一关,紧接着将token发送给服务端,服务端拿到token之后进行解析认证,这是正常用户。

如果说一个黑客,在2s访问完了服务端,然后生成token

 ,迅速在第3s的时候截取你刚刚访问的token,然后拿到token之后不做任何处理,然后再向服务端发送请求,可以通过验证。

 解决:客户端的token只能用一次就好了,在服务端只能让你访问一次token,将客户端的token存起来,如果存在数据库或者文件里面,每天如果频繁去发送的话,这个文件或数据库记录越来越多,然后之前的client_md5_token过期了就没用,所以要存在一个定期清理一些我们不需要的数据的介质里面,存在redis里面(听下回详解)

# 第一次来的时候,先去redis判断client_md5_token是否在redis中,如果在就代表已经访问过了,直接return回去
#如果不在redis第一次访问就添加到redis中并且设置过期时间:5s


总结:
1. 完善了采集端的代码:

- 完善了发送 (agent 和 sshsalt的发送)

class BASE():
def post_data():
requests.post(API_URL)

class Agent(Base):

def collectAndPost():
1. 收集服务器的信息
2. self.post_data()

class SSHSalt(Base):
def collectAndPost():
1. 获取服务器主机名列表,收集服务器的信息
2. self.post_data()



- 改进了sshsalt的登录并发执行:

python2:
线程池 无
进程池 有

python3:
线程池 有
进程池 有


2. 唯一标识的问题:

之前的方法:
sn
改进的方法:
hostname
遵守一些规则:
1. 给这些服务器分配唯一的主机名

2. 将分配好的主机名录入到后台管理的DBserver表中

3. 将采集的client客户端代码, 运行一次,
然后将得到的主机名保存到一个文件中

3. API验证:

第一关:
验证时间是否超时

server_time - client_time > 3

第二关:

对数据由原来的的明文 加密成现在的密文

md5() : 不可逆的算法 sha256 sha128

第三关:
只允许 client_md5_token 只能用一次

redis:
- 速度快
- 设置超时时间 10S

JWT
原文地址:https://www.cnblogs.com/huangxuanya/p/11626920.html