py基础2--列表，元祖，字典，集合，文件

本节内容

列表、元祖操作
字符串操作
字典操作
集合操作
文件操作
字符编码与转码
三元运算&生成式&成员运算&解压法&队列堆栈&数据类型转换

1. 列表操作

列表是我们最以后最常用的数据类型之一，通过列表可以对数据实现最方便的存储、修改等操作

语法

names = ['Alex',"Tenglan",'Eric']

通过下标访问列表中的元素，下标从0开始计数

>>> names[0]
'Alex'
>>> names[2]
'Eric'
>>> names[-1]
'Eric'
>>> names[-2] #还可以倒着取
'Tenglan'

切片:取多个元素　　

>>> names = ["Alex","Tenglan","Eric","Rain","Tom","Amy"]
>>> names[1:4]  #取下标1至下标4之间的数字，包括1，不包括4
['Tenglan', 'Eric', 'Rain']
>>> names[1:-1] #取下标1至-1的值，不包括-1
['Tenglan', 'Eric', 'Rain', 'Tom']
>>> names[0:3] 
['Alex', 'Tenglan', 'Eric']
>>> names[:3] #如果是从头开始取，0可以忽略，跟上句效果一样
['Alex', 'Tenglan', 'Eric']
>>> names[3:] #如果想取最后一个，必须不能写-1，只能这么写
['Rain', 'Tom', 'Amy'] 
>>> names[3:-1] #这样-1就不会被包含了
['Rain', 'Tom']
>>> names[0::2] #后面的2是代表，每隔一个元素，就取一个
['Alex', 'Eric', 'Tom'] 
>>> names[::2] #和上句效果一样
['Alex', 'Eric', 'Tom']

追加

>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy']
>>> names.append("我是新来的")
>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']

插入

>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']
>>> names.insert(2,"强行从Eric前面插入")
>>> names
['Alex', 'Tenglan', '强行从Eric前面插入', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']

>>> names.insert(5,"从eric后面插入试试新姿势")
>>> names
['Alex', 'Tenglan', '强行从Eric前面插入', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']

修改

>>> names
['Alex', 'Tenglan', '强行从Eric前面插入', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']
>>> names[2] = "该换人了"
>>> names
['Alex', 'Tenglan', '该换人了', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']

删除

>>> del names[2] 
>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']
>>> del names[4]
>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']
>>> 
>>> names.remove("Eric") #删除指定元素
>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy', '我是新来的']
>>> names.pop() #删除列表最后一个值 
'我是新来的'
>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy']

扩展

>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy']
>>> b = [1,2,3]
>>> names.extend(b)
>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy', 1, 2, 3]

拷贝

l = ['1','2','3',[1,2,3]]
re = l.copy()
print(l)  # ['1', '2', '3', [1, 2, 3]]
print(re) # ['1', '2', '3', [1, 2, 3]]

l[3].append(4)
print(l)  # ['1', '2', '3', [1, 2, 3, 4]]
print(re) # ['1', '2', '3', [1, 2, 3, 4]]

import copy
ret = copy.copy(l) # 同上的结果，我们称为浅拷贝

ret2 = copy.deepcopy(l) # 2份独立的空看，我们称为深拷贝
print(l)     # ['1', '2', '3', [1, 2, 3, 4]]
print(ret2)  # ['1', '2', '3', [1, 2, 3, 4]]

l[3].append(5)
print(l)     # ['1', '2', '3', [1, 2, 3, 4, 5]]
print(ret2)  # ['1', '2', '3', [1, 2, 3, 4]]

# 浅拷贝是拷贝了一份内存指引，都指向一个地址，为什么这么做，因为PYTHON为了避免数据类型里面有无限大的子集，避免浪费

统计

>>> names
['Alex', 'Tenglan', 'Amy', 'Tom', 'Amy', 1, 2, 3]
>>> names.count("Amy")
2

排序&翻转

>>> names
['Alex', 'Tenglan', 'Amy', 'Tom', 'Amy', 1, 2, 3]
>>> names.sort() #排序
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unorderable types: int() < str()   #3.0里不同数据类型不能放在一起排序了，擦
>>> names[-3] = '1'
>>> names[-2] = '2'
>>> names[-1] = '3'
>>> names
['Alex', 'Amy', 'Amy', 'Tenglan', 'Tom', '1', '2', '3']
>>> names.sort()
>>> names
['1', '2', '3', 'Alex', 'Amy', 'Amy', 'Tenglan', 'Tom']

>>> names.reverse() #反转
>>> names
['Tom', 'Tenglan', 'Amy', 'Amy', 'Alex', '3', '2', '1']

获取下标

>>> names
['Tom', 'Tenglan', 'Amy', 'Amy', 'Alex', '3', '2', '1']
>>> names.index("Amy")
2 #只返回找到的第一个下标

元祖

元组其实跟列表差不多，也是存一组数，只不是它一旦创建，便不能再修改，所以又叫只读列表

语法

names = ("alex","jack","eric")

元组本身是不可变的，但是内部的元素可以是可变类型

2个方法一个 count 一个 index，可以切片，索引取值，成员操作

程序练习

请闭眼写出以下程序。

程序：购物车程序

需求:

启动程序后，让用户输入工资，然后打印商品列表
允许用户根据商品编号购买商品
用户选择商品后，检测余额是否够，够就直接扣款，不够就提醒
可随时退出，退出时，打印已购买商品和余额

2. 字符串操作

特性：不可修改

#!/usr/bin/env python
#_*_coding:utf-8_*_

#strip 方法用于移除字符串头尾指定的字符（默认为空格）。
#str.strip([chars]);
# chars移除字符串头尾指定的字符。 这是一个包含的关系
name = "*joker**"
print(name.strip("*"))
print(name.lstrip("*")) #去除左边
print(name.rstrip("*")) #去除右边

#startswith,endswith
name = "joker_li"
print(name.endswith("li")) #是否以什么结尾
print(name.startswith("joker")) #是否以什么开头

#replace
name = "joker is good joker boy!"
print(name.replace('joker','li')) #所有joker替换li
print(name.replace('joker','li',1)) #从左到右替换1次

#find,rfind,index,rindex,count
name = 'jokerk say hi'
print(name.find('s'))   #字符串也是可以切片找不到则返回-1不会报错,找到了则显示索引
print(name.count('k'))  #统计包含有多少个

#split
name = 'root:x:0:0::/root/:bin/bash'
print(name.split(':')) #默认分隔符为空格
name = 'c:/a/b/c/d.txt' #想拿到顶级目录
print(name.split('/',1)) #按多少次切片,从左边
name = 'a|b|c'
print(name.rsplit('|',1)) #按多少次切片,从右边

#join
tag = ' '
print(tag.join(['joker','li','good','boy'])) #可迭代对象必须都是字符串
#也就是说这个方法是将列表转换为字符串，如果tag有变量的话，就会循环加

#center,ljust,rjust,zfill
name = 'joker'
print(name.center(10,'_')) #不够10个字符，用_补齐
print(name.ljust(10,'*')) #左对齐
print(name.rjust(10,'*')) #右对齐，注意这个引号内只能是一个字符
print(name.zfill(10)) #右对齐，用0补齐就是

#expandtabs
name = 'joker	hello'
print(name)
print(name.expandtabs(4)) #expand扩张的意思，就是将tab建转为多少个空格

#lower,upper
name = 'joker'
print(name.lower()) #大写变小写，如果本来就是小写，那就没变化
print(name.upper()) #小写变大写，如果本来就是大写，那就没变化

#capitalize,swapcase,title
name = 'joker li'
print(name.capitalize()) #首字母大写
print(name.swapcase()) #大小写对调
print(name.title()) #每个单词的首字母大写

#is数字系列
num1 = b'4' #bytes 类型
print(type(num1))
num2 = u'4' #unicode类型，在3里默认就是这个类型
print(type(num2))
num3 = '四' #中文数字
num4 = 'Ⅳ' #罗马数字

#isdigt,bytes,unicode
print(num1.isdigit()) #是不是一个整数数字,如果是浮点数就会False
print(num2.isdigit())
print(num3.isdigit()) #False
print(num4.isdigit()) #罗马数字 False ，不是一个整数

#isdecimal,uncicode
#bytes类型无isdecimal方法
print(num2.isdecimal()) #检查字符串是否只包含十进制字符。这种方法只存在于unicode对象
#注意:定义一个十进制字符串，只需要在字符串前添加 'u' 前缀即可
print(num3.isdecimal())
print(num4.isdecimal())

#isnumberic:unicode,中文数字，罗马数字
#bytes类型无isnumberic方法
print(num2.isnumeric()) #判断是不是数字，包括中文大写数字，罗马数字等
print(num3.isnumeric())
print(num4.isnumeric())

#三者不能判断浮点数
num5='4.3' #全是false
print(num5.isdigit())
print(num5.isdecimal())
print(num5.isnumeric())
# 最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景
# 如果要判断中文数字或罗马数字,则需要用到isnumeric

#is
print('===>')
name='joker123'
print(name.isalnum()) #字符串由字母和数字组成
print(name.isalpha()) #字符串只由字母组成

print(name.isidentifier()) #判断是不是一个合法的表示符
print(name.islower()) #判断是不是小写
print(name.isupper()) #是不是大写
print(name.isspace()) #判断是不是空格
print(name.istitle()) #每个单词字母首字母大小

View Code

3. 字典操作

字典一种key - value 的数据类型，使用就像我们上学用的字典，通过笔划、字母来查对应页的详细内容

语法

info = {
    'stu1101': "TengLan Wu",
    'stu1102': "LongZe Luola",
    'stu1103': "XiaoZe Maliya",
}

字典的特性：

dict 是无序的
key 必须是唯一的，不能重复

增加

>>> info["stu1104"] = "苍井空"
>>> info
{'stu1102': 'LongZe Luola', 'stu1104': '苍井空', 'stu1103': 'XiaoZe Maliya', 'stu1101': 'TengLan Wu'}

View Code

修改

>>> info['stu1101'] = "武藤兰"
>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya', 'stu1101': '武藤兰'}

View Code

删除

>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya', 'stu1101': '武藤兰'}
>>> info.pop("stu1101") #标准删除姿势
'武藤兰'
>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'}
>>> del info['stu1103'] #换个姿势删除
>>> info
{'stu1102': 'LongZe Luola'}
>>> 
>>> 
>>> 
>>> info = {'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'}
>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'} #随机删除
>>> info.popitem()
('stu1102', 'LongZe Luola')
>>> info
{'stu1103': 'XiaoZe Maliya'}

View Code

查找

>>> info = {'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya'}
>>> 
>>> "stu1102" in info #标准用法
True
>>> info.get("stu1102")  #获取
'LongZe Luola'
>>> info["stu1102"] #同上，但是看下面
'LongZe Luola'
>>> info["stu1105"]  #如果一个key不存在，就报错，get不会，不存在只返回None
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'stu1105'

View Code

多级字典嵌套及操作

av_catalog = {
    "欧美":{
        "www.youporn.com": ["很多免费的,世界最大的","质量一般"],
        "www.pornhub.com": ["很多免费的,也很大","质量比yourporn高点"],
        "letmedothistoyou.com": ["多是自拍,高质量图片很多","资源不多,更新慢"],
        "x-art.com":["质量很高,真的很高","全部收费,屌比请绕过"]
    },
    "日韩":{
        "tokyo-hot":["质量怎样不清楚,个人已经不喜欢日韩范了","听说是收费的"]
    },
    "大陆":{
        "1024":["全部免费,真好,好人一生平安","服务器在国外,慢"]
    }
}

av_catalog["大陆"]["1024"][1] += ",可以用爬虫爬下来"
print(av_catalog["大陆"]["1024"])
#ouput 
['全部免费,真好,好人一生平安', '服务器在国外,慢,可以用爬虫爬下来']

View Code

其他操作

#values
>>> info.values()
dict_values(['LongZe Luola', 'XiaoZe Maliya'])

#keys
>>> info.keys()
dict_keys(['stu1102', 'stu1103'])


#setdefault
#setdefault:key不存在则设置默认值，并且将默认值添加到values中
#key存在则不设置默认，并且返回已经有的值
>>> info.setdefault("stu1106","Alex")
'Alex'
>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya', 'stu1106': 'Alex'}
>>> info.setdefault("stu1102","龙泽萝拉")
'LongZe Luola'
>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya', 'stu1106': 'Alex'}


#update 
>>> info
{'stu1102': 'LongZe Luola', 'stu1103': 'XiaoZe Maliya', 'stu1106': 'Alex'}
>>> b = {1:2,3:4, "stu1102":"龙泽萝拉"}
>>> info.update(b)
>>> info
{'stu1102': '龙泽萝拉', 1: 2, 3: 4, 'stu1103': 'XiaoZe Maliya', 'stu1106': 'Alex'}

#items
info.items()
dict_items([('stu1102', '龙泽萝拉'), (1, 2), (3, 4), ('stu1103', 'XiaoZe Maliya'), ('stu1106', 'Alex')])


#通过一个列表生成默认dict,有个没办法解释的坑，少用吧这个
>>> dict.fromkeys([1,2,3],'testd')
{1: 'testd', 2: 'testd', 3: 'testd'}

View Code

循环dict

#方法1
for key in info:
    print(key,info[key])

#方法2
for k,v in info.items(): #因为会先把dict转成list,速度慢，数据里大时莫用
    print(k,v)

程序练习

程序: 三级菜单

要求:

打印省、市、县三级菜单
可返回上一级
可随时退出程序

menu = {
    '北京':{
        '海淀':{
            '五道口':{
                'soho':{},
                '网易':{},
                'google':{}
            },
            '中关村':{
                '爱奇艺':{},
                '汽车之家':{},
                'youku':{},
            },
            '上地':{
                '百度':{},
            },
        },
        '昌平':{
            '沙河':{
                '老男孩':{},
                '北航':{},
            },
            '天通苑':{},
            '回龙观':{},
        },
        '朝阳':{},
        '东城':{},
    },
    '上海':{
        '闵行':{
            "人民广场":{
                '炸鸡店':{}
            }
        },
        '闸北':{
            '火车战':{
                '携程':{}
            }
        },
        '浦东':{},
    },
    '山东':{},
}


exit_flag = False
current_layer = menu

layers = [menu]

while not  exit_flag:
    for k in current_layer:
        print(k)
    choice = input(">>:").strip()
    if choice == "b":
        current_layer = layers[-1]
        #print("change to laster", current_layer)
        layers.pop()
    elif choice not  in current_layer:continue
    else:
        layers.append(current_layer)
        current_layer = current_layer[choice]

4. 集合操作

集合是一个无序的，不重复的数据组合，它的主要作用如下：

去重，把一个列表变成集合，就自动去重了
关系测试，测试两组数据之前的交集、差集、并集等关系

常用操作

# !/usr/bin/env python
# _*_coding:utf-8_*_
# Author:Joker


a = t | s          # t 和 s的并集  
b = t & s          # t 和 s的交集  
c = t – s          # 求差集（项在t中，但不在s中）  
d = t ^ s          # 对称差集（项在t或s中，但不会同时出现在二者中）  

# set 无序，不重复序列

# 创建
# se = {'123',345}
# print(type(se))

# s = set() # 创建一个空集合

# # 对比，之前我们把元祖转换成列表的方法
# l = list((1,2,3))
# print(l)   # [1, 2, 3] 实际里面运行了for循环，也就是init方法
#
# s1 = set(l)
# print(s1)  # {1, 2, 3} 集合还有一个机制就是，如果有相同的就会去除

# 功能
# s = set()
# s.add(1)
# s.add(1)
# print(s)   # {1}
# s.clear()
# print(s)  # 清空


# 差集
s1 = {11,22,33}
s2 = {22,33,44}
# s3= s1.difference(s2)  # s1中存在，s2中不存在 {11}
# s1.difference_update(s2) 更新到s1里面，不需要创建新的集合
# print(s3)

# 对称差集
# s3 = s1.symmetric_difference(s2) # 对称差集 {11, 44}
# s1.symmetric_difference_update(s2)  更新到s1里面，不需要创建新的集合
# print(s3)

# 删除
# s1.discard(11)
# print(s1) # {33, 22} 移除指定元素，不存在不报错

# s1.remove(11)
# print(s1)   {33, 22} ，不存在报错

# ret = s1.pop()  随机的,有返回值
# print(ret)

# 交集
# ret = s1.intersection(s2)
# print(ret)   {33, 22}  
# s1.intersection_update(s2)

# ret = s1.isdisjoint(s2)
# print(ret)   # 没有交集返回true,有交集返回true

# s1.issubset() # 是否是子序列，包含的关系
# s1.issuperset() # 是否是父序列，被包含的关系

# 并集
# ret = s1.union(s2)
# print(ret) {33, 22, 11, 44} 并集

# li = [1,2,3]
# s1.update(li) # 接收一个可迭代的相比add，它可以添加个序列，并且循环执行add
#
# print(s1) # {33, 2, 3, 1, 11, 22}

View Code

5. 文件操作

对文件操作流程

打开文件，得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件

现有文件如下

Somehow, it seems the love I knew was always the most destructive kind
不知为何，我经历的爱情总是最具毁灭性的的那种
Yesterday when I was young
昨日当我年少轻狂
The taste of life was sweet
生命的滋味是甜的
As rain upon my tongue
就如舌尖上的雨露
I teased at life as if it were a foolish game
我戏弄生命 视其为愚蠢的游戏
The way the evening breeze
就如夜晚的微风
May tease the candle flame
逗弄蜡烛的火苗
The thousand dreams I dreamed
我曾千万次梦见
The splendid things I planned
那些我计划的绚丽蓝图
I always built to last on weak and shifting sand
但我总是将之建筑在易逝的流沙上
I lived by night and shunned the naked light of day
我夜夜笙歌 逃避白昼赤裸的阳光
And only now I see how the time ran away
事到如今我才看清岁月是如何匆匆流逝
Yesterday when I was young
昨日当我年少轻狂
So many lovely songs were waiting to be sung
有那么多甜美的曲儿等我歌唱
So many wild pleasures lay in store for me
有那么多肆意的快乐等我享受
And so much pain my eyes refused to see
还有那么多痛苦 我的双眼却视而不见
I ran so fast that time and youth at last ran out
我飞快地奔走 最终时光与青春消逝殆尽
I never stopped to think what life was all about
我从未停下脚步去思考生命的意义
And every conversation that I can now recall
如今回想起的所有对话
Concerned itself with me and nothing else at all
除了和我相关的 什么都记不得了
The game of love I played with arrogance and pride
我用自负和傲慢玩着爱情的游戏
And every flame I lit too quickly, quickly died
所有我点燃的火焰都熄灭得太快
The friends I made all somehow seemed to slip away
所有我交的朋友似乎都不知不觉地离开了
And only now I'm left alone to end the play, yeah
只剩我一个人在台上来结束这场闹剧
Oh, yesterday when I was young
噢 昨日当我年少轻狂
So many, many songs were waiting to be sung
有那么那么多甜美的曲儿等我歌唱
So many wild pleasures lay in store for me
有那么多肆意的快乐等我享受
And so much pain my eyes refused to see
还有那么多痛苦 我的双眼却视而不见
There are so many songs in me that won't be sung
我有太多歌曲永远不会被唱起
I feel the bitter taste of tears upon my tongue
我尝到了舌尖泪水的苦涩滋味
The time has come for me to pay for yesterday
终于到了付出代价的时间 为了昨日
When I was young
当我年少轻狂

基本操作

f = open('lyrics') #打开文件
first_line = f.readline()
print('first line:',first_line) #读一行
print('我是分隔线'.center(50,'-'))
data = f.read()# 读取剩下的所有内容,文件大时不要用
print(data) #打印文件
 
f.close() #关闭文件

常用操作

# !/usr/bin/env python
# _*_coding:utf-8_*_
# Author:Joker



# 打开文件
# f = open('db','r',encoding="utf-8")   # encoding="utf-8"，就是python默认帮你二进制转换成字符串
# f = open('db','w')  # 先清空，后写入
# f = open('db','x')  # 文件存在报错，不存在创建写内容
# f = open('db','a')  # 追加
# f = open('db','rb') # 不用python处理，我直接跟0101打交到

# data = f.read()
# print(data,type(data))  # 银盘存的二进制，给我们显示的是字符串，那是不是有一个二进制转换成字符串的过程
# f.close()

# f = open('db','ab') # 字节追加
# f.write(bytes("hello",encoding='utf-8'))  # 将字符串转为字节，并且以utf-8写入
# f.close()

# + 作用
# f = open('db','r+',encoding="utf-8")
# 因为指针问题，默认读到了最后，如果你定义了读几个字符，那么指针会在第几个字符那里，但是你要追加写的话就是从最后追加
# read 将指针调到某个字符的位置，如果是rb打开就是字节的位置
# data = f.read(1) # 一个字符
# print(f.tell())  # 位置就是3，按字节来的
# print(data)
# # seek 就是按照字节的位置，并且是覆盖原来的字节位置，如果是中文的话，seek1就会给你劈开  �111111 乱码了
# f.seek(1)
# print(f.tell())  # 获取当前指针的位置
# f.write('1111')
# f.close()

# a+ 无论你怎么调指针的位置，都是最后结尾处加内容
# w+ 先清空，在写


# 操作文件
# f = open('db','r+',encoding="utf-8")
# f.read()  # 无参数，读全部，有b按字节，无b按字符
# print(f.tell())  # 获取当前指针位置  字节
# f.seek() # 调转到哪个位置  字节
# f.write()  # 写数据，有b就是写字节，无b就是字符
# f.close() # 关闭文件
# f.flush()   # 强刷到硬盘，之前是存在缓冲区，等待close时候，才会刷到硬盘
# f.fileno()  # 文件描述符，用于后面的socker
# f.readable()  # 判断是否可读，跟模式有关
# f.seekable()    # 判断是否可以移动指针
# f.writable()   # 判断是否可写
# f.readline() # 读取一行，这时候指针换行了
# f.readline() # 读取一行
# f.truncate()   # 截断数据，将指针后面的清空
# for line in f:  # for 循环文件对象，一行一行
#     print(line)

with语句

为了避免打开文件后忘记关闭，可以通过管理上下文，即：

with open('log','r') as f:
     
    ...

如此方式，当with代码块执行完毕时，内部会自动关闭并释放文件资源

程序练习　　

程序1: 实现简单的shell sed替换功能

程序2:修改haproxy配置文件

1、查
    输入：www.oldboy.org
    获取当前backend下的所有记录

2、新建
    输入：
        arg = {
            'bakend': 'www.oldboy.org',
            'record':{
                'server': '100.1.7.9',
                'weight': 20,
                'maxconn': 30
            }
        }

3、删除
    输入：
        arg = {
            'bakend': 'www.oldboy.org',
            'record':{
                'server': '100.1.7.9',
                'weight': 20,
                'maxconn': 30
            }
        }

需求

需求

global       
        log 127.0.0.1 local2
        daemon
        maxconn 256
        log 127.0.0.1 local2 info
defaults
        log global
        mode http
        timeout connect 5000ms
        timeout client 50000ms
        timeout server 50000ms
        option  dontlognull

listen stats :8888
        stats enable
        stats uri       /admin
        stats auth      admin:1234

frontend oldboy.org
        bind 0.0.0.0:80
        option httplog
        option httpclose
        option  forwardfor
        log global
        acl www hdr_reg(host) -i www.oldboy.org
        use_backend www.oldboy.org if www

backend www.oldboy.org
        server 100.1.7.9 100.1.7.9 weight 20 maxconn 3000

原配置文件

原配置文件

6. 字符编码

需知：

1.在python2默认编码是ASCII, python3里默认是unicode

2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节)，utf-8(占1-4个字节)， so utf-16就是现在最常用的unicode版本，不过在文件里存的还是utf-8，因为utf8省空间

3.在py3中encode,在转码的同时还会把string 变成bytes类型，decode在解码的同时还会把bytes变回string

1 以什么编码存的就要以什么编码取出
ps：内存固定使用unicode编码，
我们可以控制的编码是往硬盘存放或者基于网络传输选择编码

2 数据是最先产生于内存中，是unicode格式，要想传输需要转成bytes格式
#unicode----->encode(utf-8)------>bytes
拿到bytes，就可以往文件内存放或者基于网络传输
#bytes------>decode(gbk)------->unicode

3 python3中字符串被识别成unicode
python3中的字符串encode得到bytes

4 了解
python2中的字符串就bytes
python2中在字符串前加u，就是unicode

第一阶段
打开python解释器，notepad++，pychar 加载到内存

第二阶段
写一个文件就是
内存-endoce-bytes(二进制)
显示文件就是
硬盘-decode-unicode(万国码)

第三阶段
执行阶段，针对的是内部定义新的内存空间，例如变量
数据是最先产生于内存中，是unicode格式，要想传输需要转成bytes格式
#unicode----->encode(utf-8)------>bytes
拿到bytes，就可以往文件内存放或者基于网络传输
#bytes------>decode(gbk)------->unicode

python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill）

ASCII（American Standard Code for Information Interchange，美国标准信息交换代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，其最多只能用 8 位来表示（一个字节），即：2**8 = 256-1，所以，ASCII码最多只能表示 255 个符号。

关于中文

为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

GB2312 支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030，对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

从ASCII、GB2312、GBK 到GB18030，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

有的中文Windows的缺省内码还是GBK，可以通过GB18030升级包升级到GB18030。不过GB18030相对GBK增加的字符，普通人是很难用到的，通常我们还是用GBK指代中文Windows内码。

显然ASCII码无法将世界上的各种文字和符号全部表示，所以，就需要新出一种可以代表所有字符和符号的编码，即：Unicode

Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，规定虽有的字符和符号最少由 16 位来表示（2个字节），即：2 **16 = 65536，
注：此处说的的是最少2个字节，可能更多

UTF-8，是对Unicode编码的压缩和优化，他不再使用最少使用2个字节，而是将所有的字符和符号进行分类：ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存...

所以，python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill)

# 第一个测试文件
import sys
print(sys.getdefaultencoding()) # 默认文件编码是Utf-8

s = "你哈"         # 内部还是unicode编码集
print(s.encode()) # utf-8   b'xe4xbdxa0xe5x93x88' py3中，只要进行encode会变成bytes类型
print(s.encode().decode()) # Unicode

s_gbk = s.encode("gbk")
print(s_gbk) # GBK b'xc4xe3xb9xfe'
print(s_gbk.decode('gbk'))  # unicode

gbk_to_utf8 = s_gbk.decode("gbk").encode("utf-8") # gbk转utf8，先用gbk解码成unicoud在进行编码成Utf-8
print("utf8",gbk_to_utf8)


# 第二个测试文件
#-*-coding:gbk-*-  # 文件编码，文件是以gbk编码的，Pycharm右下角显示如果是gbk，这里就写gbk，否则报错，但是对于Py内部还是Unicode编码的比如变量啥的

import sys
print(sys.getdefaultencoding()) # 默认文件编码
__author__ = "Alex Li"

s = "你好" # 这是unicode
print(s.encode("gbk"))      # 编码成了gbk，转成bytes类型
print(s.encode("utf-8"))    # 编码成了utf8，转成bytes类型
print(s.encode("utf-8").decode("utf-8").encode("gb2312").decode("gb2312"))

还要记住存中文，unicode所有存2个字节，utf-8是三个字节

测试文件

7. 三元运算&生成式&成员运算&解压法&队列堆栈&数据类型转换

#!/usr/bin/env python
#_*_coding:utf-8_*_

#三元运算
#if条件成立的结果 if 条件 else else条件成立的结果
#原来逻辑
# a,b=10,20
# if a > b:
#      c = 5
# else:
#      c = 10
# print(c)
#三元逻辑
# a,b=10,20
# c = 5 if a>b else 10
# print(c)

#队列：先进先出
# queue_l=[]
#入队
# queue_l.append('first')
# queue_l.append('second')
# queue_l.append('third')
# print(queue_l)
#出队
# print(queue_l.pop(0))
# print(queue_l.pop(0))
# print(queue_l.pop(0))


#堆栈:先进后出，后进先出
# l=[]
# #入栈
# l.append('first')
# l.append('second')
# l.append('third')
# #出栈
# print(l)
# print(l.pop())
# print(l.pop())
# print(l.pop())


#列表,集合
# list = [i for i in range(10)] #列表推倒式
# print(list)
# set = {i for i in range(10)}  #集合推倒式
# print(set)
# tuple = i for i in range(10) #元祖不行
# print(tuple)
# str = i for i in 'abc' #字符串不行

#in:not in
#字符串:子字符串
#列表：元素
#元组：元素
#字典：key

# d={'a':1,'b':2,'c':3}
# print('b' in d)


#解压法
# a,b,*_=[1,2,3,4,5]
# print(a,b)
# a,b,c,*_={1,2,3,4,5}
# print(a,b,c)
# a,b,c,d,*_=(1,2,3,4,5)
# print(a,b,c,d)
# a,b,c,*_='abcd'
# print(a,b,c)
# a,b,c,*_={1:'a',2:"b",3:'c'}
# print(a,b,c)


#enumerate 列表，字典，元祖，字典，字符串，集合
# 对于一个可迭代的（iterable）/可遍历的对象（如列表、字符串），enumerate将其组成一个索引序列，利用它可以同时获得索引和值
# 必须i v取值，因为单独I 的话是一个元祖输出
# (0, 'a')
# (1, 'b')
# (2, 'c')

# dict = {
#     1:'a',
#     2:'b',
#     3:'c'
# }
# for i,v in enumerate(dict,1):
#     print(i,dict[v])
#
# for i,v in enumerate(dict):
#     print(i+1,dict[v])
#
# list = [1,2,3,4]
# for i,v in enumerate(list,1):
#     print(i,list[i-1])

# str = 'abc'
# for i,v in enumerate(str,0):
#     print(i,v)

# set = {1,2,3,4}
# for i,v in enumerate(set,0): #集合本来无序，但是enumerate将其转化为index,values的元祖
#     print(i,v)

# tuple = (1,2,3,4)
# for i,v in enumerate(tuple,0):
#     print(i,v)

#数据类型的转换
# str = 'hello'
# print(str)
# print(list(str))
# print(tuple(str))
# print(set(str))

# list = [1,2,3]
# print(list)
# print(str(list))
# print(tuple(list))
# print(set(list))

# tuple = (1,2,3)
# print(tuple)
# print(str(tuple))
# print(list(tuple))
# print(set(tuple))


# set = {1,2,3}
# print(set)
# print(str(set))
# print(list(set))
# print(tuple(set))

# info=dict([('name','egon'),('age',18)])
# print(info)
# print(str(info))
# print(tuple(info))
# print(set(info))
# print(list(info))


#字典生成

# info=dict([('name','egon'),('age',18)])
# print(info)

# info=dict(name='egon',age=18,sex='male')
# print(info)

View Code