Python笔记120151021

一、字符串和字符编码

字符ASCIIUnicodeUTF-8
A 01000001 00000000 01000001 01000001
x 01001110 00101101 11100100 10111000 10101101

从上面的表格可以发现,UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分。

在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。

用记事本编辑的时候,从文本读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:

rw-file-utf-8

浏览页面的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器:

web-utf-8

对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符。

由于Python源代码也是一个文本文件,所以,当你的源代码中包含中文的时候,在保存源代码时,就需要务必制定保存为UTF-8编码。当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上这两行:

#/usr/bin/env python3

# -*- coding: utf-8 -*-

第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;

第二行注释是为了告诉Python编辑器,按照UTF-8编码读取源代码,否则,你在源代码中邪的中文输出可能会出现乱码。

二、格式化

>>> 'Hello, %s' % 'world'
'Hello, world'
>>> 'Hi, %s, you have $%d.' % ('Michael', 1000000)
'Hi, Michael, you have $1000000.'

常用的占位符有:

%d      整数

%f      浮点数

%s      字符串

%x      十六进制整数

其中,格式化整数和浮点数还可以指定是否补0和整数与小数的位数:

>>> '%2d-%02d' % (3, 1)
' 3-01'
>>> '%.2f' % 3.1415926
'3.14'

若不确定应该用什么,%s永远起作用,它会把任何数据类型转换为字符串:

>>>'Age: %s. Gender: %s' % (25,True)

'Age:25. Gender : True'

若字符串里面的%是一个普通字符,这个需要转移,用%%来表示一个%:

>>>'grouwth rate: %d %%' % 7

'growth rate: 7 %'

%d 整数
%f 浮点数
%s 字符串
%x 十六进制整数

三、list和tuple

序列有两种:tuple(定值表; 也有翻译为元组) 和 list (表),tuple和list的主要区别在于,tuple的各个元素不可再变更,而list的各个元素可以再变更。

1、list

Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。

比如,列表班里所有同学的名字,就可以用一个list表示:

>>>classmates['Michael','Bob','Tracy']

>>>classmates

['Michael','Bob','Tracy']

变量classmates就是一个list。用len()函数可以获得list元素的个数:

>>>len(classmates)

3

用索引来访问list中每一个位置的元素,索引是从0开始的:

>>>len[0]

'Michael'

若要取最后一个元素,除了计算索引位置外,还可以用-1做索引,直接获取最后一个元素:

>>>classmates[-1]

'Tracy'

以此类推,可以获取倒数第2个、倒数第3个:

>>>classmates[-2]

'Bob'

>>>classmates[-3]

'Michael'

list是一个可变的有序表,所以,可以往list中追加元素到末尾:

>>>classmates.append('Adam')

>>>classmates

['Michael','Bob','Tracy','Adam']

把元素插入到制定的位置,比如索引号为1的位置:

>>>classmates.insert(1,'Jack')

>>>classmates

['Michael', 'Jack', 'Bob', 'Tracy', 'Adam']

要删除指定位置的元素,用pop(i)方法,其中i是索引位置:

>>>classmates.pop(1)

'Jack'

>>>classmates

['Michael','Bob','Tracy']

要把某个元素替换成别的元素,可以直接赋值给对应的索引位置:

>>>classmates[1] = 'Sarah'

>>>classmates

['Michael','Sarah','Tracy']

list里面的元素的数据类型也可以不同,比如:

>>>L = ['Apple',123,True]

list元素也可以是另一个list,比如:

>>>s = ['python',‘java’,['asp','php'],'scheme']

>>>len(s)

4

2、tuple

 tuple和list非常类似,但是tuple一旦初始化就不能修改,比如:

>>>classmats = ('Michael','Bob','Tracy')

classmates这个tuple不能变,它也没有append(),insert(),获取元素的方法和list一样,可以使用classmates[0],classmates[-1],但不能复制成另外的元素。

因tuple不可变,所以代码更安全。如果可能,能用tuple代替list就尽量用tuple。

tuple陷阱:当你定义一个tuple时,在定义的时候,tuple的元素就必须确定下来。

若定义只有1个元素的tuple:

>>>t = (1)

>>>t

1

定义的不是tuple,是这个数,因为括号()既可以表示tuple,又可以表示数学公式中的小括号,为避免歧义,Python规定,这种情况下,按小括号进行计算,因此结果为1。

当需要定义只有1个元素的tuple时必须加一个逗号,,来消除歧义:

>>>t = (1,)

>>>t

(1,)

tuple中的元素可以为一个list。

原文地址:https://www.cnblogs.com/diaosicai/p/4897333.html