Python合集之Python字符串常用操作(一)

在上一节的合集中，我们了解了Python集合增删改及集合间运算的相关知识，本节我们将进一步了解一下Python字符串的常用操作的相关知识。

1.拼接字符串

使用 + 运算符可完成对多个字符串的拼接，+ 运算符可以连接多个字符串并产生一个字符串对象。

例如：

mot_en='Remembrance is a form of meeting. Forgetfulness is a form  of freedom. '
mot_cn='记忆是一种相遇，遗忘是一种自由。'
print(mot_en+'——'+mot_cn)

注：字符串是不允许直接与其他类型的数据拼接的，否则会抛出异常信息，因此在拼接其他的数据类型时候，需要将其转换为字符串类型进行拼接。

2.计算字符串的长度

由于不同的字符所占字节数不同，所以要计算字符串的长度，需要先了解各个字符所占的字节数。在Python中，数字、英文、小数点、下划线和空格占一个字节，一个汉字可能会占2~4个字节，占几个字节取决于采用的编码，汉字在GBK/GB2312 编码中占2个字节，在UTF-8/unicode 编码中一般占用3个字节(或4个字节)。

在Python中，提供了len()函数计算字符串的长度，语法格式如下：

len(string)
参数说明：
string：表示要进行长度统计的字符串

例如：

str1='人生苦短，我用Python！'
length=len(str1)
print(length)

上面的代码，执行后得到的结果是14。从这个结果中可以看出，默认情况下，通过len()函数计算字符串的长度时，不区分英文，数字和汉字，所有的字符都按一个字符去计算。

在实际的开发中，有时需要获取字符串实际占用的字节数，即如果是采用UTF-8编码，汉字所占3个字节，采用GBK或者GB2312,汉字所占2个字节，这时可以通过encode()方法进行编码后，在进行获取。

例如上面的例子，可以采用下面的代码，来获取采用UTF-8实际所占的字节数：

str1='人生苦短，我用Python！'
length=len(str1.encode())
print(length)

上面的代码执行后的结果为28个字节数，这是因为汉字加中文的标点符号共7个，占21个字节，英文字母加英文的标点符号占7个字节，共28个字节。

如果要想采用GBK编码来计算上面例子的所占字节数，可以采用下面的代码：

str1='人生苦短，我用Python！'
length=len(str1.encode('gbk'))
print(length)

上面的代码执行后的结果为21个字节数，这是因为汉字加中文的标点符号共7个，占14个字节，英文字母加英文的标点符号占7个字节，共28个字节。

花絮：

本期的Python 字符串的常用操作就分享到这里，下期我们将继续分享Python字符串的截取及其他常用操作的相关知识，感兴趣的朋友可以关注我。

同时也可以关注下我的个人微信订阅号，园子里面的文章也会第一时间在订阅号里面进行推送跟更新。