Python字符串基础操作

==============字符串========

>>> s1='www.baidu.com'

>>> type(s1)

>>> type(2)

>>> type("'dsfdsjk'")

用type()测一下是什么类型

字符串的访问 s1[0]=’ s1[2]=w 用下标来访问

>>> s6='aa bb'

>>> print s6

>>> #/n是转义字符，表示换行符 各种换行符如图记载

>>> s6='aa bb'

>>> print s6

>>> s7=r'aa bb' #当加上r的时候就是不转义的意思【关闭转义机制】

>>> print s7

aa bb

>>> s8=u'aa bb' #当加上u的时候表示后面跟的字符串是unicode编码

>>> print s8

>>> ‘%10s%10d%10.2f’%(‘record’,21,25.652) 格式化字符串 %s格式化为字符串 %d格式化为整数 %f格式化为浮点数(反正前面有几个格式占位符这边就几个逗号隔开的对应值)10.2f表示浮点数占10位小数点后面保留2位 四舍五入

>>> print 'name %s age %d record %f'%('amily',25,99.9)

name amily age 25 record 99.900000

>>> s1='www.baidu'

>>> s2='.com'

>>> print s1+s2 # +加号字符串连接 +前后必须都是字符串类型

www.baidu.com

>>> s1='hello amily'

>>> s2=2

>>> print s1+str(s2) 转换为字符串类型再进行加法运算

hello amily2

>>> li1=[1]*5 #*星号 字符串重复 等于N个加法 *前为字符串*后为数字

>>> print li1

[1, 1, 1, 1, 1]

>>> li2=['aa']*5

>>> print li2

['aa', 'aa', 'aa', 'aa', 'aa']

>>> s1='111'*20

>>> print s1

111111111111111111111111111111111111111111111111111111111111

>>> s1='www.baidu.com'

>>> print s1[4] #通过[]下标访问字符串的第几个位置的值 str[index]

>>> s1='www.baidu.com'

>>> print s1[-4] #负数也可以，负数就是从右边为起点

>>>

>>> print s1[2:4] # str[start:end] 切片 start切片起点 end切片终点起点或者终点可以不填 写负数就是从右边开始

>>> #这里切片起点必须小于终点，因为是从左向右切的。

如果要从右向左切片, 则str[big:small:-1], 这样是逆序输出

>>> s1='www.baidu.com'

>>> print s1[8:3:-1]

udiab

>>> s1='www.baidu.com'

>>> print s1[-1::-1] #实现字符串的逆序输出

moc.udiab.www

>>>

字符串其他常用函数

>>> s='dafdfh234234hjk'

>>> s.isalnum() #str.isalnum 判断字符串中是否均为数字或者字母

True

>>> s='sadfhd.?<dfah'

>>> s.isalnum()

False

>>>

>>> s='sdfhdjshf0'

>>> s.isalpha() #str.isalpha判断字符串中是否均为字母

False

>>> s='dfdfhdgf'

>>> s.isalpha()

True

>>> s='132746'

>>> s.isdigit() #str.isdigit判断字符串中是否均为数字

True

>>> s='sdfgydh678'

>>> s.isdigit()

False

>>> s='ABV'

>>> s.isupper() #str.isupper判断字符串中是否均为大写字母

True

>>> s='dfhu'

>>> s.islower() #str.islower判断字符串中是否均为小写字母

True

>>> s=''

>>> s.isspace() #str.isspace 判断字符串是否为空格

False

>>> s=' '

>>> s.isspace()

True

>>> s='djfdjsfh'

>>> s.upper() #str.upper字符串转化为大写字母

'DJFDJSFH'

>>> s='DJKJSDJFK'

>>> s.lower() #str.lower字符串转化为小写字母

'djkjsdjfk'

>>> s='DJKJSDJFK'

>>> s.lower()

'djkjsdjfk'

>>> s='dfhAJKH'

>>> s.upper()

'DFHAJKH'

>>> s.lower()

'dfhajkh'

>>> s=' dsjfhdsjkf kdjfhj '

>>> s.strip() #str.strip是去除某字符串左右的一个或多个空格（广义空格, , ）

可以写成str.strip(‘ ’)

#str.split()前后中间的空格都能去掉

'dsjfhdsjkf kdjfhj'

>>> s.rstrip() #str.rstrip 是去除字符串右边的空格（可以去掉多个空格）

' dsjfhdsjkf kdjfhj'

>>> s.lstrip() #str.lstrip 是去除字符串左边的空格（可以去掉多个空格）

'dsjfhdsjkf kdjfhj '

#coding:utf-8

s='www.baidu.com'

s1='www'

s2='.com'

if s.startswith(s1): #str.startswith(str1) 判断字符串是否以str1开始，返回布尔值

print 'www'

if s.endswith(s2): #str.endswith(str1)判断字符串是否以str1结束，返回布尔值

print '.com'

>>> s='www.baidu.com'

>>> id(s) #id(str)查看字符串在内存中的地址

46351608

>>> s1=s.replace('b','B') #str.replace(‘a’,’b’)将字符串中的a全部替换为b

>>> id(s1)

46353008

>>> s=s.replace('w','S') #可以看到replace函数“修改了”原来的字符串，字符串位置改变了，说明其实不是原来的字符串了，so字符串是不可以被修改的，只是产生了一个新的字符串罢了

>>> id(s)

46353808

>>> print s

SSS.baidu.com

>>> s=' dsfdsf f d 234h djfha '

>>> li=s.split() #str.split()字符串分割，返回一个list类型

>>> print li

['dsfdsf', 'f', 'd', '234h', 'djfha']

这个其实用split可以直接实现，但是这里最重要的是思路的循序渐进。写比较复杂的算法一定要有循序渐进的思路，慢慢来，一点点的去实现，然后在组合在一起，尤其是循环的这种一次找不到规律，可以逐步的走几个循环，找到规律再写while或者for语句。

#coding:utf-8

def Mysplit(s):

s=s.strip()

while(s.find(' ')!=-1):

index1=s.find(' ')

s1=s[:index1]

s=s[len(s1):]

s=s.lstrip()

print s1

else:

print s

Mysplit(' dsfdsf f d 234h djfha hfkdjfdjd dkfdk dkfjadkjf dfajkdf adkfasdfhjd 34737 ')

str.split()细讲记录split()返回的是list类型的以sth为分隔符，分割N次（分为N+1份），取第几份。Split(‘m’,n)[x]

>>> u = "www.doiido.com.cn"

#使用默认分隔符

>>> print u.split()

['www.doiido.com.cn']

#以"."为分隔符

>>> print u.split('.')

['www', 'doiido', 'com', 'cn']

#分割0次

>>> print u.split('.',0)

['www.doiido.com.cn']

#分割一次

>>> print u.split('.',1)

['www', 'doiido.com.cn']

#分割两次

>>> print u.split('.',2)

['www', 'doiido', 'com.cn']

#分割两次，并取序列为1的项

>>> print u.split('.',2)[1]

doiido

#分割最多次（实际与不加num参数相同）

>>> print u.split('.',-1)

['www', 'doiido', 'com', 'cn']

#分割两次，并把分割后的三个部分保存到三个文件

>>> u1,u2,u3 = u.split('.',2)

>>> print u1

www

>>> print u2

doiido

>>> print u3

com.cn

去掉换行符

>>> c = '''say

hello

baby'''

>>> print c

say

hello

baby

>>> print c.split(' ')

['say', 'hello', 'baby']

分离文件名与路径

>>> os.path.split('/dodo/soft/python')

('/dodo/soft', 'python')

>>> os.path.split('/dodo/soft/python/')

('/dodo/soft/python', '')

好例子

>>> str='hello hahaha<[www.baidu.com]>gdf238728'

>>> print str.split('[',1)[1].split(']',1)[0]

www.baidu.com

>>> print str.split('[',1)[1].split(']',1)[0].split('.')

['www', 'baidu', 'com']

>>>