代码 trick 积累

两个list关联排序

# 打包
zipped = zip(sen,count)
# 排序
sort_zipped = sorted(zipped,key=lambda x:(x[1],x[0]),reverse=True)
# 还原
result = zip(*sort_zipped)
sen,count = [list(x) for x in result]

pandas 行列显示不全解决方式

#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为100，默认为50
pd.set_option('max_colwidth',100)

git

# 撤回上一次的commit
git reset --soft HEAD^

Tensor Flow Addons 版本问题

--	--	--
Tensor Flow Addons	TensorFlow	Python
tfa-nightly	2.2	3.5,3.6,3.7,3.8
twnsorflow-addons-0.10.0	2.2	3.5,3.6,3.7,3.8
tensorflow-addons-0.9.1	2.1,2.2	3.5,3.6,3.7
tensorflow-addons-0.8.3	2.1	3.5,3.6,3.7
tensorflow-addons-0.7.1	2.1	2.7,3.5,3.6,3.7
tensorflow-addons-0.6.0	2.0	2.7,3.5,3.6,3.7

pandas 删除Nan值

# dataframe 行至少有两个不为 Nan 保留,inplace True 原dataframe上进行操作
df_mark.dropna(how = 'all',thresh = 2,inplace=True)
# dataframe 行全为 Nan 删除
df_mark.dropna(how = 'all',inplace=True)
# dataframe 行有一个 Nan 删除
df_mark.dropna(how = 'any',inplace=True)

字符串查找首次出现的位置

import re
content = '1、中专以上学历，农业相关专业，从事农业技术应用与实践工作一年以上； 2、热爱农业，为人踏实稳重，能吃苦耐劳，工作认真细致，有责任感，团队协作意识强。'
i = '农业'
re.search(re.compile(i),content).span()
# output 
(9, 11)

pandas 一行切分变多行

df_jd_content_split = df_jd_content['detail'].str.split('<br>|。|；d、',expand=True).stack()
df_jd_content_split = df_jd_content_split.reset_index(level=1,drop=True).rename('detail')
df_jd_content_split = pd.DataFrame(df_jd_content_split)

Monkey