代码 trick 积累

两个list关联排序

# 打包
zipped = zip(sen,count)
# 排序
sort_zipped = sorted(zipped,key=lambda x:(x[1],x[0]),reverse=True)
# 还原
result = zip(*sort_zipped)
sen,count = [list(x) for x in result]

pandas 行列显示不全解决方式

#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为100,默认为50
pd.set_option('max_colwidth',100)

git

# 撤回上一次的commit
git reset --soft HEAD^

Tensor Flow Addons 版本问题

-- -- --
Tensor Flow Addons TensorFlow Python
tfa-nightly 2.2 3.5,3.6,3.7,3.8
twnsorflow-addons-0.10.0 2.2 3.5,3.6,3.7,3.8
tensorflow-addons-0.9.1 2.1,2.2 3.5,3.6,3.7
tensorflow-addons-0.8.3 2.1 3.5,3.6,3.7
tensorflow-addons-0.7.1 2.1 2.7,3.5,3.6,3.7
tensorflow-addons-0.6.0 2.0 2.7,3.5,3.6,3.7

pandas 删除Nan值

# dataframe 行至少有两个不为 Nan 保留,inplace True 原dataframe上进行操作
df_mark.dropna(how = 'all',thresh = 2,inplace=True)
# dataframe 行全为 Nan 删除
df_mark.dropna(how = 'all',inplace=True)
# dataframe 行有一个 Nan 删除
df_mark.dropna(how = 'any',inplace=True)

字符串查找首次出现的位置

import re
content = '1、中专以上学历,农业相关专业,从事农业技术应用与实践工作一年以上; 2、热爱农业,为人踏实稳重,能吃苦耐劳,工作认真细致,有责任感,团队协作意识强。'
i = '农业'
re.search(re.compile(i),content).span()
# output 
(9, 11)

pandas 一行切分变多行

df_jd_content_split = df_jd_content['detail'].str.split('<br>|。|;d、',expand=True).stack()
df_jd_content_split = df_jd_content_split.reset_index(level=1,drop=True).rename('detail')
df_jd_content_split = pd.DataFrame(df_jd_content_split)
Monkey
原文地址:https://www.cnblogs.com/monkeyT/p/14011046.html