数据可视化基础专题（二十）：Pandas120题（五）81-100

第四期当Pandas遇上NumPy

import pandas as pd
import numpy as np
print(np.__version__)
print(pd.__version__)

#备注 使用numpy生成20个0-100随机数
tem = np.random.randint(1,100,20)
df1 = pd.DataFrame(tem)
df1

#备注 使用numpy生成20个0-100固定步长的数
tem = np.arange(0,100,5)
df2 = pd.DataFrame(tem)
df2

#备注 使用numpy生成20个指定分布(如标准正态分布)的数
tem = np.random.normal(0, 1, 20)
df3 = pd.DataFrame(tem)
df3

df = pd.concat([df1,df2,df3],axis=0,ignore_index=True)
df

df = pd.concat([df1,df2,df3],axis=1,ignore_index=True)
df

print(np.percentile(df, q=[0, 25, 50, 75, 100]))

[-1.34817283  1.41754194 23.5        50.         95.        ]

df.columns = ['col1','col2','col3']

df['col1'][~df['col1'].isin(df['col2'])]

temp = df['col1'].append(df['col2'])
temp.value_counts().index[:3]

np.argwhere(df['col1'] % 5==0)

df['col1'].diff().tolist()

df.ix[:, ::-1]

df['col1'].take([1,10,15])
# 等价于
df.iloc[[1,10,15],0]

#备注 即比它前一个与后一个数字的都大的数字
tem = np.diff(np.sign(np.diff(df['col1'])))
np.where(tem == -2)[0] + 1

df[['col1','col2','col3']].mean(axis=1)

#备注 每次移动三个位置，不可以使用自定义函数

np.convolve(df['col2'], np.ones(3)/3, mode='valid')

df.sort_values("col3",inplace=True)

df.col1[df['col1'] > 50]= '高'

np.linalg.norm(df['col2']-df['col3'])