2重复元素:title和repeat
arr = np.arange(3) print(arr) # repeat重复三次生成更大的数组 a = arr.repeat(3) print(a) # 传入数组,则会按照数组重复不同次数 b = arr.repeat([2,3,4]) print(b)# 铺设是逐行进行的,不是逐列 arr = np.arange(3) print(arr) a = np.tile(arr,3) print(a) b = np.tile(arr,(2,1)) print(b) c = np.tile(arr,(3,2)) print(c)
3 求和
# 求和 arr = np.arange(10) a = np.add.reduce(arr) b = arr.sum() print(a,b)4 apply用法
frame = pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['Utah','Ohio','Texas','Oregon']) print(frame) f = lambda x:x.max()-x.min() a = frame.apply(f) print(a) b = frame.apply(f,axis='columns') print(b) def f(x): return pd.Series([x.min(),x.max()],index=['min','max']) c = frame.apply(f) print(c) # 格式化字符串 format = lambda x:'%.2f'%x d = frame.applymap(format) print(d) e = frame['e'].map(format) print(e)5排序
# 排序,指定空的位置 obj = pd.Series([4,np.nan,7,np.nan,-3,2]) b = obj.sort_values(na_position='first') # b = obj.sort_values(na_position='last') print(b)6 排名
# 排名rank obj = pd.Series([7,-5,7,4,2,0,4]) print(obj) # 默认情况下。rank通过将平均排名分配到每个组来打破平级 a = obj.rank() print(a) # 观察顺序排名 b = obj.rank(method='first') print(b) # 将值分配给组中的最大排名 c = obj.rank(ascending=False,method='max') print(c)7 判断标签是否唯一
obj = pd.Series(range(5),index=['a','a','b','b','c']) print(obj) # 判断标签是否唯一 a = obj.index.is_unique print(a)