机器学习算法与自然语言处理出品
@公众号原创专栏作者 冯夏冲
学校 | 哈工大SCIR实验室在读博士生
# -*- coding:utf-8 -*- import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np %matplotlib inline %config InlineBackend.figure_format = 'svg' # https://blog.csdn.net/minixuezhen/article/details/81516949 plt.rcParams['font.sans-serif'] = ['Arial Unicode MS'] mpl.rcParams["axes.unicode_minus"]=False直方图与柱状图的区别
# set test scores boxWeight = np.random.randint(0,10,100) x = boxWeight # 对该数据集进行统计 # plot histogram bins = range(0,11,1) # 设置连续的边界值,即直方图的分布区间[0,1],[1,2]...... plt.hist(x, bins=bins, histtype="bar", rwidth=1, alpha=0.6) # label plt.xlabel("箱子重量(kg)") plt.ylabel("销售数量(个)") plt.show()极线图是在极坐标系上绘出的一种图。在极坐标系中,要确定一个点,需要指明这个点距原点的角度和半径。将这些点连在一起,就构成了极线图。
barSlices = 12 theta = np.linspace(0.0, 2*np.pi, barSlices, endpoint=False) r = 30*np.random.rand(barSlices) # theta 角度 r 距离原点的距离 mfc点的颜色 ms点的大小 plt.polar(theta, r, color="chartreuse", linewidth=2, marker="*",mfc="b",ms=10) plt.show()二维数据借助气泡大小展示三维数据
a = np.random.randn(100) b = np.random.randn(100) # s 散点标记的大小 c 散点标记的颜色 cmap 讲浮点数映射为颜色的映射表 plt.scatter(a, b, s=np.power(10*a+20*b,2),c=np.random.rand(100),cmap=mpl.cm.RdYlBu,marker="o") plt.show()箱线图是一个能够通过5个数字来描述数据的分布的标准方式,这5个数字包括:最小值,第一分位,中位数,第三分位数,最大值,箱线图能够明确的展示离群点的信息。箱子的中间一条线,是数据的中位数,代表了样本数据的平均水平。箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。
x = np.random.randn(1000) plt.boxplot(x) plt.xticks([1],["随机数生成器alphaRM"]) plt.ylabel("随机数值") plt.title("随机数生成器抗干扰能力的稳定性") plt.grid(axis="y",ls=":",lw=1,color="gray",alpha=0.4) plt.show()