Python 机器学习正态数据分布



  • 正态数据分布

    在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。在概率论中,在数学家卡尔·弗里德里希·高斯提出了这种数据分布的公式之后,这种数据分布被称为正态数据分布或高斯数据分布。
    典型的正态数据分布:
    import numpy
    import matplotlib.pyplot as plt
    
    x = numpy.random.normal(5.0, 1.0, 100000)
    
    plt.hist(x, 100)
    plt.show()
    
    输出如下所示:
    ml
    
    注意:由于正态分布图具有钟形的特征形状,因此也称为 钟形曲线。
    直方图解释::
    我们使用numpy.random.normal() 方法中的数组(具有100000个值)绘制具有100条的直方图。我们指定平均值为5.0,标准差为1.0。这意味着该值应在5.0左右达成一致,并且很少偏离均值1.0。从直方图中可以看到,大多数值在4.0到6.0之间,最高值大约是5.0。