登录
首页 >  文章 >  java教程

数组实现频率分布直方图实战教程

时间:2026-05-15 12:55:04 415浏览 收藏

本文手把手教你如何仅用基础数组操作实现频率分布直方图——无需依赖复杂绘图库,通过计算极差、套用斯特杰斯公式确定组数与组距、初始化计数数组并精准分桶统计,就能高效完成频次汇总;配合简单标签生成和可视化(甚至纯文本柱状图),让数据分布一目了然,特别适合教学演示、嵌入式环境或资源受限场景下的快速数据分析。

如何利用数组实现基本的频率分布直方图并实战统计变量区间频次

用数组实现频率分布直方图,核心是把连续数据“分桶”——即按预设区间划分,再统计每桶内数据个数。不需要依赖高级绘图库,纯数组操作就能完成频次统计,再配合简单绘图即可可视化。

明确分组边界与组距

先确定数据范围:找出数组最小值 min_val 和最大值 max_val,计算极差 R = max_val − min_val。再决定组数 k(常用斯特杰斯公式 k = 1 + 3.3 log₁₀(n),n 为样本量,结果四舍五入取整)。组距 d = R / k,建议调整为 5、10 等整数便于阅读。

  • 例如数据为 [12, 18, 24, 31, 39, 45, 52, 58, 63, 71],n=10 → k ≈ 1 + 3.3×1 = 4.3 → 取 k=4;R = 71−12 = 59 → d ≈ 14.75 → 调整为 15
  • 则分组边界可设为:[12, 27), [27, 42), [42, 57), [57, 72]

用数组计数实现频次统计

初始化长度为 k 的零数组 counts = [0] * k。遍历原始数据,对每个值 x,用公式 idx = int((x − min_val) // d) 算出所属桶索引(注意右边界处理:若 x 等于最大边界,需归入最后一组)。

  • Python 示例:
    data = [12, 18, 24, 31, 39, 45, 52, 58, 63, 71]
    min_val, max_val = min(data), max(data)
    k = round(1 + 3.3 * log10(len(data)))
    d = ceil((max_val - min_val) / k)  # 向上取整保证覆盖
    counts = [0] * k
    <p>for x in data:
    idx = min(int((x - min_val) // d), k-1)  # 防越界
    counts[idx] += 1
    </p>
  • 结果如 counts = [3, 2, 2, 3],对应四组频数

构造横轴标签与绘制基础直方图

用数组生成每组的区间标签(如 "12–27"),再用 matplotlib.bar 或甚至 print 打印字符柱状图。重点是让横轴刻度对齐组中点或左边界,纵轴为 counts 值。

  • 简易文本输出示例:
    for i, c in enumerate(counts):
        low = min_val + i * d
        high = min_val + (i+1) * d if i 
  • Matplotlib 绘图只需:
    bins = [min_val + i*d for i in range(k+1)]
    plt.hist(data, bins=bins, edgecolor='white', rwidth=0.9)
    plt.xlabel('Value Range')
    plt.ylabel('Frequency')
    

注意边界与异常值处理

原始数组可能含异常值(远超 min/max),直接按公式分桶会越界。稳妥做法是:预先过滤或扩展边界,比如将 min_val 设为 floor(min_val/10)*10,max_val 设为 ceil(max_val/10)*10,再重算 d 和 k。

  • 也可在计数前加判断:if x = max_val: idx = k−1
  • 频数总和必须等于原始数组长度,这是验证统计是否完整的硬指标

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《数组实现频率分布直方图实战教程》文章吧,也可关注golang学习网公众号了解相关技术文章。

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>