Skip to content

属性分布分析 (Distribution)

📊 这是什么?

想象你在超市排队结账,有人买的多,有人买的少。分布分析就是数一数,不同金额的人各有多少。

它把所有数据样本按照数值大小分成一堆一堆的,看看哪里人多,哪里人少。

🧐 怎么看?

  • 柱子高度:代表那个数值范围内有多少个样本。柱子越高,那个数值出现得越频繁。
  • 形状
    • 钟形(中间高两边低):最标准的正态分布,这是好事。
    • 偏向一边:说明数据有点偏(比如大家都很穷,只有马云一个人很有钱)。
    • 双峰(两个高峰):可能有两拨完全不同的人混在了一起(比如白天和晚上的温度)。

🛠️ 怎么用?

  • 看平均水平:最高的柱子就是大家的平均水平。
  • 抓怪胎:如果最右边或最左边孤零零有一根很矮的柱子,那可能是个异常值。

属性分布分析示例

让数据说话,让决策更简单。