Skip to content

第三步:清洗数据

现在,你已经熟练构建模型了,是不是觉得很简单,但往往你拿到的数据不一定都是“干净的”,接下来我们来把里面的“杂质”挑出来。

🎯 像玩游戏一样圈选异常 (Lasso)

如果你更相信自己的眼睛,试试我们的套索工具

lasso

  1. 打开 T1-T2 关系图 图表。
  2. 看到那些红圈外离群很远的红点了吗?它们就是异常值!
  3. 按住鼠标左键,画一个圈把它们套住(还可以再画一个蓝色的圈用于对比分析哦)。⭕️
  4. 松手!这些点就被“捕获”了,变成了选中状态。

🗑️ 批量删除

圈选完之后,点击工具栏的 删数 按钮。

  • 弹出一个对话框,点击仅显示选中列出了你刚才圈选的所有“坏蛋”。
  • 确认无误后,点击 “删除”

💥 砰!异常数据消失了! 系统会自动生成一个新模型,请为它重命名,点击 Inactive 按钮将其激活,最后点击 Fit 重新训练。

让数据说话,让决策更简单。