作者: 杜一来源: 知乎时间:2017-05-27 14:21:10
数据可视化能够提高效率,如果如果没有数据可视化,我们的决策就会低效,这会导致金钱、时间的损失,甚至危及健康与生命。
以下几个简单的例子说明可视化为什么高效。
一、一个几乎被用烂的例子,找到下面的3的数目。
如果用一点可视化的方法,添加颜色映射,是不是省时又省力?
二、看下面一张表,介绍了各个工厂小麦(Cereal)的元素含量。你能否回答这些问题,看花了多长时间。
1.那种小麦钾(potassium)含量更高?
2.钾(potassium)和纤维(fiber)之间是否有什么关系?如果有,哪些品种的小麦不符合这种关系?
3.那家工厂(manufacturer)生产最健康的小麦?
然后,看下面的这张图,他们表示了相同的信息量,回答同样的问题,你花了多长时间?
三、下面的四条数据集(I,II,III,IV),告诉我他有什么区别?
你会发现,虽然他们感觉不同,但你计算一下发现,他们好像是一样的(后面四个不知道咋翻译,反正后面四个指标也是一样的):
l x平均值均为9.0
l y的平均值均为7.5
l 最小二乘回归方程都是y=3+0.5x
l 平方误差的和均为110.0
l regression sums of squared errors (variance accounted for by x) = 27.5
l residual sums of squared errors (about the regression line) = 13.75
l correlation coefficient = 0.82
l coefficient of determination = 0.67
然后我们给出他们的图,一目了然