用户群|做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)( 四 )


如果是做一些比较基础的假设检验的话 , 在 Excel和Python都是差不多的 , 比如T测试 。 Excel里面也是一个公式的问题 , 在Python里面就一行代码的问题 。 在这里其实差不多的 。
但如果想要用一些比较复杂的检验 , 比如说多重检验 。 你在Python里面也有现成的包 , 一行代码就出来结果了 。 在Excel里需要人工的去实现两两比较 , 最后达到多重检验的结果 。
综合一下 , 其实从数据处理、报表自动化、图表可视化 , 统计检验这些是分析师日常工作里用到的几个方面 。 在不同的场景下 , Excel和Python各有不同 , 有的时候可能Excel的效率会更高一些 , 有的时候可能两者差不多 , 有的时候可能Python会更好一点 。
基于以上几点 , 我们还是有必要去学学Python的 。 关于工具 , 没有哪个工具是万能的 。
作为一个合格的分析师来讲 , 你需要有自己的工具库 。 里面有各种各样的工具 , 你需要去灵活的去组合 , 在什么样的场景下 , 用什么样的工具更好 。 或者说用哪些工具进行组合 , 效率会更好 。 大家不要局限在一种工具 , 一定要去同时掌握多种工具 , 能在不同工具之间进行自如的切换 。
拿到业务需求时 , 如何与正确的理论结合? 现在很多同学在网上不管是看书还是看视频 , 可能会学了很多数据分析的方法论 。 到了实际的工作过程中 , 可能又不知道怎么样把具体的理论和具体实践实际的工作内容结合起来 , 这个的一个本质原因 。 我认为这方面是 , 我们对这个方法本身没有理解的太透 。 因此在学一个方法的时候 , 首先需要知道这个方法本身的内容是什么 , 它的适用场景是什么 。
给大家举个例子 , 比如说图表可视化的选择 。
现在图的类型是有很多 , 最基础的柱状图、折线图、闪点图 , 还有高级一点的桑基图、热力图之类的 。
图表的类型有很多 , 如果学了很多图 , 也学了很多图表的制作 , 在实际工作的过程中 , 让你把数据用图表的形式展示出来 , 该用什么图去展示呢?
这时我们首先要对图表进行归类 , 比如说对趋势进行表达 , 可以用折线图 。 如果说要对比大小 , 对比不同类别间的大小情况 , 就可以使用柱状图 , 或者饼图 。 如果说想要表示不同指标之间的关系 , 就是相关性问题 , 就可以用散点图 , 或者两条线图去表示 。
首先要对所学过的所有图表进行归类 , 归类完之后拿到具体的工作内容、工作场景时 , 要去看数据是什么类型 , 想要通过数据表达什么样的内容 , 达到什么样的目的 。
比如说要表达最近一年销量趋势是上升还是下降 。 选择折线图或者柱状图就好了 。 如果说要表达全国不同的GDP 情况 , 很明显是比大小的问题 。 就可以用柱状图 。 不同的省份是不同的柱子 , 我们就能够看出来不同柱子之间的大小情况 。

推荐阅读