第一点就是数据处理 。
比如说缺失值处理 , 重复值处理 , 加减乘除运算等 。 Python的一个优势就在于大数据处理 ,Excel的话可能上限就100多万行 。
而且虽然上限是100多万行 , 但处理大量级数据的话 , 一般超过20万行 ,Excel就反应特别慢了 。 尤其当你在里面嵌套了很多公式时 , 经常导致 Excel无响应就崩溃退出了 。 而Python就不存在这个问题 。 如果数据量级很小 ,Excel和Python是差不多的 , 有时可能Excel效率可能还会更好 。
这是关于在数据处理方面 , 因为我们做数据分析的第一件事情 , 可能就是去对这个数据进行各种各样的一个处理 , 大家根据自己的情况去选择就好了 。
第二点是报表自动化 。
常见的有日报、周报、月报等 。 这种报表有一个好处就是格式相对比较固定 。 只要格式是固定的 , 我们就可以想想办法去把进行自动化 。 自动化的话可以用Python写代码 , 把代码写好了 , 它运行一次就ok了 。 在Excel里面的话也是可以的 , 去写vba , 或者用各种公式嵌套 。 网上就有人专门去比较过 , 同样的操作 , 用vba和用Python的效率差异 ,Python可能要比vba更快一些 , 也就是效率更高一些 。
【用户群|做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)】Python和 vba在写代码的方面 , 比如要读取一个文件 , Python里面可能一行代码就能够读取进来了 , 在vba里面可能要写好几行代码 , 而且也不是那么好理解 。
还有一个最重要的点是Python现在很火 。
很火就意味着网上会有很多的资料 , 如果你遇到什么不太懂的地方 , 去网上搜一搜大概率是能搜得到的 。 但是vba整个受众还是相对较小的 , 如果遇到什么相关问题 , 可能问身边的人发现也没几个人会用 。 你去网上搜也得不到太多的资料 , 我们在学的时候都需要去借助网上资料 , 网上的资料多少就决定了我们学习的效率 。
第三个方面是图表可视化 。
我们就经常需要去做图 , 需要做的好看 。 Excel和python其实都能做出很好看的图表来 , 只不过Python里面是有很多现成的包 , 只需要调用一两行代码就能够做出很好看的图表来 。 Excel里想要做出好看的图表 , 就要做进行各种设置 , 这需要耗费很长的时间 , 这方面效率是不如 Python 。
另外遇到一些比较高级的图表 。 比如说统计里的核密度图或者小提琴图之类的 。 这些在Python里都有现成的包可用 , 只需要一行代码就能绘制出小提琴图 。 在Excel里面 , 如果想绘制小提琴图基本是不太可能的 。
最后在统计检验或者说统计学方面 。
A/B测试大家应该都有用到过 , 其本质上核心内容就是假设检验 。
推荐阅读
- 安全|Redline Stealer恶意软件:窃取浏览器中存储的用户凭证
- 柯腾|争做细分赛道冠军——探寻厦门“小巨人”企业成长密码
- 低碳发展|四川做强清洁能源产业
- IT|以色列正式批准开放第四剂新冠疫苗接种 限免疫力低下人群
- 吴祖榕|上线 2 周年,用户数破 2 亿,腾讯会议和我们聊了聊背后的产品法则
- 硬件|上线两年用户破两亿,腾讯会议还能做什么?
- 全体|喜报:三星 Galaxy S21 系列全体用户现已获推 One UI 4.0 正式版
- 隐私|用户隐私保护新境界,2021 vivo开发者大会将发布安全新动作
- |彰显交通特色 突出担当作为——南安市交通运输局“我为群众办实事”实践活动见行见效
- |南安市司法局凝初心践使命 以民为本做实人民调解