什么是数据分析?
如果给你淘宝一整年的购物数据,这些数据能卖多少钱。这些数据在电商巨头手里可能价值不下于十亿。
他们能通过这些来优化自己的推荐算法。通过每个用户的购物数据来对用户建立用户画像,打上“年龄段20-25”、二次元、或者程序员。
你自己攒了一台电脑,但是没配键盘,淘宝就给你推cherry的键盘。
你近期买了一个猫砂盆,判断你已化身猫奴,于是疯狂给你首页推猫粮
与你打着同样二次元标签的用户最近喜欢上了鬼灭之刃,于是手办推送也给你安排上了。
这一切哪怕只能淘宝带来了10%成交额的上升,利润都不止十亿。
数据分析的常规过程
数据为业务服务。
这是做数据分析的核心要点。
常规的业务分析有以下历程:
- 确定目的
- 获取数据
- 清洗数据
- 数据分析
- 数据可视化
- 得出结论
为什么用 Python 来做数据分析
在 Python诞生的初期,它一度被看作一种不严谨的脚本语言,被用来处理一些琐碎的工作。不过经过长期的发展,Python 衍生出了许多活跃的社区。使用 Python 开发的项目越来越多,Python 已经成为了数据科学、机器学习、学术界和互联网开发最重要的语言的之一。近两年更是被 IEEE 评选为最受欢迎的语言。
正是因为 Python 通用性,使得我们单单使用 Python 便能完成数据分析的整个过程。从数据的获取到数据的数学计算再到分析结果的展示都可以用 Python 独立高效地完成。避免了同时使用多个工具的繁杂工作。并且 Python 的易用性使得我们可以专注于基于业务场景的数据分析,不用考虑过多的语法细节。
如 Pandas 等运算库都使用cython优化过,使得 Python 下对于大量数据的处理速度已经不亚于静态语言。pyecharts等的优秀图表展示库使得我们能展示更漂亮的图表,生成一个可交互的网页。爬虫方面的天然优势使得我们获取网络上的数据变得更加简单。
可以说 Python 已经是数据分析的不二之选。
热门跟贴