本博客是一个个人的学习精力和路程的博客,仅供大伙看一乐儿。
对于刚刚入行迷茫的IT小伙伴可以大概的看一看。很多人刚刚入行的时候都会有一种技多不压身的想法,当然我也不例外,但是随着时间的推移,慢慢的我改变了这种看法。
在刚刚开始入行的时候大概是16年,我满怀着激情想研究各个领域的知识,想要无论什么分析什么算法什么软件都想学,于是我分别学了python、matlab、R、SPSS、stata、SAS这些数据分析工具,渐渐的开始发现自己的精力不够用,因此决定抛弃掉其他工具,就学python了。
在这里插个小曲,对于上述的工具一些刚刚开始接触数据分析的小伙伴们不知道怎么选择,在这我给大伙说下我个人的看法。
SPSS:这个是一个傻瓜式的操作软件,操作非常简单方便,但是如果你数据量一大的时候,软件的性能相对而言计算性能就会下降了不少,但是他最大的优势就是可以使用最简单的操作方法实现各种统计学算法,比如多元线性回归、logistics回归、决策树等等的。相对新手而言也是最友好的,通常医疗、问卷分析等方面用的比较多,当然SPSS我学的也不是很多可能说的并不完全准确。
R:这是一个编程语言,自然从性能以及计算效率上都要超过SPSS,并且基本能实现你想到的任何算法,可能是因为封装的太好了,想对比其他编程语言而言性能略低。通过R调库获得的统计结果一般也会更全面,因为人家都给封装好了。
matlab:这也是个编程语言,专门用于数据科学的编程语言,如果你是从事学术方向,那这个语言是相当的不错,而且性能也很好。缺点是等你真正的去参加工作了,有很多公司用不到它,这样你就得在学一门语言,也会花费很大的精力。
stata、SAS:这两个我学的不是很多,没资格评价。
python:这个语言是我热推的语言,他不单单可以完成各种数据分析任务,并且机器学习建模深度学习、后端开发任务也都可以很好的完成,并且生态也很好。学术能做数据科学,就业也能参与实际开发,所以我最后选择了python坚持学习下去。
但是即使是pyhon他所涉猎的方向依然非常多,我又再一次的犯了同样的错误,我天真在想把python弄精通。事实上我并没有过人的智商和精力,python能做的事情太多了,学一辈子是根本学不完的,在这我分别学了数据分析,爬虫、web开发、机器学习,看似不少,但是会的越杂往往也意味着你哪一方面学的都不好,越学到最后感觉自己越弱鸡,于是乎我想专门研究机器学习方向了。
PS: 这里大伙需要注意一个坑。巨大的坑,有很多人或者培训机构说,这个编程简单,那个简单,在这里我说下我个人的看法:
1. 编程语言各有各的优势不要真的认为这个语言简单那个简单,实际真正学起来编程语言的最终思想和逻辑都是大同小异的,难度其实差异并不大。最大的是看你实现要做什么项目。不要相信内些所谓的鄙视链,学某个语言就比另外一些语音厉害了什么的。我个人想法是,有这种想法的人应该还都是小白。
2. 个人感觉相对于编程语言,算法才是最难的,也可能是个人智力原因,我这学机器学习深度学习也好几年了,现在感觉自己还啥也不是呢,而且还总有跟不上时代要被淘汰的感觉。
所以我感觉还是看自己以后目标想做什么,如果是后端web开发、app开发类的,我建议用php或者java,深度学习类的学c++或者python,专门做数据科学的学matlab、R、python都可以,临时做一个数据分析想速成就用SPSS。我是个程序员,对于语言表达能力比较次,大伙不喜勿喷,后续将会专门更新python相关的机器学习方面的博客,叙述自己的学习历程。
也希望各位刚刚入行的小伙伴能够坚持学习,在学习的路上必然会遇到一些不顺心的事儿,比如一些水平不怎么样的人对你指手画脚,或者同学同事的嘲讽。这种人大伙就当他是个P吧。最后学到手才是自己的。
如果有想做数据分析相关的任务可以关注下小店,我们几个朋友一起弄的小淘宝店:
首页-CDBmax数据国度丨数据分析服务-淘宝网



