新万博代理介绍 大发极速彩代理 贵州快3计划软件 天津快3开奖手机版 3分排列3代理 大发幸运pk10开奖 江苏快3哪个平台正规 大发代理好做吗 cc网投app下载 5分排列3平台 安徽快3哪个平台正规 江苏快3独胆计划 江西快3计划群骗局 湖北快3在线计划网 3分3d注册 3分排列3平台 天津快3是合法的吗 安徽快3官方计划网 安徽快3第一期几点 万博代理要求 天津快3最稳免费计划 山西快3是合法的吗 湖北快3和值计划网 重庆快3计划软件 uu快3app 福建快3是合法的吗 极速排列3玩法 大发分分快3平台 甘肃快3遗漏号码查询 大发五分快3玩法

网站地图


成为数据科学家并不难

child-learning-about-big-data

几个菜鸟程序员在Coursera上免费注册学习了几天“机器学习”课程后,赢下了Kaggle预测模型建模大赛。

企业界在IT业制造的大数据人才恐慌(麦肯锡是始作俑者)中纷纷提高了对大数据和高级分析人才的期待和要求,数据科学家也一夜之间成为最性感的职业,其光环直追体育明星。数据科学家被描绘成神一般的人物,他们通晓数学、计算、社会学、物理学等各学科知识,同时又洞察世事,深谙企业运作之道,存世数量堪比特级珍稀保护动物。这些都让有志从事大数据分析的IT从业人员高山仰止,望而止步。

但越来越多的证据显示,即使是初级程序员也能成为优秀的数据科学家。

事实表明,只需要借助云计算服务器,在Coursera公开课上跟斯坦福教授Andrew Ng学上几天“机器学习”课程(Machine Learning),即使是菜鸟程序员也能变成掘金大数据的金凤凰。

以上并不是痴人说梦,预测分析竞赛网站Kaggle为我们提供了不少例证。今年9月,一位律师出身的保险业风险模型设计师Carter S.首次参加Kaggle竞赛就斩斩获项目奖金。Carter采用的是独创的“暴力分析”(Overkill Analytics),所谓暴力分析就是舍弃复杂费神的大数据分析模型,采用大量简单模型的组合,利用当今硬件系统(如Hadoop集群)的强大处理能力“暴力”分析大数据集。Carter的案例说明大数据未必意味着“大模型”,这意味着大数据分析的技术门槛并没有想象得那么高。尽管如此,Carter还是在工作中自学了自然语言处理和社会化分析等知识,对线性回归分析也不陌生。

如果说Carter成为大数据科学家前已经具备了一些数据分析知识和经验,那么?完全没有数据分析经验的,只有大学课程水平的初级人士能否成为数据科学家呢?

答案是肯定的。新奥尔良大学学生Luis Tandalla去年在Coursera在线平台上听了几堂课后,在高手云集的Kagge大赛中一举中的,拿下了Hewlett Foundation设立的竞赛奖金。Tandalla开发出的模型能够准确评估短问题测验的得分。要知道,在Coursera上报名之前此之前,Tandalla压根不了解人工智能和机器学习。

在尝到甜头后,Tandalla的学习热情被彻底点燃,他在Coursera上报名更多课程,包括自然语言处理和概率分析模型,并开始自学其他数据分析知识。Tandalla将于2013年5月毕业,但Tandalla表示将考虑继续就读并考取机器学习专业的研究生。如今,创立自己的预测分析软件公司已经成了Tandalla的方向和梦想。

Tandalla并非个案,在Heritage Foundation的竞赛中,第二名和第三名都学习了Coursera 的机器学习课程,其中来自新加坡的39岁的Xavier Conort去年才转型成为数据科学家,目前已经是Kaggle上的顶级选手。

Courera的成功基因

andrew_ng

Andrew Ng

Coursera课程如此富有成效的原因与斯坦福教授Andrew Ng的治学理念密不可分。Ng认为这与自己在硅谷的氛围有关,如果不是与硅谷最优秀科学家们的紧密交流,Coursera的课程不可能如此成功。此外,Ng的课程侧重实际应用,在解决实际问题的过程中学习技术,他将更多的时间花在技术的应用上,而不是算法本身。

Ng认为,孤立的学习算法并不可取,这就好比单纯学习编程语言的语法,而不是尝如何编出有用的程序。在另外一个著名的在线免费课程平台Udacity上,我们也能看到类似的教学理念。Google副总裁,斯坦福教授Sebastian Thrun在主讲计算科学101课程时,就是围绕如何开发可用的搜索引擎来讲解Python编程语言。

Via GigaOM

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   
除非注明,本站文章均为原创或编译,转载请务必注明出处并保留原文链接: 文章来自IT经理网
相关文章:


关于作者

        在TMT领域具有十余年的咨询和创业经验。 目前主要关注信息安全,同时密切关注云计算、社会化媒体、移动、企业2.0等领域的技术创新和商业价值。拥有美国麻省理工学院MBA学位和清华大学经济管理学院学士学位,曾任BDA中国公司高级顾问,服务过美国高通、英特尔、中国网通、SK电讯、及沃达丰等公司。联系邮件:wangmeng@ctocio.com

5 条评论
  • 成熟质感 撰写于 2014 年 1 月 2 日

    你如何处理数据异常?

    你如何确立数据分析结构?

    –成熟质感 @贡献

  • kk 撰写于 2014 年 3 月 5 日

    胡扯淡

  • qq 撰写于 2014 年 3 月 5 日

    要这么简单的话,你们让从本科到博士统计学专业人,情何以堪,~~显然作者对统计学是狗屁不通

  • yy 撰写于 2015 年 6 月 8 日

    不要理解错误了,国外的大学和我朝大学教学质量和水准不在一个层次上!不要拿所谓清华和北大与美前10名校相比,井口外,天很高!人家的计算机系的学科够我朝博士生掉几层皮的了。

  • 陈会端 撰写于 2015 年 12 月 5 日

    最重要是好的想法,而不是复杂的模型。

写评论

忘记密码

X