程序员人生 网站导航

【快讯】阿里开放5.7亿条脱敏数据,90后“Marvel”团队竞赛夺冠

栏目:互联网时间:2014-09-06 13:17:56

8月21日,已经持续了四个多月的2014阿里巴巴大数据竞赛决出了前三名:由北京航空航天大学学生李森栋和中国科学院大学学生王涛组成的“Marvel”团队获得冠军,获得20万元冠军奖金。南京航空航天大学学生柯文玮的“KLMJV”,南京航空航天大学学生李国拯、徐菁风和东南大学学生肖志宇组成的“Fly402”分获二三名。


PS:笔者已与比赛得分前11的团队取得联系,更多分享请关注CSDN后续报道。本次“天猫推荐算法大赛”更多前期报道请访问解析阿里云大数据服务――ODPS。


据了解,比赛接下来将进入第三阶段――第二阶段的TOP选手将可在今年的双十一参与实战,与天猫算法团队正面交锋,使用真实的第一手数据,让其算法上线接受真实流量的考验。

在答辩现场,选手谈论自己参赛以来的最大感受是,通过这次数据竞赛,终于可以跟“高大上”的大数据贴身接触了,这对于他们理解数据挖掘带来了与以往听报告、看论文完全不一样的感观,这意味着他们从以往大数据研究的“试管捉鱼”状态进入到现在的“入海捕鱼”。

阿里天池项目负责人王一婷向记者介绍,目前学术界面临的数据资源不足、计算能力有限的困境,事实上无法进行真正接地气的大数据研究。举办首届阿里大数据竞赛,一方面是为高校学子提供大数据的实战机会,推动高校和研究机构对大数据和算法的研究发展,另一方面也是为了培养相关领域的人才成长。

一位参加2014阿里大数据竞赛的中科大学生在其参赛随笔中写到,“大数据时代或许真的已经来临,起码'Big Data'已经成为了最近两年最buzzword的词汇。但是,如果没有这次的大数据比赛,就我而言,大数据可能永远只是一个概念,一个新技术,一个新前沿,几篇优秀的论文,永远不会走入我们。”

这次以天猫算法大挑战为主题的数据竞赛在阿里大数据科研平台――“天池”上开展的,比赛通过建立算法模型分析用户在天猫上的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。大赛主办方阿里提供了总计5.7亿条经过脱敏处理的真实海量天猫用户行为数据,给选手们供应了真正意义上的大数据,同时给参赛队伍免费开放ODPS云计算数据处理平台,让选手免却搭建计算平台的后顾之忧。

根据阿里提供的资料显示,十支进入第二阶段的高校队伍来自中国科学院大学、清华大学、香港科技大学、浙江大学等知名大学。有意思的是,与目前中国数据挖掘领域的男女比例现状保持一致,在最后进入到TOP10排名的16位选手中,仅有一位来自浙江大学的王静是女性,其余都是男生。

比赛结果是第一阶段比赛产生的TOP10战队,在经过现场答辩后,由专业的评审委员会评选出的。评审委员会中包括华为公司诺亚方舟实验室主任暨香港科技大学计算机系教授杨强、美国密歇根州立大学终身教授金榕、华东师范大学软件学院教授暨美国乔治亚理工学院计算所计算科学与工程系教授查宏远、电子科技大学大数据研究中心主任暨互联网科学中心主任周涛,以及阿里研究员薛贵荣博士等人。

这次“脚踏实地”数据竞赛,也获得了高校和科研机构的强烈反响,据阿里数据显示,从大数据竞赛3月10日宣布报名以来,在短短的一个月内,就迅速吸引了全球14个国家和地区7276支队伍参赛,经过几轮的循环竞赛,并在8月20日前诞生出了10强队伍。

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐