天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

算法应用大赛

随着“宽带中国”建设步伐的加快,及4G+网络快速覆盖,在线视频已经成为广大用户热衷的娱乐方式。在线视频蕴含着巨大的商业价值,通过分析用户上网行为,视频网站可以为用户提供个性化服务。

请根据给定用户前7周访问十个视频网站的历史数据,预测下一周每个用户每天分别访问十个视频网站的情况。

 

赛制安排

第一赛段,12月1日—1月10日

  1. 选手可在本阶段下载数据,在本地运行调试算法,并按照数据格式说明,上传将会有访问行为的用户的预测结果。将预测结果经“个人中心-比赛信息”提交;若队伍一天内多次提交结果,新结果版本将覆盖原版本,系统根据最后一次提交结果计算得分;
    2. 12月10日起提供每天一次的评测和排名机会,提交截止时间为每天的23点59分,次日更新排行榜,排行榜将选择选手在本阶段的历史最优成绩进行排名展示;
    3. 1月1日将进行一次数据切换(需重新下载数据进行运算和结果提交),排行榜将取1月1日之后成绩排名;
    4. 第一赛段截止时,1月1日起最优成绩排名前35名的队伍进入第二赛段;

实名认证,2016年1月11日-2月22日

选手需在此阶段登录“个人中心”上传本人身份证照片。

 

第二赛段,2016年2月23日-3月23日

通过实名认证的选手,在“算法应用大赛-赛题与数据”页面查看参赛规则,具体规则届时公布和通知。

复赛截止时,最好成绩排名前5名的队伍将受邀参加决赛答辩;

 

总决赛,待定

  1. 参与答辩队伍需提前准备评审材料;
    2. 答辩现场根据参赛队的算法原理、历史成绩、评委打分,选出最终获奖选手。

 

参赛对象

大赛面向全社会开放,要求以个人形式参赛。

注:大赛主办和承办单位在职正式员工禁止参赛。

 

组队规则

参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人。

  1. 参赛队员自由组合,队长在“个人中心”选择组建队伍,添加其他用户为组员;
  2. 每个团队只有队长有权限上传结果;
  3. 参赛选手必须保证报名信息准确有效,否则会被取消参赛资格及奖励;
  4. 组队信息于第一赛段结束前5天截止变更;

 

赛题与数据

大赛数据(*登录后可查看附件)

将于12月5日开放下载,敬请期待!竞赛题目

第一赛段赛题

请根据给定用户前7周访问十个视频网站的历史数据,预测下一周每个用户每天分别访问十个视频网站的情况,并按照以下说明,上传预测结果(若预测某用户某天访问10个视频网站次数全为零,则不上传此条预测结果)。

数据说明

赛题数据:7周用户视频网站访问记录

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

选手提交预测结果的格式说明(按TXT格式提交)

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

选手需要将预测结果存入txt文本文件中,并采用如下格式:

user_id \t d1_v1,d1_v2,… ,d7_v1 , d7_v2, d7_v3,… ,d7_v10\n

即:user_id与预测结果之间用tab分隔符分隔;d1_v1表示第八周第一天视频网站1的访问量。访问量必须为非负整数。

预测结果按照日期排列由近到远,同一个日期内按照赛题给出的视频网站顺序排列。预测数据之间用逗号分割。

上传文件格式必须为txt格式,不需要添加header。

示意:

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

 

 

评分标准

大赛采用准确率和召回率作为排行榜的评分依据,排行榜评分由二者运算后的F1值得出,详细评分说明如下。

(1)  准确率:用于评估预测的准确度。

采用余弦相似度判断每个用户在第八周每天对十个视频网站的访问量的准确度,并除以选手预测的用户数量。

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

注:

(a)    N为选手预测的有访问记录的用户数量。

(b)   Similarity为每个被预测用户对10个网站7天的访问量预估的余弦相似度。若被预测的用户并未在第八周出现,则默认真实值为该用户对所有视频网站的访问量为0。

(c)    UserCount为选手预测的用户数量(包括被列出但对所有视频网站访问量为0的记录)

(d)   有访问记录,即至少存在对某一视频网站某天的访问量不为0的记录。

(2)  召回率:用于评估预测覆盖的用户数量。

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

注:

(a)    rUserCount:为真实有访问记录的用户数量

(b)   hitUserCount:预测的有访问记录的用户列表与真实有访问记录的用户列表的交集的用户个数。

(c)    有访问记录,即至少存在对某一视频网站某天的访问量不为0的记录。

(3)  F1值:排名所用分数。

大赛最终将以F1值由高到低进行排名。

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

组织单位

指导单位
中国企业大数据联盟

主办单位

中国电信集团公司

承办单位

中国电信股份有限公司云计算分公司

北京至信普林科技有限公司

华为技术有限公司

出题单位

中国电信股份有限公司云计算分公司

 

奖金与奖品

奖金与奖品

决赛:

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

决赛将评选出冠军、亚军、季军队伍各一支,分别获得贰拾万元、伍万元、贰万元人民币(税前)并颁发获奖证书

第二赛段:

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

第二赛段前15名选手,获得专属礼品一份;

第一赛段:

天翼杯 • 大数据算法应用大赛 [2015年12月1日至2016年3月23日]

有效参加第一赛段的选手(提交答案并获得排名)获得大赛纪念品一份;

FAQ常见问题转下一页

腾讯云CDN拥有顶尖加速能力,丰富的功能全面覆盖各业务场景的加速需求,最为用户考虑的加速产品

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

admin