AI60小.png


1478138949710325.jpg


为了促进机器学习的学术研究和应用,中国人工智能学会联合IEEE中国、今日头条举办了一项面向全球的机器学习竞赛。竞赛的任务是为头条问答的问题在今日头条专家用户中寻找潜在的答案贡献者。今日头条目前已经积累了超过5.8亿用户,其中包括30万头条号作者,其大规模机器学习系统每天为这些用户推荐个性化的新闻,图集和视频内容。

 

头条问答是一个新兴的移动社交问答平台,基于头条5亿+用户及精准分发技术优势,在移动端以问答为形式进行的碎片化创作及互动。头条问答将信息和人精准匹配,为问题找到合适的回答者;为回答找到合适的阅读者。从而实现“让所有人问所有人,所有人答所有人”。

 

目前,头条问答每天已有数万用户参与答题,带来的优质回答每天有数千万的阅读。因此一个重要问题就是如何为每个热门问题找到愿意回答的专家用户并将问题推送给他们。如果问题推送策略准确度不高,为了保证问题有足够的高质量回答数,只能尽量扩大推送覆盖面,可能给部分不适合回答问题的专家用户带来打扰。为了更好的解决这个问题,中国人工智能学会联合IEEE中国分会、今日头条举办了本次比赛,希望能激发更多优秀的机器学习&数据挖掘界人才对该问题的兴趣。

 

这场数据分析竞赛的主题是:如何在社交问答系统中精准地匹配专家和问题。

 

与过往比赛的不同之处在于本次竞赛所使用的数据,全部源自今日头条自建内容阅读平台的真实数据。在比赛期间,所有参赛者都可以自由下载数据、组队、分析建模,并把得出的结果上传到竞赛平台。 

 

系统会给定若干问题,参赛者需要预测哪些专家更有可能回答这些问题,具体针对每个问题和一位候选专家计算该专家回答问题的概率。实际运营中,系统会优先向回答概率高的候选专家发送这个问题的回答邀请,直到收到的回答数量达到指定阈值。评估时会按照预测概率把候选专家排序,并分别评估排序结果的NDCG@5,NDCG@10最后评分公式为 NDCG@5 * 0.5 + NDCG@10 * 0.5。比赛平台将实时比对提交的答案和真实数据,返回比赛分数并对当前所有参赛者进行排序。

 

为了让算法模型更好的改善问答效果,参赛选手可能还需要考虑以下内容:

 1、问题分发

为用户的提问快速的找到最合适的人,并且提供高质的回答;

2、答案质量

是否很好的回答了问题,其中包括能有效的处理答非所问,答案配图无关等;

3、答案排序

顾名思义,在同一问题下,能给出较好的答案排序,该排序对浏览用户和创作者都比较友好;

4、问题配图

用户提问的时候,经常需要比较合适的图片来加以详细的描述,因此希望系统能给出合适并优质的配图候选;

5、问题自动生成

碰到一些热门的新闻或者用户津津乐道的话题,系统能快速的自动生成问题,并配以生动的描述;

6、问题去重

对于重复的问题,除去传统的聚合手段,还需要做到高准确召回,这有不小的挑战。 

   

比赛要求11月11日(23:59p.m UTC)前发布测试数据,提交测试集预测结果,11月20日正式截止。本次竞赛的指导委员会主席由清华大学张钹院士担任,竞赛委员会主席由罗格斯大学熊辉教授担任。

 

奖励说明:

1.前3名可分享1万美元奖励

2.前10名可获得竞赛证书

3.前40名可获得IEEE会员资格

4.前50名可获得中国人工智能学会第七届会员资格(有效期至2019年)

5.前100名可获得中国计算机学会会员资格(2017年当年)

今日头条还将额外提供经费资助获奖选手参加北京的颁奖仪式发布自己的方法和结果。 


1478138958545040.jpg

 

如果你也对机器学习&数据挖掘感兴趣,欢迎你点击下方网址了解此次2016ByteCup问答专家挖掘挑战赛。

http://lab.toutiao.com/

https://biendata.com/competition/bytecup2016/

中国人工智能学会
2016年11月03日


Copyright © 2010 中国人工智能学会 互联网ICP备案:京ICP备06029423号-1
地址: 北京市海淀区西土城路10号 邮编: 100876 技术支持: 010-62283919

二维码