悬赏17万：美国“知乎”的沙雕问题，要靠你家的AI来识别 _悬赏

[ 虎娃导读 ] 知乎上面，时常会出现一些“睿智”的问题。
知乎上面，时常会出现一些“睿智”的问题。
比如，一颗陨石如何挑选自己的归宿：
又比如，公交车的职业操守如何：
这么可爱的问题，并非知乎独享。
知乎的大前辈Quora上面，也有一些脑回路别具一格的人类：

我的MacBook Air重量是2.3磅。下载的东西多了之后，它会不会越来越重？

既然，大家都喜欢这样可爱的问题，怎么才从千千万万个问题里面，把它们找出来呢？
重赏之下，必有勇夫。
Quora拿出25,000美元 (约合17万人民币) 作为奖金，举办了一场Kaggle比赛：
有毒问题在哪里？
比赛内容之一，就是让AI识别出建立在虚假前提上的问题，简称虚假问题 (Insincere Questions)。
所以，怎样算是虚假前提？
还是举起开头的栗子， “陨石坠地前，那陨石坑已经存在” ，这是个合格的虚假前提了。
第二， AI要识别的对象还包括，打着提问的旗号，实则在表达观点，这样的问题。
例如，对某一人群表现出歧视、攻击或者侮辱的问题：
第三，若是为给别人带来冲击力 (不为寻求答案) 而使用了性内容，也会成为缉拿对象。净化网络环境，也是保护祖国的花朵。
△ 来自山下智博
以上概括起来，任务就是揪出那些并非真心发问而另有用意的问题。
Quora说，站内已经在用机器学习与人类一同完成这项任务了，不过依然需要大家的帮忙。所以才为选手们提供了不错的回报：

冠军， 12,000美元亚军， 8,000美元季军， 5,000美元

△ 如何在一夜之间学会编程？(急，在线等)
比赛用的数据，就是Quora里面的问题。官方提供的数据集，分为训练集合测试集。训练集里有超过130万个问题，测试集里有5.6万个问题。信息包括：问题ID ，问题本身，以及问题是否虚假。
在此之外，选手不可以使用其他数据来训练模型。
比赛成绩，是由模型的F1分数决定的：
这里，问题只有两种分类，一是虚假，二是正常。F1分就是衡量二分类模型准确度的指标，兼顾了精确率 (Precision) 和召回率 (Recall)。
这场为期3个月的比赛，一周前已经启动。现在，已经有超过750支队伍参与其中，排行榜也一直在变化。
窃以为，解锁不可描述的问题，应该是一项愉悦身心的活动。
那么，想要参加比赛的同学注意一下：

报名截止日期为2019年1月29日。提交截止日期为2019年2月5日。

参赛地址在这里：
https://www.kaggle.com/c/quora-insincere-questions-classification
有问，必有答
最后的最后，母交车到底能不能吸引公交车？
有理有据，令人信服。
— 完 —
【悬赏17万：美国“知乎”的沙雕问题，要靠你家的AI来识别】活动策划招聘
量子位正在招聘活动策划，将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入，并希望你能有一些活动策划或运营的相关经验。相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。