数据标注师 数据标注师是干什么的( 二 )

【数据标注师 数据标注师是干什么的】
图片来源:人社部
2020年4月26日,人力资源与社会保障部发文正式宣布,“人工智能训练师”正式成为新职业,并纳入国家职业分类目录 。预计到2022年,国内外相关从业人员有望达到500万 。
行业向上,但“老师”们依旧用密集、艰辛的劳动辅助AI一步步走向成熟 。光鲜的AI科技发布会在台前风光无限,可标注师们的生活似乎变得有些困难了 。
“说是没技术含量,精度要求在那里,很容易犯错,”刘梦缘看着现在的手下的员工说道 。每张图片要标记的点位繁杂,稍有偏离就会产生错误 。一张图有错,会影响到整个数据包数据,然后就是“回炉重造” 。
除了精度,疲倦是标注师最大的敌人 。“这行干久了之后,我清楚地知道客户要通过我们实现什么——就是把人脑当电脑用”,刘梦缘笑着说道 。
大公司会用软件监控标注师的疲劳程度,也算是一种人性化的体现 , “但小公司本来就是接人家剩下来的活 , 时间紧任务急,只能拼着命熬,”正是如此,刘梦缘的团队里常年备着成箱的红牛和西洋参含片 。
AI快速发展的背后 , 一批批“老师”换血,流动率相当高 。“做文本标注的人员,现在越来越少,图像标注的30%的流动率,语音、视频常年都是对半开 。而且现在的95后、00后愿意做的人少了 , 一般呆过三个月就不愿意继续干了” 。
3年时间过去了 , 刘梦缘不断和老同事告别 。但她从枯燥无味的工作中坚持了下来,她记不得自己标注了多少图,只觉得自己是踏上了人工智能的大潮 。
对那些新晋的员工,刘梦缘也是如此描述,“我们是走在智能时代前面的一群人” 。
巨头来了行业的分水岭出现在2019年初:几大互联网巨头纷纷意识到数据的重要性 , 并着手建立自己的“数据工厂” 。

据媒体报道,截至今年3月,百度山西人工智能数据产业基地中,就拥有超过3000位标注师,主要涉及自动驾驶、人脸识别等内容标注,其中86%的员工为90后;字节跳动在北京、天津、济南、武汉各地,也招募了4万名数据标注师;腾讯更是直接把平台放到了线上 , 让标注师变成了一种“全民兼职”,称为“众包” 。
巨头的加入一方面是为了市场和成本 , 另一方面也是出于数据安全考虑,所以在内部搭建专门的标注团队显然是一个好选择 。但是 , “模型的训练和数据需求是周期性的,任务不持续,今天有活、明天没活 , 人员容易流失,管理成本很高” , 刘梦缘能理解大厂摆出“众包”的原因,“我让手下的人去试过平台的兼职标注,单个标注几分钱,一个月的收入在2000元左右,比起让外包来做,省了一半还多 。”
“大厂出手之后,市场最后拼的就是成本”,那段时间刘梦缘所在公司业绩下滑了40%,而且做出的标注数据质量也差很多 。

图片来源:Boss直聘
据懂懂笔记了解,2018-2020年数据标注师行业平均薪资为5000-6000元 , 如果晋升为项目主管或者更高级别的项目总监后,月薪才能向5位数靠拢 。而这一薪资标准到了2021年,在一些求生的外包“小厂”内,不升反降 。

图片来源:职友集
巨头涌入,薪资缩水的“大趋势”下,能窥探出标注师行业的“小趋势”:许多数据标注就像被人精心种下的水稻,还未到秋收季节稻穗就掉进了土里 。

推荐阅读