天天人才网,广州最近那里有招聘会?( 十 )


过去一年里,马萌利见过各种稀奇古怪的图片,她给人体标注过关节点,从头顶、脖子、膝盖到脚踝,一共打17个关节点;给道路图里的汽车、摩托车、自行车拉过边框,黑夜里的照片要比白天难一倍;她还录过一下午音,对着手机,念了300句话,有的短,就两个字、五个字,有的是十几二十几个字,具体内容,公司不让往外说 。
2012年,谷歌大脑做了一个著名的实验:1000台计算机组成了超过10亿个“突触”连接的神经网络,研究者输入了1000万个静态图像,通过3天的密集寻找重复出现的模式后,谷歌大脑终于可以识别出一些特定的重复类别:人类面孔和人类身体,或者是一只猫 。
马萌利这样的AI数据标注工人,就是给计算机输入图像,为人工智能提供学习材料的人 。他们用的是最原始的办法,一张图接一张图地手动标记 。他们在人脸上标注几百个记号点,让计算机知道哪里是内眼角、外眼角,瞬间扩出大眼睛;他们录入的语音信息,被拆分标注后,能让智能音箱懂得“关机”和“十分钟后给我老公打电话”是什么意思 。未来,自动驾驶的车辆之所以能在路口停下,就是因为工人们标注过红灯、斑马线和一帧一帧移动的行人 。
关于这项技术,最为人所熟知的一个例子是,在张学友南昌、赣州、嘉兴、金华4场巡回演唱会上,警方用安检时的人脸识别系统,一共抓获了5名在逃犯人 。
我一提到这个新闻,刘洋锋立刻讲出了背后公司的名字 。虽然没合作过,但知道他们是如何运转的:当逃犯们兴冲冲地拿着票走过摄像头时,他们的面部信息已经被抽取,实时传到云端,与后端数据库飞快地做比对 。
这是一种无差别的信息比对,如果用传统人工,在几万人的演唱会安检现场找到一名在逃犯,需要成百上千名安防人员 。现在,只要几秒钟,比对完成,系统发出警告,警察按图索骥,拿下案犯 。
太简单了,就跟QQ截图差不多
这家公司只有一年历史,从设想到成立,一共才花了3天时间 。
第一天,刘洋锋和另外两名创始人聚在一起,琢磨以后要干点儿什么 。他翻出一个文件,一家江苏的数据标注公司在转卖一个单子,提到一个新鲜的概念:数据标注 。
刘洋锋试验了一下软件,在一张马路的照片上,他给一个行人圈了一个框——太简单了,就跟QQ截图差不多 。
第二天,三个人就去买了网线,去平顶山买了20个格子间卡位,旧货市场买的,90块钱一个 。
第三天,面试 。刘洋锋有个开手机店的老表,在乡镇里混了七八年了,“他有微信群,认识的人多,一发朋友圈就有人来 。”招工唯一的要求是,年龄不要太大 。招20个,去掉几个四十多岁的应聘者,正好招满 。
2007年,普林斯顿大学助理教授、计算机视觉专家李飞飞第一次试验做数据标注时,她以10美元/小时的价格,雇佣了一批普林斯顿的本科生 。10年后,这项试验已经演变成产业,在郏县这种中国的三、四线城市,以工厂、车间、质检员的形式落地生根 。
刘洋锋的公司是在县城郊区一个农民楼里成立的 。第一批员工是初中刚毕业的学生、三十多岁在家带孩子的妇女、前手机店店员和前服装店的销售员们 。已经经过了江苏来的业务一道盘剥,算下来每拉一个框3分2厘钱,公司再抽成,到员工手里,变成了2分5 。
一个星期之后,所有人都已经能熟练地在电脑上操作,这份工作的门槛几乎为零 。电脑从20台扩充到40台、100台,一年后,已经到了500多台 。员工都是本地人,马萌利的村子今年来了7个人,她骑电瓶车载我回了一趟家,10公里的村路,她小时候骑自行车,碾着泥坑,一上午都骑不到,现在变成水泥路,20分钟就到家了 。马萌利家刚贷款买了一台哈弗SUV,下雨天就拉着村里人一起去上班 。

推荐阅读