这意味着,在某种程度上,AI算法的优化,取决于数据标注的质量,而把控这些质量的,是完全不懂AI技术的一群人 。
一名没有任何经验的标注员 , 通过半天的培训即可开工 , 一两个月之后可变成熟练工,一天就可以完成1500张-2000张图片的标注 。
需要标注的图片数据从客户提供的数据处理平台上打包下载,根据不同的需求进行标注,常见的包括物体识别和人脸识别,物体识别主要是“画框” , 人脸识别则是“打点” 。
完成后会进行一到两道的质量检测程序,来确保标识准确率,合格后会重新传送到客户的数据平台上 。
然后,这些数据会被应用到自动驾驶、AI安防、智能身份认证等新兴应用领域 。
依靠这些应用,人工智能公司在资本市场颇受追捧,投中研究院发布的数据显示 , 2018年上半年,进入商业化阶段的中国人工智能行业已经获得超过400亿元人民币的融资 。
这400亿元的资金,仅有极少部分流入了数据标注行业 。商业信息服务平台企名片收录的标签为“数据标注”的公司共有15家,2018年,这15家公司共完成6笔融资,单笔融资金额约为1000万元人民币左右,总计不超过1亿元人民币 。
靳建伟还没考虑过融资这件事,他听说北京的AI公司都在以亿为单位进行融资 , 但他的思维和之前的数次创业没有区别,找客户,做业务,能赚钱,才是应该做的事情 。
单打独斗在当下的AI圈很难混得开 。由于完全没有相关行业经验 , 也没有资本加持 , 一开始靳建伟只能接二手、甚至三手订单,也即外包服务 。“一些有渠道的公司接了订单 , 自己不做,或者自己做不过来,就分发给我们做,他们再从中间收取差价 。”
与很多行业一样,渠道是核心竞争力,中间商们不需要耗费太多的人力物力,就能赚取可观的利润 , 底层的工厂们,加班加点,只能勉强维持经营 。
这样下去可不行 。在熟悉了行业之后,靳建伟开始主动出击,拓展渠道,试图绕过中间商 。从知名的头部AI公司开始 , 到所有他能找到联系方式的中小AI企业,他问了个遍 。得到的回应要么是“不需要”,要么是“我们已经有了自己的数据标注团队”,更多的是石沉大海 , 没有回音 。
“人家上来就问你 , 以前做过哪些项目,我说不上来 。”他很无奈 。
类似商汤科技、科大讯飞这样的头部AI公司,都会自建数据标注团队,既方便管理 , 也能更好地理解需求 。
但确实也有大量AI公司 , 由于团队人数、资金成本有限,有外包数据标注的需求,但大部分都会通过熟悉的渠道寻找标注团队 , 或者和大平台合作,例如百度众测平台 。
百度众测是百度旗下的一个类似众包模式的数据平台,2014年在百度世界大会上正式推出,平台上会分发各类任务,在行业内称为“放题”,包括数据采集、图片标注、文本标注等 。
百度在中国人工智能领域起步早,渠道辐射广,众测平台上每天都有大量的数据标注需求,并且开放注册,这让靳建伟看到了机会 。
当然了,当时他还没有意识到,更大的困难在等待着他 。
饱一顿,饥一顿
距离郑州车程两个小时的河南新乡辉县,甚至找不到一栋商用写字楼 。从马路边一个毫不起眼的门洞上楼 , 就是翊澳在辉县的工厂,也是该公司目前规模最大的一个厂 。
两层楼,近500平方米的空间里,划分出了三片工作区域,目前仅有一片区域开工运转 。
推荐阅读
- 网红带货怎么收费的 网红带货怎么收费
- 激趣app怎么了 激趣app
- 京东怎么查看自己的消费记录啊
- 轴承坏了会出现什么异响,轴承有异响怎么回事
- 电信wifi设置密码怎么设置 电信怎么设置wifi密码
- 家里的花怎么清洗 家里很多花怎么除掉
- 衣柜伸缩顶杆怎么用视频 衣柜伸缩顶杆怎么用?
- 苹果7怎么设置NFC 苹果7手机nfc设置在哪
- 微信怎么知道朋友有没有屏蔽自己的好友圈
- 黄皮哈密瓜怎么挑